Beautiful Soup est un package Python pour l'analyse HTML / XML. La dernière version de ce package est la version 4, importée en tant que bs4.

beautifulsoup...

J'essaye d'obtenir des informations sur des trucs amazoniens. Idk pourquoi mon code ne fonctionne pas. Chaque fois que j'essaye de tester ces lignes, j'obtiens une sortie None. J'utilise Visual Studio. import requests from bs4 import BeautifulSoup page = requests.get("https://www.amazon.it/Xiaomi-fr....
J'ai un HTML à l'intérieur du contenu de la classe DIV ressemble à <h2> <strong> Brookstone </strong> AS20194 Multi-functional Massage Chair </h2> Mes codes Python sont soup.find('div',attrs={'class':'content'}).h2.text Et ça revient Brookstone AS20194 Multi-functional....
Cela fait partie d'un exemple de fichier test.html: <html> <body> <div> ... ... <table class="width-max"> <tr> <td style="max-width: 300px; min-width:300px;"> <a href="nowhere.com"> <h2> <b> <font size="3"> ....
9 juin 2020 à 10:26
J'essaie de récupérer les données des plaintes des clients sur un site Web. Je peux obtenir le titre et la date, mais je ne sais pas comment obtenir le nombre de vues. Voici le code pour obtenir le titre: headers = {'User-Agent':'Mozilla/5.0'} complaints = [] time = [] for i in range(100): r = r....
31 mai 2020 à 12:29
J'essaye de faire du web scraping. En utilisant BeautifulSoup, j'analyse plusieurs objets et je suis confronté à un problème. Le problème est que je ne peux pas prédire où l'erreur se produit en utilisant la méthode «trouver». On dirait a = soup.find(something).find(something) b = soup.find(somethin....
Je suis nouveau sur Python et je cherche à extraire le titre d'un lien. Jusqu'à présent, j'ai ce qui suit mais je suis dans une impasse: import requests from bs4 import BeautifulSoup page = requests.get("http://books.toscrape.com/") soup = BeautifulSoup(page.content, 'html.parser') books = soup.find....
30 mai 2020 à 21:38
Je suis nouveau sur BeautifulSoup alors veuillez excuser toute erreur de débutant ici. J'essaie de gratter une URL et je souhaite stocker la liste des films sous une seule date. Voici le code que j'ai jusqu'à présent: import requests from bs4 import BeautifulSoup page = requests.get("https://www.imd....
29 mai 2020 à 17:18
J'essaye de gratter ce site: https://www.senate.gov/general/ contact_information / senators_cfm.cfm Mon code: import requests from bs4 import BeautifulSoup URL = 'https://www.senate.gov/general/contact_information/senators_cfm.cfm' page = requests.get(URL) soup = BeautifulSoup(page.content, 'html.....
Je ne parviens pas à localiser le tableau HTML avec la classe table-light border rounded. Savez-vous tous pourquoi cela peut être? Voici ma tentative: import requests from bs4 import BeautifulSoup url = "https://iextrading.com/trading/eligible-symbols/" r = requests.get(url) soup = BeautifulSoup(r.....
Je suis un débutant en exploration Web et j'ai besoin d'aide pour obtenir les valeurs du tableau Ceci est le site Web C'est mon code pour l'instant. Mais ça ne marche pas import requests as rq from bs4 import BeautifulSoup import pandas as pd location = [] posted_date = [] summary = [] deadline....
28 mai 2020 à 09:28
import requests from bs4 import BeautifulSoup url ="https://www.hltv.org/stats/matches/mapstatsid/103093/furia-vs-chaos" headers= {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"} response = requests.get(url, headers = headers) soup = BeautifulSoup(response.content, "html.parser") #stat_....
26 mai 2020 à 05:57
J'essaie de gratter le Web, en utilisant Python 3, une table de ce site Web dans un fichier .csv: Calendrier national 2011-2012 de la NBA Le tableau commence comme: Revised Schedule Original Schedule Date Time Game Net Time ....
La ligne: <span class="current">7</span> Script qui imprime cette sortie: current = actual_items.find("span", class_="current") print(current) Ma tentative: print(current.find("text", text=current.isdigit())) Sortie attendue: 7 ....
26 mai 2020 à 00:56
J'essaye d'extraire des données entre les <td> de plusieurs tableaux HTML. La structure HTML de chaque tableau ressemble à ceci <td rowspan="2" class="nfvtTitleTop"><b>Delta</b></td></tr><tr><td class="nfvtTitleSTop">USD <span style="color:#808080"><i>(in Million)<i></span></td><td class="nfvtTitleS....
25 mai 2020 à 13:28
Page principale du site Web | Page utilisateur / La page que j'essaie de supprimer Mon code: import requests from bs4 import BeautifulSoup as bs payload = { "username": x, "password": y } s = requests.Session() res = s.get('https://9anime.to/user/watchlist', data=payload) soup = bs(res.text....
Je suis nouveau sur python et j'essaye de réaliser un projet de web scraping. Je suivais un tutoriel et je suis resté coincé dans la partie où je transmettais les données à une feuille csv. J'ai déjà essayé de déplacer certains supports et autres structures, mais rien ne semble aider. Voir le code c....
24 mai 2020 à 16:08
J'essaie de récupérer sur le Web, en utilisant Python 3, un graphique de ce site Web dans un fichier .csv: Programme TV national de la NBA 2013-14 Le graphique commence comme: Game/Time Network Matchup Oct. 29, 8 p.m. ET TNT Chicago vs. Miami Oct. 29, 10:30 p.m. ET....
Je suis un novice complet en scraping et j'essaye de gratter https://fr.finance.yahoo.com et je ne peux pas comprendre ce que je fais de mal. Mon objectif est de gratter le nom de l'index, le niveau actuel et la modification (en valeur et en%) Voici le code que j'ai utilisé: import urllib.request ....
J'essaye de gratter youtube mais la plupart du temps je le fais, ça donne juste un résultat vide. Dans cet extrait de code, j'essaie d'obtenir la liste des titres vidéo sur la page. Mais quand je l'exécute, j'obtiens juste un résultat vide. Même un titre n'apparaît pas dans le résultat. J'ai cherché....
Lorsque vous travaillez avec une nouvelle structure XML, il est toujours utile d'avoir d'abord une vue d'ensemble. Lors du chargement avec BeautifulSoup: import requests, bs4 s = requests.get('https://www.w3schools.com/xml/cd_catalog.xml').text x = bs4.BeautifulSoup(s, 'xml') print(x) existe-t-il ....
18 mai 2020 à 12:21
Comment extraire une partie spécifique d'un exemple de fichier html https: // patents.google.com/patent/EP1208209A1/en?oq=medicinal+chemistry Jusqu'à présent, j'ai utilisé beautifulsoup pour obtenir la version texte du html sans toutes les balises. Mais je voudrais que mon code ne lise que les secti....
17 mai 2020 à 07:03
J'essaie d'écrire un script qui extrait les numéros de stock d'un site Web pour moi. J'ai pu trouver l'élément sur la page en utilisant BeautifulSoup, mais je n'ai pas été en mesure de convertir la sortie de cette variable en un simple nombre. J'ai essayé de transformer les données de la variable en....
16 mai 2020 à 22:20
Essayer d'extraire du texte des balises br. Comment fait-on cela? Jusqu'à présent, j'ai essayé différentes combinaisons mais sans succès. Vrai débutant. from requests import get from bs4 import BeautifulSoup article = "https://www.readlightnovel.org/martial-god-asura/chapter-4095" r = get(article,....
14 mai 2020 à 20:21
J'essaie d'extraire le corps du article suivant. Voici le code que j'utilise: from bs4 import BeautifulSoup import requests a_url = "https://www.business-standard.com/article/current-affairs/up-plans-100-000-covid-beds-as-325-000-stranded-labourers-return-in-2-weeks-120051100865_1.html" y = request....
12 mai 2020 à 10:30
Je souhaite extraire les données du tableau de http://5000best.com/websites/ Le contenu du tableau est paginé sur plusieurs pages et est dynamique. Je veux gratter les données du tableau pour chaque catégorie. Je peux gratter le tableau manuellement pour chaque catégorie mais ce n'est pas ce que je ....