Le principal objectif de XPath est d'adresser des parties d'un document XML. Il fournit également des fonctionnalités de base pour la manipulation de chaînes, de nombres et de booléens. XPath utilise une syntaxe compacte non XML. XPath fonctionne sur la structure logique abstraite d'un document XML, plutôt que sur sa syntaxe de surface.

xpath...

Je suis assez nouveau dans ce domaine et je suis coincé depuis environ 2 jours. Je ferai de mon mieux pour expliquer mon problème. C'est l'élément que j'essaie de trouver: <div id="popupContent" style="display: block; width: 300px;"> <div style="width:100%;text-align:center"> <div> ....
Ma question est en fait la même que celle posée ici: Scraping table html et ses liens href dans R Mais la solution fournie ne fonctionne pas dans mon cas ... ou il y a quelque chose que je n'ai pas compris ... Dans mon cas, la page Web a plus qu'une table et je ne sais pas comment cibler une table s....
26 déc. 2019 à 04:28
J'essaie d'obtenir les valeurs d'un span qui n'a pas de classe, et j'ai réussi à obtenir la valeur à l'intérieur d'une, mais je dois les obtenir toutes en même temps. Voici mon code: <span>one</span> <span>two</span> <span>three</span> <span>four</span> var headings = document.evaluate("//span[co....
20 déc. 2019 à 18:23
J'utilise scrapy pour obtenir un objet de type htmlresponse par exemple: <p class="post"> line1<br /> line2<br /> line3<br /> </p> <p class="post"> line4<br /> line5<br /> line6<br /> </p> et je veux obtenir tout le texte entre p, mais j'essaie: respo....
20 déc. 2019 à 05:17
S'il y a une page avec des blocs div similaires, mais certains de ces blocs ont un div de bloc supplémentaire et je dois récupérer des données uniquement à partir de div avec le bloc supplémentaire. Comment filtrer uniquement les blocs div dont j'ai besoin? Par exemple, j'ai besoin de données de [di....
19 déc. 2019 à 15:22
Existe-t-il un moyen en Python de vérifier les différences entre deux fichiers Yaml , qui contiennent des xPaths tels que: Le premier fichier, file1: interfaces: oper-status: xpath: //rpc-reply/interface-information/* Le deuxième fichier, file2: interfaces: oper-status: xpath: //rpc-....
18 déc. 2019 à 13:17
Je suis en train de créer un script POC pour un site Web de site Web d'actualités. Je suis nouveau dans le scraping mais j'ai une connaissance de base des balises css et des xpaths après avoir suivi un cours d'utilisation de l'API sur Datacamp. Je suis allé sur la page d'accueil de Bloomberg Europe ....
17 déc. 2019 à 16:59
J'utilise Selenium pour Python 3.x et un webdriver Chrome. Je voudrais localiser un élément de prix en utilisant l'expression XPATH. HTML ressemble: Mon XPATH à cet élément ressemble à ceci et est valide: //td[contains(text(), 'Montant')]/following-sibling::td/span Je peux trouver un élément par c....
17 déc. 2019 à 16:41
J'essaie de comprendre comment obtenir la valeur de jxdm:ID à partir du fichier XML suivant: <?xml version="1.0" encoding="UTF-8" standalone="no" ?> <My:Message xmlns:Abcd="http://...." xmlns:box-1="http://...." xmlns:bulb="http://...." xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmln....
16 déc. 2019 à 18:48
J'ai un script XML, comment écrire une requête dans Xpath? La requête Doit-elle apporter le nom des étudiants dont la note moyenne de cours est supérieure à 70? XML <Students> <student StudentID="12"> <StudentName>Ruti Dohan</StudentName> <CourseID>49001</CourseID> <Grade....
15 déc. 2019 à 11:27
J'essaie d'obtenir la LATITUDE et la LONGITUDE à partir d'une entrée Wikipedia (aléatoire). wiki_coordinates(website) coordinates = website.xml.find('.//*[@id="coordinates"]/') Voici le HTML est de https://en.wikipedia.org/wiki/Seattle (Latitude et longitude) Il y a deux sections "intéressantes" d....
15 déc. 2019 à 03:09
Je lis le tutoriel lxml avec la démonstration suivante: #+BEGIN_SRC ipython :session lxml :results output print(html.xpath("string()")) # lxml.etree only! # TEXTTAIL print(html.xpath("//text()")) # lxml.etree only! # ['TEXT', 'TAIL'] #+END_SRC #+RESULTS: : TEXTTAIL : ['TEXT', 'TAIL'] Je suis conf....
13 déc. 2019 à 17:51
J'essaie de partir de l'élément <span> qui contient du texte Valeur lors de la transaction Ensuite, récupérez son parent <div> et obtenez le frère suivant qui est un <div> et à partir de cela <div> récupérez le texte de l'enfant <span>. D'après ce que je peux dire, le code est correct et devrait f....
13 déc. 2019 à 00:12
J'ai ce code python et ça marche bien J'utilise xpath pour obtenir le titre du plan et créer un répertoire avec ce nom. import requests from lxml import html import csv import os resp = requests.get( url="https://www.architecturaldesigns.com/house-plans/prairie-style-home-plan-1....
12 déc. 2019 à 17:34
Im essayant de coder un bateau à vapeur en python qui sera publié dans le groupe Steam; J'ai un problème avec la dernière étape, je ne trouve pas le bouton Soumettre <button type="submit" class="btn_green_white_innerfade btn_medium" id="commentthread_General_34191408_submit"> ....
J'ai une page qui contient des liens avec des divs. Les liens ressemblent à: <a href="http://www.url.com"> <span> <div class="linkText">Link text</div> </span> </a> J'ai réussi à extraire le texte du lien avec ce qui suit: $links = $xpath->query('//div[@class="linkText"]'); foreach....
11 déc. 2019 à 23:40
Je travaille avec du sélénium en python 3.6 sur le navigateur Chrome. Je l'ai programmé au point où je peux accéder au site Web que je veux, mais j'ai du mal à trouver l'élément de zone de texte que je recherche. Quand j'inspecte l'élément, il a ce code. <input placeholder="" id="ember32" class="ssR....
J'essaie de trouver une classe particulière sur un site Web. La classe est parfois présente et parfois absente. Ainsi, lorsque la classe est présente, il faut quelques secondes au script pour localiser l'élément (logo). Lorsque la classe n'est pas présente, le script s'exécute pendant une longue pér....
10 déc. 2019 à 07:38
Je crée un modèle XML puis je chargerai dans mon code JS. J'ai du mal à charger toutes les instances d'une balise. Dans cet exemple, <section>: let xmltemplate = `<?xml version="1.0" encoding="UTF-8" ?> <sheet> <meta> <version>0</version> <author></author> <contact></contact> <no....
7 déc. 2019 à 22:09
Je suis assez nouveau sur Python et Scrapy. J'ai donc créé une araignée et j'ai des problèmes avec les chemins relatifs. Si je n'utilise pas le «point» à l'intérieur de la boucle, il imprime le même résultat tant que la boucle s'exécute, mais si j'utilise le «point» à l'intérieur de la boucle, il mo....
6 déc. 2019 à 22:25
J'ai vérifié pour des questions similaires et je n'ai pas trouvé de réponse pour la mienne. J'ai besoin de collecter la valeur de texte à l'intérieur d'une balise h1, selon l'exemple de valeur "text1", qui se présente dans 3 situations différentes. Je partage les 3 codes html ci-dessous: Premier cas....
5 déc. 2019 à 13:22
une chose que j'essaie d'implémenter dans mon code est un XPath pour extraire les résultats de 2 balises différentes, de telle manière que les résultats affichés à l'écran présentent ces attributs ensemble. J'ai essayé avec les fonctions d'union pour les 2 XPaths différents mais les résultats sont p....
4 déc. 2019 à 23:04
Merci d'avance et excuses pour ma naïveté: J'essaie de sélectionner le texte d'un élément qui est un enfant d'un li, qui est le frère d'un li que j'ai ciblé avec succès. Mon sélecteur pour l'ancêtre est: var buyerName = detail.FindElement(By.XPath(".//*[(text()='Buyer:')]")).Text; J'ai essayé plusi....
4 déc. 2019 à 07:51
J'essaie de naviguer sur la page de croisière PADI pour gratter un bateau, la date de départ et les informations sur les prix. J'ai pu obtenir le xpath à partir de la console de débogage de chrome et faire en sorte que le sélénium le trouve. Mais je veux l'améliorer en utilisant un chemin relatif et....
30 nov. 2019 à 08:48
Le code ne reçoit qu'une seule liste d'URL puis s'arrête. Il est censé obtenir 209 articles. Pourquoi n'imprime-t-il qu'une seule ligne? def parse_link(self, response): # Extract the list of products results = response.xpath('//li[@class="s-item "]') # Extract info for each produc....
29 nov. 2019 à 22:46