Le principal objectif de XPath est d'adresser des parties d'un document XML. Il fournit également des fonctionnalités de base pour la manipulation de chaînes, de nombres et de booléens. XPath utilise une syntaxe compacte non XML. XPath fonctionne sur la structure logique abstraite d'un document XML, plutôt que sur sa syntaxe de surface.

Plus à propos xpath...

J'ai besoin d'extraire la valeur d'identifiant de XML. J'ai écrit le code suivant. Cela fonctionne sur un exemple simple. Mais retournez None sur du vrai XML. Code: from lxml import etree parser = etree.XMLParser(ns_clean=True) tree = etree.parse('real.xml', parser) #tree = etree.parse('test.xml', ....
8 déc. 2020 à 22:07
Je souhaite extraire du texte dans <p> entre la balise div 'Heading1' et la balise div suivante, dans l'exemple ci-dessous. Je ne peux pas utiliser 'titre2 pour isoler le prochain div car ce texte peut changer. library(XML) # create example html html <- ' <div class="AAA"> <div class="AAA">Heading1<....
8 déc. 2020 à 16:52
J'essaie de créer un grattoir pour les responsables de boutique Etsy, mais une fois connecté, je ne peux pas utiliser le code pour localiser le bouton du responsable de boutique (NoSuchElement). Voici mon code: from selenium import webdriver options = webdriver.ChromeOptions() options.add_argument....
Je travaille actuellement sur un projet Python où un script visite un site Web (https://service.berlin. de / dienstleistung / 120686 /), puis clique sur le lien "Termin berlinweit suchen und buchen". J'ai essayé: from selenium import webdriver from selenium.webdriver.support.ui import WebDriverWait ....
J'essaye de cliquer sur le bouton suivant sur une page LinkedIn en utilisant selenium: <button id="ember607" class="share-actions__primary-action artdeco-button artdeco-button--2 artdeco-button--primary ember-view" data-control-name="share.post"><!----> <span class="artdeco-button__text"> ....
5 déc. 2020 à 21:53
Blockquote Overall, my table should be displayed as below: Thank you, Joe Doe My Code: --> Blockquote <?xml version="1.0" encoding="UTF-8"?> <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:template match="/"> <html> <body> <h2>Products</h2> <tab....
2 déc. 2020 à 19:48
J'essaie de boucler des pages à partir de ce link et extrayez la partie intéressante. Veuillez voir le contenu dans le cercle rouge dans l'image ci-dessous. Voici ce que j'ai essayé: url = 'http://so.eastmoney.com/Ann/s?keyword=购买物业&pageindex={}' for page in range(10): r = requests.get(url.form....
Bonne journée tout le monde. Je travaille sur une application simple et je souhaite mettre en œuvre quelque chose qui permettra à l'utilisateur de choisir un outil dans un menu déroulant, et après avoir cliqué sur le bouton Soumettre, il affichera les informations de l'outil choisi en extrayant les ....
1 déc. 2020 à 19:50
Voici le site Web: https://seekingalpha.com / news / 3580581-docusign-eps-beats-0_02-beats-on-revenue J'essaie de gratter le Web de l'EPS, de l'EPS, du GEFS GEPS et des revenus. List1 = driver.find_element_by_xpath("""/html/body/div[2]/div[1]/div/main/div[2]/div[3]/div[2]/section[1]/div/div/div[3]/d....
1 déc. 2020 à 02:31
Je suis un débutant en codage et j'essaie d'apprendre le webscraping avec du sélénium, j'ai travaillé sur un projet pour vérifier avec un dictionnaire combien de temps il faut pour déchiffrer un mot de passe avec chaque mot. Donc, mon code lit un fichier .txt qui a un mot sur chaque ligne, puis l'éc....
Je connais assez bien R, mais je n'ai aucune expérience du scraping Web. J'avais regardé autour de moi et je n'arrivais pas à comprendre pourquoi mon scraping Web «échoue». Voici mon code incluant l'URL que je veux gratter (le ngs-data-table pour être précis): library(rvest) webpage <- read_html("ht....
28 nov. 2020 à 05:31
J'essaie de sélectionner les balises div qui contiennent "month-table_col" (sélectionnez par mois). ... <div class="month-table"> <div class="month-table_row"> <div class="month-table_col">Jan</div> <div class="month-table_col">Feb</div> <div class="month-table_col">Mar</....
27 nov. 2020 à 07:13
Pensez à suivre le code HTML: <!DOCTYPE html> <html> <body> <div class="Animal" align="center"> <h2>Animal</h2> <div class="Vertebrate" align="left" > <h3 align="left">Vertebrate</h3> <div class="Fish"> <h4 >Fish....
J'utilise Python3 et Selenium. Le xpath ci-dessous pointe vers un lien. Je souhaite imprimer l'URL. Si j'écris print(link.text), j'obtiens uniquement la partie texte affichée du lien. Par exemple: link.text dans le lien suivant me donnerait un "texte du lien" lorsque je veux une URL. HTML: <a href="....
25 nov. 2020 à 01:53
Je voudrais rechercher dans plusieurs fichiers XML des nœuds avec un attribut facultatif. Les fichiers qui n'ont pas l'attribut que je recherche ne déclarent pas l'espace de noms auquel ils appartiennent. Je recherche en utilisant un XPath simple comme dans l'exemple suivant: Ici, je suis intéressé ....
24 nov. 2020 à 13:56
J'essaie de sélectionner l'Afrique du Sud dans la liste d'options ci-dessous: <select name="from_country" id="from_country" data-role="none" class="button-negative button-negative-country-select classic" > <option value="ZA">South Africa</option> <option value="ZW" selected="selected">Zimbab....
Je dois sélectionner l'élément <a> uniquement si la valeur textuelle de la <li> précédente est LINE 2 <html> <div> <label>LABEL 1</label> <div> <ul> <li>LINE ITEM 1</li> </ul> </div> <div> <div> <a>Edit</a> </div> </div> </div> <div> <label>LABE....
24 nov. 2020 à 01:03
J'essaie de gratter les titres de produits sur la première page produit d'Amazon en utilisant HTMLSession et xpath. from requests_html import HTMLSession from bs4 import BeautifulSoup def getTitle(url): session = HTMLSession() r = session.get(url) r.html.render(sleep=1) produc....
20 nov. 2020 à 19:59
Je veux parcourir chaque nœud dans un document xml et retourner true si le nœud est égal à une certaine valeur de chaîne et false dans le cas contraire. La sortie doit être similaire à: Vrai Faux Faux Vrai Vrai True étant où le nom du nœud correspond à une chaîne. Merci.....
20 nov. 2020 à 16:08
J'essaye de supprimer une page Web comme celle-ci <html> etc etc.. <div id='due'> <h2>title</h2> <div> <div class='desc'> sub1 </div> </div> <div> <div class='desc'> sub2 </div> </div> <div> <div class='desc'> ....
18 nov. 2020 à 00:05
Comment faire pour que si XPATH ne voit pas l'élément sur la page, il saute l'élément et passe à la ligne suivante? Mon code est: 1. driver.find_element_by_xpath('//img[@alt = "Black"]').click() Puis s'il ne trouve pas le 1er élément, il saute et essaie de trouver: 2. driver.find_element_by_xpath(....
28 oct. 2020 à 00:40
J'essaie de sélectionner un élément en fonction de son contenu textuel. J'utilise XPath pour y parvenir. Je suis juste perplexe car cela devrait fonctionner? WebElement link = obj.driver.findElement(By.xpath("//div[contains(text(), 'Notifications')]")); Je vais même copier le code HTML: <div cla....
27 oct. 2020 à 20:28
Il existe une balise d'ancrage, dont la valeur peut être modifiée par l'utilisateur. Maintenant, je veux écrire une requête Xpath qui recherche plusieurs noms de texte de lien dans une instruction elle-même. <a href="#login" class="fancybox" xpath="1">Signin</a> Maintenant, la valeur du texte du l....
23 oct. 2020 à 14:29
Je veux obtenir le contenu des balises fraternelles dans un intervalle fraternel. Ex de ce site Web: <div class="event__header top event__header--no-my-games event__header--noExpand"><div class="icon--flag event__title fl_6" title="Europe"><div class="event__titleBox"><span class="event__title--typ....
18 oct. 2020 à 21:12
J'ai un document xml, disons du format: <DynamicReport> <DynamicReportDefId>501</DynamicReportDefId> <DynamicReportDefName>Test report</DynamicReportDefName> <DynamicReportDefSource>Live</DynamicReportDefSource> <IsPrivate>false</IsPrivate> <showSummaryRowsOnly>false</showSummary....
18 oct. 2020 à 19:11