为什么用Xpath?基本使用方式有哪些?
一、为什么用Xpath?
XPath 的选择功能十分强大,它提供了非常简洁明了的路径选择表达式,另外它还提供了超过 100 个内建函数用于字符串、数值、时间的匹配以及节点、序列的处理等等,几乎所有我们想要定位的节点都可以用XPath来选择。
简单来说就是:获取网页源码的部分数据的一种方式。
二、Xpath的基本使用
from lxml import etree
xpath解析方式: 当解析的是本地文件时 etree.prase
当服务器响应的文件时 etree.HTML()
1.用xpath解析本地文件
自己写一个.html文件。
注意:开始标签和结束标签不匹配 那么怎样看开始与结束标签是否匹配呢? <,/>要成对出现才行。像<,>就不行


2.xpath的基本语法
a.路径查询
//:查找所有子孙节点,不考虑层级关系
/:找直接子节点
b.谓词查询
//div[@id]
//div[@id:'maincontent']
c.属性查询
//@class
d.模糊查询
//div[contains(@id,'he')]
//div[starts-with(@id,'he')]
e.内容查询
//div/h1/text()
f.逻辑查询
//div[@id='head'and@class='s_down']
//title|//price'''



THE END