admin管理员组文章数量:1538748
总述:
一开始接触爬虫的时候,一个元素的定位能让我纠结半天。定位有很多种,我觉得最好用的是xpath,在这里分享一个用谷歌浏览器自动定位元素的trick,以后定位元素只需要复制就可以了。
第一步:找到在网页上定位元素
找到你需要定位的元素,右键-》检查,那么谷歌浏览器的有边框就会跳到相对应的元素位置。如图:
我右键点击了话题榜,然后代码就自动跳到了话题榜所在的元素。
第二步:复制xpath
在检查的代码里面点击你需要定位的元素,右键-》copy->xpath就可以了
这样子的话,你接下来在代码里面可以crtl+v复制一下,得到的就是这一个元素的xpath位置:
//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[2]/span
注意在使用的时候,xpath需要包含在单引号里面,不能是双引号。
ok,这个单个元素,那么问题来了,有时候我们需要某一类元素怎么办呢?
我们可以来观察一下这个微博界面:有话题榜,热搜榜,新时代。。。几个小标题,我们来看一看他们的xpath。
//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[1]/span
//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[2]/span
//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[3]/span
//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[4]/span
发现什么规律没有,对了,只有倒数第二个元素li元素的下标不太一样。那么如果你想获取所有的小标题,你把下标去掉就可以了。
//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li/span
以上。
版权声明:本文标题:谷歌浏览器获取网页元素的xpath 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/xitong/1726982452a1092957.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论