admin管理员组

文章数量:1604643

注: 抓取Google评论的时候,'hl=en' 这个参数是关键,en是英语,所以你看到的评论就是英语的,其他地区看不到

以下是针对chrome浏览器的评论抓取

APP链接: https://play.google/store/apps/details?id=com.android.chrome&showAllReviews=true&hl=en

第一页的数据 用 Xpath 或者 正则 的方式获取评论 ,其中用户名称,评论时间,打星数量都有

翻页抓取

上面的这个字符串是下一页的标识 (获取方式是请求当前访问的URL链接 (https://play.google/store/apps/details?id=com.android.chrome&showAllReviews=true&hl=en)    然后用正则获取整个json,然后取出)

下面是使用方法

curl 'https://play.google/_/PlayStoreUi/data/batchexecute' \
  --data-raw 'f.req=[[["UsvDTd","[null,null,[2,null,[40,null,\"CsUBCsIBKpsBCm73O5rLG_____9nYWlhOjAwMDAwMGU2YTRiMTNmOTQ6MTp2bToxMDczODQ5MjEwOTI0ODU4NDI0OQD_Af_-Z2FpYTowMDAwMDBlNmE0YjEzZjk0OjE6dm06MTA3Mzg0OTIxMDkyNDg1ODQyNDkAARAoIWtbxE9mhitbOQAAAADkNGXESAFQAFoLCWDbJ26NiKTXEANgwdyvoQIyIgogCh5hbmRyb2lkX2hlbHBmdWxuZXNzX3FzY29yZV92MmE\"],null,[]],[\"com.android.chrome\",7]]",null,"generic"]]]&hl=en' \
  --compressed


form_data中 [[["UsvDTd","[null,null,[2,null,[40,null,\"  后面这堆字符串是下一页的参数


form_data中 hl=en 是控制抓取内容语言的功能, 切换地区可换,如 hl=id, hl=zh-CN


请求返回的json,需要处理一下,json当中存在下一页的参数,在json的最后

一个简单的Google Play评论的抓取就完成了,大家可以参考这个案例去抓取其他APP的评论。

 

源代码就不发了,自己操作一遍就能明白,学会了是自己的,在这里祝大家步步高升。

 

本文标签: Googleplay