admin管理员组

文章数量:1530081

  • 爬取网站动漫 - 腾讯动漫官方网站 - 首页

    • 漫画强势推荐

    • 初步分析

      • 所有漫画的链接都在<li>中,链接都为错误提示 - 腾讯动漫"编码"
      • 进入漫画,分析页面

         

      • 所有的漫画章节链接都在一个页面中全部被包含。1个<li>包含5个<pi>,1个<pi>包含4个<span>,1个<span>中存储一个章节。所以1个<li>对应腾讯漫画每20个一组的分组
  • 目前已经获取了单个漫画的每个章节的链接地址,下一步是分析保存图片
    • 进入某一章节中,分析图片的地址

    • 由此可以发现图片是直接可以爬取下来的,但是只有前几章是这样,后面全是后缀为.gif的文件,这些GIF文件就是加载动画,在滑动进度条到该图片的位置后就会加载出来图片地址

本文标签: 腾讯仅限动漫Python