微博自动化登录(selenium+cookie)|电子爱好者

admin管理员组
文章数量:1656604

文章目录

前言
一、首先分析网页
二、编写代码
总结

前言

本次呢我讲俩种方法，一种是单纯的selenium自动化登录，这种方法经测试不太行。因为单纯使用账号密码登录微博现在行不通，还需要手机验证码。另一种是使用selenium加cookie的方法登录，经测试很有效。只需要在第一次使用手机扫码登录后用selenium保存cookie，后续就可以用之前保存的cookie登录微博了。

编写代码

1.分析网页

首先是第一种方法。
还是老套路，右键点击检查，因为selenium操作的是渲染后的网页，所以直接看elements就好了。找到账号、密码和登录对应的标签。

然后写好登录时发现还需要验证码。一样的找到验证码和验证码输入框对应的标签。

这里的验证码我们可以采用百度免费的ocr接口来识别或者打码平台的接口来识别，或者自己训练一堆验证码，然后用自己的接口来识别。不过一般我们采用别人的接口就可以了，一方面时使用的次数不多，另一方面没这个技术。这里我采用的打码平台，因为百度的接口识别的效果不太好。
第二种方法就更简单了。
就是用selenium打开微博网页后，手机扫码登录，然后selenium获取cookie保存到文件里。然后后面就读取这个文件，selenium携带cookie就可以免账号密码登录微博了。

2.编写代码

第一种

首先是selenium登录网页然后输入账号密码，点击登录后，出现了验证码，利用selenium直接将验证码截图，处理为灰色图片，上传打码平台，将返回的识别结果填入验证码输入框，点击登录的主函数。

def get_html(url,zhanghao,password):
    #打开谷歌浏览器
    wd = webdriver.Chrome()
    #发起请求
    wd.get(url)
    time.sleep(5)
    #输入账号
    zhh = wd.find_element_by_xpath('//*[@id="loginname"]')
    zhh.send_keys(Keys.CONTROL, 'a')
    zhh.send_keys(zhanghao)
    time.sleep(1)
    #输入密码
    pw = wd.find_element_by_xpath('//*[@type="password"]')
    pw.send_keys(Keys.CONTROL, 'a')
    pw.send_keys(password)
    time.sleep(1)
    # 点击登录按钮
    login_button = wd.find_element_by_xpath('//*[@node-type="normal_form"]//*[@class="info_list login_btn"]')
    login_button.click()
    time.sleep(1)
    try:
        x_button = wd.find_element_by_xpath('//*[@class="main_txt"]/a')
        x_button.click()
        time.sleep(2)
    except BaseException:
        pass
    element = wd.find_element_by_xpath('//*[@node-type="verifycode_image"]') # 定位验证码图片
    filename = str(random.random()) + '.png'  # 生成随机文件名
    element.screenshot(filename)
    im = Image.open(filename)
    # 转换为灰度图像
    im = im.convert('L')
    im.save(filename)
    # 使用打码平台中提供的方法识别验证码并返回验证码
    data = base64_api('mark123','123456',filename,'3')
    wd.find_element_by_xpath('//*[@action-data="text=请输入验证码"]').send_keys(data)  # 输入验证码
    # 点击登录按钮
    login_button = wd.find_element_by_xpath('//*[@node-type="normal_form"]//*[@class="info_list login_btn"]')
    login_button.click()
    time.sleep(1)
    time.sleep(1000)  # 为了看清登录，等待1000秒

接下来是打码平台的接口，这个要自己去阅读打码平台的API开发文档，如果对啥是API不了解的话可以看本专栏的第一篇文章。简单的API爬虫(和风天气数据获取)

def base64_api(uname, pwd, img, typeid):
    with open(img, 'rb') as f:
        base64_data = base64.b64encode(f.read())
        b64 = base64_data.decode()
    data = {"username": uname, "password": pwd, "typeid": typeid, "image": b64}
    result = json.loads(requests.post("http://api.ttshitu/predict", json=data).text)
    if result['success']:
        return result["data"]["result"]
    else:
        return result["message"]
    return ""

总的代码

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
from PIL import Image
import base64
import json
import requests
import random

def base64_api(uname, pwd, img, typeid):
    with open(img, 'rb') as f:
        base64_data = base64.b64encode(f.read())
        b64 = base64_data.decode()
    data = {"username": uname, "password": pwd, "typeid": typeid, "image": b64}
    result = json.loads(requests.post("http://api.ttshitu/predict", json=data).text)
    if result['success']:
        return result["data"]["result"]
    else:
        return result["message"]
    return ""

def get_html(url,zhanghao,password):
    #打开谷歌浏览器
    wd = webdriver.Chrome()
    #发起请求
    wd.get(url)
    time.sleep(5)
    #输入账号
    zhh = wd.find_element_by_xpath('//*[@id="loginname"]')
    zhh.send_keys(Keys.CONTROL, 'a')
    zhh.send_keys(zhanghao)
    time.sleep(1)
    #输入密码
    pw = wd.find_element_by_xpath('//*[@type="password"]')
    pw.send_keys(Keys.CONTROL, 'a')
    pw.send_keys(password)
    time.sleep(1)
    # 点击登录按钮
    login_button = wd.find_element_by_xpath('//*[@node-type="normal_form"]//*[@class="info_list login_btn"]')
    login_button.click()
    time.sleep(1)
    try:
        x_button = wd.find_element_by_xpath('//*[@class="main_txt"]/a')
        x_button.click()
        time.sleep(2)
    except BaseException:
        pass
    element = wd.find_element_by_xpath('//*[@node-type="verifycode_image"]') # 定位验证码图片
    filename = str(random.random()) + '.png'  # 生成随机文件名
    element.screenshot(filename)
    im = Image.open(filename)
    # 转换为灰度图像
    im = im.convert('L')
    im.save(filename)
    # 使用打码平台中提供的方法识别验证码并返回验证码
    data = base64_api('mark123','123456',filename,'3')
    wd.find_element_by_xpath('//*[@action-data="text=请输入验证码"]').send_keys(data)  # 输入验证码
    # 点击登录按钮
    login_button = wd.find_element_by_xpath('//*[@node-type="normal_form"]//*[@class="info_list login_btn"]')
    login_button.click()
    time.sleep(1)
    time.sleep(1000)  # 为了看清登录，等待1000秒
    return 0

if __name__ == '__main__':
    url = 'https://weibo/'
    zhanghao = '你自己的账号'
    password = '你自己的密码'
    get_html(url,zhanghao,password)

第二种

这个和上面差不多，我就不分析了。
首先是获取并保存cookie的代码。唯一要注意的是其中的time.sleep(15)，这个15秒是selenium打开网页后你需要扫码的时长，如果15秒不够你扫码登录的操作的话，可以按自己需求延长。

from selenium import webdriver
from time import sleep
import json
if __name__ == '__main__':
  driver = webdriver.Chrome()
  driver.maximize_window()
  driver.get('https://weibo/login.php')
  sleep(6)
  # driver.switch_to.frame(driver.find_element_by_xpath('//*[@id="anony-reg-new"]/div/div[1]/iframe')) # 切换浏览器标签定位的作用域
  driver.find_element_by_xpath('//*[@id="pl_login_form"]/div/div[1]/div/a[2]').click()
  sleep(15)
  dictCookies = driver.get_cookies() # 获取list的cookies
  jsonCookies = json.dumps(dictCookies) # 转换成字符串保存
  with open('微博_cookies.txt', 'w') as f:
    f.write(jsonCookies)
  print('cookies保存成功！')
  driver.close()
  driver.quit()

然后就是读取保存好的cookie登录微博的代码。

from selenium import webdriver
from time import sleep
import json


def browser_initial():
    browser = webdriver.Chrome()
    browser.maximize_window()
    browser.get(
        'https://weibo/login.php')
    return browser


def log_csdn(browser):
    with open('微博_cookies.txt', 'r', encoding='utf8') as f:
        listCookies = json.loads(f.read())

    # 往browser里添加cookies
    for cookie in listCookies:
        cookie_dict = {
            'domain': '.weibo',
            'name': cookie.get('name'),
            'value': cookie.get('value'),
            "expires": '',
            'path': '/',
            'httpOnly': False,
            'HostOnly': False,
            'Secure': False
        }
        browser.add_cookie(cookie_dict)
    sleep(3)
    browser.refresh()  # 刷新网页,cookies才成功

if __name__ == "__main__":
    browser = browser_initial()
    log_csdn(browser)

总结

第一种方法是不实用的，第二种方法的cookie具有时效性，失效后就要重新获取更新，也不太实用。听其他大佬说还有其他的接口可以单光使用账号密码登录，但我还未去尝试。

本文标签： selenium cookie

版权声明：本文标题：微博自动化登录(selenium+cookie) 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1729734261a1211608.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

微博自动化登录(selenium+cookie)

文章目录

前言

编写代码

1.分析网页

2.编写代码

第一种

第二种

总结

更多相关文章

第 四 周 write up （BJDCTF-2020-Web-Cookie is so subtle! Bugku 蹭网先解开密码 [网鼎杯 2020 青龙组]AreUSerialz nmap）

利用python selenium动态爬取Google play store apks

Cookie连接时报错

调用当前浏览器打开网页（Python+selenium+VScode）

python控制已经打开的浏览器_使用selenium控制已打开的浏览器

selenium 之 控制打开的浏览器

selenium如何控制已打开浏览器

Selenium基础-打开和关闭浏览器

selenium以手机浏览模式打开浏览器

python+selenium自动化不打开浏览器测试

使用selenium浏览百度网页（Python）

python selenium使用百度搜索框搜索的几种方式

python+selenium 跳过验证码

15.网络爬虫—selenium验证码破解

python selenium在浏览器打开一个新窗口

Windows XP32+Python2.7+selenium环境配置

Selenium：设置无头浏览器

Python Selenium环境搭建

【flask】360极速浏览器查看cookie

selenium 酷狗音乐搜索歌曲播放

发表评论

推荐文章

PDF转换成WORD教程及方法资源

AE中Identify查询工具的实现

激活Paragon NTFS的方法有哪些？

新买的Mac，发热严重，耗电快，活动监视器打不开

edge浏览器、网络、Windows太卡、太慢？WiFi、蓝牙、USB共享网络谁更快？

热门文章

mnist数据集下载——mnist数据集提供百度网盘下载地址

外星人Alienware x14笔记本电脑原厂Win11系统，恢复开箱状态预装oem系统包下载

ubantu 黑屏_电脑隔一段时间黑屏

matlab i5 i7,i5性能等于i7?全负荷压力详细测试告诉你

达人评测 i7 12700F和i5 12400F区别 i7 12700F和i5 12400F对比

评测 i7 12650H和i5-12450H选哪个 i712650H和i512450H差多少

Windows10 ls命令

租用的服务器CPU使用率高的原因分析与解决办法

韩国物联网看全球最新趋势：5G为主线，工业物联网成主角，2C应用为新亮点

基于PCQQ协议的Python QQ机器人库

最新文章

解决android studio卡顿，提升studio运行速度

intellij idea在macOS下卡顿的问题解决方法

华为手机打开图片很慢是怎么回事_华为手机相册打开很慢怎么解决？

QtCreator 打开项目巨慢

win10打开plsql-dev输入法卡顿，其他软件运行慢问题---plsql插件CnPlugin_1.5.4兼容性问题

Xcode13模拟器和预览(Preview)导致Mac处理器占用率急剧飙升的解决方法

虚拟机挂起后硬盘响应变慢，SCSI转IDE方法

word打开文档很久很慢_word文档打开速度慢的几个原因和解决方法

Mac使用dd命令速度奇慢的解决方式

解决微信开发工具卡顿的问题

前置机服务器windows系统,前置机和服务器怎么设置连接

matlab第一次启动特别慢,[转载]Matlab启动初始化很慢的解决办法

vue打包上传到服务器加载慢的优化

solidworks重建模型好慢_别再抱怨SolidWorks卡顿了，这个打开模型技巧你可能还不知道！...

MATLABR2019b启动速度慢的解决办法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

第四周 write up （BJDCTF-2020-Web-Cookie is so subtle! Bugku 蹭网先解开密码 [网鼎杯 2020 青龙组]AreUSerialz nmap）

selenium 之控制打开的浏览器

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载