通过爬虫实现百度在线翻译|电子爱好者

admin管理员组
文章数量:1643657

使用post请求:

我们一般使用requests中的post请求会基于以下情况:
1.模仿浏览器进行登录注册
2.需要传输大文本数据时(post请求不限制数据长度)
使用requests模块实现爬虫:requests.post(url=post_url,data=data)

寻找url与js数据:

一、实现英文–>中文的翻译：

# coding=utf-8
import requests

headers = {
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36"}
data = {
    "from":"en",
    "to":"zh",
    "query":"hola",
    "transtype":"translang",
    "simple_means_flag":"3",
    "sign":"372549.85108",
    "token":"e89a8f037aac1b51a86cbc82356949d"
}
post_url = "http://fanyi.baidu/v2transapi"

r = requests.post(post_url,data=data,headers=headers)
print(r.content.decode())

此时，执行代码会返回：
{“error”:997,”from”:”en”,……}
分析检查界面中的headers会发现，sign这个值会随着输入内容不同改变(也就是js动态生成的.),因此我们考虑将网页版改为手机版浏览。

手机版代码与电脑版代码区别仅为url的不同,下面是手机版的爬虫代码。

# coding=utf-8
import requests
import json
import sys

query_string = sys.argv[1]

headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.1.1; Nexus 6 Build/LYZ28E) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Mobile Safari/537.36"}

post_data = {
    "query":query_string,
    "from":"zh",
    "to":"en",
}

post_url = "http://fanyi.baidu/basetrans"

r = requests.post(post_url,data=post_data,headers=headers)
# print(r.content.decode())
dict_ret = json.loads(r.content.decode())
ret = dict_ret["trans"][0]["dst"]
print("result is :",ret)

二、实现自动检测语言的功能:

# coding=utf-8
import requests
import json
import sys

class BaiduFanyi:
    def __init__(self,trans_str):
        self.trans_str = trans_str
        self.lang_detect_url = "http://fanyi.baidu/langdetect"
        self.trans_url = "http://fanyi.baidu/basetrans"
        self.headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 5.1.1; Nexus 6 Build/LYZ28E) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Mobile Safari/537.36"}

    def parse_url(self,url,data): #发送post请求，获取响应
        response = requests.post(url,data=data,headers=self.headers)
        return json.loads(response.content.decode())

    def get_ret(self,dict_response):#提取翻译的结果
        ret = dict_response["trans"][0]["dst"]
        print("result is :",ret)


    def run(self):#实现主要逻辑
        #1.获取语言类型
            #1.1 准备post的url地址，post_data
        lang_detect_data = {"query":self.trans_str}
            #1.2 发送post请求，获取响应
        lang = self.parse_url(self.lang_detect_url,lang_detect_data)["lan"]
            #1.3 提取语言类型
        #2.准备post的数据
        trans_data = {"query":self.trans_str,"from":"zh","to":"en"} if lang== "zh" else \
            {"query":self.trans_str,"from":"en","to":"zh"}
        #3.发送请求，获取响应
        dict_response = self.parse_url(self.trans_url,trans_data)
        #4.提取翻译的结果
        self.get_ret(dict_response)


if __name__ == '__main__':
    trans_str= sys.argv[1]
    baidu_fanyi = BaiduFanyi(trans_str)
    baidu_fanyi.run()

本文标签：爬虫在线翻译

版权声明：本文标题：通过爬虫实现百度在线翻译内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1725599628a1032305.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Python爬虫爬取Google Play 100万个App的数据，并入库到数据库 scrapy框架

10天前

代码目录结构相关文件代码 google.py爬虫主要代码 # -*- coding: utf-8 -*- import scrapy from scrapy.spiders import CrawlSpider, Rule from sc

python中主流爬虫框架_python爬虫的十大框架

10天前

python爬虫的十大框架： 一、Scrapy Scrapy框架是一套比较成熟的Python爬虫框架，是使用Python开发的快速、高层次的信息爬取框架，可以高效的爬取web

python网络爬虫--浏览器伪装

7天前

一.爬虫前言在我们爬取一些网页的时候可能会失败，因为这写网站为了防止恶意爬虫的访问，会设置一些爬虫机制，常见的爬虫机有：（1）通过分析用户请求的Headers信息进行反爬虫（2）通过检测用户行为进行爬虫，比如通过

selenium 反爬虫之跳过淘宝滑块验证！首先要搞定JS！

7天前

在处理问题的之前，给大家个第一个锦囊！ 你需要将chorme更新到最新版版本84，下载对应的chorme驱动驱动地址注意划重点！&#

Python网络爬虫模拟登录与验证解析

7天前

内容导读使用Selenium模拟登录使用Cookies登录网站模拟表单登录网站爬虫识别简单的验证码实例解析一、使用Selenium模拟登录 1、为什么要模拟登录在互联网上存在大量需要登录才能访问的网站&

python爬虫另辟蹊径绕过企查查的登录验证，我太冇财了

7天前

从企查查爬取企业信息，如果没有登录直接检索，邮箱、电话都被隐藏了点击详情，部分信息同样会被隐藏毕竟只是打工的，没钱不能任性！

爬虫实战6：爬取英雄联盟官网五个位置的综合排行榜保存到excel

6天前

申明：资料来源于网络及书本，通过理解、实践、整理成学习笔记。文章目录英雄联盟官网获取一个位置的综合排行榜所有数据（上单为例）获取所有位置的综合排行

Python爬虫之selenium爬取英雄联盟官网英雄皮肤图片下载到本地和保存到数据库

6天前

从英雄联盟皮肤网站的网页源代码中获取不到英雄的皮肤地址通过selenium可以轻松获取想要的内容源码展示 from selenium import webdriverfrom time import sleepfrom pyqu

Python爬虫：英雄联盟近期战绩查询

6天前

c语言选手早已听说Python的方便和其各大爬虫模块的实用性，于是暑假无所事事的我决定在没有系统学习Python语法的情况下，一边写一个和自己兴趣有关的爬虫，一边学习一下Py

python爬虫————获取英雄联盟所有皮肤原画

6天前

第一步先获取皮肤的url的地址：在英雄联盟官网资料库中，随便打开一个英雄的详细信息页面查看源码可以看得到url是有规律的就是一个英雄的每个皮肤的的url都是https:game.gtimgimageslolactimgsk

英雄联盟拳头公司个人开发API如何注册获取 - Web-scraping爬虫

6天前

准备工作需要这下面两项东西： 美服lol账号(欧服没准也可以。。。不太清楚，大家可以试一试）如果在国内需要 vpn 创建账号登录进入拳头开发api官网&

python爬虫脚本初级入门爬虫英雄联盟所有皮肤_Python爬虫练习：20行Python代码爬取王者荣耀全英雄皮肤...

6天前

引言王者荣耀大家都玩过吧，没玩过的也应该听说过，作为时下最火的手机MOBA游戏，咳咳，好像跑题了。我们今天的重点是爬取王者荣耀所有英雄的所有皮肤&

【Python爬虫系列教程 18-100】Python网络爬虫实战：小姐姐手把手教你爬取并下载英雄联盟所有英雄皮肤高清大图

6天前

文章目录前言一、分析页面二、分析第二个页面三、代码四、下载结果前言上次教你怎么爬取王者荣耀，今天小姐姐教你使用几十行代码下载英雄联盟所有皮肤，你看我下载的九尾妖狐。一、分析页面首先我们先去英雄联盟资料站官网，地址是https:

使用爬虫框架scrapy爬取LOL英雄数据

6天前

Scrapy框架实战爬取目标：英雄联盟所有英雄的基本信息(名字，背景故事，技能名称及介绍)、下载所有英雄的皮肤并保存至本地首先来到LOL官网首页&#xff0c

LPL比赛数据可视化，完成这个项目，用尽了我的所有Python知识_lol英雄信息爬虫数据可视化

6天前

代码过多，请到源码中查看 Echarts部分小总结 Echarts部分不是很难，直接到Echarts官网实例中找你想要的图表，然后复制代码，修改图表的

Python爬虫实战 | 利用多线程爬取 LOL 高清壁纸

6天前

来源：公众号【杰哥的IT之旅】作者：阿拉斯加 ID：Jake_Internet 如需获取本文完整代码及 LOL 壁纸，请为本文右下角点赞并添加杰哥微信

python爬虫获取华为应用商店app信息

5天前

最近项目需要几个品牌手机应用商店上app的一些数据，所以就上网找了一些爬虫的文章，一边学一边做，把方法记录下来，方便以后查看。代码具体功能是爬取华为应

Python爬虫教程-10-UserAgent和常见浏览器UA值

4天前

Python爬虫教程-10-UserAgent和常见浏览器UA值有时候使用爬虫会被网站封了IP，所以需要去模拟浏览器，隐藏用户身份， UserAgent 包含浏览器信

python打开qq并登录_python爬虫入门之qq登陆初探

2天前

不得不承认：这篇文章的方法有些小猥琐。作为一个非专业人士，qq登陆这件事困扰我很长时间。在没有头绪满头乱撞的时候，无意间我发现了一件大杀器：splin

爬虫--破解验证码的几种方式

1天前

1.使用selenium 手动输入 2.使用打码平台(超级鹰http:www.chaojiyingprice.html)推荐 3.机器学习去第三方打码平台注册账号(超级鹰),拿到Python的接口压缩包 #!usrbine

电子爱好者 - 最新技术资讯及电子产品介绍！

通过爬虫实现百度在线翻译

使用post请求:

寻找url与js数据:

一、 实现英文–>中文的翻译：

二、实现自动检测语言的功能:

更多相关文章

Python爬虫爬取Google Play 100万个App的数据，并入库到数据库 scrapy框架

python中主流爬虫框架_python爬虫的十大框架

python网络爬虫--浏览器伪装

selenium 反爬虫之跳过淘宝滑块验证！首先要搞定JS！

Python网络爬虫模拟登录与验证解析

python爬虫另辟蹊径绕过企查查的登录验证，我太冇财了

爬虫实战6：爬取英雄联盟官网五个位置的综合排行榜保存到excel

Python爬虫之selenium爬取英雄联盟官网英雄皮肤图片下载到本地和保存到数据库

Python爬虫：英雄联盟近期战绩查询

python爬虫————获取英雄联盟所有皮肤原画

英雄联盟拳头公司个人开发API如何注册获取 - Web-scraping爬虫

python爬虫脚本 初级入门爬虫英雄联盟所有皮肤_Python爬虫练习：20行Python代码爬取王者荣耀全英雄皮肤...

【Python爬虫系列教程 18-100】Python网络爬虫实战：小姐姐手把手教你爬取并下载英雄联盟所有英雄皮肤高清大图

使用爬虫框架scrapy爬取LOL英雄数据

LPL比赛数据可视化，完成这个项目，用尽了我的所有Python知识_lol英雄信息爬虫数据可视化

Python爬虫实战 | 利用多线程爬取 LOL 高清壁纸

python爬虫 获取华为应用商店app信息

Python爬虫教程-10-UserAgent和常见浏览器UA值

python打开qq并登录_python爬虫入门之qq登陆初探

爬虫--破解验证码的几种方式

发表评论

推荐文章

html egg mac os 10.7,10.7、10.8 MAC OS原版通用安装教程

【opencv-mobile】cannot use ‘try‘ with exceptions disabled

执行curl安装命令时候提示：https not supported or disabled in libcurl

VSCode Markdown PDF 导出成 PDF 报 phantomjs binary does not exist 错误的解决办法

关于win11内存占用高的相关解决办法

热门文章

ubuntu 或者虚拟机连接u盘

java给Excel文件加密（非只读加密打开文件的加密）希望能够给大家点帮助。

ansible常用模块详细整理（批量管理模块功能）

macbook卡在进度条开不了机_苹果电脑开机一直停留在加载进度条当中是怎么回事...

【Material-UI】Drawer中的 Permanent Drawer 详解

firewalld开放oracle端口

步步深入：Photoshop CS6数码照片处理完全学习手册

win11桌面一直刷新闪屏无法操作怎么办？快速排查并修复Win11中的屏幕闪烁问题

Google谷歌搜索引擎登录网站 - Blog透视镜

阿里成立达摩院 1000 亿投研发，马云称达摩要比阿里活得长

最新文章

无法创建在程序集“SimpleChart, Version=1.0.0.0, Culture=neutral, PublicKeyToken=null”中定义的“ChartPlayGround”的实例

未能加载文件或程序集Office, Version=2.2.0.0, Culture=neutral, PublicKeyToken=null或它的某一个依赖项。找到的程序集清单定义与程序集引用不匹配...

创建MVC项目，提示NuGet.visualStudio.Interop,Version=1.0.0.0,Culture=neutral,PublickeyToken=b03f5f711d50a3a&quot;

Do you feel like we do? Stanford psychologists examine how culture can guide giving

类型“DbSet&lt;&gt;”在未引用的程序集中定义。必须添加对程序集“EntityFramework, Version=5.0.0.0, Culture=neutral, PublicKeyToken=b7

ArcGIS engine C#开发出现未能加载程序集“ESRI.ArcGIS.Controls, Version=10.0.0.0, Culture=neutral, PublicKeyToken=

未能加载文件或程序集&quot;System.Data,Version=2.0.0.0,Culture=neu

未能加载文件或程序集“System.Web.Extensions, Version=4.0.0.0, Culture=neutral, PublicKeyToken=31bf3856ad364e35”...

未能加载文件或程序集“System.Web.Mvc, Version=4.0.0.0, Culture=neutral, PublicKeyToken=31bf3856ad364e35”或它的某一个依

关于SQLite中“其他信息: 未能加载文件或程序集“System.Data.SQLite, Version=1.0.81.0, Culture=neutral, PublicKeyToken=db“

未能加载文件或程序集“Newtonsoft.Json, Version=6.0.0.0, Culture=neutral, PublicKeyToken=30ad4fe6b2a6aeed”或它的某一个...

未能加载文件或程序集“MySql.Web, Version=6.7.4.0, Culture=neutral, PublicKeyToken=c5687fc88969c44d”或它的某一个依赖项。系

未能加载文件或程序集“RSSharePointSoapProxy, Version=11.0.0.0, Culture=neutral, PublicKeyToken=89845dcd8080cc91...

未能加载文件或程序集“log4net, Version=1.2.10.0, Culture=neutral, PublicKeyToken=1b44e1d426115821”或它的某一个依赖项。系统找...

“未能加载文件或程序集“EntityFramework, Version=6.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089”...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

一、实现英文–>中文的翻译：

python爬虫脚本初级入门爬虫英雄联盟所有皮肤_Python爬虫练习：20行Python代码爬取王者荣耀全英雄皮肤...

python爬虫获取华为应用商店app信息

创建MVC项目，提示NuGet.visualStudio.Interop,Version=1.0.0.0,Culture=neutral,PublickeyToken=b03f5f711d50a3a"

类型“DbSet<>”在未引用的程序集中定义。必须添加对程序集“EntityFramework, Version=5.0.0.0, Culture=neutral, PublicKeyToken=b7

未能加载文件或程序集"System.Data,Version=2.0.0.0,Culture=neu

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载