爬虫学的好，牢饭吃得好（爬虫实例）|电子爱好者

admin管理员组
文章数量:1542430

鉴于本人喜欢爬虫，最近看了一些爬虫的基础，几个爬虫入门实例。下面给你们看，大佬勿喷

主要知识点:

1.标题web是如何交互的
2.requests库的get、post函数的应用
3.response对象的相关函数，属性
4.python文件的打开，保存

好，接下来先安装requests库
在pycharm命令行输入

pip install requests

安装好了以后咱先爬个baidu首页

# 爬虫示例,爬取百度页面

import requests #导入爬虫的库，不然调用不了爬虫的函数

response = requests.get("http://www.baidu")  #生成一个response对象

response.encoding = response.apparent_encoding #设置编码格式

print("状态码:"+ str( response.status_code ) ) #打印状态码

print(response.text)#输出爬取的信息

get方法实例

# get方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.get("http://httpbin/get")  #get方法

print( response.status_code ) #状态码

print( response.text )

post方法实例

# post方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.post("http://httpbin/post")  #post方法访问

print( response.status_code ) #状态码

print( response.text )

get传参方法实例

#  get传参方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.get("http://httpbin/get?name=hezhi&age=20")  # get传参

print( response.status_code ) #状态码

print( response.text )

post传参方法实例

#  post传参方法实例

import requests #先导入爬虫的库，不然调用不了爬虫的函数

data = {
	"name":"hezhi",
	"age":20
}
response = requests.post( "http://httpbin/post" , params=data )  # post传参

print( response.status_code ) #状态码

print( response.text )

绕过反爬机制，以zhihu为例


import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.get( "http://www.zhihu")  #第一次访问知乎，不设置头部信息

print( "第一次,不设头部信息,状态码:"+response.status_code )# 没写headers，不能正常爬取，状态码不是 200

#下面是可以正常爬取的区别，更改了User-Agent字段

headers = {

		"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"

}#设置头部信息,伪装浏览器

response = requests.get( "http://www.zhihu" , headers=headers )  #get方法访问,传入headers参数，

print( response.status_code ) # 200！访问成功的状态码

print( response.text )

保存百度图片到本地

#保存百度图片到本地

import requests #先导入爬虫的库，不然调用不了爬虫的函数

response = requests.get("https://www.baidu/img/baidu_jgylogo3.gif")  #get方法的到图片响应

file = open("D:\\爬虫\\baidu_logo.gif","wb") #打开一个文件,wb表示以二进制格式打开一个文件只用于写入

file.write(response.content) #写入文件

file.close()#关闭操作，运行完毕后去你的目录看一眼有没有保存成功

愿你早日成为爬虫大佬

如果大家对Python感兴趣，这套python学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门Python是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：Python激活码+安装包、Python web开发，Python爬虫，Python数据分析，人工智能、机器学习、Python量化交易等习教程。带你从零基础系统性的学好Python！

零基础Python学习资源介绍

① Python所有方向的学习路线图，清楚各个方向要学什么东西

② 600多节Python课程视频，涵盖必备基础、爬虫和数据分析

③ 100多个Python实战案例，含50个超大型项目详解，学习不再是只会理论

④ 20款主流手游迫解爬虫手游逆行迫解教程包

⑤ 爬虫与反爬虫攻防教程包，含15个大型网站迫解

⑥ 爬虫APP逆向实战教程包，含45项绝密技术详解

⑦ 超300本Python电子好书，从入门到高阶应有尽有

⑧ 华为出品独家Python漫画教程，手机也能学习

⑨ 历年互联网企业Python面试真题,复习时非常方便

👉Python学习路线汇总👈

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。（全套教程文末领取哈）

👉Python必备开发工具👈

温馨提示：篇幅有限，已打包文件夹，获取方式在：文末

👉Python学习视频600合集👈

观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

👉实战案例👈

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

👉100道Python练习题👈

检查学习结果。

👉面试刷题👈

资料领取

这份完整版的Python全套学习资料已经上传网盘，朋友们如果需要可以点击下方微信卡片免费领取 ↓↓↓【保证100%免费】

本文标签：爬虫饭吃实例

版权声明：本文标题：爬虫学的好，牢饭吃得好（爬虫实例）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727070054a1096060.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Python 一.开发环境搭建(分布式爬虫打造搜索引擎)

6天前

pycharm的windows安装和使用mysql和navicat的安装和使用vitualenv和vitualenvwrapper的安装和配置 1.pycharm的windows安装和使用进入pycharm官网https:www.j

python爬虫（上）--请求——关于模拟浏览器方法

5天前

前言离上一篇更新的博文应该过了挺久的了（ python爬虫（上）–请求——关于旅游网站的酒店评论爬取（传参方法）），因为中间考完试紧接着就去实习的缘故，然后到新环境各种熟悉什么的，所以后面有所学到的东西就来不及汇总，终于在某个礼拜天的下

云计算 shell脚本实例_让我们了解云计算和一些案例研究

5天前

云计算 shell脚本实例 Hey guys In this article I am going to explain What is cloud Computing, Type of cloud and Going to show yo

dbca 创建实例过程中报错ORA-12547: TNS:lost contact

5天前

aix 6.1的操作系统，在上面安装了oracle 10g，但是在dbca创建实例的时候，总是报出ora-12547：TNS：lo

aws预留实例_aws没有告诉您有关储蓄计划和预留实例的信息

4天前

aws预留实例 AWS has a new Savings Plan that is pitched for Savings Costs for folks who don’t want to make an upfront cost co

初探Azure的保留实例（Reserved Instance）

4天前

最近的Ignite 2017宣布了Azure将在年底推出保留实例（Reserved Instance）。虽然在没有RI的这些年，Azure的EA Monetary Commi

跨浏览器书签导入实例演示，更好的管理书签！

4天前

因为种种原因，我们可能会用到多个浏览器，每个浏览器上都会有一部分我们珍藏的书签，那么，是时候整理一下了，来个书签大集合&#

【爬虫】修改Chrome浏览器的UserAgent

4天前

右键Chrome的快捷方式的属性，修改目标在后面加上下面语句来修改浏览器访问网页时的默认User-Agent（注意最前面要有个空格） --user-agent"要

Android杀毒实现原理及实例

3天前

一个杀毒软甲最核心的部分一个是病毒库一个是杀毒引擎，病毒库从服务器中获得，杀毒引擎实际上是判断程序中的包名和签名是否匹配病毒库中的包名和签名，如果匹配则为病毒&#xf

crawlergo：强大的浏览器爬虫工具

2天前

crawlergo：强大的浏览器爬虫工具 crawlergoA powerful browser crawler for web vulnerability scanners项目地址:https:gitcodeg

springMVC4(10)强大类型转换器实例解析

1天前

在《springMVC4(9)属性编辑器剖析入参类型转换原理》一文中，我们通过分析Sping内置的属性编辑器来理解springMVC是如何完成请求参数到入参的类型的转换的。而在新版本中，SpringMVC使用了新的架构来完成类型转换的工作

python爬虫之获取谷歌浏览器所有cookie

1天前

前言:爬虫大家肯定都不陌生了,但是有的网站就设计了爬虫和反爬虫的措施,下面就介绍一下爬虫的思路先来彻底了解一下cookie(笔记哈) cookie介绍: cookie是保存在客户机中以键值对形式存储的少量信息的文本文件(重点)&am

linux远程登陆忘记密码,Linux免密码远程登录的实例

8小时前

Linux免密码远程登录的实例如何通过一台Linux ssh远程其他linux服务器时，不要输入密码，可以自动登入。提高远程效率，不用记忆各台服务器的密码。 1. 首先登入

python爬虫案例，爬取某站上海租房图片！

3小时前

前言对于一个net开发这爬虫真真的以前没有写过。这段时间开始学习python爬虫，今天周末无聊写了一段代码爬取上海租房图片，其实很简短就是利用爬虫的第三方库Requests与BeautifulS

Python爬虫案例，腾讯动漫爬虫，步骤超详细解释

3小时前

实施步骤 (1) 数据爬取：使用requests请求为基础获取数据源。 (2) UA伪装：模拟浏览器访问网址。 (3) 数据解析：使用xpath语法处理数据。 (4) 数据