mac 环境下 Scrapy 入门|电子爱好者

admin管理员组
文章数量:1532286

文章目录

- 安装
- 步骤
- - 新建爬虫项目 - scrapy startproject
  - 明确数据目标 - disease/items.py
  - 制作网页爬虫 - spiders/MedicaldataSpider.py
  - - - 创建爬虫
      - 配置爬虫
      - 取数据
      - 提取其他信息
      - 保存数据

安装

sudo pip install scrapy

python3环境配置

步骤

新建爬虫项目（scrapy startproject name)
明确数据目标（编写 items.py）
制作网页爬虫（spiders/xxspider.py）
存储爬取内容（pipelines.py）

新建爬虫项目 - scrapy startproject

终端进入项目目录

scrapy startproject spiderName
spiderName - 项目名称

系统创建一个 spiderName 文件夹，目录结构：

spiderName/
    scrapy.cfg                项目配置文件
    spiderName/               Python模块 - 从这里引用代码
        __init__.py
        items.py              目标文件
        pipelines.py
        settings.py           设置文件
        spiders/              存储爬虫代码目录
            __init__.py
            ...

明确数据目标 - disease/items.py

目标：抓取 http://yao.xywy/class/4-0-0-1-0-1.htm 网站里的药品的名称、生产公司和功能主治

打开 disease 目录下的 items.py

Item 定义结构化数据字段，用来保存爬取到的数据
scrapy.Item 创建一个类
scrapy.Field 定义类型类属性

创建一个 MedicaldataItem 类，构建 item 模型

import scrapy

class MedicaldataItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    name = scrapy.Field()  # 药品名称
    company = scrapy.Field()  # 生产公司
    function = scrapy.Field()  # 功能主治

制作网页爬虫 - spiders/MedicaldataSpider.py

爬虫功能 : 爬 => 取

创建爬虫

创建一个名为Medicaldata的爬虫，并指定爬取域的范围：
cd disease

scrapy genspider Medicaldata "http://yao.xywy"

打开 dise

本文标签：入门环境 Mac scrapy

版权声明：本文标题：mac 环境下 Scrapy 入门内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1724840719a993208.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

2021最新IDEA初级入门详细教程流出，开发组小伙伴怒赞

15小时前

本次安装的 IntelliJ IDEA 版本：2020.2 (当前最新版本，2020.07.28发布的202.6397.94版) 官方推荐的安装条件（指当前你手里电脑的配置&

苹果mac电脑查看已连接到的wifi密码

10小时前

平常在家的时候，电脑、手机都是自动记住密码的，但是当朋友来家里做客，问起密码的时候，自己久了没有连接也会忘记，进入路由器查看又太麻

基于8266WIFI模块实现智能手机与51单片机的通信入门

10小时前

1芯片及电路的介绍 1.18266WIFI模块在文章的最开始我们首先要介绍今天的主角，8266WIFI模块。这是一个非常好用的模块，其他的废话不在多说，我们直接上干货.

WIFI环境下支付安全问题探析

9小时前

1 引言　　　　曾还记得，在2016年的“3·15晚会”上，央视曝光了利用“免费”WiFi进行钓鱼和诈骗的行为，告诫广大用户谨慎连接公共场所免费WiFi,防止个人信息被盗，个人利益损失。相关部门表示，在公共场所使用WiFi时一定要谨慎注

Mac电脑硬盘无法读取怎么办 Mac硬盘读取慢会导致电脑卡吗

7小时前

Mac电脑作为众多用户的工作与生活伙伴，其稳定性和效率至关重要。然而，当遭遇硬盘无法读取或读取速度缓慢的问题时，这无疑会给用户带来极大的不便，影响日常操

mac如何检测移动硬盘 mac硬盘检测工具 Tuxera怎么用 Tuxera NTFS官网

6小时前

在工作学习中，我们都绕不开用移动硬盘来拷贝存储一些文件。但是在使用过程中，我们经常遇到“mac检测不到移动硬盘”“移动硬盘不存在”等问题，今天本文就带大家了解下mac如何检测

Mac移动硬盘直接拔掉后，再插上无法显示的解决办法

6小时前

使用mac的时直接拔掉外接移动硬盘，再插上移动硬盘的时候，桌面无法移动硬盘，解决方法如下： 输入如下命令查看硬盘信息: diskutil list输

直接拔掉Mac移动硬盘所造成的无法识别问题

6小时前

背景博主在一次使用自己的 Mac 的时候，由于赶时间，在卸载外接移动硬盘时，没有在访达里点击「推出」，而是直接拔掉了，结果在下

移动硬盘异常拔出后，mac上无法识别的问题

6小时前

移动硬盘在windows上使用，结果意外跌落断开连接，结果再插在mac上时，发现无法识别，一开始以为是端口问题，结果换完所有的端口

苹果Mac 无法读写NTFS格式的U盘或移动硬盘？一次解决

6小时前

Mac 默认只能读取NTFS 格式的U盘或移动硬盘，因为写入权限被隐藏封闭了。所以我们只要开启它就可以了。通过下面的办法你就可以轻松的为你的U盘或移动硬盘开启写入权限。（也就是说你可以把文件从你的

硬盘 mac 读取

6小时前

问题：mac读取不了硬盘解决：移动硬盘在Mac苹果电脑上使用需要如下操作方法1：在Mac上的Launchpad→其他（实用工具&#xff09

Mac:解决移动硬盘异常退出后无法识别

6小时前

** 如果仅仅使用电脑进行传输数据，格式化硬盘，选择macOS和Windows通用支持的格式：exFAT。分配单元大小保持系统默认：虽然分配单元越小

MAC移动硬盘的坑

6小时前

移动硬盘：TOSHIBA 问题： 发现兼容性问题， ·APFS：优点：可靠，安全。对配合苹果电脑使用友

mac电脑将移动硬盘改为可读写

6小时前

1.mac电脑支持的硬盘格式主要为EXFAT和MS-FAT格式，查看本机的硬盘格式步骤点击电脑左上角的苹果图标点击关于本机打开系统报告找到存储项查看文件系统格式按照下图顺序依次查看 2.实际操作来修改将移动硬盘接入电脑，桌面显示移动

Mac通过type-c接口无法识别移动硬盘

6小时前

最近买了一块移动硬盘以及硬盘盒连接到Mac上来使用，最近发现了一个问题，就是当我使用完后将硬盘推出第二天再次连接上的时候硬盘不能被识别了，连硬盘和上的数据指示灯也不会亮&am

在window环境下面virtualbox加载移动硬盘里创建好的虚拟机

6小时前

1. 移动硬盘上面的虚拟机我们需要在virtualbox里面加载.vdi文件的数据，由于自己笔记本的磁盘容量太小了，所以把创建的虚拟机移动到了移动硬盘上面。 2现在我想要把移动硬盘上面的虚拟机

mac支持fat32格式吗 mac支持什么格式的移动硬盘

6小时前

大家在购买Mac电脑前，需提前了解Mac系统的一些注意事项，Mac系统并不是支持任意一种格式的外接U盘或硬盘，Mac对于外接硬盘设备，有自己支持的固定格

搭建qnx开发环境，虚拟qnx系统+虚拟win7系统+QNX Momentics IDE 4.6

3小时前

1、准备说明 VMware Workstation (Pro)win7虚拟机（可参考win7虚拟机详细搭建过程）qnx虚拟机（QNXNeutrino650Target&am

ChatGPT从入门到精通（116页）

1小时前

本书从⼊⻔到精通，介绍了ChatGPT的基础知识、实现⽅法、进阶应⽤以及最新进展等多个⽅⾯。同时，本书的全部内容均是由ChatGPT完成，展现了ChatGPT强⼤的能⼒和⼴阔

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域

1小时前

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域 1. 背景介绍 1.1 问题的由来自然语言处理(Natural Language Processing, NLP)是人工智能(Artifi

电子爱好者 - 最新技术资讯及电子产品介绍！

mac 环境下 Scrapy 入门

文章目录

安装

步骤

新建爬虫项目 - scrapy startproject

明确数据目标 - disease/items.py

制作网页爬虫 - spiders/MedicaldataSpider.py

创建爬虫

更多相关文章

2021最新IDEA初级入门详细教程流出，开发组小伙伴怒赞

苹果mac电脑查看已连接到的wifi密码

基于8266WIFI模块实现智能手机与51单片机的通信入门

WIFI环境下支付安全问题探析

Mac电脑硬盘无法读取怎么办 Mac硬盘读取慢会导致电脑卡吗

mac如何检测移动硬盘 mac硬盘检测工具 Tuxera怎么用 Tuxera NTFS官网

Mac移动硬盘直接拔掉后，再插上无法显示的解决办法

直接拔掉Mac移动硬盘所造成的无法识别问题

移动硬盘异常拔出后，mac上无法识别的问题

苹果Mac 无法读写NTFS格式的U盘或移动硬盘？一次解决

硬盘 mac 读取

Mac:解决移动硬盘异常退出后无法识别

MAC移动硬盘的坑

mac电脑将移动硬盘改为可读写

Mac通过type-c接口无法识别移动硬盘

在window环境下面virtualbox加载移动硬盘里创建好的虚拟机

mac支持fat32格式吗 mac支持什么格式的移动硬盘

搭建qnx开发环境，虚拟qnx系统+虚拟win7系统+QNX Momentics IDE 4.6

ChatGPT从入门到精通（116页）

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域

发表评论

推荐文章

chrome浏览器背景色更改

电商项目相关面试问题及答案

移动硬盘在macos上可被识别，在win10无法显示盘符

苹果笔记本装win7_m2 ngff无线网卡接口的笔记本电脑装苹果网卡

ChatGPT润色论文高阶技巧（附17个顶级提示词指令）

热门文章

添加应用的快捷入口

测试（总结）

AMD启用虚拟化（AMD-V）

The requested image‘s platform (linuxarm64v8) does not match the detected host platform (linuxamd

dpdk 问题分析：amd 设备运行 dpdk 程序时报接口无法初始化问题

ubuntu-20.04-desktop-amd64.iso下载rufus-3.10.exe下载

Win10 环境下安装Ubuntu 18.04过程记录

搜狗拼音输入法皮肤设置【笔记】

wifi 路由 dns 被劫持 手机 电脑 打开后弹出一些广告窗口

chatgpt应用链接

最新文章

计算机初级证书 英语怎么说,常见职业资格证书英文翻译（含英语、计算机等）...

统考英语和计算机作弊,统考英语-大学英语b网络统考作弊?

高效翻译工具GPT插件的使用教程

【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码（一）

学术英语理工（第二版）Unit2课文翻译

常见英语人名及其音标和中文翻译

利用Python爬取翻译网站的翻译功能

学术英语理工（第二版）Unit4课文翻译

python爬虫入门——13行代码制作英语翻译器教程，小白入门一点通

全新版大学英语综合教程第四册学习笔记（原文及全文翻译）——8A - In the Jungle（在丛林中）

SAP顾问英语自学的免费且有效的方法汇总！--一文搞定英语学习

学术英语理工（第二版）Unit3课文翻译

2016-2020英语四级翻译汇总

学术英语理工（第二版）Unit6课文翻译

这学期她选修了英语 计算机 驾驶三门课程,大一英语翻译答案

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

wifi 路由 dns 被劫持手机电脑打开后弹出一些广告窗口

计算机初级证书英语怎么说,常见职业资格证书英文翻译（含英语、计算机等）...

这学期她选修了英语计算机驾驶三门课程,大一英语翻译答案

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载