A Simple Distributed Web Crawle

These details have not been verified by PyPI

Project links

Homepage

Project description

simplified-scrapy

simplified scrapy, A Simple Web Crawle

Requirements

Python 2.7, 3.0+
Works on Linux, Windows, Mac OSX, BSD

运行

进入项目根目录，执行下面命令
python start.py

Demo

项目中爬虫例子，在文件夹spiders下，文件名为demoSpider.py。自定义的爬虫类需要继承Spider类

from core.spider import Spider 
class DemoSpider(Spider):

需要给爬虫定义一个名字，配置入口链接地址，与抽取数据用到的模型名称。下面是采集新浪健康资讯数据的一个例子。其中auto_main_2表示抽取相同2级域名的链接，auto_obj表示自动抽取页面中的资讯数据，包括标题、正文和时间。

name = 'demo-spider'
start_urls = ['http://health.sina.com.cn/']
models = ['auto_main_2','auto_obj']

其中模型文件在文件夹models下，如果需要自定义模型，可以使用这个模型工具，下载地址。使用说明在这里

pip安装

pip install simplified-scrapy

例子

Project details

These details have not been verified by PyPI

Project links

Homepage

Release history Release notifications | RSS feed

1.5.165

Feb 2, 2024

1.5.164

Apr 21, 2021

1.5.163

Mar 4, 2021

1.5.162

Jan 27, 2021

1.5.160

Jan 7, 2021

1.5.159

Dec 10, 2020

1.5.157

Nov 5, 2020

1.5.156

Oct 27, 2020

1.5.152

Oct 3, 2020

1.3.147

Aug 9, 2020

1.3.146

Aug 7, 2020

1.3.144

Jul 15, 2020

1.3.142

Jul 9, 2020

1.3.141

Jul 2, 2020

1.2.139

Jun 30, 2020

1.2.138

Jun 19, 2020

1.2.137

May 16, 2020

1.2.136

May 15, 2020

1.2.134

Apr 27, 2020

1.1.129

Apr 22, 2020

1.1.128

Mar 25, 2020

1.1.127

Mar 10, 2020

1.1.126

Mar 8, 2020

1.1.125

Feb 27, 2020

1.1.123

Feb 23, 2020

1.1.122

Feb 18, 2020

1.0.117

Feb 12, 2020

1.0.115

Feb 8, 2020

1.0.112

Feb 6, 2020

1.0.111

Feb 2, 2020

0.9.109

Feb 1, 2020

0.9.106

Jan 28, 2020

0.9.105

Jan 22, 2020

0.9.102

Jan 19, 2020

0.8.100

Jan 17, 2020

0.8.98

Jan 15, 2020

0.8.97

Jan 13, 2020

0.8.96

Jan 10, 2020

0.8.91

Jan 7, 2020

0.7.90

Jan 5, 2020

0.7.89

Jan 4, 2020

0.7.88

Jan 3, 2020

0.7.87

Jan 2, 2020

0.7.84

Dec 31, 2019

0.7.83

Dec 30, 2019

0.7.82

Dec 27, 2019

0.7.81

Dec 26, 2019

0.6.79

Dec 25, 2019

0.6.78

Dec 23, 2019

0.6.76

Dec 19, 2019

0.6.73

Dec 18, 2019

0.6.71

Dec 17, 2019

0.5.66

Dec 16, 2019

0.5.65

Dec 13, 2019

0.5.62

Dec 11, 2019

0.5.61

Dec 10, 2019

0.5.60

Dec 6, 2019

0.4.56

Dec 5, 2019

0.4.55

Dec 4, 2019

0.4.52

Dec 3, 2019

0.4.50

Dec 2, 2019

0.3.43

Nov 29, 2019

0.3.41

Nov 28, 2019

0.2.39

Nov 26, 2019

0.2.37

Nov 22, 2019

0.2.36

Nov 21, 2019

0.2.35

Nov 20, 2019

0.2.33

Nov 18, 2019

0.2.30

Nov 11, 2019

0.1.28

Nov 8, 2019

0.1.27

Nov 6, 2019

0.1.23

Nov 5, 2019

This version

0.1.22

Nov 4, 2019

0.0.17

Oct 31, 2019

0.0.15

Oct 29, 2019

0.0.13

Oct 23, 2019

0.0.11

Oct 22, 2019

0.0.10

Oct 18, 2019

0.0.9

Oct 16, 2019

0.0.8

Oct 12, 2019

0.0.6

Oct 11, 2019

0.0.5

Oct 9, 2019

0.0.4

Sep 30, 2019

0.0.1

Sep 25, 2019

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

simplified_scrapy-0.1.22-py2.py3-none-any.whl (26.7 kB view hashes)

Uploaded Nov 4, 2019 Python 2 Python 3

Hashes for simplified_scrapy-0.1.22-py2.py3-none-any.whl

Hashes for simplified_scrapy-0.1.22-py2.py3-none-any.whl
Algorithm	Hash digest
SHA256	`cea77ebec65764817a079f9a1576a7645bf9f37380229b9efcb3279fcf1a98d1`
MD5	`19bad1dc1e9df8114ea8d37b9bc4335c`
BLAKE2b-256	`1f7601bc37cf93db90be7175c88db8f3f2a4f0211aac20b566eeb60b94b75a00`

simplified-scrapy 0.1.22

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

simplified-scrapy

Requirements

运行

Demo

pip安装

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distributions

Built Distribution