Skip to content
This repository was archived by the owner on Mar 20, 2021. It is now read-only.

Commit 27f93aa

Browse files
committed
Update README.md
1 parent 33a3a8a commit 27f93aa

File tree

1 file changed

+20
-20
lines changed

1 file changed

+20
-20
lines changed

README.md

Lines changed: 20 additions & 20 deletions
Original file line numberDiff line numberDiff line change
@@ -1,24 +1,24 @@
11
# Snoopy-for-Python
2-
翻译自一个强大的PHP采集库
3-
4-
By Doscript
2+
<br>翻译自一个强大的PHP采集库
53

4+
<br>By Doscript
65

6+
*****
77
# PHP版本的解释:
8-
9-
原PHP库,详见
10-
http://sourceforge.net/projects/snoopy/
11-
Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。
12-
Snoopy的特点:
13-
1、抓取网页的内容 fetch
14-
2、抓取网页的文本内容 (去除HTML标签) fetchtext
15-
3、抓取网页的链接,表单 fetchlinks fetchform
16-
4、支持代理主机
17-
5、支持基本的用户名/密码验证
18-
6、支持设置 user_agent, referer(来路), cookies 和 header content(头文件)
19-
7、支持浏览器重定向,并能控制重定向深度
20-
8、能把网页中的链接扩展成高质量的url(默认)
21-
9、提交数据并且获取返回值
22-
10、支持跟踪HTML框架
23-
11、支持重定向的时候传递cookies
24-
要求php4以上就可以了,由于本身是php一个类,无需扩支持,服务器不支持curl时候的最好选择。
8+
<br>
9+
原PHP库,详见<br>
10+
http://sourceforge.net/projects/snoopy/<br>
11+
Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。<br>
12+
Snoopy的特点:<br>
13+
1、抓取网页的内容 fetch<br>
14+
2、抓取网页的文本内容 (去除HTML标签) fetchtext<br>
15+
3、抓取网页的链接,表单 fetchlinks fetchform<br>
16+
4、支持代理主机<br>
17+
5、支持基本的用户名/密码验证<br>
18+
6、支持设置 user_agent, referer(来路), cookies 和 header content(头文件)<br>
19+
7、支持浏览器重定向,并能控制重定向深度<br>
20+
8、能把网页中的链接扩展成高质量的url(默认)<br>
21+
9、提交数据并且获取返回值<br>
22+
10、支持跟踪HTML框架<br>
23+
11、支持重定向的时候传递cookies<br>
24+
要求php4以上就可以了,由于本身是php一个类,无需扩支持,服务器不支持curl时候的最好选择。<br>

0 commit comments

Comments
 (0)