This repository was archived by the owner on Mar 20, 2021. It is now read-only.
File tree Expand file tree Collapse file tree 1 file changed +20
-20
lines changed Expand file tree Collapse file tree 1 file changed +20
-20
lines changed Original file line number Diff line number Diff line change 1
1
# Snoopy-for-Python
2
- 翻译自一个强大的PHP采集库
3
-
4
- By Doscript
2
+ <br >翻译自一个强大的PHP采集库
5
3
4
+ <br >By Doscript
6
5
6
+ *****
7
7
# PHP版本的解释:
8
-
9
- 原PHP库,详见
10
- http://sourceforge.net/projects/snoopy/
11
- Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。
12
- Snoopy的特点:
13
- 1、抓取网页的内容 fetch
14
- 2、抓取网页的文本内容 (去除HTML标签) fetchtext
15
- 3、抓取网页的链接,表单 fetchlinks fetchform
16
- 4、支持代理主机
17
- 5、支持基本的用户名/密码验证
18
- 6、支持设置 user_agent, referer(来路), cookies 和 header content(头文件)
19
- 7、支持浏览器重定向,并能控制重定向深度
20
- 8、能把网页中的链接扩展成高质量的url(默认)
21
- 9、提交数据并且获取返回值
22
- 10、支持跟踪HTML框架
23
- 11、支持重定向的时候传递cookies
24
- 要求php4以上就可以了,由于本身是php一个类,无需扩支持,服务器不支持curl时候的最好选择。
8
+ < br >
9
+ 原PHP库,详见< br >
10
+ http://sourceforge.net/projects/snoopy/ < br >
11
+ Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。< br >
12
+ Snoopy的特点:< br >
13
+ 1、抓取网页的内容 fetch< br >
14
+ 2、抓取网页的文本内容 (去除HTML标签) fetchtext< br >
15
+ 3、抓取网页的链接,表单 fetchlinks fetchform< br >
16
+ 4、支持代理主机< br >
17
+ 5、支持基本的用户名/密码验证< br >
18
+ 6、支持设置 user_agent, referer(来路), cookies 和 header content(头文件)< br >
19
+ 7、支持浏览器重定向,并能控制重定向深度< br >
20
+ 8、能把网页中的链接扩展成高质量的url(默认)< br >
21
+ 9、提交数据并且获取返回值< br >
22
+ 10、支持跟踪HTML框架< br >
23
+ 11、支持重定向的时候传递cookies< br >
24
+ 要求php4以上就可以了,由于本身是php一个类,无需扩支持,服务器不支持curl时候的最好选择。< br >
You can’t perform that action at this time.
0 commit comments