Skip to content

liinnux/ghost-login

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

39 Commits
 
 
 
 
 
 

Repository files navigation

#Ghost-login


  • 专门用来解决爬虫采集相关网站数据时模拟登录,验证码自动识别的问题;欢迎加入一起开发完善。
  • Specifically designed to solve the crawler when collecting Internet web data who need to login the web-site by useing some Simulated ways. The Ghost-login will verificate the captcha code automatically; Welcome to join in together to develop and improve it.

#主要基于以下第三方lib及技术

##模拟登录一些常见的网站Done

  1. 百度(已实现)
  2. QQ微博 (已实现)
  3. 知乎(已实现)
  4. 京东(已实现)
  5. 新浪微博 (已经实现)
  6. 新浪邮箱(待实现)
  7. QQ邮箱(待实现)
  8. 豆瓣(待实现)
  9. 淘宝(还有点问题)
  10. 支付宝(还有点问题)

##Todolist 0. 重构代码,增加可扩展性

  1. 增加简单验证码识别模块;
  2. 重新组织文件结构和代码风格;
  3. 增加可扩展性,方便添加新的功能;

tips of pull request

欢迎大家一起来 pull request

  1. 兼容JDK1.8版本;
  2. 自动模拟登录新的网;
  3. 改进bug, 完善代码;
  4. 增加新的模拟自动登录的方法;

something to add

  1. 网站的前端更新、验证、变化较快,若不能用了请及时告知,我会定期修改完善,同时热烈欢迎有兴趣的加入我们。
  2. 接下来最重要的是重构代码,让大家可以更容易的做出一些满足个性需求的功能。
  3. 如果你觉得某个网站的登录很有代表性,欢迎在 issue 中提出,如果你感觉网站的模拟自动登录很有意思,加入我们吧。
  4. 验证码的识别模块还有待完善...

除责申明

  1. 本开源项目仅为技术交流此一目的,严禁用于其他任何商业、违法犯罪、恶意攻击等行为;
  2. 若第三者用此项目侵犯相关网站权益,一切责任自负;
  3. 若本项目侵犯相关网站、个人,组织机构权益,请及时联系;

使用帮助

交流讨论

  1. 开源网络爬虫QQ交流群:322937592
  2. email address: liinux at qq.com

About

Specifically designed to solve the web crawler when collecting Internet web data who need to login the web-site by useing some Simulated ways.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages