首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > Java > 网页爬虫 WebCrawler

网页爬虫 WebCrawler

  • 资源大小:2.20 MB
  • 上传时间:2021-06-30
  • 下载次数:0次
  • 浏览次数:0次
  • 资源积分:1积分
  • 标      签: 爬虫 WebCrawler 网页

资 源 简 介

moved to https://github.com/myshzzx/mlib/tree/master/core/src/main/java/mysh/crawler2 爬虫特点: 1. 插件驱动. 爬虫本身可视作http访问和持久化引擎, 爬虫的目标和数据处理由插件定义. 2. 高并发. 视自己的网络环境自由配置. 3. 持久化支持. 这里使用 MySQL, 要换的同学自行配置. 使用: 配置在 conf/mycrawler.properties 库表定义在 conf/sql.sql 程序入口在 mysh.crawler.core.MyshCrawler

文 件 列 表

MyshCrawler
.classpath
.project
readme.txt
.settings
org.eclipse.core.resources.prefs
conf
log4j.properties
dist
lib
commons-dbcp-1.4.jar
logs
log4j.log
src
mysh
crawler
core
Config.java
test
VIP VIP
0.187163s