这是个在研究linux下如何采集的时候发现的东西,感觉上只要环境带得动,还比较好用。当然前提是需要准备后台采集规则,并且知道这条规则所带的id,将采集器放在任意可以访问到自己网站的windows设备就行了,也是远程的形式。但是值得注意的是,就算你是linux,延迟太大,性能太差也会采集到一半就环境崩掉,做站的时候选择靠谱的服务器商家很重要。
这个软件被称为“杰奇外置采集器”,我暂时不知道是哪个大佬发布的,之前做自己小说网的时候也用了用,感觉还行。速度没有关关采集器快,但是好歹也是linux下稳定的采集方案之一。
如果是windows服务器就千万别用了,1.7版本还好,1.8可以卡出高深莫测的境界。最后这个采集器似乎也只比较适合1.7和1.8,再往高走都不太好。
截图如下:
使用说明(转载):
一.功能特色
本程序是杰奇小说系统的辅助采集器,使用的是杰奇后台采集规则,不像网上其他一些采集器,
还需要重新编写采集规则,杰奇后台的采集规在网上随处都可以下到,并且本程序在所有windows
系统上都可完美使用.本程序可以多开,采集一万本小说,最多使用24小时.并且本程序不会卡死,
可以完美代替杰奇后台和其他采集器.
二.使用方法
1.用户名和密码填写杰奇小说系统后台用户名和密码
2.开始和结束分别填写开始ID和结束ID号,数字,如1,10000
3.网址:写你的杰奇小说网址,不要带http或者https,直接填域名就好
4.规则号:先打开网站文件configsarticlecollectsite.php,找到你需要规则序号,如:
$jieqiCollectsite['23']['name'] = '冷迪小说网';
$jieqiCollectsite['23']['config'] = 'lengdi';
$jieqiCollectsite['23']['url'] = 'www.lengdi.com';
$jieqiCollectsite['23']['subarticleid'] = 'floor($articleid / 1000)';
$jieqiCollectsite['23']['enable'] = '1';
其中23就是规则号,填入第1个框中,第2个框可以填写该规则号的对应的标识,如:冷迪小说网,随便写
5.超时:填写100-600间的数字,单位是秒,这个主要防止采集卡死
6.顺序:选正或负随你,一个代表正序采集,一个代表倒序采集
7.循环采集:选中后,采集完成后会重新从开始ID采集
8.屏蔽列表:可以填写你要屏蔽目标站的小说,按ID号屏蔽,这个列表也可以为空
9.返回代码:可以查看当前采集状态
10.点击开始按钮就可以了
11.关于多开:新建多个文件夹,把本程序copy到每个文件中,分别配置,就能实现多开
下载地址(如果失效,就评论说明):点击进入
密码:uwl4
能支持2.4吗
站长有没有什么好的采集器推荐啊?付费的也行啊,哎。要是有生成wap的html功能就好了,找了好多都找不到。。
@ty
网上很多模板的wap是插件形式,不是官方原程序,自然不太好生成html啊,所以我也没什么推荐
我自己玩小说站,还没用过外置的采集器,都是杰奇后台自己采,有时间有心情就更新,根本不追求及时同步。
@奇侠一枝梅
自己玩玩就简单的后台采集其实还行,不过这个工具主要也是方便