杰奇外置采集器,多线程调用后台采集

2018-03-28T10:22:00

这是个在研究linux下如何采集的时候发现的东西,感觉上只要环境带得动,还比较好用。当然前提是需要准备后台采集规则,并且知道这条规则所带的id,将采集器放在任意可以访问到自己网站的windows设备就行了,也是远程的形式。但是值得注意的是,就算你是linux,延迟太大,性能太差也会采集到一半就环境崩掉,做站的时候选择靠谱的服务器商家很重要。
这个软件被称为“杰奇外置采集器”,我暂时不知道是哪个大佬发布的,之前做自己小说网的时候也用了用,感觉还行。速度没有关关采集器快,但是好歹也是linux下稳定的采集方案之一。
如果是windows服务器就千万别用了,1.7版本还好,1.8可以卡出高深莫测的境界。最后这个采集器似乎也只比较适合1.7和1.8,再往高走都不太好。

截图如下:

使用说明(转载):

一.功能特色
本程序是杰奇小说系统的辅助采集器,使用的是杰奇后台采集规则,不像网上其他一些采集器,
还需要重新编写采集规则,杰奇后台的采集规在网上随处都可以下到,并且本程序在所有windows
系统上都可完美使用.本程序可以多开,采集一万本小说,最多使用24小时.并且本程序不会卡死,
可以完美代替杰奇后台和其他采集器.

二.使用方法
1.用户名和密码填写杰奇小说系统后台用户名和密码
2.开始和结束分别填写开始ID和结束ID号,数字,如1,10000
3.网址:写你的杰奇小说网址,不要带http或者https,直接填域名就好
4.规则号:先打开网站文件configsarticlecollectsite.php,找到你需要规则序号,如:

$jieqiCollectsite['23']['name'] = '冷迪小说网';
$jieqiCollectsite['23']['config'] = 'lengdi';
$jieqiCollectsite['23']['url'] = 'www.lengdi.com';
$jieqiCollectsite['23']['subarticleid'] = 'floor($articleid / 1000)';
$jieqiCollectsite['23']['enable'] = '1';

其中23就是规则号,填入第1个框中,第2个框可以填写该规则号的对应的标识,如:冷迪小说网,随便写
5.超时:填写100-600间的数字,单位是秒,这个主要防止采集卡死
6.顺序:选正或负随你,一个代表正序采集,一个代表倒序采集
7.循环采集:选中后,采集完成后会重新从开始ID采集
8.屏蔽列表:可以填写你要屏蔽目标站的小说,按ID号屏蔽,这个列表也可以为空
9.返回代码:可以查看当前采集状态
10.点击开始按钮就可以了
11.关于多开:新建多个文件夹,把本程序copy到每个文件中,分别配置,就能实现多开

下载地址(如果失效,就评论说明):点击进入
密码:uwl4

当前页面是本站的「Baidu MIP」版。发表评论请点击:完整版 »