杰奇外置采集器,多线程调用后台采集

这是个在研究linux下如何采集的时候发现的东西,感觉上只要环境带得动,还比较好用。当然前提是需要准备后台采集规则,并且知道这条规则所带的id,将采集器放在任意可以访问到自己网站的windows设备就行了,也是远程的形式。但是值得注意的是,就算你是linux,延迟太大,性能太差也会采集到一半就环境崩掉,做站的时候选择靠谱的服务器商家很重要。
这个软件被称为“杰奇外置采集器”,我暂时不知道是哪个大佬发布的,之前做自己小说网的时候也用了用,感觉还行。速度没有关关采集器快,但是好歹也是linux下稳定的采集方案之一。
如果是windows服务器就千万别用了,1.7版本还好,1.8可以卡出高深莫测的境界。最后这个采集器似乎也只比较适合1.7和1.8,再往高走都不太好。

截图如下:
1.png

使用说明(转载):

一.功能特色
本程序是杰奇小说系统的辅助采集器,使用的是杰奇后台采集规则,不像网上其他一些采集器,
还需要重新编写采集规则,杰奇后台的采集规在网上随处都可以下到,并且本程序在所有windows
系统上都可完美使用.本程序可以多开,采集一万本小说,最多使用24小时.并且本程序不会卡死,
可以完美代替杰奇后台和其他采集器.

二.使用方法
1.用户名和密码填写杰奇小说系统后台用户名和密码
2.开始和结束分别填写开始ID和结束ID号,数字,如1,10000
3.网址:写你的杰奇小说网址,不要带http或者https,直接填域名就好
4.规则号:先打开网站文件configsarticlecollectsite.php,找到你需要规则序号,如:

$jieqiCollectsite['23']['name'] = '冷迪小说网';
$jieqiCollectsite['23']['config'] = 'lengdi';
$jieqiCollectsite['23']['url'] = 'www.lengdi.com';
$jieqiCollectsite['23']['subarticleid'] = 'floor($articleid / 1000)';
$jieqiCollectsite['23']['enable'] = '1';

其中23就是规则号,填入第1个框中,第2个框可以填写该规则号的对应的标识,如:冷迪小说网,随便写
5.超时:填写100-600间的数字,单位是秒,这个主要防止采集卡死
6.顺序:选正或负随你,一个代表正序采集,一个代表倒序采集
7.循环采集:选中后,采集完成后会重新从开始ID采集
8.屏蔽列表:可以填写你要屏蔽目标站的小说,按ID号屏蔽,这个列表也可以为空
9.返回代码:可以查看当前采集状态
10.点击开始按钮就可以了
11.关于多开:新建多个文件夹,把本程序copy到每个文件中,分别配置,就能实现多开

下载地址(如果失效,就评论说明):点击进入
密码:uwl4

您的大名:
万水千山总是情,给个打赏行不行。 打赏
原创文章,作者:不暇,如若转载,请注明出处:https://www.ruletree.club/archives/628/
宝塔面板,开启Mysql远程连接权限
« 上一篇 03-23
杰奇2.3版本的演示数据,刚好250本
下一篇 » 03-30

发表评论

已有 4 条评论

  1. tyLv.1 说道:

    站长有没有什么好的采集器推荐啊?付费的也行啊,哎。要是有生成wap的html功能就好了,找了好多都找不到。。

    1. 不暇VLv.6 说道:

      网上很多模板的wap是插件形式,不是官方原程序,自然不太好生成html啊,所以我也没什么推荐

  2. 奇侠一枝梅Lv.1 说道:

    我自己玩小说站,还没用过外置的采集器,都是杰奇后台自己采,有时间有心情就更新,根本不追求及时同步。 icon_confused.gif

    1. 不暇VLv.6 说道:

      自己玩玩就简单的后台采集其实还行,不过这个工具主要也是方便