之前分享的笔趣阁的后台采集听反馈说已经失效,我专门去看了官方网站也确实如此。所以最近稍微找了一下小说网,也找到几个还不错的,制作了后台采集规则,那么我就只分享一个吧,官方网站名叫999文学,感觉书籍还比较多的样子。杰奇的后台采集速度还是可以的,当然这个也只是体现在1.7版本,不足的是采集的时候不显示进度,而且如果服务器的配置不行容易直接崩。
本文章仅供学习研究,请勿用于侵权
基本设置如下
下面没有出现的选项,则不填即可。如果规则失效或者出现什么问题,请在评论反馈。
基本设置
网站名称:999文学
网站地址:http://www.999wx.net
对方网页编码:GB2312
文章信息页面采集规则
文章信息页面地址:http://www.999wx.net/book_<{articleid}>/
文章标题采集规则:<meta property="og:novel:book_name" content="!!!!"/>
作者采集规则:<meta property="og:novel:author" content="!!!!"/>
文章类型采集规则:<meta property="og:novel:category" content="!!!!"/>
文章类型对应关系:根据自己网站的分类填
关键字采集规则:<meta name="keywords" content="****}" />
内容简介采集规则:<meta property="og:description" content="!!!!"/>
封面图片采集规则:<meta property="og:image" content="!!!!"/>
全文标记采集规则:<meta property="og:novel:status" content="!!!!"/>
文章目录页面采集规则
文章目录页面地址:http://www.999wx.net/book_<{articleid}>/
分卷名称采集规则:》!!!!</dt>
章节名称采集规则:html">!!!!</a></dd>
章节序号采集规则:<dd><a href="$$$$.html">
章节内容页面采集规则
章节内容页面地址:http://www.999wx.net/book_<{articleid}>/<{chapterid}>.html
章节内容采集规则:<div id="content" name="content">****</div>
章节内容过滤规则:一秒记住【999文学 www.999wx.net】,精彩小说无弹窗免费阅读! (这里按实际情况可以自己加点)
是否采集图片内容到本地:是
最后,如果看到有什么还行的网站,可以直接留言在评论,我会想办法制作采集规则。当然,原创网站那些是搞不定的。
规则之树版权所有,转载注明来源。
本文来自投稿,不代表本站立场,如若转载,请注明出处:https://www.ruletree.club/archives/676/
已经失效了,单篇采集显示:错误原因:读取对方网站失败,可能是对方无法访问或者本服务器禁止远程读取网页!
@特大辉哥
了解了,现在网站的防采集越来越厉害
后台采集需要一直打开后台吗?关闭浏览器会不会停掉?
@天涯
会,我博客分享过一个外置采集器
你可以先用那个
博主有关关采集器吗
@annna
我分享了几个,你仔细找找
这个规则在2.2提示规则不存在怎么弄
@浅笑
杰奇1.8以上的版本都不建议用后台采集了
你搞点关关规则啊,后台的规则简单了
@666
关关的规则到处都有啊,后台的反而没几个,况且我还不会