杰奇cms笔趣阁后台采集规则

本文阅读 3 分钟
广告

很早之前写过,也有人在评论里提到过,很多网站章节用js显示,杰奇后台根本采集不到,我之前的尝试就失败过。今天下午看了看www.qu.la这个网站,发现章节并不是我想象的那种显示,而是直接代码,所以就试试写了后台采集规则,没想到成功了,只是windows下采集真的很慢,我的电脑采集到一半nginx竟然还崩溃了,不过这也是个成功吧。所以我觉得如果是用windows系统,直接用关关采集器好多了,linux下用后台采集还行。
或许看我这个,应该可以学会自己配置后台采集吧。

本文章仅供学习研究,请勿用于侵权

以下为我的填法,最底下我会附配置好的文件,除了我设置的之外,其它的可以不填:

网站名称:笔趣阁
网站地址:http://www.qu.la
发送HTTP_REFERER标志,用于突破防采集设置:是

小说信息页面采集规则

小说信息页面地址:http://www.qu.la/book/<{articleid}>/
小说标题采集规则:<meta property="og:novel:book_name" content="!!!!"/>
作者采集规则:<meta property="og:novel:author" content="!!!!"/>
小说类型采集规则:<meta property="og:novel:category" content="!!!!"/>
小说类型对应关系:根据自己网站的填写
关键字采集规则:<meta name="keywords" content="****"/>
内容简介采集规则:<meta property="og:description" content="****"/>
封面图片采集规则:<meta property="og:image" content="!!!!"/>
目录页面链接采集规则 :<meta property="og:novel:latest_chapter_url" content="http://www.qu.la/book/$$$$/$.html"/>
全文标记采集规则:<meta property="og:novel:status" content="!!!!"/>

小说目录页面采集规则

小说目录页面地址:http://www.qu.la/book/<{articleid}>/
分卷名称采集规则:》!!!!</dt>
章节名称采集规则:>!!!!</a></dd>
章节序号采集规则:/$$$$.html">

章节内容页面采集规则

章节内容页面地址:http://www.qu.la/book/<{articleid}>/<{chapterid}>.html
章节内容采集规则:<div id="content">****</div>
章节内容过滤规则:看情况吧,目标网站有哪些广告文字就填哪些进来
是否采集图片内容到本地:是

提示:目前遇到的问题就是,虽然可以成功获取到小说的封面,但是似乎无法本地化,当然不排除是我试验时候,是用的一库多站分站的原因,或者看了这篇文章的人也可以试试,希望可以留下反馈,当然如果出现问题或者有问题也留下评论,我都会解答。

以下是我采集截图:
1.png
2.png

规则文件下载地址(怎么加进后台自己看杰奇后台说明):site_qu_la.zip

本文来自投稿,不代表本站立场,如若转载,请注明出处:https://www.ruletree.club/archives/311/
杰奇cms用户微章功能,源码及安装教程
« 上一篇 11-05
关关采集器分类对应,写法教程
下一篇 » 11-09
广告

发表评论

V注册会员 L评论等级
R9 条回复
  1. 4wesLv.1 说道:
    2019-10-26     Win 7 /    UC浏览器

    /www.qu.la
    这个网站规则采集的章节是错乱的,
    把第一章的内容放到了最新章节里边了。。
    有没有解决办法

    1. 不暇VLv.6 说道:
      2019-10-27     Win 7 /    Chrome

      @4wes

      如果是后台的话,基本没有办法,因为它没有完善的筛选识别机制

  2. 探险狼123Lv.1 说道:
    2018-06-15     Win 7 /    MicroSoft Edge

    还有个问题就是文章总是不显示,要手动一章章的更新才显示,有的也不显示,还有的是空内容。
    知道这是什么原因么。

  3. 探险狼123Lv.1 说道:
    2018-06-15     Win 7 /    MicroSoft Edge

    2.2版本后台采集怎么一次总是只采集十多章节,图片也是下载不到本地。

    1. 不暇VLv.6 说道:
      2018-06-15     Win 10 /    Chrome

      @探险狼123

      2.2版本有个图片采集的bug,具体可以看我博客的文章,但是我只修复了单篇采集,另外那个采集的限制,是源站做了防抓取,而没有采集成功就自然不会生成opf,所以不显示。

  4. 星空下的恋曲Lv.1 说道:
    2017-12-08     Win 10 /    Chrome

    失效了。。。

    1. 不暇VLv.6 说道:
      2018-04-09     Win 10 /    Chrome

      @星空下的恋曲

      我会新制作一些的

  5. 吕老汉Lv.1 说道:
    2017-11-13     Win 10 /    Chrome

    我怎么显示规则不存在呢

    1. 不暇VLv.6 说道:
      2017-11-13     Android /    Chrome

      @吕老汉

      如果显示规则不存在,那就按照我文章的在后台新创建吧,也是同样的。

没有更多评论了

作者信息

热门文章

标签TAG

热评文章