特别功能
多任务可视化采集
采集量图表统计,历史采集状况一看便知
支持文章评论采集(仅第一页评论)
支持大多数主题、插件数据采集(任意数据表入库)
第三方触发自动采集
多标签页,多线程采集
文章伪原创(5118、百度翻译)
本插件一些规则配置方面,参考了火车头软件
免责申明
因为本插件属于“蜘蛛”性质,采集网站请遵守对方的robots.txt规则。如有违反,相应的法律责任由使用者自行承担。
插件使用教程
插件截图
插件首页
任务概况
正在采集
未采集到内容
任务规则-第一步(链接采集)
任务规则-第一步(添加有规则的网址)
任务规则-第一步(链接采集预览)
任务规则-第二步(添加内容采集)
任务规则-第二步(测试内容采集)
任务规则-第三步(设置发布规则)
任务规则-第三步(设置自定义内容)
任务规则-第四步(任务杂项配置)
公共配置
入库模块配置
本采集插件正常情况下仅支持单个数据表入库,要同时入库多个表,需要定制入库模块。
什么情况下需要入库模块?比如文章评论,采集到的评论,入库时和文章不在同一个数据表,这时候就要单独的一个入库规则来实现评论发布;或者是需要处理一些其它数据
目前插件已附加两个入库模块
更新日志
v1.4.4 2022-04-04 11:15
[修复]无法下载mip图片的问题
[优化]下载图片时,请求头会使用其它配置中的header
v1.4.3 2022-01-23 16:27
[修复]某些图片下载失败的问题
v1.4.2 2022-01-07 11:22
[修复]在zblog1.7下触发自动采集文章入库状态为“没有权限”的问题
v1.4.1 2021-11-19 16:09
修正文章入库配置“5118伪原创”名称错误的问题,改为“5118一键智能换词API”,API没换,更新后无需处理
[修复]5118一键智能换词API总开关无效的问题
v1.4 2021-11-13 16:13
[优化]5188伪原创同时开始“标题伪原创”和“正文伪原创”时,一次性请求,不会请求两次
[新增]内容采集可以配置“间隔内容”,当匹配到多个内容时,入库时多个内容合并时之间的内容
[新增]发布规则增加“截取字符串”,截取指定范围的字符长度
v1.3 2021-07-06 16:33
[新增]5188一键智能改写API
v1.2.4 2021-03-03 19:36
[修复]链接采集填充异常的问题
v1.2.3 2021-02-27 19:48
[修复]部分网站采集的链接无法正确填充的问题
v1.2.2 2021-02-27 16:10
[修复]问答插件采集分类配置无效的问题
v1.2.1 2021-02-24 11:39
[修复]不信任的ssl证书图片下载失败的问题
v1.2 2021-01-30 22:53
[优化]文章采集“保存到文本”中的内容进行简单的代码格式化
[优化]文章采集“保存到文本”可配置“保存后不发布文章”
[新增]文章采集百度翻译伪原创
[新增]文章采集可配置字数最低限制
v1.1.1 2021-01-04 16:16
[优化]公共配置只的内容替换将会在所有内容处理后最后一步执行
[优化]公共配置内容替换input文本框改为textarea文本框
v1.1.0 2021-01-04 16:03
[修复]链接匹配正则匹配方式无效的问题
v1.0.9 2021-01-01 16:56
[修复]某些情况下排除多个元素部分无法排除的问题
v1.0.8 2020-11-21 10:12
[修复]部分服务器导入的规则数据太长导入失败的问题
v1.0.7 2020-11-09 20:52
[修复]文章发布模块,不能保存txt文件的问题
插件入口改到顶部导航
v1.0.6 2020-11-03 20:49
[修复]链接采集链接排除中的回车符导致采集不到链接的问题
v1.0.5 2020-10-18 20:47
[新增]规则配置可选择是否调用其它插件接口Filter_Plugin_Upload_SaveBase64File
[修复]前后截取部分情况下无法截取的问题
v1.0.4 2020-10-16 20:55
[修复]部分情况下排除元素消失的问题
v1.0.3 2020-10-14 22:14
[优化]当转存图片时,对方站点证书不匹配造成的失败问题(忽略证书检测)
[新增]插件右上角新增“使用手册”菜单
v1.0.2 2020-10-10 20:59
[新增]文章采集,可以设置保存到txt文件
[新增]链接采集可配置“必须包含”“不能包含”
[新增]链接采集可选择“打乱链接”,采集后的链接不是按照原页面顺序
v1.0.1 2020-10-08 17:59
meta支持数组,结尾用[]表示
v1.0 2020-10-07 20:12
还没有评论,来说两句吧...