所在位置:首页 > 软件下载 > 网络软件 > 万能文章采集器下载

万能文章采集器

v2.17.7.0绿色免费版

万能文章采集器绿色版

  • 安全
  • 人工检测
  • 官方版
  • 软件类别:网页辅助
  • 发布时间:2021-05-24
  • 下载热度:
立即下载

推荐评语

万能文章采集器下载,万能文章采集器绿色版

软件介绍

万能文章采集器是一款方便易用的文章采集软件,其功能强大且完全免费使用。该软件操作简单,可以精确提取网页里的正文部分保存为文章,支持去标签、链接、邮箱等格式化处理,只需要短短的几分钟就可以采集你想要的任何文章。而且拥有独家首创智能的万能算法,可以只需输入关键字就能采集各种网页和新闻,还可以采集指定列表页(栏目页)的文章,精确提取网页里的正文部分保存为文章内容。同时还有插入关键词功能,可以识别标签或标点旁边插入,并且能识别英文空格间距插入,更有文章转译功能,也就是可以将文章从一种语言如中文转到另一种语言如英文或日文,再从英文或日文转回中文,这样就是一个转译周期,可以设定转译周期循环多次。如果您对某个关键词的文章感兴趣想进行批量性的下载,可以使用这款完全免费的水淼万能文章采集器,如需要的用户欢迎前来下载!
水淼万能文章采集器

软件特点

一、依托于水淼软件独家万能正文识别智能算法,可实现任何网页正文自动提取准确率95%以上。
二、只需输入关键词,就能采集到百度新闻和网页、搜狗新闻和网页、360新闻和网页、谷歌新闻和网页、必应新闻和网页、雅虎;可批量关键词全自动采集。
三、可定向采集指定网站栏目列表下的所有文章,智能化匹配,无需编写复杂规则。
四、文章转译功能,可对采集好的文章,将其翻译到英文再翻译回中文,实现翻译伪原创,支持谷歌和有道翻译。
五、史上最简单最智能文章采集器,支持全功能试用,效果如何一试就知!

功能介绍

正文提取算法有3种模式,标准、严格、精确标签。大多数情况,标准和严格模式是相同的提取结果。下面说的是特殊情况:
标准模式:即一般性提取,大多数时候能够精确提取正文,但一些特殊页面会导致提取到一些不需要内容(但本模式能够较好识别类似百度经验的文章页面)
严格模式:顾名思义,比标准模式严格一点,可以很大程度避免不相关内容提取为正文,但对于特殊分段页面如百度经验的页面(不是一般
段落,而是有格式的多个独立div段),一般只能提取到某一段,而标准模式则可以提取全部段。
精确标签:当标准和严格模式不管用时,可以精确指定目标正文的标签头。本模式只适合网络批处理。
所以可以根据实际情况来切换模式。可以使用本地批处理的读网页正文功能来测试指定网页适合哪种模式提取。
可以在网址模板里插入 #网址#、#标题#来组合引用
支持多线程高速采集网页。可以根据网速而定,电信2m可以5个线程,电信4m可以10个线程,更多以此类推,但需适当设置,设置太多将可能严重影响采集效率甚至影响系统效率。如果采集时有其他占用流量的软件在运行比如在线视频播放,可以适当降低线程数。
虽然水淼研究了一个准确率极高的正文提取算法,但难免还是有极少数提取错误,这些错误主要是:目标网页的主体是在线视频,或主体内容过于简短而无法形成正文的特征。因此可以通过设置提取最终结果的字数多少来提高准确率(在“正文最少字数”参数,这个字数是程序将正文去标签、去行、去空格之后的纯文字字数)。
而文章快速筛选器就是为了快速查看采集好的文章,方便判断删除提取正文错误的文章。同时也方便基于网络信息采集目的而需要进行的炼选过程。
展开

详细信息

软件大小: 994KB软件版本: v2.17.7.0绿色免费版 系统要求: Win10,Win8,Win7,WinXP软件类型: 国产软件 语言: 简体中文软件授权: 免费软件

万能文章采集器 下载地址

我要评价

  • 软件排行榜
  • 软件新品榜