懒人采集器是一款智能采集器,拥有多元化的功能,简单易懂的操作方式,可以轻松获取采集网络信息,并且适合大部分的网站,它还拥有一个特别智能的识别功能,能够避免获得重复的数据,为用户提供了非常大的帮助。懒人采集器零门槛,可视化配置,多引擎,智能生成编程,推荐有需要的朋友下载体验。
懒人采集器软件特色
1、零门槛:不懂网络爬虫技术,会上网,就会采集网站数据。
2、多引擎,高速稳定:内置高速浏览器引擎,还可以切换为HTTP引擎模式运行,采集数据更加高效。还内置了JSON引擎,无需分析JSON数据结构,可视化选取JSON内容。
3、适用各种网站:能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站。
4、智能识别:可自动识别网页列表、采集字段和分页等。
懒人采集器软件功能
1、可视化向导
所有采集元素,自动生成采集数据。
2、计划任务
灵活定义运行时间,全自动运行。
3、多引擎支持
支持多个采集引擎,内置高速浏览器内核、HTTP引擎和JSON引擎。
4、拦截请求
自定义拦截域名,方便过滤站外广告,提高采集速度。
5、多种数据导出
可导出为Txt 、Excel、MySQL、SQLServer、 SQlite、Access、网站等。
懒人采集器常见问题
问:采集时怎样避免重复到重复数据?
答:方法很简单,我们希望哪一个字段内容不允许出现重复,只要点击该字段表头上这个三角符号,再勾选“过滤重复”复选框,点击确定就可以了。
问:如何手动生成字段?
答:点击“增加字段”按钮,点击列表中任意一行中要提取的元素,比如要提取标题和链接地址,鼠标左键点击一下该标题即可,当点击的是网页链接时,会提示是否用时要抓取链接地址。如果要同时提取链接标题和链接地址,点“是”,如果只要提取标题文本,点否。
这里我们点“是”,系统会自动生成标题和链接地址字段,并在字段列表中显示出提取到的字段内容,当点击底部表格字段标题时,会在网页上以黄色背景高亮显示出匹配的内容,如何还有标记列表中的其他字段,点击新增字段,重复以上操作即可。