现在市面上充斥着一些收费的网页采集器,这样一款绿色免费的网页采集器不管他功能怎么样,是免费的就很难得了!
本软件通过互联网,采集网页信息。有两大特色功能:
1,可以采集js之后的动态信息。
2,可以设定采集的正则表达式。
另外,本软件内置多种采集方案,分别对应静态网页和动态网页。
官网的图片(人脸)搜索引擎的数据都是用这个软件采集,然后才做索引的。
使用步骤:
1,输入网址,正常浏览网页到达采集目标后,点击工具栏上的“查看js后源码”图标,则显示执行js后的网页内容。
如果没有看到相关内容,可以等待片刻再次点击,以保证js代码执行完毕。通过浏览完整的网页源码,我们可以确定
使用方案1还是方案2。如果更改网址的页码就可以导航到下一页,则使用方案1;如果是通过脚本动态更新网页内容,
则使用方案2。
2,点击工具栏上的“运行采集方案”图标,根据步骤1,选择方案1或2。如果已经有方案1和2生成的downloadtotal.txt
文件,也可以选择方案3。填入必要的信息或者表达式,点击“开始采集”按钮,系统将自动采集。点击对话框的“取消”
按钮,则不启动采集任务直接关闭对话框。
3,点击工具栏上的“停止采集方案”图标,系统终止采集任务。
防止网页采集:
防止采集第一种方法:在文章的头尾加上随机不固定的内容。网站采集者在采集时,通常都是指定一个开始位置和一个结束位置,截取中间的内容。
比如你的文章内容是"有讯软件信息网",则随机内容的加入方法:
随机内容1+有讯软件信息网+随机内容2
注:随机内容1和随机内容2每篇文章只要随机显示一个就可以了.
- 采集器专题
尊天网页采集器v1.0.1绿色版下载地址
Windows版下载-
百科推荐
-
下载排行
近期更新
-
-
1
ADsafe净网大师正式版
v5.4.521.1800
-
2
360抢票王六代
官方最新版 v13.1.5330.0
-
3
12306订票助手
电脑版 v2021.10.15.2
-
4
p2psearcher
v6.4.8
- 5
-
6
闪联任意通
V5.0 官方版
-
7
Steam Inventory Helper
官方版 v1.17.70
-
8
左轮网吧助手
v1.1绿色版
-
9
ChromeHistoryView
v1.30
-
10
盘古越狱
v8.41
-
1
网页智能填写工具(AI RoboForm Enterprise)
v7.9.13.5中文免费版
-
2
天易成网管软件
官方版v5.70
-
3
网页快照助手
最新版 v1.0
-
4
新知魔方
官方版 v2.0.0
-
5
Wise AD Cleaner
官方版 v1.2.7.61
-
6
南阳村镇银行网银助手
官方版 v1.0.22.1011
-
7
飞Q客户端
中文版v1.5.2
-
8
指北针分类信息软件
绿色版 v1.4.8.10
-
9
speedtest
中文版 v1.10.163
-
10
超级兔子IE修复专家
免费版 v8.20
-
1