软件介绍
火车采集器(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软,软件功能非常强大,界面简洁明晰、操作方便快捷,设计得很人性化。火车采集器通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。
- 最新版本:官方免费版v9.3
- 软件大小:21.62MB
- 软件类型:国产软件
- 软件分类:下载工具
- 软件语言:简体中文
- 软件授权:免费软件
- 支持系统: | | | |
软件截图
软件特色
分布式高速采集
任务分配至多个客户端,同时运行采集,效率倍增。
多识别系统
配备正文识别、中文分词识别、任意编码识别等多种识别系统,智能识别操作更轻松。
可选验证方式
可选择是否使用加密狗,随时保障数据安全。
全自动运行
无需人工值守操作,任务完成后自动关机。
替换功能
同义,近义词替换、参数替换,伪原创必备技能。
任意文件格式下载
图片、压缩文件、视频等任意格式的文件都能轻松下载。
采集监控系统
实时监控采集,确保数据的准确性。
支持多数据库
支持Access/MySQL/MsSQL/Sqlite/Oracle多种类型的数据库保存及发布。
无限级多页采集
支持包含ajax请求数据在内的多个页面信息的无限级采集。
支持扩展
支持接口和插件扩展,满足各种采发需求。
安装步骤
一、在本站下载火车采集器最新版,双击运行。
二、如下图,可以点击【浏览】设置软件的安装位置。
三、设置完毕点击【安装】,耐心等待即可。
使用技巧
起始网址设置。
采集规则制作的第一步骤,点击向导添加,①➯②,出现如图界面。
分3种方式:普通网址,批量网址,文本导入。
a、普通网址:以一行一个的形式直接加入网址,不做任何解析。
b、批量网址:以通用的表达式批量生成网址。
c、文本导入:以文本导入的形式,文本为一行一个的网址。
FAQ
登录信息设置: 对于部分需要登录的网站,需要设置此项。
点击 点击设置 按钮,跳转到第四步其他设置——Http请求设置
点击 使用浏览器获取网页登录信息 按钮,登录网址,输入账号密码后,再关闭窗口即可
这样登录信息就已经记录在采集器里了,就是我们常说的 Cookie 和 User-Agent 。