浏览器
双核浏览器
游戏浏览器
高速浏览器
视频浏览器
IE浏览器
浏览器周边
手机浏览器
安卓游戏
音乐舞蹈
养成游戏
儿童游戏
仙侠手游
角色扮演
策略塔防
休闲益智
动作冒险
飞行射击
模拟经营
体育运动
赛车竞速
网络游戏
安卓软件
资讯阅读
生活服务
影音播放
购物理财
效率办公
趣味娱乐
交通出行
学习教育
摄影图像
在线音乐
系统工具
网络购物
聊天工具
安全杀毒
图片编辑
新闻资讯
软件资讯
游戏资讯
手机教程
手游攻略
游戏攻略
软件教程
IE专区
安卓专题
文章合集
电脑软件专题
安全软件
杀毒软件
系统安全
加密解密
防火墙
远程控制
木马查杀
影音软件
网络电视
视频播放
音乐播放
视频制作
音频编辑
录音录像
教育学习
外语学习
教育管理
早教启蒙
在线课堂
成人教育
资格考试
聊天社交
即时通讯
视频聊天
在线交友
变声器
表情包
办公软件
线上会议
文档管理
行业管理
考勤打卡
应用工具
输入法
下载工具
时钟日历
记事本
文件管理
计算器
编程开发
编程工具
JAVA相关
加壳脱壳
编程控件
数据库
网页源码
软件开发
补丁制作
系统美化
桌面制作
壁纸大全
系统主题
屏幕保护
桌面辅助
系统软件
系统优化
备份还原
系统检测
U盘工具
磁盘工具
驱动补丁
图文处理
图片素材
图像处理
图片制作
图片压缩
电子相册
抓图工具
其他软件
电子书籍
模拟器
辅助工具
交通出行
手机管理
其他工具
素材下载
字体素材
PPT素材
专区
文章合集
软件
游戏
浏览器
安卓专题
软件
游戏
浏览器
IEfans/ 应用工具/ 下载工具 /火车采集器(LocoySpider) v9.21.20200907共享版
火车采集器(LocoySpider) v9.21.20200907共享版

火车采集器(LocoySpider) v9.21.20200907共享版

立即下载

应用工具截图

  • 应用工具介绍

    LocoySpider可以帮助小伙伴们采集各种网站的信息数据,新闻网站、论坛求职类网站都不在话下,图片、文字、相关文件都能一键抓取,软件运行稳定,适用范围广。

    软件特色

    1、通用性强

    无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容。

    2、稳定、高效

    五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。

    3、扩展性强、适用范围广

    自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用。

    菜单功能

    1.新建分组

    新建一个任务分组,选择所属分组,确定分组名称和备注。

    2.新建任务

    确定所属分组,新建一个任务,填写任务名称并保存。

    3.Web发布配置

    Web发布配置定义了如何登陆一个网站以及向该网站提交数据。

    主要涉及到登录信息的获取,网站编码设定,栏目列表的获取,以及使用数据测试发布效果。

    4.Web发布模块

    可以定义网站登录,获取栏目列表,获取网页随机值,内容发布参数,以及上传文件,构造发布数据等高级功能。

    5.数据库发布配置

    数据库发布配置定义了数据库链接信息的设置以及数据库模块的选择。

    6.数据库发布模块

    用于编辑数据库的发布模块,方便我们将数据发布到配置好的数据库中。

    火车采集器可选mysql、sqlserver、oracle、access四种数据库类型,在文本输入框中填写sql语句

    (需有数据库相关知识),并可使用标签替换相应数据。也可在采集器模块文件夹中加载某一模块进行编辑。

    7.计划任务

    设置列表中采集任务的启动计划,可每间隔、每天、每周、仅一次、或自定义Cron表达式,

    (Cron表达式的写法可参考相关术语中的介绍)。保存设置后,任务即可按照设置执行。

    8.插件管理

    插件是可以用来扩展火车采集器功能的程序

    火车采集器V9支持PHP源码、C#源码、C#类库三种类型的插件,

    可用于扩展http请求、内容处理和文件下载的功能,并可以分别进行测试。

    9.http二级代理

    网络中的服务器,可以让网络用户去取得所需要的网络信息。

    代理的功能有可以突破自身ip的访问限制访问国外站点,访问一些单位或团体内部资源,

    突破电信的ip封锁和隐藏真实的ip等。

    火车采集器V9支持http代理、socket4和socket5代理。

    10.http模拟请求

    可以设置如何发起一个http请求,包括设置请求信息,返回头信息。并具有自动提交的功能。

    基本功能

    1、规则自定义 - 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。

    2、多任务,多线程 - 可以同时进行多个信息获取任务,每个任务可以使用多个线程。

    3、所见即所得 - 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。

    4、数据保存 - 数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。

    5、断点续采 - 信息收集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。

    6、网站登录 - 支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。

    7、计划任务 - 通过这个功能可以让你的采集任务定时、定量或者一直循环执行。

    8、采集范围限制 - 可以根据采集的深度和网址的标识来限制采集的范围。

    9、文件下载 - 可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。

    10、结果替换 - 可以将采集的结果根据规则替换成你定义的内容。

    11、条件保存 - 可以根据某个条件来决定那些信息保存,那些信息过滤。

    12、过滤重复内容 - 软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。

    13、特殊链接识别 - 运用此功能可以将用JavaScript动态生成的链接或其他更古怪的连接识别出来。

    14、数据发布 - 可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库(access, sql server,my sql,oracle) ,静态htm文件。

    15、预留编程接口 - 定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能。

    特色功能

    1、支持所有网站编码:完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。

    2、多种发布方式:支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。

    3、全自动:无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。

    4、本地编辑:本地可视化编辑已采集的数据。

    5、采集测试:这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。

    6、管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。

    更新日志

    2020-09-07

    火车采集器V9.21版

    1: 自动获取cookie功能优化

    2: 数据库发布增加事务,优化数据库发布速度

    3: 数据转换速度优化(针对Mysql和SqlServer数据库的导入), 同时去除网址库的清空逻辑

    4: html标签处理错误问题处理

    5: json提取关于数字转换为科学计数法问题处理

    6: 发布测试时,图片上传无效的问题处理

    7: 采集内容页处理错误时,增加对于当前出错标签的提示,以便快速定位出错标签

    8: 任务批量编辑,增加可操作范围

    9: 循环匹配匹配空格问题处理

    10: 刷新分组中增加统计数据的刷新

    11: post分页处理

    12: 部分功能逻辑优化

    以上就是火车采集器(LocoySpider)的全部内容了,快快收藏IE浏览器中文网站下载更多电脑软件吧!

    相关应用工具

    相关专题

    爬虫软件 爬虫软件

    互联网的优质内容那么多,但它又是如此脆弱,今天看到的信息可能下一秒就再也找不到了,小编带来的爬虫软件能帮你自动获取文字、图片内容,将它们保存到本地,供你随意使用。

    网页爬虫工具 网页爬虫工具

    网上有这么多的资源,光靠一个搜索引擎总会遗漏些什么,小编为大家挑选的网页爬虫工具可以一次性抓取各种你想要的内容,你能自行编写规则,软件爬取速度快,短时间内就能获取大量内容。

    相关资讯