飞速土豆(加速土豆网视频播放)1...
Wildpackets OmniPeek Personal (截..
代理猎手ProxyHunterV3.1完整版
MAC地址修改工具_SMACV1.2 汉化版
网络刺客II(查找主机共享资源)绿色..
局域网超级工具NetSuperV3.0 正式绿..
统一加速器(统一网关) 个人应用V3...
聚生网管V2.10
局域网查看工具(LanSee)V1.70 绿色..
NIC Express Enterprise(增加带宽-..
SmartHide(免费VPN软件)v2.0.74 免..
网络剪刀手NetCutV1.51
科来网络分析系统V6.0 build 1019 ..
K-MAC (网卡MAC修改)v 1.0.0.6 中文..
万象妙管家 2003 Build 0324 正式版..
SocksCap32V2.4汉化版
vIDC (端口映射工具)2.0
刷票器(全自动的刷票外挂)V4.0 中..
Anti ARP Sniffer(网卡扫描工具)V2..
WebSparrow网络信息采集系统V1.0是一个供各大主流文章系统,论坛系统等使用的多线程内容采集发布程序。使用火车采集器,你可以瞬间建立一个拥有庞大内容的网站。系统支持远程图片下载,图片批量水印,Flash下载,下载文件地址探测,自制作发表的cms模块参数,自定义发表的内容等。此外,丰富的规则制定,内容替换功能,对Access,Mysql,MSsql的数据入库导出的支持,更可令你采集内容的时候得心应手,现在开始你可以抛弃过去重复乏味的手工添加工作了,请马上开始体验瞬间建站的乐趣吧!
火车采集器(LocoySpider)是一款功能强大且易于上手的专业采集软件,强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器,自定义用户cms系统模块,不管你的网站是什么系统,都有可能使用上火车采集器,系统自带的模块文件支持:风讯文章,动易文章,动网论坛,PHPWIND论坛,Discuz论坛,phpcms文章,phparticle文章,LeadBBS论坛,魔力论坛,Dedecms文章,Xydw文章,惊云文章等的模块文件。更多cms模块请自己参照制作修改,也可到官方网站与大家交流制作。 同时您也可以使用系统的数据导出功能,利用系统内置标签,将采集到的数据对应表的字段导出到本地任何一款Access,MySql,MS SqlServer内。
需要 .Net 2.0 支持
火车采集器3.0版本基本功能介绍
----由于时间原因,测试版中入库和文件下载尚未完善
1、使用站点+任务方式管理采集节点。通常,一个站点大都有多个分类,如果各个分类只采用一套模版或者模版标记变化不大的情况下我们只要一个任务即可完成整个网站的采集,但是如果每个分类使用一个模版且模版的标记变化比较大,这时候我们就需要对各个分类设置一个对应的采集规则(也称任务)。因此,使用站点加任务的管理方式有利于日后维护——特别是采集站点比较多的时候;
2、实现采集地址和及内容采集同时进行。按传统的采集方式是先把地址读取到本地,然后在对各个地址一个个的分析,这样的效率明显很低。火车采集器3.0采用同步进行方式,也就是在获取完第一条地址之后再接着获取其他采集地址的时候同时采集内容而且可以同时多任务采集!
3、对来源采集站进行登陆采集,编码,JS转换选择,保守计算可以实现对95%以上目标进行采集。 一些比较大的或者国际性的软件大都采用utf8或者unicode编码来解决各国字符之间的问题。而utf8或者unicode字符在gbk下显示的将是一堆乱码,这时候我们就可以利用火车采集器3.0的内部转码工具自动转换!在采集网站的过程中我们发现很多网站都隐藏了真实的地址,通过js调用来防采集(比如:javascript winopen([参数1],[参数2]),一般的采集器是没办法实现这样网址的采集的,对火车采集器3.0正式板来说可以通过自定义网址实现这样地址的采集!
4、地址采集可以通过单条,批量,及文本方式导入添加,无需标签自动识别网址连接。 采集地址时当我们只需要采集一个网页时,您添加单条网址即可,如果单任务需要采集多页面,这是您就可以批量添加网址。如果您有已经有了一个网址的文本集合,那么您直接导入网址即可。火车采集器能智能化地识别网址!
5、使用规则标签对采集条目进行管理,不再局限于普通的标题,内容采集,标签实现完全自定义。假如我们采集一个药品的数据,那么我们可能需要的数据包括:生厂商、产品型号、使用说明、产品配置等。这些标签单单用一个内容和标题是没办法实现的,这时候你可以用火车采集器的自定义标签来完成无数个你想要的任何标签;
6、对规则标签的编辑可以无限对其进行剔除广告和替换,真正得到你所需要的内容,同时程序提供规则类型选择和基本的HTML代码排除功能。在任何标签中都可以添加无限的排除和替换规则提取您需要的任何格式内容。同时火车采集器提供了html标签排除功能,你可以一次排除
7、人工智能的内容分页采集技术,结合您的论坛/CMS系统甚至将采集的文章可以还原成采集时原来的分页数。现在大多数的cms系统都有手动分页标签,因此我们在采集带分页的目标站时,可以给采集回来的内容添加分页标志,实现了跟目标站一样的分页格式。当然,您可以更加灵活的运用分页标志以达到您想要的任何格式; 8、采集内容测试功能。这个功能是其他任何采集器所无法比拟的,火车采集器可以跳过网址采集直接先进行内容采集测试和内容规则的定义。这个功能的最大特点就是,可以避免在一些特殊的网站上浪费时间。因为网址采集一般都比较简单。当我们按步骤采集完网址的时候却发现自己没有能力采集内容那不是很浪费时间?所以,给您个提示,您可以先进行内容采集测试,发现可以采集再采集网址! 9、 [发布方式1]采集内容及连接保存到软件数据库,方便对内容进行管理,对比避免重复采集。这个比在线采集的强大之处是,您不需要任何服务器、数据库的支持,也不需要占用您服务器的任何空间。所有的数据全部保存在本地的数据库中,避免了下次数据重复采集!当然,您如果觉得占用您pc空间,您可以清空任何任务的数据库。不过我想现在每个人的硬盘至少都有80g以上吧,占用一点点的硬盘并不影响您机器的性能; 10、[发布方式2]采集内容可以选择保存为本地文件,方便阅览收藏。这个功能也是其他任何采集器目前没办法实现的,您除了可以选择在线发布外还可以选择保存为本地文件,包括txt hmtl csv格式,当然您可以复选的,也就是选择发布方式1的同时选择保存为本地文件,两个任务同时进行互不干扰; 11、[发布方式3]采集内容可以选择在线发表到您的网站(软件主打功能)。也就是离线采集,您可以在本级采集数据,然后通过自定义模块发布到任何系统中! 12、[发布方式4]采集内容可以选择对口保存在本地及远程数据库,目前开放ACCESS,MSSQL及MYSQL配置接口。这个功能将大大的提高采集的入库速度。不过直接对数据库进行操作风险较大,强烈建议在对已存的数据库进行备份。我们建议,只有对数据库熟悉的朋友才利用此功能。请谨慎使用此功能,我们不对此造成的任何风险承担任何责任,一切后果皆由操作者自行负责; 13、[发布方式5]采集内容可以选择保存为本地标准SQL运行语句文件,可实现向任意数据库的数据导入。有了这个功能,您可以把数据入库到任何sql数据库的系统中,即使是您的系统没有任何文章提交接口——只要您的系统有简单的数据读取功能就可以了! 注意:在入库方式选择直接对数据进行操作前请自行备份数据库,以防不测!如果您对数据库的操作不熟悉我们不建议您这么做! 14、自定义论坛/文章系统接口模块,可以实现对各种主流文章/论坛系统的在线内容导入。这个也是火车最为强大的功能之一,通过自定义模块您可以入库到所有您想入库的任何系统!同时我们会提供大量的主流模块的登陆发表系统,发表模块请到论坛的火车采集器3.0模块区去下载; 15、支持使用代理服务器采集。这个功能实现了ip封锁的突破。简单的例子是,有些国外的网站被封锁了ip,而他的内容您又非常需要,这时候您就可以通过代理服务器来实现! 16、实现自定义文件后缀名类型的文件分段断点下载,破解简单防护得到真实地址下载文件,自定义更名/保存及地址保存接口。目前大部分的采集器大都只能实现图、,flash的采集,对于其他的采集器无能为力。火车采集器3.0可以自定义文件下载类型的后缀名,突破大部分的防护功能获得真实的下载地址。同时,您可以自定义文件的保存地址实现跟文章系统同步; 17、同时进行多站点多任务多线程采集。这个可以根据您pc的配置来定义线程和任务数,只要您的pc配置够好,就可以同时进行够多的任务! 18、自动将您的模块和任务规则发布到论坛与大家共享。如果您有好的采集任何规则和模块希望跟其他的网友分享的话,那么可以用火车采集器内置板块直接发送到论坛对应的板块。请放心,在您没有操作的情况下,系统是不会把您的模块发布到论坛那的。 19、真正意义的软件计划任务,实现对某些网站的动态内容更新监视。这个功能可以大大的提高您的工作效率,当您启用自动任务调度的时候,火车采集器将自动帮您监视目标网站的内容更新! 本软件为绿色软件,无需安装,使用WinRAR打开解压后直接使用;火车头团队一直致力于为广大网站站点提供数据信息和实用的工具软件, 开发团队秉承“专业,专注,沉着,创新”的理念,用实力铸造精品。
可以选择格式,包括:任意文本、网址、email、汉字、英文、整数、小数、ip等!
经过2007年3月至2007年9月,近5个多个月的研发及几个版本的内部测试,一个具有全新内核和架构的强大信息采集,数据加工软件--火车采集器3.2版
呈献在大家面前,为始终支持和关爱火车软件发展的站长们献上一份谢礼。
火车采集器1.X-3.X一直免费使用并深受广大站长欢迎,通过大家对3.2测试版的反馈,无论在性能,功能和稳定性上面3.2都是以前版本无法比拟的,
我们此次发布的3.2正式版同样也是免费使用,没有任何限制(功能上附带3.1版的所有基本功能及3.2内部测试版发布的所有功能)
同时为了软件和更好发展及为部分用户更好的技术支持,3.2版也发布支持更多SEO功能和技术支持的个人、标准和企业版三种高级版本,各位朋友可按需选用 高级版本请访问这里
3.2版功能简介
继承3.1的优点,站点+任务式管理,多任务多线程同时运行
3.1版的基本功能可查看这里 http://www.locoy.com/article/show.php?itemid-8/page-1.html
下面仅对3.2正式版中新增的功能做简单列表:
采网址,采内容,发内容三个步骤可以分开分步操作
增加缩略图采集功能,并能保存到本地文件
增加多页采集,使采集多页下载链接或产品多页图片,参数,评论,价格内容成为可能
增加自定义网页编码类型,默认任何编码页都可以实现内部转换,都能正确采集,发布时请选择目标UTF8
增加循环采集(可采集列表和论坛回复列表类似的网页)
增加将循环采集匹配到的结果添加为新记录和间隔符分割的功能
增加内容采集中使用正则匹配的功能
增加WEB发布配置,保存每个网站的发布配置,单任务可以发布到多网站,但任务可以发布到网站的不同栏目
增加数据库发布模块,去掉以前的数据库直导配置,成熟的发布模块可以使不懂数据库结构的人使用数据库直导成为可能
增加分页采集自定义地址格式的功能,完善以前的分页采集中上10页下10页这种无法采集的问题
增加源代码查看和测试工具
增加软件内动态帮助,使用更为方便..
增加对任意采集标签里的内容自动生成摘要和自动拼音的功能
增加保存到本地SQL文件的功能(3.1中未完成),完善各种在线发布和数据库发布功能
改进了下载算法,使下载图片和其他任意格式的文件更快更稳
还有本地任务数据编辑再发布功能 ,
自动获取tag(生成中文关键词功能),
自动英文->中文翻译功能 ,
任务定时自动更新功能 ,
任意格式文件下载功能 ,
(ACCESS,MYSQL,MSSQL)数据库发布模块编辑器
在高级版本中发布,如果需要这些高级功能或获取更多技术支持,请访问:
关键词:采网址 采内容 发内容 分步 缩略图 本地 循环采集 多页采集 分页采集 自动拼音 生成摘要 自定义网页编码 数据库发布模块 多网站发布 自动关键词 自动翻译 ACCESS MYSQL MSSQL 自动更新
..
进入下载页:火车采集器(LocoySpider)v3.2 版SP1 版 
点这里下载:Microsoft.NET Framework 2.0 Final多国语言版
进入下载页:火车头采集器(LocoySpider)V3.0版
进入下载页:火车采集器(LocoySpider)3.1正式版免费发布
☉ 本站广告较多,请大家见谅,我们采用 Cookies 控制广告只显示一次你再次刷新就不会有广告了。
☉ 飞翔90%以上的软件都是本地下载,如果不能下请用网际快车迅雷等下载; 如何下载飞翔的软件或者找不到下载地址请点这里。
☉ 默认解压密码为 www.52z.com 欢迎加入 飞翔软件交流群: 210808 2222845 30958999
商务合作: QQ:160845 Msn: hncj@msn.com FlyUser@126.com
Copyright 2003-2005 Www.52z.Com 版权所有 湘ICP备 05000461号
本站提供的所有软件均来自互联网下载纯属学习交流之用,如侵犯您版权的请与我们联系,我们会尽快改正请在下载24小时内删除了