返回顶部

[文摘] 网络信息采集机器人介绍

[复制链接]
awagink 显示全部楼层 发表于 2008-2-18 08:21:10 |阅读模式 打印 上一主题 下一主题
网络信息采集大师(NetGet)3.28

傻瓜式建站法,帮你快速建站    教你轻松下载土豆网搞笑视频

文件大小:0B
下载次数:205
更新日期:2006-09-15 13:24
软件版本:3.28
适用平台:Win9x/Me/NT/2000/XP
软件类型:免费版
立即下载
文件大小:0B

网通下载   电信下载

企业版破解补丁:

NetGetpojie.exe.rar (705.38 KB, 下载次数: 0)


《网络信息采集大师》概述

网络是信息取之不尽的源泉。面对如此丰富繁多的网络信息,难道你不想取之为我所用吗?答案是很明显的。
而信息采集的难点是什么?---数据复杂,下载后的难点又是什么?---数据管理
网络信息采集大师NetGet)的使命,就是解决这两个问题。一般数据采集是有针对性的,通常是针对某个或者某些网站,采集某些类别的数据。比如采集几个网站的新闻,人才招聘信息,产品信息,供求信息,公司库信息等等。对这些网站的数据结构进行简单分析后,设置相应的采集规则,就可以把你想要的数据统统下载到本地。本软件支持分类,分类的目的是数据便于管理,便于统计分析。可以按照网站进行分类;也可以按照你所感兴趣的方式分类,比如分为人才招聘类,产品信息类等;某一类下边还支持小类,没有任何限制。
现有功能简介:
    本软件可采集任何类型的网站信息。包括Htm , ASP , Jsp , PHP等。采集速度快,信息一致准确。 登录。可轻松采集登录后才能看到的信息,支持软件登录。 多任务,多线程。支持多任务多线程,采集速度快。 任务。任务即采集任务。表现为相应的采集规则。任务可以随时开始,暂停和停止。本软件支持多任务,即同时采集不同的数据。 数据批量二次加工。可把采集的数据,进行批量处理,如增加字符,替换,删除等。 数据导出。采集的数据可导出为三种方式:文本,Excel和数据库。可根据自己的需要,导出为不同的格式。 数据库。支持目前流行的多种数据库,如SqlServer, Oracle, DB2, Access, MySql等。数据库功能包括导入数据库和数据查询。可自定义数据库接口。 密码保护。如果您不想他人随意进入你的软件,用你的任务采集数据,可以通过设置密码进行限制。即使在采集的同时,如果你想离开 一会,可用暂离功能,类似系统的屏保功能。 备忘录。 一天的采集任务很多,怕有遗忘的时候,可通过备忘录,代为记忆。 菜单功能扩展。一般是为了扩展数据分析功能。比如您自己开发了一个数据库软件,这个软件用来分析采集的数据,可把软件挂接在本 软件上,方便使用。 日志。记录每个重要的操作。比如对类别的维护,对任务的维护等等。可对日志进行清理和备份。 数据高级处理。可对采集的数据进行全方位的二次再加工。可批量过滤重复数据。 修补E-mail。如果您采集的信息里面没有E-mail数据,可进行修补。 文件下载。可对采集的数据进行相应的文件下载,比如图片,多媒体,软件等。 任务调度。设置任务自动循环运行,然后把采集的数据,自动导入数据库,自动去掉重复数据,无人值守的情况下达到数据同步。 数据自动保存。可设置自动保存周期,即使突然断电,也能有效保护数据。 通过发布页面,把采集的数据发布到网站数据库。此功能适用于租赁的数据库, 不能直接连接, 网络提供商只提供了一个发布页面的情况。
  • 可设置采集一定数据量后, 自动保存到数据库, 保存后清空历史数据。此功能可在占用系统资源很少的情况下, 连续不间断地采集十万级和百万级数据。


功能特色:


1.强大的信息采集功能。可采集几乎任何类型的网站信息,包括静态htm,html类型和动态ASP,ASPX,JSP等。可N级页面关联采集,自动整合成一条完整记录。支持网页框架,链接和网页加密等。支持完整采集和增量采集(断点续采)。
2.网站登录。需要登录才能看到的信息,先在任务的'登录设置'处进行登录,就可采集登录后才能看到的信息。
3.速度快,运行稳定。真正的多线程,多任务,运行时占用系统资源很少,可稳定地长时间运行。(明显区别于其他软件)
4.数据保存格式丰富。可把采集的数据,保存为Txt,Excel和多种数据库格式(Access sqlserver Oracle Mysql等)。
5.支持脚本。 可设置脚本类型的任务, 类似javascript:submit('Page',1)等格式的可轻松采集。
6.强大的新闻采集,自动化处理功能。可自动保留新闻的格式,包括图片等(可通过设置自动去除广告)。可通过设置,自动下载图片 ,自动把正文里图片的网络路径改为本地文件路径(也可保留原样);可把采集的新闻自动处理成自己设计的模板格式;可采集具有分页形式的新闻。 通过这些功能,简单设置后即可在本地建立一个强大的新闻系统,无需人工干预。
7.强大的信息自动再加工功能。对采集的信息,可进行二次批量再加工,使之更加符合您的实际要求。也可设置自动加工公式,在采集的过程中,按照公式自动加工处理,包括数据合并和数据替换等。
8.提供从采集,到自动加工,到数据导出(发布)一条龙自动化功能。通过任务调度实现,实时监测和发布。指定某些任务自动运行,把采集的数据自动去掉重复之后导入数据库(可指定组合唯一项)。可循环往复运行。可指定某任务在某个时间点运行。可设置采集一定数据量后,自动保存入库,自动清空内存。此功能可在占用系统资源很少的情况下,连续不间断地采集十万级和百万级数据。
9.可自动下载二进制文件,比如图片,软件,mp3等。
10.采集本地磁盘信息。使用'列表类型'的任务,可象采集网络上的信息一样,采集本地磁盘上的信息。
11.通过发布页面,把采集的数据发布到网站数据库。即用群发数据的方式,模拟人工提交数据。
12.无人值守采集。 启动任务后, 可自行采集, 自动保存进数据库, 采集完毕后自动关机。既可提高工作效率, 又可最大限度节约能源。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

纳速健身网成立于2006年8月,是国内优秀健身运动网站,现拥浏览人数超30万。网站是集养生、武术、太极拳和健身气功等多种健身项目于一体的多功能交流平台。平台提供大量优质的教学视频、伴奏音乐(太极拳晨练音乐,广场舞音乐,健身气功音乐)、图文教程、运动科普和经验分享,为健身爱好者提供完善的运动指导平台。
  • 纳速QQ群乙:151815303
  • 纳速QQ群丙:79104490
  • 微信交流群:微信好友搜索【nasuwang】加小纳微信进群交流健身知识,备注【纳速】
  •                     或者扫描页面底部右侧二维码添加小纳微信>>>
  • 微信公众号

  • 微信群客服交流

  • Copyright © 2006-2021, 纳速健身网. | | 辽ICP备13002388号-1 辽公安网备21050202000005号公安网备号 纳速武术-乙 QQ