纳速健身

标题: 网络信息采集机器人介绍 [打印本页]

作者: awagink    时间: 2008-2-18 08:21
标题: 网络信息采集机器人介绍
网络信息采集大师(NetGet)3.28

傻瓜式建站法,帮你快速建站    教你轻松下载土豆网搞笑视频

文件大小:0B
下载次数:205
更新日期:2006-09-15 13:24
软件版本:3.28
适用平台:Win9x/Me/NT/2000/XP
软件类型:免费版
立即下载
文件大小:0B

网通下载   电信下载

企业版破解补丁:

(, 下载次数: 0)


《网络信息采集大师》概述

网络是信息取之不尽的源泉。面对如此丰富繁多的网络信息,难道你不想取之为我所用吗?答案是很明显的。
而信息采集的难点是什么?---数据复杂,下载后的难点又是什么?---数据管理
网络信息采集大师NetGet)的使命,就是解决这两个问题。一般数据采集是有针对性的,通常是针对某个或者某些网站,采集某些类别的数据。比如采集几个网站的新闻,人才招聘信息,产品信息,供求信息,公司库信息等等。对这些网站的数据结构进行简单分析后,设置相应的采集规则,就可以把你想要的数据统统下载到本地。本软件支持分类,分类的目的是数据便于管理,便于统计分析。可以按照网站进行分类;也可以按照你所感兴趣的方式分类,比如分为人才招聘类,产品信息类等;某一类下边还支持小类,没有任何限制。
现有功能简介:


功能特色:


1.强大的信息采集功能。可采集几乎任何类型的网站信息,包括静态htm,html类型和动态ASP,ASPX,JSP等。可N级页面关联采集,自动整合成一条完整记录。支持网页框架,链接和网页加密等。支持完整采集和增量采集(断点续采)。
2.网站登录。需要登录才能看到的信息,先在任务的'登录设置'处进行登录,就可采集登录后才能看到的信息。
3.速度快,运行稳定。真正的多线程,多任务,运行时占用系统资源很少,可稳定地长时间运行。(明显区别于其他软件)
4.数据保存格式丰富。可把采集的数据,保存为Txt,Excel和多种数据库格式(Access sqlserver Oracle Mysql等)。
5.支持脚本。 可设置脚本类型的任务, 类似javascript:submit('Page',1)等格式的可轻松采集。
6.强大的新闻采集,自动化处理功能。可自动保留新闻的格式,包括图片等(可通过设置自动去除广告)。可通过设置,自动下载图片 ,自动把正文里图片的网络路径改为本地文件路径(也可保留原样);可把采集的新闻自动处理成自己设计的模板格式;可采集具有分页形式的新闻。 通过这些功能,简单设置后即可在本地建立一个强大的新闻系统,无需人工干预。
7.强大的信息自动再加工功能。对采集的信息,可进行二次批量再加工,使之更加符合您的实际要求。也可设置自动加工公式,在采集的过程中,按照公式自动加工处理,包括数据合并和数据替换等。
8.提供从采集,到自动加工,到数据导出(发布)一条龙自动化功能。通过任务调度实现,实时监测和发布。指定某些任务自动运行,把采集的数据自动去掉重复之后导入数据库(可指定组合唯一项)。可循环往复运行。可指定某任务在某个时间点运行。可设置采集一定数据量后,自动保存入库,自动清空内存。此功能可在占用系统资源很少的情况下,连续不间断地采集十万级和百万级数据。
9.可自动下载二进制文件,比如图片,软件,mp3等。
10.采集本地磁盘信息。使用'列表类型'的任务,可象采集网络上的信息一样,采集本地磁盘上的信息。
11.通过发布页面,把采集的数据发布到网站数据库。即用群发数据的方式,模拟人工提交数据。
12.无人值守采集。 启动任务后, 可自行采集, 自动保存进数据库, 采集完毕后自动关机。既可提高工作效率, 又可最大限度节约能源。





欢迎光临 纳速健身 (https://nasue.com/) Powered by Discuz! X3.4