资源说明:主要应用领域:
• 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量采集,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧
• 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地 采集内容,输出富含语义元数据的XML格式的抓取结果文件,确保自动化的数据集成和加工,跨越小尺寸屏幕展现和高精准信息检索的障碍。手机互联网不是 Web的子集而是全部,由MetaSeeker架设桥梁
• 企业竞争情报采集/数据挖掘:俗称商业智能(Business Intelligence),噪音信息滤除、结构化转换,确保数据的准确性和时效性,独有的广域分布式架构,赋予DataScraper无与伦比的情报采 集渗透能力,AJAX/Javascript动态页面、服务器动态网页、静态页面、各种鉴权认证机制,一视同仁。在微博网站数据采集和舆情监测领域远远领 先其它产品。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。
-
- Google.Hacks.rarGOOGle搜索引擎,平时不知道的神秘功能
- SearchHistory.rar搜索记录查看器,用于读取goole,yahoo,live等搜索引擎的搜索历史,以及yahoo车站搜索 ...
- totsearch.rar淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的 ...
- YiBaidu.zip李彦宏 壹百度
- totsearchc.rar搜索引擎(asp.net)开发实例搜索引擎(asp.net)开发实例
- org.apache.lucene.analysis_1.9.1.v200706181610.jarLucene 搜索引擎的一个庖丁解牛的jar包,找了好久才找到的.
- Searcharoo_7_its.zipsearch engine which create in C#
- SiteNumOne.rar是一款主流搜索引擎自动点击的工具,操作简单,轻松提高网站关键词自然排名,站长必备 ...
- LuceneAndNuch_Ch1-10.rarLucene+Nuch搜索源代码_Ch1-10.rar
- Exersize2.rarSSD4 Exercise 2 Answer for this course...
-
- Apian.rar下载软件和影视等的软件,非常的好用。还可以搜索A片及下载。 ...
- Web_Crawler.zipc++ spider 源代码 网络爬虫 适合研究搜索引擎
- swish-efiles.1.3.2.tar.gz用C语言写的搜索引擎,包含多种建立索引的方式
- spider(java).rar 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot) ...
- Internet蜘蛛程序.zipInternet蜘蛛程序 所谓蜘蛛即SPIDER! 相信大家都知道是什么意思 ...
- xunlong0.6.rar完整的.net搜索引擎采用LUCENE.net为索引核心,分布式架构.包含wordnet,分词,spider,简 ...
- websearch.zip简单的全路径全文搜索的程序
- SearchEngineer.rar本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三 ...
- lucene+mysql+eclipe.rarlucene+mysql+eclipe开发实例,实现了分页和中文分词。欢迎交流qq:276367673 ...
- TSE_all.rar搜索引擎电文子档,PPT,MP3。北大天网的。搜索引擎名称TSE