资源说明:要构建搜索引擎,首先要收集各个FTP站点的文件信息,记录到数据库,用于提供搜索。因特 网中有许多的FTP站点,要收集某个FTP站点的信息时,从数据表中读出站点信息,然后登陆到此站点,多数FTP服务器都开辟有一个公共访问区,称为"匿 名FTP",对公众提供免费的文件信息服务,一般用户名为 Anonymous,密码为一个Email地址。数据采集程序用此用户名和密码登陆站点,然后对站点所有目录进行采集,读取每个目录下的文件信息,在收到 文件信息之后,对其进行分析,将文件信息存储到相应的数据表字段中。完成此站点的数据采集之后,再读取另外一个FTP站点的信息,进行文件信息采集。如此 循环,采集所有已知FTP站点的文件信息。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。
-
- Google.Hacks.rarGOOGle搜索引擎,平时不知道的神秘功能
- SearchHistory.rar搜索记录查看器,用于读取goole,yahoo,live等搜索引擎的搜索历史,以及yahoo车站搜索 ...
- totsearch.rar淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的 ...
- YiBaidu.zip李彦宏 壹百度
- totsearchc.rar搜索引擎(asp.net)开发实例搜索引擎(asp.net)开发实例
- org.apache.lucene.analysis_1.9.1.v200706181610.jarLucene 搜索引擎的一个庖丁解牛的jar包,找了好久才找到的.
- Searcharoo_7_its.zipsearch engine which create in C#
- SiteNumOne.rar是一款主流搜索引擎自动点击的工具,操作简单,轻松提高网站关键词自然排名,站长必备 ...
- LuceneAndNuch_Ch1-10.rarLucene+Nuch搜索源代码_Ch1-10.rar
- Exersize2.rarSSD4 Exercise 2 Answer for this course...
-
- Apian.rar下载软件和影视等的软件,非常的好用。还可以搜索A片及下载。 ...
- Web_Crawler.zipc++ spider 源代码 网络爬虫 适合研究搜索引擎
- swish-efiles.1.3.2.tar.gz用C语言写的搜索引擎,包含多种建立索引的方式
- spider(java).rar 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot) ...
- Internet蜘蛛程序.zipInternet蜘蛛程序 所谓蜘蛛即SPIDER! 相信大家都知道是什么意思 ...
- xunlong0.6.rar完整的.net搜索引擎采用LUCENE.net为索引核心,分布式架构.包含wordnet,分词,spider,简 ...
- websearch.zip简单的全路径全文搜索的程序
- SearchEngineer.rar本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三 ...
- lucene+mysql+eclipe.rarlucene+mysql+eclipe开发实例,实现了分页和中文分词。欢迎交流qq:276367673 ...
- TSE_all.rar搜索引擎电文子档,PPT,MP3。北大天网的。搜索引擎名称TSE