html-extractor.rar
文件大小: 5k
下载次数:8
源码类别:

WEB源码(ASP,PHP,...)

开发平台:

PHP

源码售价: 5 个金币 积分规则     积分充值
资源说明:发布一个HTML正文提取程序HTMLExtractor, 程序主要是基于内容统计的方法,暂不包含自学习能力,仅是 一个分析程序而以,网上也有别人实现了的正文提取程序,不过 大部人都当宝,都不愿意公开完整代码,有些大人实现了一些简 单的,不过分析能力和识别能力都不太理想。所以自己做了一个 简单的,本来想用PHP DOM分析器,不过大部份网页都不规范, 缺个标签啥的都很正常,所以自已又造了个简单的轮子分析HTML标 签,功能比较简单,每个元素都生成一个对象,内存方面占用比较 高,不过在这里我只是为了实现,并没去做优化。因为我并不是在 做应用,所以希望不要让我改改成什么样去适用你们的业务(以前经常 有QQ加上让我把我的例子怎么改,很无语), 如果你们喜欢,可以和我一起开发完善他。 补充一下,因为写的着急,现在几个类的耦合性还比较大,下来再守善吧。 项目代码 http://code.google.com/p/html-extractor/ 在线例子 http://dev.psm01.cn/c/html-extractor.php
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。
    
  • zyp.rar校园网站模板,史上最经典模板下载校园网站模板,史上最经典模板下载 ...
  • shihua.rar校园网站的设计与实现,史上最强校园网站模板。
  • 52ccc55a371572d86a7d2c6992a2591b.rar企业网站建设 应用程序开发 网络商城建设 网站优化推广 国际域名注册 虚拟主机 企业邮 ...
  • BookSellAnalysis.rar图书销售智能分析 会员级别分析,会员消费分析,会员类型分析,图书推荐,销售走势分 ...
  • 671chapter9.rar实现了新闻页面中新闻的添加删除功能,以及点住标题出现新闻内容 ...
  • GamVanClub.rar特色: 1.今晚在线社区独有的双风格分桢形式 2.社区最多可进行3级分类,大部分论坛应 ...
  • NG.zipPHP-curl implementation of a spider that does a certain thing on the website new ...
  • YDMusic.rar1、生成全本HTML效能优化 2、优化采集程序使采集音乐速度更快 3、增加批量专辑采集 4 ...
  • gouwuche.rar购物车的实现!只是简单的而已!也许会帮助
  • shangpinxiangmu.rar商品项目 是一个模拟Struts框架的购物网站
    
  • 400套超酷网站模板.rar400套超酷网站模板 有很多朋友做网站的时候都因为没有模板而着急,现在好了,有400套 ...
  • Android_1.0_eBook_by_tom_kao_2008_10_15.rar高焕堂android中文书全,电子文件for version 1.0 好东西,不藏私 高焕堂写的关于androi ...
  • zhangyw_NHS.rarasp.net 1.1编写的网上作业系统,为本人历时4个月的苦心力作,功能非常强大,包括学生 ...
  • OAJP.rarcsdn三楼楼长提供的精品OA下载(包括完整的源程序、文档及数据库) 此程序为作者所在 ...
  • ch.zip将HTML转换为TXT文本的小程序
  • apache-tomcat-6.0.13.rartomcat 最新版本6.0.13 ,从Apache官方网站上当的
  • jsp+servlet+javaBean+sql_server.rar一个学生成绩管理系统`用jsp+servlet+javabean设计基于mssql数据库` 带有数据结构图和 ...
  • 计算机考试网上报名系统.rar全国计算机等级考试在线注册系统,四六级考试报名系统,asp结合网页在线报名 ...
  • OA.rarcsdn三楼楼长提供的精品OA(包括完整的源程序、文档及数据库) 此程序为作者所在的开发 ...
  • htmlpars.zip利用IE接口分析HTML文件