-
-
html.rar
html的各种标签,很重要的参考资料。可以通过这个文档查找各种标签。
-
-
-
-
-
-
-
html-extractor.rar
发布一个HTML正文提取程序HTMLExtractor,
程序主要是基于内容统计的方法,暂不包含自学习能力,仅是
一个分析程序而以 ... 不规范,
缺个标签啥的都很正常,所以自已又造了个简单的轮子分析HTML标
签,功能比较简单,每个元素都生成一个对象,内存方面占用比较
高,不过 ... 个类的耦合性还比较大,下来再守善吧。
项目代码 http://code.google.com/p/html-extractor/
在线例子 http://dev.psm01.cn/c/html-extractor.php
-
-
-