论文研究 - 基于HMM的文档文本字段的数学表达提取。
文件大小: 2048k
源码售价: 10 个金币 积分规则     积分充值
资源说明:针对难以自动,快速,有效地提取文档非结构化文本域中的数学表达式的问题,提出了一种基于隐马尔可夫模型的方法。 首先,该方法通过利用数学表达式的符号组合特征来训练HMM模型。 然后,进行了一些预处理工作,例如删除标签和过滤单词。 最后,将预处理后的文本转换为观察序列,作为HMM模型的输入,以确定哪个数学表达式并将其提取出来。 实验结果表明,该方法可以有效地从文档的文本字段中提取数学表达式,具有较高的准确率和查全率。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。