论文研究-基于HMM的柯尔克孜语词性标注的研究.pdf
文件大小: 604k
源码售价: 10 个金币 积分规则     积分充值
资源说明:柯尔克孜语的语言信息处理研究,对新疆柯尔克孜族是否能跨入信息时代,传承民族文化起着至关重要的作用。采用两级标注法,基于传统的HMM理论,改进了HMM模型参数的计算、数据平滑和未登入词的处理方法,更好地体现了上下文依赖关系。同时,把基于自动分词词典的词干提取算法与规则和统计相结合的方法用于柯尔克孜语的词性标注系统上。相对于传统的HMM,改进后的方法有效提高了准确性。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。