基于CRF模型的维吾尔语分词研究

来源 :中南民族大学学报(自然科学版) | 被引量 : 0次 | 上传用户:angelboy8100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
条件随机场能够很好地处理序列标注问题.引入条件随机场进行维吾尔语分词方法研究,主要包括制定词性和分词单独标注与一体化标注集并建成语料库;设计不同特征模板进行训练测试,反复比较实验结果,总结优化以获取最佳的特征模板.在设计特征模板时充分结合维吾尔语语言形态特征,采用了对称特征组合非对称特征的设计方法,并将获得的最佳分词模板应用到分步预测词性和分词实验中.相比单独分词标注,分词时加入词性特征列进行分词与词性一体化标注能展现更优的分词性能.
其他文献
期刊
期刊
在投资项目的分析过程中,最重要同时也是最难的环节之一就是评估项目的现金流量.现金流量包括项目所需的投资额、项目投入运营现金流量以及项目终结时的现金流量.财务管理人
期刊
期刊
期刊
期刊
期刊