【摘 要】
:
本文提出了一种能更准确的反映两个汉字串之间相关程度的新概念--黏结度,并给出了其计算方法.该方法把需要计算相关程度的汉字串放在一个大环境中进行讨论,通过加入上下文信
论文部分内容阅读
本文提出了一种能更准确的反映两个汉字串之间相关程度的新概念--黏结度,并给出了其计算方法.该方法把需要计算相关程度的汉字串放在一个大环境中进行讨论,通过加入上下文信息来提高分词的准确度;另外,该方法在引用汉字词频时,增加了对动态词频的考虑,可以自动识别未登陆的专业词汇.文中同时给出了黏结度在分词领域中的应用实例.通过与前人提出的相关信息的方法相比较,这种计算方法能够解决分词中一些难于解决的问题并提高分词的精确度.
其他文献
目的了解1993年和2001年安徽省枞阳县15岁以上农村居民的吸烟模式及相关因素变化情况。方法采用随机整群抽样调查、描述性分析和非条件logistie回归分析。结果总吸烟率、现在
本文从形式化的角度讨论了汉语文本的形式结构及有关的基本概念,给出了文本的标题、子标题、段落及其层次结构的一种划分与标记方法,提出了规范的与准规范的文本等概念,并以
目的探讨腹腔镜对异位妊娠诊治的价值.方法采用腹腔镜下诊治56例异位妊娠.术中应用不同手术方法治疗异位妊娠.结果56例异位妊娠全部在腹腔镜下得到进一步诊治,无中转开腹.结
“十二五”规划前期研究工作已经启动。每次制定五年规划都遇到目标量化问题,而量化过程中遇到的基本问题是确定标准和基础数据采集,这几乎成为所有主体规划和单项规划中的瓶颈
中国经济的快速发展,重化工化和城镇化进程的加快,常规能源的支撑能力已经受到了严峻挑战,资源的制约和环境状况的恶化,迫切需要改变低效、高污染的能源结构。但是,作为清洁能源的
鄂尔多斯西缘前陆盆地中生界储层砂岩成岩作用主要受前陆盆地构造演化的影响,不同构造区带砂岩储层的成岩环境存在一定的差别。研究发现,冲断带近物源区由于杂基和软矿物含量高
令人回味的2009年即将过去。纳入世界经济大背景之下去回首中国经济过去一年的变化,尽管过程很艰难,也有一些不确定性,但从运行结果看,却是令人赞叹的:在世界经济环境的逆风之
根据地貌、地震、压应力分布、地壳运动的GPS速度矢量、新生代沉积、新生代火山岩、古地磁、深部地幔结构等特征,论证中国大陆及邻区自新生代以来呈现整体右旋运动特征,动力
在文语转换(TTS)系统中,正确标记短语间的停顿对提高合成语音的自然度起着重要作用.本文介绍了一种在汉语语句中自动预测短语间停顿的方法.首先,文本进行分词,并转换为一列由
声音转换技术可以将一个人的语音模式转换为与其特性不同的另一个人语音模式,使转换语音保持源说话人原有语音信息内容不变,而具有目标说话人的声音特点.本文研究了由遗传算