【摘 要】
:
基于类的语言模型被认为是解决数据稀疏的有效方法。众所周知,自然语言中存在着大量一词多义、一词多性的现象,这在传统基于硬聚类的词类划分下无法表达。而基于软聚类的类语
【机 构】
:
解放军理工大学通信工程学院研究生1队; 解放军理工大学通信工程学院;
【基金项目】
:
江苏省自然科学基金资助项目(BK2012511)
论文部分内容阅读
基于类的语言模型被认为是解决数据稀疏的有效方法。众所周知,自然语言中存在着大量一词多义、一词多性的现象,这在传统基于硬聚类的词类划分下无法表达。而基于软聚类的类语言模型采用大数定律,依然没有摆脱在最终计算时一词一类的思维模式。为解决此类问题,基于词的软聚类,结合模糊数学,提出了词的隶属度,以及基于隶属度的模糊类语言模型。该模型提高了传统类语言模型对训练语料中历史信息的利用率,较基于词的语言模型能给未出现词对提供更多的类内参考数据。设计了一个小语料集的实验,结果表明在数据稀疏条件下,较传统的类语言模型有更好的效果。
其他文献
强化大曲是通过人工方法,增加有益微生物数量,更好地调节菌群之间的均衡性,使大曲品质提升。通过试验,设置强化大曲不同菌种的扩培条件,进行单菌种和混合菌种的单因素轮换试
在整个道路工程施工总成本中,机械设备的使用成本占比很重,尤其是在路面施工中,这一占比达到30%,且其中用在机械设备维修保养中的费用又占有较大比例。另外,机械设备保养工作
保障安全与提高效益是当前高校固定资产管理的两大主要目标,在实际管理工作中存在诸多问题。本文通过高校固定资产安全与效益风险分析,从加强制度创新,完善责任体系,提升管理
<正> 一、渗流问题的有限单元法本文为不习惯矩阵的人,采用了与其它文献上所见到的矩阵表示不同的方法来叙述用有限单元法解渗流问题的方法,当然,这种表示与矩阵表示在本质上
文本分割的实质是根据文本内子主题的相似程度,将文本切分成若干个语义段落,每个段落的内部具有最高的语义一致性。因此,文本分割最需要解决的技术难点为度量文本的相似性及识别
<正>2010年6月9—11日,由农业部畜牧业司、全国畜牧总站主办的全国畜牧良种补贴项目管理与技术培训班在山东烟台举行。会议贯彻落实了中央1号文件精神,全面总结了畜牧良种补
对银杏叶提取物的有效成分、质量标准,药效学的研究成果、药用价值和食用价值作一综述,以进一步认识和指导银杏制品的开发和应用。
公共艺术选修课作为高校普遍开设的一门公共艺术选修课,在整合教育资源、提升学生艺术素养和塑造完善人格等方面具有重要作用。目前地方高校的公共艺术选修课还存在一系列问