藏语句子相似度算法的研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:sdfsdfsdfasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了一种藏语句子相似度的计算方法,即采用散列单词倒排索引和基于句长相似度粗选的算法,快速从语料库中筛选出候选句子的集合,散列单词倒排索引能够有效提高算法的查找速度;再采用基于词形和连续单词序列相似度的多策略精选算法,可以有效衡量两个藏语句子的相似程度。实验结果证明算法是有效的。
其他文献
新学期伊始,为了让学生感受高考,笔者依据2011年各地高考历史试题和苏北四市模拟题组合了一张试卷,对我班学生进行了限时测试。从阅卷分析上看,他们在答卷中暴露出许多问题,部分题目失分非常严重。于是,笔者要求他们写出考试小结,重点总结失分原因以及自己应对考试最欠缺的地方。依据他们所作的小结,笔者对答题的失分原因进行了归类,整理如下,希望对同学们有所帮助。  一、时间记忆不清楚  【学生反馈】“一遇到时
发动机是汽车的重要组成部分,缸盖是发动机的重要零部件,精度要求高、加工工艺复杂,加工的质量直接影响发动机的整体性能和质量。其负责发动机的配气组成机构,控制着发动机的