【摘 要】
:
在农业垂直搜索引擎研究过程中,中文分词是重要的研究方向。针对传统农业垂直搜索引擎搜索信息抽取不准确、速度慢等缺点,采用双数组Trie树为基本模型,利用中文词条首字区位
【机 构】
:
中国农业大学烟台研究院,中国农业大学信息与电气工程学院,农业部农业信息获取技术重点实验室,山东省农业科学院科技信息研究所
论文部分内容阅读
在农业垂直搜索引擎研究过程中,中文分词是重要的研究方向。针对传统农业垂直搜索引擎搜索信息抽取不准确、速度慢等缺点,采用双数组Trie树为基本模型,利用中文词条首字区位码与数据库表行号相对应的方式,并根据农业垂直搜索引擎的需要设置了农业词汇的词性编码,以My SQL数据库为例设计了农业领域专用的分词词典。该分词词典可充分利用数据库的优势进行词典组织,并且可以进行词库的远程共享和共同维护,方便不同的系统进行访问;词条按首字分类存放构造双数组Trie树,可有效减少构造过程的内存空间。该农业分词词典结构对其他领域
其他文献
以兰州城区乔木(槐树和榆树)、灌木(杜鹃和黄杨)、草本(黑麦草和三叶草)3类植物为试材,研究其滞尘量的差异及蒙尘后的生理响应。结果表明:不同绿化植物的滞尘能力差异显著,3种植物平
藏东南是忍冬属植物种类比较丰富的地区之一,其种类约占全国的24%,世界的12%。基于对藏东南分布的忍冬属植物资源资料进行系统的整理和研究现状综述,编制了藏东南忍冬属植物1亚属4组9亚组24种1亚种6变种2变型分组分种检索表,对比分析了各个种的表型特征和分布规律及其主要影响因子,并论证了该属植物的演化与青藏高原隆升的关系。发现忍冬属植物在该区域的分布从西北部到东南部、高海拔到低海拔,其生活型呈现了由
防止权力滥用,必须对权力进行限制、规范与监督。加强权利保障,必须建立有效权利救济机制。由于现行法律对高校学生管理权规定不明、界定不清,使得本处于优势地位的高等学校在行
内适性与外适性是评判高等教育质量高低的两个重要标准,内适性属于高等教育的预设性质量,外适性属于高等教育的检验性质量。内适性是外适性的内在依据和保障,外适性是内适性的外
随着现代信息化技术的发展,多媒体技术为大学教育创新提供了更加广阔的空间。从多媒体技术辅助教学概念出发,分析阐述了在武警院校电子技术基础教学中运用多媒体技术,可以起
贫困生作为高等职业院校学生中的特殊群体,就业问题是他们生活的重中之重。调查显示,随着年级升高,高职院校贫困学生就业压力增大,且差异显著;高职院校的贫困生就业心理处于矛盾状
在当前全球化形势下,社会对大学生的跨文化交际能力要求日益强烈。在笔者在已完成湘鄂渝黔边区学生跨文化交际能力调查的前提下,提出培养湘鄂渝黔边区大学生跨文化交际能力的