【摘 要】
:
研究汉语的基本词汇,可以"帮助说明汉语的特点和它发展的规律性".本论文针对基本词汇的"全民常用性、稳定性和构词能力强"特点,在现有语言学家对基本词汇定性研究的基础上,构建基本词汇特征描述向量,及定量提取现代汉语基本词汇集数学模型,采用遗传算法训练特征向量因子权重值,提出了在大规模真实文本的动态流通语料库基础上,定量动态考察现代汉语基本词汇变化状况的模型结构.
【机 构】
:
内蒙古师范大学,计算机与信息工程学院 北京语言大学,应用语言学研究所
论文部分内容阅读
研究汉语的基本词汇,可以"帮助说明汉语的特点和它发展的规律性".本论文针对基本词汇的"全民常用性、稳定性和构词能力强"特点,在现有语言学家对基本词汇定性研究的基础上,构建基本词汇特征描述向量,及定量提取现代汉语基本词汇集数学模型,采用遗传算法训练特征向量因子权重值,提出了在大规模真实文本的动态流通语料库基础上,定量动态考察现代汉语基本词汇变化状况的模型结构.
其他文献
解决水电站中长期风险调度问题,在电力市场环境下,显得尤为必要.在纵观国内外水电站中长期风险调度问题研究现状的基础上,应用集对分析理论对市场环境下水电站中长期调度的风险问题进行具体的分析,对径流、发电用水和电价进行了同异反描述,建立了基于集对分析的中长期风险调度模型,并用一次二阶矩法进行求解,可提供效益与风险的定量关系.
随着科技的迅猛发展,尤其是现代通信与传媒技术的不断进步,人们可以轻而易举地获得大量信息。但问题也随之而来:噪声夹杂其中,使得信息多且杂,难以筛选。此外,人们先要将噪声删除,其次还要在海量信息中确定信息的重要性以及自己对某类信息的依赖程度,这无疑又是难上加难的。本文讨论了用集对分析方法分析、筛选复杂信息系统中的复杂信息,并给出程序框图及应用实例.
本文基于多智能体理论,提出一种采用模糊认知图模型,通过网格节点对任务分配决策支持度进行协商,来实现资源配置的智能网格调度策略.该调度策略无需存在处于上层的资源调度决策单元,各网格节点利用由任务分配而形成的关联作用,通过协商即可实现对资源的调度.该调度策略适用于分布式计算,并支持网格节点的动态变化,具有较好的实时性和鲁棒性.
将南水北调东线工程看成是由蓄水湖泊存储Agent、抽水泵站执行Agent、输水通航河道传输Agent等组成的复杂系统,本文提出基于供应链管理的南水北调东线多Agent调水仿真模型,研究和设计了该仿真模型下多Agent之间的交互协议.详细分析了仿真模型中各Agent交互过程,以及得出和制定的水资源调度计划的可行性和合理性.
风险基础审计是以审计风险的分析和控制为基础,因此审计风险管理在整个审计过程中占据了极为重要的地位.把基于案例的推理方法(CBR)引入审计风险管理中,有利于审计人员的经验传承,提高审计风险管理的质量.
作为计算机进行中文处理的基础和关键,词语粗分必须能提供少量甚至唯一的高准确度的词语切分结果.本文在引入了词语频率数据的扩展中文词典基础上,结合逆向最短路径、全切分和基于统计概率分词方法,对原有的计算模型进行了改进,实现了一种结合逆向最短路径和统计模型的中文词语粗切分方法.对大规模语料库的实验表明,在返回唯一结果时,该方法的切分正确率达到了99.73%,比以前最好切分方法的正确率提高了6%多,证明该
知识已经成为推动经济发展的主要力量.KMSphere是中科院计算所开发的基于本体的知识管理平台,本文在介绍当前本体开发领域研究现状的基础上,分析对比目前工作的不足,主要针对半自动化本体的创建问题展开讨论,从本体工程角度给出了半自动化本体获取的过程.
随着IT技术的迅猛发展,移动通讯技术渐渐融入驾驶界面的设计之中.信息交流,尤其是言语交流在驾驶过程中变得日益重要,同时由于言语交流造成司机分心而发生交通事故的情况也非常严重. 目的:本研究从驾驶心理负荷的角度,运用实验室实验方法模拟驾驶操作的同时,探讨言语交流的不同过程对各种环境条件下驾驶操作的影响.方法:本研究将言语过程分为言语的理解与言语的产生,按照言语加工水平分为句子加工和段落加工;驾
在民文语料库建设过程中,从基础语料库的建设到依据标准规定进行语料库多层次语言信息的标注,都需要计算机软件工具来辅助进行.本文就此展开讨论,内容涉及民文语料库建设过程中语料的采集、编码、存储和标注.论文工作为深入研究民文语料库工具软件的开发奠定了坚实的基础.
软件人是生活在网络世界中的,具有"分布式移动智体"、"机器人"和"人工生命"特征的虚拟机器人.本文在比较其他人工生命平台的基础上,总结了软件人研究平台的特点,给出了基于人工生命的软件人的适应度模型、生理发育模型、自繁衍和突变模型,并简单描述了软件人群模型.