文本切分知识获取及其应用

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:szcentsweb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 文章描述了一种从熟语料中自动获取文本切分知识的机器学习的方法。该方法从已切分标女b‘^&64十自动获取错误的文本切分形式及其相应的上下丈信息,以及正确的切分形式,形成知识库,并将获取的知d再应m到㈤语料的加工过程,从而进一步提高机器切分的正确率;同时,采用滚动式的方法,建造具有较高加I质量的女Ⅲ模6料库。
  关键词 分词 知识获取 语料库 质量保证
  文章编号1002—8331—(2003)02—0063—02 文献标识码A 中图分类号TP391
其他文献
摘 要 自动指纹识别的关键技术之一是指纹特征的检出。目前,指纹特征检出大多是先采用图像增强和图像分割技术检出指纹纹线,然后从指纹纹线图像中检出指纹特征。用这些方法检出的指纹特征依赖于图像分割的精度,而且检出过程>L较复杂,运算速度比较慢。为此,提出一种直接按指纹梯度矢量的方向图进行指纹特征检出的算法。文中的算法是先采用拓宽的Prewitt算子计算指纹图像的梯度矢量图,然后计算梯度矢量的方向一致
期刊
摘 要 多媒体任务的处理能力是可穿戴计算机的重要性能指标,为了使配备国产CPU的可穿戴计算机具有较强的多媒体任务处理能力,采用了可伸缩的系统结构模型。设计了15条面向多媒体任务的新指令,实现了执行新指令的多媒体任务协处理部件的逻辑结构设计,并利用工具软件对协处理部件进行了功能和性能的仿真,实验结果表明:利用可伸缩系统结构模型提高可穿戴计算机的多媒体任务处理能力是可行的。  关键词 可穿戴计算
期刊
摘 要 Web仓储是使用物化视图方法有效利用Web信息的重要技术。Web仓储系统进行刷新的目标是追求最大的系统时新性,不同的数据时新性标准,决定着不同的系统刷新方案。文章提出了一种基于“状态—效果”的系统时新性标准。分析和实验都表明,所介绍的标准和传统的基于“状态”的标准有着本质不同,它不仅倾向于用户查询结果的最佳化,视图刷新方案也有较强的可操作性,特别适合于复杂多变的Web环境。  关键词 
期刊
摘 要 论文介绍一套应用于博物馆熊猫模型的口语对话系统。该系统利用大词汇量非特定人连续语音识别技术与,语对话模型实现了智能熊猫系统的人机知识问答。系统采用统计的正则语言模型和机器主导的口语对话策略提高系统的识别速度和识别率。由于采用基于子词的声学模型,系统的识别词表易于增加,不受限制。该系统自2001年7月起在北京自然博物馆正式运行,系统对环境噪声以及带有不同方言口音的普通话都表现出良好的稳健
期刊
摘 要 数据挖掘是一种新兴的信息处理技术,在信息的利用和提取中发挥着日益重要的作用。论文从数据挖掘的概念和本质出发,详细阐述了数据挖掘的各种技术方法,深入分析了数据挖掘技术的应用领域,并对数据挖掘应用中的主要问题进行了探讨。  关键词 数据挖掘 知识发现 技术方法 应用领域  文章编号1002—8331—(2003)02—0045—04 文献标识码A 中图分类号TP391
期刊
摘 要 作业成本法在企业战略决策和战术决策方面都有应用,但是如何使作业成本实施同时满足战略与战术决策的需要,是实施应用的难点。文章提出一种两级作业成本管理系统的实施体系和框架结构,把企业看成部门的集合体。在部门层次,分别对各部门实施作业成本,侧重于战术决策,在企业层次,对各部门的实施进行信息综合,支持战略决策。对作业成本核算模型在以下三个方面进行了扩展:丰富的分配路径、统一的动囚管理、统一的分
期刊
摘 要 域名系统作为当今Intemet的基础架构,将在下一代网络中发挥更大的作用。IPv6是被设计用来取代IPv4协议的下一代网络协议,它的许多新特性也需要域名系统的支持。论文根据IPv6的地址结构特点分析了1h6中域名系统的体系结构和扩展方法,并给出了具体的在Linux下的实现方案。  关键词 DNS IPv6 Linux  文章编号1002—8331—(2003)02—0049—04
期刊
摘 要 该丈介绍了一个非监督、多级嘴唇区域分割检测方法。首先提出利用hsher变换增强嘴唇区域,然后利用嘴唇在人脸区域的分布面积比,提出利用统计阈值完成嘴唇的初步分割,最后利用嘴唇对称性和轮廓光滑性的先验知识,提出了基于局部阈值调整完成嘴唇的精细分割。实验证明该方法在不同光照条件下、对不同人、各种表情都能自动地、鲁棒地、精确地检测出嘴唇区域,并较准确提取初步的嘴唇几何参数。利用这些几何参数作为
期刊
摘 要 在二维CIS系统中经常需要对图层中的多边形进行叠置分析,为了有效地分析不同系统提供的多边形图层数据,论文研究了地理信息系统中表示多边形图层的两种数据结构——简单数据结构和拓扑数据结构,以及分别适用于这两种情况的多边形叠置算法。拓扑数据结构下的算法现在已经很成熟,论文重点介绍简单数据结构情况下的算法。  关键词 CIS 多边形 叠置分析 线段相交  文章编号1002—8331—(
期刊
摘 要 在矩阵压缩存贮中引入0—l属性矩阵的概念,并在0—1矩阵的基础上给出了利用一维动态数组以及二维动态数组和一维动态数组混合存贮稀疏矩阵的寻址公式,该存贮方法为快速有效的存贮方法,节约了内存空间。  关键词 稀疏矩阵 0—1属性矩阵 压缩存贮  文章编号1002—8331—(2003)02—0082—02 文献标识码A 中图分类号TP301.6
期刊