【摘 要】
:
研究汉语文本自适应压缩算法还是探讨汉语文本自适应模型的有效途径.汉语文本自适应模型是汉语分词、汉字识别、词性标注和文本自动校对等汉语自适应处理系统的重要基础.该文
论文部分内容阅读
研究汉语文本自适应压缩算法还是探讨汉语文本自适应模型的有效途径.汉语文本自适应模型是汉语分词、汉字识别、词性标注和文本自动校对等汉语自适应处理系统的重要基础.该文综述了数据压缩、尤其是文本压缩的研究与发展情况,并对汉语文本自适应压缩技术涉及到的若干重要问题进行了全面的研究.
其他文献
IP电话的核心是IP网关,该课题的任务就是设计IP网关.它处于PSTN网和数据网之间,成为两种网络间的桥梁.研究人员使用No.1信令与程序交换机通信,在概论之后,论文详细介绍了信令
该文研究如何完整表示设计模式并将它应用于软件设计过程,从而发挥它对设计的潜力,使设计过程越来越确定、越来越成熟.该文首先分析了设计模式本质,指出它是一个面向软件设计
论文就微行星齿轮减速器的选型进行了分析,采用了微3K-2型行星齿轮减速器;对微行星齿轮减速器的配齿与建模进行了设计;对微齿轮的建模方法进行了讨论,提出了一种较好的、符合
该文介绍了智能卡的软硬件知识,主要是智能卡的内部结构,文件组织及一些关键操作.针对智能卡在信息存储、信息保密和信息认证方面的特性,突出了智能卡在现实世界信息安全和信
该文围绕着大规模散乱数据可视化中的问题,分别用层次B-样条曲面和多尺度分析技术,对大规模散乱数据进行表示.作者在该文中提出的自适应层次B-样条曲面逼近是针对在实际应用
该文以数据预处理阶段中属性子集的选择问题、属性约简问题和连续属性离散化方面 为主要研究内容.在属性子集的选择上,作者提出利用信息熵作为识别相关属性的度量标准.在属性
鉴于微博媒体方式的流行,越来越多的用户使用微博进行社交交互,有必要在呼叫中心里集成微博。呼叫中心的客户大都是政企单位,这些单位使用呼叫中心系统对外提供业务服务,承载
在电子商务的应用中,协同过滤算法是一种很实用也很简便的方法。通过一系列具有相同的体验或者偏好的用户群体的经历来为特定用户进行推荐。每一个个体对于推荐的结果给予一
该论文的主要内容由三个部分构成:1.介绍COSIX V2.0操作系统的体系结构.作为基于微内核的多态结构的操作系统,COSIX V2.0主要分三个层次:核心层、服务器层和用户层;2.对COSIX
该文在介绍信息搜寻与发现中的"Rich Data Poor Information"问题产生根源的基础上,较为详细地讨论了网络信息的获取以及信息搜寻与发现技术的各个方面,最后介绍我们开发的原