PAT-tree相关论文
该文介绍了作者开发的面向领域的关键词提取系统.面向领域的关键词提取系统自动提取特定领域语料库中的领域关键词,并且可以发现普......
随着Web文档数量的剧增,搜索引擎也暴露了许多问题,用户不得不在搜索引擎返回的大量文档摘要列表中查找.而对搜索引擎结果聚类能使......
提出了一种基于序列数据挖掘的中文网页候选特征的选择方法,并用于中文网页分类模型.该方法运用改进的PAT树结构挖掘频繁出现在同一......
文中根据Internet搜索引擎的特点 ,提出了用PATTree作为搜索引擎索引数据库的思想 ,在理论上对其可行性进行了分析 ,用它实现了一......
针对基于Web页面信息本体的信息抽取中,需人工根据待抽信息项的概念和对应的实例值来建立本体的缺点,设计一个页面信息本体的自动......
本体作为语义基础被广泛应用于信息检索、人工智能、语义网络和知识管理等领域。然而本体的构建和维护工作费时费力,影响了本体的广......
本体作为语义基础被广泛应用于信息检索、人工智能、语义网络和知识管理等领域。然而本体的构建和维护工作费时费力,影响了本体的广......
本体作为语义基础被广泛应用于信息检索、人工智能、语义网络和知识管理等领域。然而本体的构建和维护工作费时费力,影响了本体的......
使用基于PAT-Tree的候选短语提取算法,通过修改PAT-Tree数据结构使之适合处理变长中文字符串及非中文字符。根据交互信息评估字符......
随着Web文档数量的剧增,搜索引擎也暴露了许多问题。对于一般的查询返回的结果很多,其中很多是无用或无关的结果,为了找到想要的结果,......
基于词典的中文分词程序不能正确划分文本中包含的新词(词典中没有涵括的词)。如果需要处理的中文文本中包含很多新词,基于词典的......
未登录词翻译一直是机器翻译和跨语言信息检索的重点和难点之一。随着社会信息化和网络的飞速发展,网络上出现层出不穷的新词、术......
随着互联网的飞速发展,网络媒体已经成为继报纸、广播、电视之后的第四大媒体。由于网络新闻所具备的开放性、信息传播的快速性等特......