领域知识在文本聚类应用中的机遇和挑战

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:fronj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近几年,越来越多学者意识到单靠数据驱动的无监督聚类方法很难满足用户对富含语义信息的文本数据的处理需求。领域知识,如领域本体的人工或自动构建、百科全书Wikipedia的网上公布为文本处理带来了新的希望和美好的前景。本文主要阐述领域知识在文本聚类过程中的具体应用、研究现状和所面临的挑战。
其他文献
替代数据方法是检验时间序列非线性和混沌的重要统计方法,应用此方法时,常用的检验统计量各有优势与局限性。本文在采用振幅调节傅立叶变换法(AAFT)产生替代数据后,引入信息冗余度
本文提出了基于DEXEL模型实现数控铣削过程中毛坯体的实时建模方法,减少了内存存储空间,支持观察视角的变化和仿真结果的缩放;根据三轴数控铣床加工的特点,将刀具扫描体看成离散
以美国海军研究生院、美国军事大学和国防大学为研究对象介绍美国高层次人才——包括硕士研究生、博士研究生、高级军官和将领——培养做法,并讨论从中得到的启示。
图像方法仅以屏幕像素为分析对象,与景物的复杂度无关。本文将图像方法嵌入到火焰的粒子系统实现中,用预定的图像来填充火焰的内焰部分,用粒子来形成火焰极不规则的外焰部分,从而在保证火焰高度随机外形的前提下用图像填充降低火焰内部的绘制代价。与其它单纯的粒子系统相比,这种图像、粒子相结合的方法在达到相同的视觉效果下,显著地降低了系统的粒子数,提高了运行效率。
相对于传统有线网络集中化组密钥管理协议和算法,门限秘密共享技术能很好地适应移动自组网(MANET)的特点,提供高效可靠的安全保证。为了防止退出节点合谋重构组私钥威胁组通信安