一种对聊天文本进行特征选取的方法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:duobao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于网络聊天文本具有结构松散、简短、上下文相关等特点,对其进行特征选取时使用传统的TFIDF(Term Frequency Inverse Document Frequency)算法存在较大缺陷。针对这个问题,本文提出了一种通过聊天主题来确定聊天文本的特征选取范围的方法,并通过实验验证了该方法的有效性。
其他文献
为研究循环爆炸对地下洞室的影响,基于相似模型试验,采用通用有限元软件ABAQUS对比研究了洞室拱顶高水平单次爆炸和低水平10次循环爆炸作用下地下洞室围岩的应力波衰减规律、
跨文化传播的产生与发展和公共危机紧密相连。从主体关系上讲,公共危机是指不同文化群体的人之间传播活动的一种障碍,它使人产生焦虑与不确定性,从而使文化间的交流失去平衡,表现
研究了以免疫算法为工具对信息系统进行规则提取。在免疫算法中结合了小生境技术的共享机制,利用了共享机制中对资源的共享和竞争原理,体现了规则之间竞争与互补的关系。针对普
基于对网格聚类方法的分析,结合由底向上的网格方法和自顶向下的网格方法,设计了一个能在线处理高维数据流的子空间聚类算法。通过利用由底向上网格方法对数据的压缩能力和自顶
为增强军用分组网的QoS传输能力,必须综合考虑链路质量、拥塞及跳数。本文首先阐述了现有路由协议及链路质量检测方法的不足之处,指出了设计QoS选路算法的关键所在。紧接着,设计