【摘 要】
:
互联网中存在大量的短文本信息流,需要对其进行会话抽取,将相同主题的内容合并到同一会话中。会话中的内容、时间和用户关系都会对会话抽取的性能产生影响,针对该问题提出了
【机 构】
:
解放军信息工程大学信息系统工程学院
【基金项目】
:
国家“863”计划资助项目(2011AA7032030D), 国家社会科学基金资助项目(14BXW028)
论文部分内容阅读
互联网中存在大量的短文本信息流,需要对其进行会话抽取,将相同主题的内容合并到同一会话中。会话中的内容、时间和用户关系都会对会话抽取的性能产生影响,针对该问题提出了一种基于多策略的会话抽取算法。首先,基于内容、时间和用户关系进行会话分割得到会话片段;然后,利用词向量计算内容语义相似度,并结合时间信息计算会话片段间的相关度,对其进行聚类,实现会话抽取。在三个来源于真实聊天记录的数据集上进行实验的结果表明,本方法优于传统方法,综合F值分别提高了38.5%、15.7%和26.8%。
其他文献
传统的基于项目的协同过滤算法离线计算项目相似性,提高了在线推荐速度,但该算法仍然不能解决数据稀疏性所带来的问题,计算出的项目相似性准确度较差,影响了推荐质量。针对这一问题,提出了一种结合类别偏好信息的协同过滤算法。定义了类别偏好相似性,采用类别偏好相似性方法为目标项目找出一组类别偏好相似的候选邻居,在候选邻居中搜寻最近邻,排除了与目标项目共同评分较少项目的干扰,从整体上提高了最近邻搜寻的准确性。在
中文微博的评价对象抽取作为中文微博情感分析的基础任务,受到研究者的广泛关注,有着重要的研究价值。结合微博文本的特点,对微博文本进行预处理,利用句法分析构建包括名词、名词短语、微博话题在内的评价对象候选集,再分别利用SVM模型、加权模型实现多特征融合的筛选候选评价对象方法,所用特征包括语义角色信息、最小距离和词频。算法经实验证明有效,在对候选评价对象进行筛选后,采用SVM模型的F值达到0.357 3
为了更加准确地表征功放的记忆效应,提出了一种新的动态x参数功放模型。该模型是对动态x参数模型的一种改进,利用FF(feed—forward)模型技术提取出表征功放记忆效应的核函数,并将
为了提高多维分类的执行效率,同时保持高的预测准确性,提出了一种基于贝叶斯网络的多维分类学习方法。将多维分类问题描述为条件概率分布问题。根据类别向量之间的依赖关系建
新闻专题的阶段性摘要对了解专题的动态演化、勾勒专题的发展轮廓等都能提供较高的参考价值,一定程度上弥补了专题内容太多而不便阅读的缺憾。以"马航MH370航班失联"专题为研究
扩展目标跟踪与传统目标跟踪不同,不仅需要对目标的运动状态进行跟踪,同时对于目标的外形特征也不能忽略。针对扩展目标跟踪过程中存在的外形拟合和非线性的问题,提出一种基于星凸随机超曲面模型(RHM)的扩展目标序贯蒙特卡洛概率假设密度滤波(SMC-PHD)算法。该算法运用星凸RHM对扩展目标量测源建模,在SMC-PHD的框架下,推导出非线性滤波算法的量测似然表达式和更新方程,实现扩展目标跟踪。仿真结果证明
SDN(software defined network)是一种新兴起的网络,它强调将数据平面与控制平面分离,大大提升了网络的灵活性。随着研究的深入,可扩展性问题逐渐成为研究的重点之一。为了给该问题的研究提供一个全面的视野,对可扩展性问题进行了深入剖析,包括可扩展性研究的背景和研究现状;从控制器的部署角度综合比较了几种较为成熟的解决方案,从两个方面探讨了可扩展性对于其他研究问题的影响,并介绍了其在
负载聚合特别是虚拟机聚合是降低数据中心计算功耗、减少数据中心运行成本的有效方法,传统虚拟机聚合方法在降低计算功耗时却忽略了对冷却功耗的考虑。根据数据中心温度功耗模型探讨了负载聚合的必要条件,提出了采用遗传算法来指导虚拟机聚合,优化系统整体功耗。以实际网上书店的访问数据进行因特网数据中心虚拟机聚合仿真实验,结果表明基于遗传算法的虚拟机聚合方法可以有效降低系统温度,并以微弱的性能下降代价大幅地降低了系
压缩感知利用信号的稀疏性,无损地从低维测量信号中恢复高维度稀疏信号。然而,目前存在的测量矩阵中大多存在元素相关性高等问题,无法保证恢复效果的精确性,大大制约了它们的应用前景。针对此问题,通过引入切比雪夫混沌系统,提出一种基于采样列化的切比雪夫混沌感知测量矩阵(SC3M)。不同于经典的相对独立取值的构造方法,SC3M矩阵通过对切比雪夫混沌序列作采样列化及归一化处理等操作来确保矩阵的低列相关性,以优化
在社会网络中,根据已有的连接关系和文本信息发掘社会网络中的社团不但可以将相似的用户划分在一个社团,还可以用来预测网络中潜在的连接关系。为了提高社会网络中社团发现的