【摘 要】
:
针对微博话题观点摘要问题,提出一种基于LDA与评价对象相结合的微博观点摘要方法.首先,利用LDA模型得到话题的词分布矩阵和文档的话题分布矩阵,把两个矩阵的乘积作为各个词在
【机 构】
:
湖南工业大学计算机学院,广州索答信息科技有限公司
【基金项目】
:
国家自然科学基金项目(61402165), 国家社会科学基金项目(12BYY045), 湖南省教育厅重点项目(15A049)
论文部分内容阅读
针对微博话题观点摘要问题,提出一种基于LDA与评价对象相结合的微博观点摘要方法.首先,利用LDA模型得到话题的词分布矩阵和文档的话题分布矩阵,把两个矩阵的乘积作为各个词在句子中的权重分布矩阵,再利用词频与词权重分布矩阵的乘积作为词的重要度;然后,通过词的词性标注规则从句子中选择候选评价对象,再计算句子中候选评价对象的稳定性;最后,把句子中所有词的重要度与句子中所有候选评价对象的稳定性的总和作为句子权重,并从大到小排序,再进行观点句识别,并去除相似性较大的句子,抽取前20个句子作为话题观点摘要.实验结果表明
其他文献
拓扑空间中的X0-sn-弱第一可数空间与X0-sn-网之间关系密切,拓扑空间X是X0-sn-弱第一可数空间,且P是X中的一个点可数cs-网,如果P是有限交封闭的,则存在P的一个子族B,使得B是X
研究了重尾分布下同时带常数利息力和延迟索赔的更新风险模型.将保费由常数变为一个非负随机过程,索赔额推广为广义负相依,并在分布属于L∩D族情形下,得到了有限时破产概率的
针对越南语分词词典构建问题,提出了一种新的半监督集成构建方法.该方法能够结合人工干预,从大规模未标注越南语语料中识别多音节单词.首先设计了一种n元音节词产生器,并生成
为了能保证载体所有者隐私的安全性和原始载体图像的完整性,提出了一种在加密域中进行直方图平移的可逆水印算法.该算法首先对原始载体图像和数字水印进行加密,然后利用直方
在基于模拟退火算法的基础上提出了一种改进温度下降函数和自适应的生成邻域解的新型算法.该算法通过新提出的温度下降函数,使得在初始温度较高的时候下降较为平滑,同时在邻
在定时截尾缺失数据样本下研究了Lomax分布形状参数的估计和假设检验.在尺度参数已知的条件下给出了形状参数的极大似然估计,证明了估计量的相合性和渐近正态性,并给出了形状
针对相同敏感值的数据集,定义了其特有的隐私泄露方式,研究了该类数据在同质性攻击下的隐私泄露特点,提出了实例完全泄露风险的概念和计算方法,实现了相同敏感值条件下隐私泄
使用直流磁控溅射设备,不同压强下在玻璃衬底上制备了系列TiN薄膜.采用紫外-可见光分光光度仪测试了样品的光学性能,采用四探针法测量了样品的方块电阻.研究了溅射沉积过程中
对带有Neumann边界条件的常系数对流扩散方程,建立了一个两层有限差分格式,利用离散能量分析法给出了差分解的先验估计式,分析了差分格式解存在唯一性、收敛性以及稳定性.并
基于状态获取的故障信息,对可能导致作业运行失败的原因事件进行分类和严重等级分级,进而通过问题规模及其关联关系,提出了一种针对批量大规模并行作业运行故障的快速分析定