【摘 要】
:
针对基于关键词元的话题内事件检测算法运行效率不高、不适合进行大规模文本话题检测的问题,提出了一种高效的关键词元聚类算法.该算法在进行词元簇选择时,为簇间相似度分配
【机 构】
:
西安交通大学电子与信息工程学院,陕西省计算机网络重点实验室,西安财经学院信息学院
【基金项目】
:
国家自然科学基金资助项目(61172090), 国家科技重大专项课题(2012ZX03002001-004)
论文部分内容阅读
针对基于关键词元的话题内事件检测算法运行效率不高、不适合进行大规模文本话题检测的问题,提出了一种高效的关键词元聚类算法.该算法在进行词元簇选择时,为簇间相似度分配权值,并借鉴正态分布函数评估词元簇的个数,提高词元簇的选择精度,从而减少所需的词元聚类次数.实验结果表明,将改进的方法应用到舆情监控的话题检测中,能在不影响检测精度的前提下有效地提高算法的运行效率.
其他文献
一、把中小企业定为扶持主体政府应确定现阶段应该扶持的投资主体(中小企业)和扶持重点(高科技型中小企业),具体到广东地区,除高新技术型中小企业外,那些有利于出口创汇的外
针对传统的基于工件CAD模型或建筑CAD图纸的路径模型生成和规划方法不适用于复杂桁架结构的问题,提出了一种基于桁架结构CAD图纸的二维桁架路径模型的自动生成算法.该算法首先使用图像处理算法(如图像膨胀、面积滤波、腐蚀和细化)结合特征点提取算法对输入的图像进行处理,并获得桁架图像的特征点集,通过求取特征点间的连接关系得到邻接矩阵,然后利用特征点集和邻接矩阵重构出二维桁架路径模型.以输电线路铁塔路径模
上莞镇位于东源县东北部山区,是全省有名的茶叶专业镇。近年来,该镇充分利用自身的资源优势,采取“公司+基础+农户”的模式,引进外来资金合资、合作、独资经营以及农户兴办小庄园等
一、中小企业融资难的原因分析一、外部原因1、资本“崇大轻小”长期以来,人们总是认为只有大企业才有效率,才具有低风险,而中小企业就没有信誉,没有保障。当前,在发展中小企业的
文章结合长安大学“道路桥梁与渡河工程专业”(国际班)建设,从课程体系的建设、教学大纲的制订、授课方法的采用以及考核方法的制订等方面对该专业的双语教学体系进行探讨,可为其