基于页面分块与信息熵的评论发现及抽取

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:vazumi126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种新颖的REA(Review Extract Algorithm)算法进行评论信息的发现与抽取。算法采用了页面分块与信息熵的迭代计算技术实现了评论块的自动发现与抽取。其中,页面分块技术的运用有效地去除了噪声信息;基于块的熵值计算精确定位了每一个用户评论。实验结果证明该算法具有较高的查全率与查准率。
其他文献
火电厂的正常运行离不开锅炉设备的作用,作为火电厂发电过程中十分重要的一个部分,锅炉设备状态的好坏对其运行有着很大影响。在运行过程中,如果火电厂锅炉设备产生了故障,那
近年来,辽宁凌海市充分依托丰富的石材资源优势,大力发展石材产业。该市通过加大招商引资力度,吸引外来企业落户,全市已经形成以102国道为主轴,以白台子乡、石山镇、金城等乡镇为
以新型的面向图形对象、基于矩阵的交互式数据处理语言(IDL),与空间数据引擎(SDE)结合来构建分布式GIS应用,既发挥了IDL在空间数据处理、三维显示方面的长处,又利用了SDE在空间数据管理方面良好的性能及安全性,同时避免了在购买专业GIS开发组件许可证上的巨额投入,在性能和开发成本之间做到了合适的平衡,是一种经济可行的应用方案。
采用HTTPS和传统远程脚本来实现身份认证存在一些缺点。在分析了Ajax技术特点后,提出了一种轻量级基于Ajax的适合中小企业Web应用开发的身份认证方法。同时设计了实现该方法的模型,并分析了该方法的安全性和特点。