微博主观性发现关键技术研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zhouxifengli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和通讯产业的快速发展,微博成为了又一个跨时代产品。微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要的课题。本文主要针对在判定中文微博是否具有主观性的过程中所需的关键技术进行研究。论文的主要内容归纳如下:基于线索树双层聚类的微博话题检测方法本文针对微博文本短、半结构、上下文信息丰富等特点,提出了基于线索树双层聚类的话题检测方法,利用融合了时序特征和作者信息的话题模型进行线索树内的局部聚类,借以实现垃圾微博的过滤,最后利用整合后的线索树进行全局话题检测,该方法有效缓解了微博文本中的数据稀疏问题。基于跨实体推演的事件抽取方法本文将实体类型一致性作为事件抽取过程中的一个重要特征,针对实体类型和事件类型之间的关系,通过实体类型推演出事件类型,然后选取特征对事件的其他要素进行判定。该方法比较传统的句子级事件抽取系统取得了更好的效果。基于文法特征的中文能愿词挖掘方法本文采用基于二元、三元、四元文法的方法,对微博中的中文能愿词进行抽取,并以该微博所抽取出的事件中是否含有能愿词作为微博主观性判定的依据。该方法主要基于规则和文法特征,分为两个阶段,其中第二部分是在第一部分的基础上,对能愿词进行循环迭代挖掘。
其他文献
当前,随着互联网技术的发展,企业也在逐步加快管理现代化、信息化建设。企业建立一套完善的信息化系统对企业在日益激烈的市场化竞争中尤为重要。本文结合目前主流的开发平台与
随着计算机网络技术的迅速发展,Internet已成为全球信息传递和共享的重要资源,企业和个人通过网络进行数据交换变得越来越频繁,传统的数据模式不能精确的表示这些数据。XML技术
随着游戏、动画等娱乐产业的快速发展,计算机三维动画广告和片头在电视屏幕上频频播映,计算机三维动画已经走进了人们的日常生活。计算机三维动画在各行各业中的应用越来越广
物联网的对象名解析服务(ONS)是一个分布式系统,它可以提供以下基本的查找服务:现实世界的每一个对象有唯一一个标识符,即电子产品代码(EPC),通过EPC和ONS解析服务可以返回一
伴随着科学计算可视化技术的不断发展,医学影像三维重建技术在疾病珍断、手术导航和辅助教学等方面也开始发挥着越来越重要的作用。其中的三维重建体绘制算法可以将各组织器
随着互联网技术的迅速发展,传统的分布式计算技术已不能满足用户需求,Web服务应运而生并成为面向服务计算的范例。随着Web服务技术的不断发展及其应用范围的逐步扩大,越来越
随着互联网技术和信息技术的迅猛发展,人类社会进入了信息时代。信息时代的一个显著的特点就是人们所面对的信息和对信息的需求剧增。如何从这些信息中获取有用的知识是人们
云计算是继分布式计算、并行计算、网格计算之后一种新的计算模式,已经成为学术界和工业界的关注焦点。根据云计算技术架构可知,云计算环境下的管理中间件对云服务的功能和性能
密码安全的重要性,无论是个人业务还是集体作业,或是在证券、金融、政府、教育等行业领域,抑或是大到关系国家信息安全的机构,都是不言而喻的。尤其是随着网络技术的日新月异,虚拟
近年来,随着计算机技术、多媒体技术及网络技术的快速发展,音视频会话系统正在向嵌入式、数字化和网络化的方向发展。随着移动网络的高速发展,在移动终端上实现音视频会话功