基于领域本体的微博用户信息抽取方法

来源 :长江大学学报自然科学版:理工(上旬) | 被引量 : 0次 | 上传用户:WUYU8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统基于本体的 Web页面信息抽取以单个信息项为最小抽取单位,抽取出的实体语义关联性较差和抽取准确率不理想。针对上述问题,以微博领域本体为基础,提出了一种两层次匹配的用户信息抽取方法:将微博中具有语义关联的不同层次的用户信息划分成对应信息块,以信息块作为最小抽取单位分别抽取其中包含的用户各属性信息(包含个人信息、关注的好友信息和所发文本微博信息)。试验结果证明,与传统信息抽取方法相比,设计的抽取规则算法能够有效地提高信息的准确率和召回率,对微博页面结构复杂以及信息量大的 Web网页有良好的抽取效果。
其他文献
1月15日,省档案局在《南方日报》发布“广东省重大建设项目档案金册奖2009年获奖项目公告”,正式确认茂名热电厂“上大压小”建设30万千瓦热电联产发电机组项目和广东省西部沿
自去年入秋以来,贵州省持续干旱,造成百年不遇的特大旱灾,全省88个县、市、区中有86个受灾严重,557万人饮水困难,84.8万公顷农作物面临绝收,直接经济损失达28.79亿元。3月18
当前我国农产品安全问题层出不穷,一旦出现食品安全事故,难以追溯原因。物联网技术集成了传感器技术、网络技术、软件技术为一体,为我国农业信息化提供了新型技术基础。利用物联
去年,业界刮起了一阵“西风”,北美电器的进入和东菱转向国内市场都不免让业界对西式化小家电多了点关注,尤其是东菱国内销售第一年的开门一斧便创下了1亿元的喜人成绩,但相比国
建构了以PLC为核心的自动控制系统,设计了真空管烤消打标自动线的电气传动系统、烤消温度控制系统和电气控制系统;实现生产智能化,设计了较好的人机界面;绘制了主电路和PLC控
记得22年前,从学校分配到江西省一个边远的小县城农业局上班,工作两年多的我,还是个懵懂小伙,环境还没完全适应就被调到档案局这个全新的工作岗位。刚来时,对档案局这个陌生的环境
最近,广西南宁市劳动和社会保障局决定对失业人员在领取失业救济金期间、退伍军人3年内、低保人员享受低保期间和随军家属免收档案托管费。
我手里珍藏着一张20世纪30年代故宫文献馆同仁的合影,约有40余人,看到这张旧照,我就会情不自禁地想起开辟我国明清历史档案事业先河的第一代档案工作者,他们当年艰苦创业的光辉业
无数实践证明:面对灾难,只要勇于担当,冷静应对,就能够化灾难为机遇。“5.12”汶川特大地震发生后,四川档案系统有力有序的重建行动再次诠释了这一哲理。两年来,在四川省各级党委政