【摘 要】
:
二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取
【机 构】
:
哈尔滨工业大学计算机学院信息检索研究室
【基金项目】
:
国家自然科学基金(No.60503072,No.60575042)
论文部分内容阅读
二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取方法和自举迭代策略,提出了一种新的从Web上抽取实体关系元组的方法.基准方法的平均准确率达到了78.12%,采用过滤措施后抽取方法的平均准确率达到了98.42%.实验结果表明,利用网络挖掘方法获取的实体关系元组能够很好满足信息抽取的应用,对抽取出的元组进一步处理,能够获取更多有价值的信息.
其他文献
作文个性化,就是学生能自主地写作,写真实的文章,在作文中能展示自己的个性与风采。个性化的习作必然有创新的火花,这就需要老师适时引燃,随时点拨。
最近,陈泽文等人提出了一种基于中国剩余定理的群签名方案,该方案的安全性是基于大数分解困难性假设.本文对该群签名方案进行了分析,指出该方案中的大数分解可有效地进行计算,其安
将85例早期糖尿病肾病(DN)患者随机分成两组,对照组在常规治疗基础上口服厄贝沙坦150 mg/d;治疗组在对照组基础上加服氟伐他汀40 mg/d。结果两组治疗后尿白蛋白排泄率均明显减
P-糖蛋白(P-gp)是多药耐药基因(MDR)编码的蛋白质,在多种人类恶性肿瘤中均有高表达。近年来,我们采用免疫组化法(S-P法)检测了50例骨巨细胞瘤患者瘤组织P-gp表达情况,现探讨其与肿
下肢深静脉血栓形成较少见,其栓子容易脱落栓塞从而导致严重并发症。糖尿病患者由于代谢紊乱、血管壁内皮细胞损害、血液黏稠度升高成为血栓形成的高危因素,如果患者处于应激情
2002年9月-2005年12月,我院采用喘定、异舒基联合静滴治疗慢性肺心病急性发作156例,疗效满意。现报告如下。
一、工程概况南京卷烟厂易地搬迁工程主厂房工程占地面积34600m2,建筑面积约80000m2,钢筋混凝土结构,地上1-2层;地下1层停车场.厂房平面形状呈"L"型,竖向长181m,宽79m;横向长
分别采用酶联免疫方法(ELISA)和免疫透射比浊法测定84例急性冠状动脉综合征(ACS)患者(ACS组)、21例稳定性心绞痛患者(SAP组)及22例健康人(对照组)血浆基质金属蛋白酶19(MMP-9)及C反应蛋白
目的探索采用乳晕边缘小切口切除乳房多发或巨大良性纤维腺瘤,达到既切除病灶又能起到美容目的的可行性。方法2006年1月~2008年2月选择46例乳房多发良性纤维腺瘤和2例巨纤维腺
扣件式钢管脚手架具有装拆方便、搭设灵活、使用耐久、费用相对较省的特点,且能适应建筑物的平、立面变化,因此扣件式钢管脚手架在建筑施工中使用较多,特别是在面广量大的多层住