基于概念类的索引方法

来源 :长春理工大学学报 | 被引量 : 0次 | 上传用户:heyun102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的信息检索方法一般都采用对文本内容的词频进行分析的统计方法,这种索引方法仅仅考虑词语在文本中的出现率,因此不能抽取出表达文本语义的索引词。为了解决这个问题,本文提出了一种新的信息检索方法,即基于概念的权重索引方法。本方法引入了概念类的概念,并且提出了用概念之间存在的关系来表示文档中的词汇和概念的语义重要度。本方法比单纯的词汇信息更能体现文本的概念特征,提高信息检索的性能;同时环能隆低文本向量的维数,减少计算量,提高检索效率。
其他文献
近年来,雾霾污染问题愈发突出,严重影响了人们的生产和生活,因此对雾霾浓度的预测具有重要意义。PM2.5是雾霾形成的主要因素,PM2.5浓度越高,雾霾污染越严重,因此本文针对PM2.5浓度值进行短期预测研究。本文的具体研究如下:(1)通过对前人成果的研究,结合西安市地理环境信息,并使用相关性分析与逐步回归分析方法确定了PM2.5浓度预测的影响因素为:PM10、CO、NO2、SO2、O3、温度、湿度、
甲状腺结节是一种常见的疾病,发病的原因复杂多变,且发病率有逐年上升的趋势。目前,对甲状腺结节的诊断主要是利用超声图像诊断或者化学诊断的方法。但由于甲状腺结节的物理特征复杂多变,以及受医生经验水平和医疗设备等外在因素的影响,诊断结果的准确性很难得到保证。因此,本文利用医院收集到的甲状腺结节的物理特征数据,使用机器学习的方法,建立了一种科学直观的甲状腺结节良恶性预测模型,可为医生的诊断提供辅助手段。组
受美国经济问题的影响,全球经济增长的负面因素接踵而至。中国经济的发展必然受到世界经济问题的影响。我们要不断扩大国内消费市场,从源头上抑制通货膨胀恶性发展,加快发展高效
让学生每周轮流一次打扫教室或者校园卫生,这是一种常见的学生值日形式。作为一种教育形式,值日的初衷不仅仅是让学生参加劳动,以达到让整个校园更整洁的目的,还是想培养学生的劳
期刊
我国市场经济随着改革开放后快速发展,建筑施工企业所涉及的业务领域越广,企业在发展运营的过程中面临的风险则会越多。企业在进行风险管理时,主要是风险管理的实施流程、实施方法不完善。为适应新环境下风险的不断变化及企业对风险管理有更高要求的趋势,在2004年COSO发布了可以指导企业研究风险的《企业风险管理综合框架》,之后又于2017年9月发布了《企业风险管理-战略与绩效整合》框架,全面风险管理理论框架从