【摘 要】
:
[目的]优化已有的基于疾病知识图谱的自动问答系统,为公众提供一种准确率更高的疾病知识查询工具.[方法]在疾病知识图谱构建基础上,采用AC多模式匹配算法和语义相似度计算获
【机 构】
:
吉林大学管理学院 长春130022
论文部分内容阅读
[目的]优化已有的基于疾病知识图谱的自动问答系统,为公众提供一种准确率更高的疾病知识查询工具.[方法]在疾病知识图谱构建基础上,采用AC多模式匹配算法和语义相似度计算获取疾病症状实体,通过人工标注和AC多模式匹配算法相结合实现用户问题分类,将匹配的词语封装成分类字典后转换成数据库查询语言,获取相关问题答案.[结果]通过中文医学问答数据集中语料测试,本系统在回答新冠疫情相关疾病5类问题时的平均准确率达到86.0%,高于已有的疾病问答系统.[局限]数据集中“检查”和“传染性”类数据缺失值较多,影响问答系统结果准确性.[结论]优化已有的基于疾病知识图谱的自动问答系统,为疫情相关疾病知识查询提供一种有效的知识服务工具.
其他文献
教师专业发展标准是衡量教师水平的重要指标.运用NVivo12.0软件对最新发布的美国、英国、澳大利亚以及我国等6份教师专业发展标准进行分析,编码形成职业认知和师德、专业发展
连续3年,每年扩招100万,是我国高等职业教育的重大政策部署,旨在提升退役军人、下岗失业人员、农民工、新型职业农民等群体人员的技术技能,是稳就业的重要举措,也是在职业教育界实施的重大民生工程、民心工程和根基工程。然而以退役军人等为主体的四类扩招生源,其基础知识和技术技能水平差异较大,生源结构多样且复杂,较之于普通生源,存在基础薄弱、学习养成不够等多种不足,相当一部分生源还存在工学矛盾问题。招生和培养都需要设计并实施与普通生源不同的方案,需要做好政策与宣传引导,强化学校与企业共管,以保证规模与质量并进,以期
高职百万扩招工作的持续推进使得职业教育的社会职能被进一步强化。扩招工作重点关注的退役军人、下岗失业人员、农民工和新型职业农民等非传统生源群体的报考和就学意愿将是扩招任务能否顺利落实的关键所在。政策利好条件的宣传与落实是非传统生源群体感知扩招行动的基本前提,而职业教育教学内容的实用与适用也是形成其决策信念的先赋优势所在。同时,这一群体对成本最小化与收益最大化的愿望诉求也催生了最终的决策意图。在职业教育回报率能有效针对非传统生源群体实现决策愿望的同时,职业教育与培训功能的发展态势也成为影响这一生源群体实施决策
民办高等教育已成为我国高等教育事业的重要组成部分。营造公平、良性、可持续发展的政策环境,成为民办高等教育治理的当务之急。通过梳理变迁脉络及其背后的治理逻辑发现,民办高等教育政策经历了酝酿、构建、转向、重构、创新五个阶段,其制定及其发展深受社会环境、利益冲突和价值前提的影响,并在民办高校属性“、合理回报”等问题上存在模糊不清、诠释灵活甚至矛盾冲突等情况,呈现出明显且多样的“模糊性”。民办高等教育这一牵涉众多利益群体的公共领域,正是遵循“模糊性”治理逻辑形成政策系统,该系统两难情境下的策略性模糊和
【目的】实现社交媒体虚假新闻早期检测,遏制虚假信息的广泛传播。【方法】在同时利用图像与文本特征的基础上,通过将图像映射为语义标签,设计了一种图像与文本内容语义一致性计算方法,构建虚假新闻检测模型,并采用虚假新闻检测标准数据集FakeNewsNet验证模型的性能。【结果】融合新闻图像与文本语义一致性特征的全特征模型在PolitiFact数据上的检测F1值达到0.775,在GossipCop数据上的F1值达到0.879,说明该模型具有良好的检测效果。【局限】由于现有图像语义标注模型标注能力的局限性,尚无法准确
【目的】针对在自然语言处理领域中高质量的标签数据较难获取的问题,设计基于多层次数据增强的半监督中文情感分析方法。【方法】采用简单数据增强和反向翻译的文本增强技术获取大量无标签数据,通过对无标签数据计算一致性正则提取无标签数据的数据信号;对弱增强数据计算其预判标签,将强增强数据与预判标签一起构建监督训练信号,通过置信度阈值过滤使模型得出置信度高的预测结果。【结果】在三个公开情感分析数据集上进行实验,在Waimai和Weibo数据集上仅使用1000条有标签文档就可以分别获得超过BERT 2.311%和6.72
教育教学工作是高校的中心工作,是办学之本。后疫情时代线上线下混合式教学成为高校教学的新常态,这对高校教师的教学能力提出了更高的要求,对高校教学管理也提出了新的挑战。教学质量的高低关系到学校的生存和发展。后疫情时代,高校在线教学管理应不断完善教学质量管理制度,加强教学过程管理和教师技能培训,为师生提供更优质的线上教学平台。同时,创建完善的线上线下混合式教学评价体系,以全面提升在线教学质量和高校人才培养质量。
【目的】使用文本挖掘技术从西方媒体的新闻文本数据中提取中国的经济形象。【方法】基于人类的认知图式分析了形象的文字呈现方式,提出从主题、观点、倾向三个层次来提取国家形象,进而提出相应的文本挖掘方法和流程。【结果】从达沃斯论坛期间的西方媒体新闻中提取的中国经济形象可以概括为:充满活力、有巨大成就、为世界带来机遇和挑战、可能撼动世界格局的新兴发展中国家。【局限】主题模型使用人工解释,会带来个体差异。【结论】从主题、观点、倾向三个层次进行文本挖掘有利于把新闻数据和媒体形象联系起来,该方法对国家、地区、城市等媒体形
【目的】针对音乐信息检索中的声乐分类问题,将音频的统计特征和图像特征进行融合,探索效果更好的分类模型。【方法】抽取音频信息的统计特征以及梅尔频谱图图像特征。将机器学习方法用于统计特征,并设计了一种多层卷积神经网络架构用于图像特征,将声乐分类问题转化为图像分类问题,最后提出一种融合统计特征和图像特征的深度学习方法。【结果】在声乐分类任务上,基于图像特征的深度学习方法比机器学习方法 F1值提高约6个百分点,基于特征融合的深度学习模型F1值可达到69%以上,超过基于图像特征的深度学习模型3.4个百分点。【局限】
【目的】针对现有模糊重叠社区划分算法执行效率较差和准确度较低的问题,提出一种基于节点向量表示的模糊社区划分算法。【方法】使用由节点重要性引导的随机游走策略生成节点序列,将节点序列视作语料库中的句子,利用Skip-gram模型训练得到节点向量,并将高斯混合模型引入模糊社区划分算法FCM(Fuzzy c-Means)中实现多峰值节点数据拟合,通过最大化模块度得到最佳的社区数目。【结果】相比经典的社区划分方法,该算法在真实网络Jazz和人工网络N1(mu=0.5)上的EQ值分别提高了7.0%和9.7%,能够更准