人工智能延伸科学交流触角

来源 :科海故事博览·下旬刊 | 被引量 : 0次 | 上传用户:houzi7731
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  近日,一款看起来挺有文化的写稿机器人上线了。它叫小柯,由中国科学报社和北京大学科研团队共同研发。小柯写的不是普通的稿子,而是中文科学新闻。据介绍,运用自然语言处理技术,小柯以英文论文摘要为基础,能够快速写出中文科学新闻底稿,然后由专业人士和报社的编辑进行把关和完善信息,帮助科学家以中文方式快速获取全球高水平英文论文中的最新科研进展。目前小柯的作品已经上线。人工智能的触角,也在伸向各个领域。
  小柯:一个尽职的摘要翻译转写者
  2019年7月5日,小柯机器人发出第一篇稿子,截至8月22日统计时,小柯机器人共发稿415篇。初期更新时间距论文发表时间间隔一个月左右,现在可以做到当天或隔天更新,每天更新几篇到二十几篇不等。所选论文来自生命科学等领域,涉及《自然》《细胞》《新英格兰医学杂志》等期刊。有记者对照分析了小柯的作品《单细胞测序揭示冠状动脉疾病保护机制》及其英文原文。文章中,小柯先对论文主题、研究单位以及发表的期刊进行了简单介绍,后接英文原文摘要的翻译,大致反映原文内容;翻译时会对原文进行适当的语句简化,同时在对专业词语的翻译上也使用了如“血管平滑肌细胞”“保护性纤维帽”等专业表述。不过,这也不全是小柯的功劳,因为稿件发出前,还有人工审校这一步骤。北京大学计算机科学技术研究所研究员万小军团队负责小柯的系统总体设计与联合技术攻关。他告诉记者,目前机器翻译系统的性能很大程度上依赖于其所使用的训练数据,即平行语料。目前的平行语料多为新闻语料,因此训练得到的机器翻译模型对于日常新闻的翻译效果较好。但学术文献(比如生物学术论文)与日常新闻在用词造句等方面都有较大差别,机器翻译系统对于学术文献翻译的效果并不理想。这一次,他们通过融合领域知识进行语句智能筛选,选择适合大众理解的语句,并基于语句简化提升语句翻译质量。“英文学术论文摘要适合专业科研人员阅读,但摘要中的语句并不都适合写到科学新闻中面向大众传播,因此需要结合编辑提供的先验知识,采用计算机算法对语句进行筛选,保留适合进行大众新闻传播的语句。”万小军说。
  机器人不只能写稿
  研发小柯用了半年时间,万小军表示,和一般写稿机器人相比,一个好的跨语言科技新闻写稿机器人需要进行两次重要的信息转换过程:一次是不同语言的转换,将英文文本转换为中文文本;另一次是语言风格的转换,将学术型文字表达转换为大众能够接受的通俗文字表达。“这两次转换都具有较大的挑战性,目前并没有完全解决。后续还需要进一步积累数据,调整算法模型,才能取得更好的效果。”万小军说。接下来,团队还将继续优化小柯,让它写出的科学新闻内容更丰富,表达更生动。当然,翻译撰写科技新闻稿件,只是自然语言处理等人工智能技术在学术交流中所能大显身手的领域之一。“基本上,只要人类交流和工作过程中涉及语言和文字的地方,自然语言处理技术都有可能发挥作用。”万小军说,在科研论文写作过程中,可以借助自然语言处理技术帮助推荐参考文献,并自动生成related work等章节的文字;业界也有基于自然语言处理技术自动编撰图书的尝试。“我个人也接触了很多很有意思也很有挑战的应用需求,但可惜的是不少需求都无法基于目前的自然语言处理技术进行实现。自然语言处理技术还需要进一步地发展和突破,我相信在未来将有更多的用武之地。”
  中國知网常务副总经理张宏伟长期关注自然语言处理,大数据和人工智能方面的应用研究。他告诉记者,在数字出版和知识服务的全链条中,你都能看到人工智能和机器学习技术的身影。人工智能可以对数字出版的选题策划、协同撰稿、内容编审进行赋能。大数据标注机器人则能对海量文献信息资源进行OCR文字识别,智能版面分析,知识元抽取,自动分类,自动标引主题,自动生成摘要,自动翻译,自动标注引用和参考文献。人们熟悉的论文抄袭检测,同样需要智能技术。它不是简单的语句重复检测,而是要对文本内容(包括图片、公式、表格等)进行语义索引,“看你在思想上有没有抄袭别人”。如果存在不同语言之间的互抄,还需要动用“机器翻译”。张宏伟表示,初级的语义抄袭可以由机器揪出来,不过,如果足够有“心机”,就可以完全用自己的语言“洗”了别人的思想,对人工智能的技术要求一下就提高了许多。目前已有利用神经网络模型对文本内容构建高维度语义索引等新技术出现,不管是中文还是英文,一律映射到一个统一的语义空间,实现真正基于内容理解的语义级全文比对检索。
  知识库是智慧社会的基础设施
  至于在学术研究中必不可少的资料索引,看似简单,也仍然具有技术含量。张宏伟说,数字出版和数字图书馆的资源类型非常丰富,有大量文本、图像和音视频数据,且数据是非结构化的,若想对其进行深度的挖掘利用,难度不小。就拿常见的信息检索来说,首先得做到结果要全,相关度要高;再进阶一步,能不能用自然语言交互的方式检索;升级一下难度,用智能问答的方式查找信息,能否直接给出答案?“要让检索功能变得更贴心,计算机要‘学会’阅读资料,总结、推理然后回答。它需要把海量的数据资源变成自己可以理解的知识库。”张宏伟说。深度学习等统计方法严重依赖于大样本数据,然而,现实世界中,很多实际问题仅仅依靠统计方法是无法解决的,这就需要建立专门的计算机能理解的知识库,实现真正的人工智能。但构建知识库,本身是一项极其艰难且耗时漫长的工作。毕竟,机器和人对知识的理解方式大相径庭。张宏伟说,像知网这样的机构正在致力于深度整合全球知识信息资源,建设世界知识大数据。也在让文本文献碎片化、网络化,依据知识使用的场景,采用半自动知识抽取算法来构建面向垂直领域的知识图谱。2019年知网陆续推出了一些基于知识图谱的行业智慧应用产品,如医疗领域的临床智能诊断,法律领域的智能量刑判案等。“不过,我们在这些领域刚刚起步。我个人觉得,还是要少一点浮躁,踏踏实实做一些基础性的工作。没有知识的支撑,就谈不上‘智慧’。”在张宏伟看来,知识库和人工智能,本身就是互相促进、相互赋能的关系。构建知识库需要人工智能,而人工智能的发展,也离不开知识库。怎么将人类的知识库转换成计算机能理解的知识库是人工智能的核心问题,面临许多困难,需要学术界和产业界共同努力。
其他文献
摘 要 新一代工程人才的培养不仅仅是基础理论与实践的学习,更加需要工程核心能力与素质。计算机网络作为一门信息工程课程,采用情境化教学模式,能使学生在生动鲜活的场景中将抽象的核心能力与素养融合到课程中,提升综合能力。实践证明,该教学模式带活了课堂,能培养学生主动探究的意识,教学效果良好。  关键词 计算机网络;情境化教学模式;故事教学;工程人才  中图分类号:G652 文献标识码:B  文章编号:1
摘 要 中小学3D打印教材匮乏且无法满足学生的需求。以华兴小学课程开发为例,从学生的实际需求出发,用访谈调查法对师生需求进行了解,同时进行3D打印课程开发与设计,以满足学生的需求和解决3D打印教材匮乏的问题。  关键词 创客教育;课程开发;3D打印;教材;校本课程  中图分类号:G623.58 文献标识码:B  文章编号:1671-489X(2019)11-0054-04  1 前言  当前已经
摘 要 以小学音乐教学为例,概括小乐器的特点,总结其在课堂教学中的应用优势,论述应用策略,指出需要注意的问题。  关键词 小乐器;小学音乐;器乐教学;口风琴;竖笛  中图分类号:G623.71 文献标识码:B  文章编号:1671-489X(2018)03-0104-02  1 前言  在音乐教学中,注重和加强器乐教学,既是音乐教学的重要内容,也是促进教学的有效手段,而且能促进学生动口动耳和动手动
编者注:自1980年9月—2016年5月,中国教育装备展示会历经35年已成功举办了70届。2016年5月7日,中国教育装备行业协会在沈阳组织召开了70届展示会回顾展望座谈会,部分领导和老同志应邀参加了座谈会。会议由第70届中国教育装备展示会组委会副主任、中国教育装备行业协会副会长李兴植主持。  中国教育装备展示会迄今已成功举办了70届。70届展示会的发展之路,体现了我国经济发展、教育发展不同阶段的
摘 要 以实际企业制作项目为载体,基于项目制作的工作流程,将图形图像处理、二维动画制作、网页制作等课程的相关内容,以问题的解决为主线,经过精选和加工,深度融合在项目化教学中。在具体实施过程中注重学习过程的优化,实现德育教育与岗位技能的双渗透,学生数字化学习与创新素养得到提升,最终实现提升学生网页制作综合实践能力这一目标。  关键词 教育信息化;中职;计算机应用专业;学科融合;网页制作;智慧学习;S
摘 要 新冠疫情导致师生时空分离,“停课不停学”让学生在教师的指导下居家学习。教师如何重点抓好导学与助学,引导学生自主学习?以小学数学“比例的认识(一)”为例,从学习指南、学习任务和困惑与建议三个方面,对学习任务单进行详细设计。  关键词 停课不停学;小学数学;网络课程;在线学习;自主学习;学习任务单;比例的认识  中图分类号:G623.5 文獻标识码:B  文章编号:1671-489X(202
摘 要 疫情防控期间,作为疫情严重地区的湖北省当阳市全市各校春季学期推迟开学。当阳市教育局为确保全体学生能够在疫情结束之前“停课不停学”,根据实际情况,统筹安排,开展线上教学,实现全市义务教育学校统一开课。  关键词 义务教育;信息技术;停课不停学;网络授课;互联网 教育;混合式学习  中图分类号:G434 文献标识码:B  文章编号:1671-489X(2020)13-0012-03  1 前
10.3969/j.issn.1671-489X.2020.21.136  摘 要 从技工院校钳工实训教学面临的困惑入手,分析傳统教学模式对学生的影响,进而论述微课应用于钳工实训教学的显著优势,最后探讨微课在教学中的具体制作与运用。  关键词 微课;技工院校;钳工实训教学;教学资源  中图分类号:G434 文献标识码:B  文章编号:1671-489X(2020)21-0136-02  1 前言
摘 要 近年来,信息化迅速发展带来教育范式的转变,国家及各省市的教育云平台基本建成。《中小学教师信息技术应用能力标准(试行)》中要求教师运用信息技术转变教与学的方式,而翻转课堂作为一种相对成熟的以学为中心的教学模式,有助于指导教师转变教与学的方式。基于云平台构建翻转课堂教学流程,有助于指导教师应用信息技术转变学与教的方式。  关键词 教育信息化;翻转课堂;教育云平台;微课  中图分类号:G642
摘 要 问题导向学习活动是把学生置于教师刻意创设的问题情境中,在小组合作中共同解决问题,旨在挖掘学生潜在的能力,有利于培养学生的自学能力和创造能力。结合初中信息技术课教学情况,例谈这一模式在实际教学中的应用。  关键词 问题导向学习;信息技术;网络旅行;PPT  中图分类号:G633.67 文献标识码:B  文章编号:1671-489X(2018)01-0074-03  1 问题提出  长期以来,