机器写作

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:linyulan430
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  1概念内涵
  机器写作,又称自然语言生成,是自然语言处理领域的重要分支,指的是综合运用大数据分析、内容理解和自然语言生成等,实现机器智能生成文本内容的技术。基本创作流程主要分为数据采集、数据分析、自动写稿、审核签发等。其应用级产品WordSmith的软件于2007年首次出现,由美国Automated Insights开发。
  2 机器写作简要流程
  3机器写作的三大主流方式
  计算机根据输入的结构化数据(报表、RDF数据等)进行文字创作。该方式能够生成原创稿件,是目前机器写作的主要方式,适用于天气预报、医疗报告、赛事简讯、财经报道等文本的生产。
  计算机根据已有的文字素材(例如,已经发表的新闻)进行二次文字创作。该方式能够基于已有稿件创作出不一样的稿件,例如,为一篇新闻生成摘要,对多篇相关新闻进行综述,对一篇新闻进行文字改写等。
  计算机可以结合原创与二次创作两种方式进行文字创作,稿件中的一部分内容从结构化数据中直接生成,另一部分内容则从已有文本中进行提炼或改写得到,生成内容更丰富、形式更多样的文本。
  4机器写作的各应用领域
  知识类应用
  速报类应用
  资讯聚合类应用
  5平行语料缺乏
  未来基于深度学习的机器写作需要大规模的平行语料进行训练,而很多应用场景却缺乏此类平行语料,因此有必要探索小数据下的学习机制来解决这个问题。
  领域迁移性不足
  机器写作生成文本中信息与数据的准确性、文本的可读性不能完全得到保证,而不少应用场景不能容忍文本质量上的瑕疵,因此需要考慮结合更先进的技术来提高所生成文本的质量。
  写作质量难以客观评价
  机器写作的客观评价指标一般为BLEU和ROUGE,但文章的写作方式多样,每个作者都可以根据同一命题写出内容不一样但质量都很高的文章,未来有必要设计更合理的客观评价指标。
其他文献
本报讯 中国移动日前在河北雄安新区试点部署并成功演示了超級智能系统,为雄安新区城市综合治理、环境监控等领域的智慧城市应用提供了可行性方案。该系统由前端智能感知节点和后端智能引擎组成,能够实现远距离目标自动发现、动态人脸识别、持续实时追踪等功能。本次试点,利用现有4G基站灯杆、传输网络与互联网专线,将前端智能感知节点设备接入系统,实现了高速率、低延时移动通信网络与智能感知网络的无缝叠加。
提起Titan大家能想到很多东西,比如游戏和神話中的巨人。最近谷歌也打造了一款同名产品,而且是一款硬件设备。  这个名为Titan的设备主要是针对企业员工设计的,针对现在很多企业要求员工使用硬件安全密匙进行双重身份认证而推出的产品。根据介绍,这是一款兼容FIDO的物理密匙,它可用来保护支持该硬件的账号,比如FaceBook和Twitter等企业都支持了通过安全密匙进行双重认证的方式,未来会有更多的
2017年将是网络安全行业高速发展的一年,WebRAY(盛邦安全)副总裁严雷表示,盛邦安全将建设更多办事处,发展渠道伙伴,深耕市场。同时, 盛邦安全将继续研发新产品,开发新技术,保持技术领先。在2017年,盛邦安全将发布更多新产品为用户提供更好的服务。  随着云计算产业的不断成熟,越来越多的企业用户选择将业务系统迁移至云和虚拟化平台中。但是,在关注云和虚拟化基础设施安全的同时,防网页篡改、防网页挂
管理学之父彼得·德鲁克上世纪50年代就说过,市场营销的最高境界就是创造市场、创造客户,那种随着市场起伏投机的行径是企业界所不耻的,这就是商人和企业家的区别。在最伟大的时代,无数企业家在沧海中搏流而出。深圳拜特科技董事长胡德芳就是一个典型。  聪明的自嘲  “金钱”“精英”“名牌”“应酬”“赢利”,这些足以解构一切“成功学”和“狼性崇拜”。拜特科技董事长胡德芳显然是个异类:不爱出风头,不喜交际应酬,
2016年12月22日,“云智软件 众享未来——2016华为大连软件开发云上线大会”在大连举行。会上,华为企业云与大连华信计算机技术股份有限公司、亿达信息技术有限公司、英特工程仿真技术(大连)有限公司、辽宁维森信息技术股份有限公司、大连理工大学、大连海事大学等分别签订了云计算战略合作协议。软件开发的上云之旅就此开启。  千呼万唤始出来,华为软件开发云终于飘到了软件名城大连。  为什么是大连?  2
本报讯 10月25日,在2018中国国际社会公共安全产品博览会上,地平线首次展示基于旭日2.0处理器架构的XForce边缘AI计算平台,发布并系统解读了地平线未来城市解决方案。地平线创始人兼CEO余凯在会上表示,地平線今年营收已经达到亿元级,旭日1.0处理器去年已量产,而旭日2.0芯片预计年底量产流片。  余凯还透露,地平线今年新一轮融资金额在5亿~10亿美元之间。此外,在本届安博会上,地平线还与
2016年,信息泄漏事件频频发生,DDoS攻击、勒索软件等网络攻击规模不断上升,让信息安全市场备受关注。政府部门、重点行业在信息安全产品和服务上的持续投入增加,令信息安全市场仍然保持较高的发展势头。2016年信息安全产品市场整体规模达到338.39亿元,比2015年增长22.3%。  未来3年,随着国际信息安全局势的復杂变化,政府依然高度重视信息化和网络安全投入,电信、金融、能源等行业不断加强其信
智能网联汽车是汽车与信息通信技术等多产业融合发展的新兴产业,已成为全球汽车产业技术变革和转型升级的战略制高点。据美国波士顿咨询公司预测,智能网联汽车从2018年迎来持续20年的高速发展,到2035年将占据全球25%左右的新车市场,产业规模预计可超过770亿美元。  美日欧等国家和地区纷纷加快智能网联汽车布局,制定出台智能交通系统、自动驾驶等战略规划,加快推动自动驾驶相关法案制定,以国家级科技研究计
IDG公司最近发布的《2017年CIO行情报告》披露,云计算改变了一切,尤其是改变了CIO的角色。  该报告指出,CIO们仍要做好微妙的工作,一方面要制定技术战略,推动业务创新;另一方面要监管日常的IT职能任务,比如成本控制、与供应商谈判、危机管理和运营改进等。  虽然报告没有明确说明,但是云服务在提高CIO的工作效率方面将继续发挥很大的作用。比如,云计算现在已是众多企业提供新服务的默认方式,无论
“十三五”期间将是我国高等教育信息化发展的关键阶段,中国高等教育学会教育信息化分会理事长蒋东兴指出,“十三五”重在融合创新。  一般来说高校宽带网络接入和多媒体教学环境都早已具备,而云计算、虚拟化、大数据、无线网络等新技术也在高校信息化建设中得到了广泛的关注,近年来已经出现了不少融合创新型的教学模式和管理模式,并且得到了一定程度上的普及。高校信息化當前已处于应用深化期,如何进一步推动信息技术与教育