论文部分内容阅读
如果现在已经站在了人工智能时代的入口,那么接下来面临的就是一场环境和范式变化下的重新洗牌。其间,行业知识图谱建设是人工智能应用领域的战略制高点
科技浪潮风起云涌,中国互联网用户已经接近9亿人,互联网的人口红利基本结束了。从互联网时代迈向人工智能时代是当下最热门的话题。
因应人工智能热,要回答两个问题:
第一,互联网时代之后会不会是人工智能时代?
我们通常所讲的时代或者时代特征,是在讲环境和范式,一是指能够影响意识和存在形态的客观环境变迁;二是指在这个特定的客观环境条件下形成最广泛共识的范式。工业革命时代的范式是“分工”、互联网时代的范式是“连接”、人工智能时代如果能够成立的话,它的范式应该是“替代”。
凡是规则清晰、能够形成数据闭环的应用场景,都可以用人工智能“替代”人工。人工智能时代能否成立,取决于人工智能能够解决多少实际应用问题,人工智能能否渗透到足够广泛的应用场景,在多大程度上实现人工智能工具化。
第二,人工智能走到哪一步了?
这一轮人工智能浪潮,有两个标志性事件,一个是阿尔法狗,毫无悬念地完胜世界顶尖棋手们;另一个是无人驾驶汽车,全球首款L4级别无人驾驶汽车正式量产”,第100辆阿波龙在厦门金龙客车生产线下线。
人工智能真正能够成气候,回过头去看,互联网、大数据、云计算都是用来为人工智能服务的,或者是人工智能进化的充分条件。类似人类进化的生物、社会和自然条件。
乐观的判断是人类现在已经站在了人工智能时代的入口,所以起步越早,积累越多,受益越快,竞争对手越难以追赶。当然,起步过早,会付出试错成本。 Gartner有一个技术成熟度曲线,被引用的比较多,Gartner给所有的技术发展定义了五个阶段:萌芽期、泡沫期、滑坡期、复苏期和成熟期。目前来看人工智能的成熟度应该处于萌芽期和泡沫期之间。
如果互联网时代之后确实是人工智能时代,如果现在已经站在了人工智能时代的入口,那么,接下来面临的就是一场环境和范式变化下的重新洗牌。各行各业都在做人工智能应用,你不用,别人用,别人的效率就比你高,你就处于劣势。
抢先拿到人工智能时代的船票,是未来建立行业竞争优势的关键。
人工智能的定义:基于大数据、算法和算力,以计算机程序模拟人的智能,能够自主对标的物进行感知、识别、分析和判断;能够自主采取有针对性、有目的、有控制的行动;能够自主响应和处理环境条件的变化;并且能够具有自主深度学习的能力。
目前人工智能技術比较成熟的主要领域: 语音识别,已经达到97%的准确率;图像识别,人脸识别的准确率已经达到99.7%;自然语言处理,成熟度低于语音和图像识别;机器学习,包括模拟人的认知与推理能力、深度学习、甚至不依赖经验数据的强化学习。
AI典型应用场景包括: 智能行业顾问、智能运营作业、智能客户服务、智能信息系统运维、智能风控。
典型的人工智能应用案例:
围棋棋盘上有361个点位,每一盘棋大概要下150手,每一手棋平均有250种可选的下法,150的250次方的量级。“阿尔法狗”的算法能够穷尽围棋量级的局面变化,而且能够通过自学习提高取舍能力,控制运算量。 “无师自通”的阿尔法元完全从零开始,不需要任何历史棋谱的指引,不需要参考人类的经验和知识,完全靠自身强化学习完胜阿尔法狗。阿尔法狗需要在48个TPU上,花几个月的时间,学习3000万棋局,才打败了人类。阿尔法元打败阿尔法狗只用了4个TPU,花三天时间,自己左右互搏490万棋局就做到了。
从阿尔法狗到阿尔法元的意义在于:证明人工智能可以用算法复制人类的智慧,从而模仿甚至超越人类的智慧。
去年7月5日,李彦宏把搭载Apollo1.0的无人车开上北京五环;去年9月20日,Apollo1.5发布上线,解锁了障碍物感知、决策规划、云端仿真、高精地图服务、End-to-End等五方面能力;今年1月8日,Apollo2.0发布上线,搭载Apollo 2.0的无人车第一次在美国加州公路上进行测试;4月24日百度商用级无人驾驶巴士“阿波龙”面向公众试乘;7月4日李彦宏在百度AI开发者大会上兑现去年的承诺:“是的,我们去年吹的牛实现了!全球首款L4级别的无人车量产下线!”百度“阿波龙”已经具备了在简单城市道路下完全自动驾驶的能力,无需任何干预,包括变道、等红灯、避让等等都由无人车自主完成;腾讯也自主开发出无人驾驶“AI in car生态系统”,放言2019年量产;阿里巴巴也推出了斑马智行汽车操作系统。无人车的商业化进程在加速。
AI最核心的技术是在无人驾驶汽车上的先驱。
4月7日晚张学友南昌演唱会、5月5日晚张学友赣州演唱会、5月20日晚张学友嘉兴演唱会上,警方应用人脸识别技术在现场连续抓获三名网上逃犯。人脸识别系统,包括动态人脸卡口检测和静态人脸大库检索,利用人脸检测及识别技术,从高清视频监控画面中抓拍人脸照片,即时分析人脸特征,快速完成人脸照片与后端数据库的黑名单的比对与识别,实现智能化的视频监控,即使在茫茫人海中,警察也能快速分辨出每个人,从而锁定逃犯位置。
人脸识别技术经过前几年的发展,已经进入到具体的落地运用阶段,比如通过摄像头比对身份证信息、上班人脸打卡考勤、支付宝的人脸支付、智能手机上的人脸解锁等等。
蚂蚁金服于2017年6月推出的国内首个车辆事故图像定损AI技术,将过去由人工肉眼判定车损的环节升级为用人工智能做标准化统一定损。事先喂大量图片给AI,然后手把手教它——车型、部位、损失程度、修理成本,AI逐渐会从中学习到分辨图片的细节,完成车辆事故定损。据称“定损宝1.0”推出不到一年提供定损调用服务超过千万次,共计节省定损人员工作量超75万个小时,为保险行业节省案例处理成本超过10亿元,减少理赔渗漏约10亿元。 定损宝2.0已经在今年5月份上线,由照片定损升级为视频定损,支持车主用手机按照系统指引拍摄视频即可自助定损。
“阿尔法保险”是中国太保打造的业内首个人工智能保险顾问。产品使用大数据分析和机器学习算法,融合保险、精算专家团队经验,通过基本信息、家庭结构、收入支出、资产负债、社保福利、生活习惯6组问题,为客户测算家庭风险防御能力指数,量身定做家庭理想保险保障建议。阿尔法保险2017年9月1日上线,当天访问量就超过20万用户,三天累计访问量突破了100万,目前累计访问量近500万,访问用户在朋友圈的分享率持续超过10%。
“AI优先”的策略选择:“All in”、“聚焦”和“优先”是三种不同的策略选择。All in是孤注一掷,全力以赴、全押上;聚焦是高度关注,突出重点、集中资源;优先是根据轻重缓急,优先排序、资源倾斜。
在重要性和紧迫性矩阵中,人工智能目前应该定位在重要但不十分紧迫的象限,无论从短期成效和长期机会看,都适用优先排序策略。
确立“AI优先”的意义,一是进一步动员和倾斜企业资源,强化AI应用产品的研发能力;二是形成协同研发体系;三是在行业中率先确立“AI优先”,有利于形成先发效应。
“AI优先”工程的路径设计:
1.AI的企业级应用研发不要“最前沿”而要“最实用”的成熟AI技术。
2.AI应用研发以内部效率提升和改善外部客户体验并重。
3.建立企业级AI产品研发清单
目前企业级AI应用研发呈现碎片化,缺乏应用场景及需求的系统规划;缺乏底部基础层和中间能力层的平台支持,导致单打独斗和重复建设,也缺乏外部合作伙伴的统筹管理。往往事倍功半。應该在存量开发项目全面梳理和系统挖掘增量需求的基础上,建立企业级AI产品研发清单,统一筹划,配套资源,协同运作,强力推进。
4.启动AI技术平台建设
AI技术平台架构是AI应用研发的重要基础设施和先决条件,包括应用层、中间能力算法层和底部基础资源层。应用层直接面向各种业务场景的需求,提供感知、识别、分析、判断和行动的应用软件和服务。中间能力算法层承上启下,在底部基础层提供资源的支持下,为应用层提供数据库和算法,以及耦合接口。底部基础资源层提供计算和存储资源。中间能力算法层和底部基础资源层要建设企业级的共享平台。
AI平台、大数据平台、云计算平台,是下一代信息系统建设的骨干项目。
5.选择合适的AI合作伙伴
“AI优先”需要引进外部合作伙伴,因为传统企业在AI技术领域基本是空白,且AI技术日新月异。搭便车事半功倍。合作模式有两种选择,一是锁定主要伙伴,长期深度合作;二是多管齐下,广域随机合作。
选择主要AI合作伙伴的主要考量要素:AI技术的资质和能力;对合作的定位;对行业AI应用的理解;具体合作内容与方式。
6.培育AI人才队伍
AI人才包含三个层次:一是AI业务需求团队,对业务场景有深刻理解,对AI应用高度敏感,能够完成有质量的AI业务需求交付,并配合算法建模团队完成知识图谱和实体知识库的建设任务,AI业务需求团队散布于各个业务领域的前中后台;二是AI算法建模团队,有大数据和建模的专业基础,熟悉业务场景及业务需求,能够协调AI业务需求团队和IT开发团队共同完成知识图谱、实体知识库的建模及拟合算法的系统开发需求交付,AI算法建模团队应该是一个专家级的团队;三是IT开发团队,大数据平台、云计算平台、应用软件架构和编程的专业基础扎实,能够完成AI平台建设、AI应用软件的开发及部署,具有自主研发交付能力。
AI人才队伍建设包括内部培养和外部引进。尤其在AI算法建模团队适度引进外部AI领域有项目实践经验的专家级人才可能是一条捷径。
行业知识图谱建设是人工智能应用领域的战略制高点,也是人工智能时代行业竞争的核心竞争力。
人工智能应用要件包括场景、实体知识库、知识图谱、算法拟合,一个都不能少。人工智能的能源是数据,人工智能的引擎是知识图谱。
什么是知识图谱?举一个例子,图形识别领域的正方形知识图谱:有四条直线;这四条直线首尾相连形成闭环;这四条线是相互垂直的;这四条线长度相等;并且它们必须在一个平面上。
用这个知识图谱建立算法,机器就可以完成识别一个正方形的任务。人工智能在本质上就是用计算机程序执行类似的逻辑。
知识图谱的建立是由场景驱动的,场景才是盘活存量数据、生产增量数据,完成知识图谱定义集,最终实现人工智能的应用价值。从这个意义上讲,场景比算法重要。而没有建立知识图谱的实体知识库也只是原材料,从这个意义上讲,算法确实比数据重要。
归纳一下关于知识图谱建设的几个要点:人工智能是基于实体知识库和知识图谱的;知识图谱要做的是让实体知识库可以被有效访问、判断和推理;知识图谱是实体知识库所使用的标签体系和组织框架,有别于“实体知识库”;如果要用人工智能解决某个特定领域问题,首先要建立相关领域的知识图谱。
建立知识图谱的实战步骤:1.基于垂直领域应用场景抽象出知识图谱——领域实体知识的标签体系和组织框架;2.用知识图谱与样本建立映射关系,验证知识图谱能否穷尽场景和领域实体知识;3.不断喂食数据以丰富知识图谱和领域实体知识库;4.完善算法后形成垂直领域的人工智能应用场景解决方案。
著名的“费米问题”,是讲在信息不充分的条件下,凭借对事物本质的深刻理解和洞察,采用变通和量纲分析,直接做出一些假设和估算,把难题变成简单可解的问题。费米问题的案例:算一算地球的周长是多少?已知纽约到洛杉矶3000英里,时差3小时,3小时是一天的1/8,而一天即地球自转一周的时间,所以,地球的周长就是3000乘以8,等于24000英里。与精确值的24902.45英里相比,误差不到4%。这是一个标准的费米问题。
人工智能和知识图谱的建设,也需要解决“费米问题”的能力。即想象力和创造力。
在人工智能这件事情上,行业知识图谱的建设要耗费海量人力、财力、数据和专业知识,尤其是时间,数据库和数据标注的工作量可能是以年/人为单位的。比如人工智能车辆事故定损,要建立车损知识图谱,需要全球所有车型、每种车型所有部位、每个部位不同距离角度光线、不同损失程度的图片,这个实体数据库是大数据级的。这种事情你想到了也不一定有能力去做出来,只能由智猪博弈中的“大猪”来做。
即便是免费时代,“天底下没有免费的午餐”的商业逻辑仍然成立。互联网经济流行“羊毛出在羊身上狗来买单”,精准广告推送分成,是一种商业模式;流量故事找风投,估值溢价,通过IPO变现是另一种商业模式;免费使用产品,隐性对价是用户隐私,海量数据建设领域知识图谱,数据资产通过人工智能变现,又是一种商业模式。互联网经济的商业模式比一手交钱 一手交货的交易结构更复杂更隐蔽而已。
尤瓦尔在《未来简史》中提到牛津大学的一份研究报告,这份研究报告预测了2033年的人工智能替代率:电话营销员99%、保险代理人99%、运动赛事裁判员98%、收银员97%、厨师96%、服务生94%、律师94%、导游91%、面包师89%、公交车司机89%、建筑工人88%、兽医86%、安保人员84%、船员83%、调酒师77%、档案管理员76%、木匠72%、救生人员67%。
各行各业的总体替代率是47%。
每一位读者无论相信不相信这份报告,都会下意识地对号入座吧。
面对人工智能的步步紧逼,人类最后的手段也许只剩下拔掉电源插头了。
(作者为中国太平洋保险集团首席数字官,编辑:袁满)
抢票入口时代
科技浪潮风起云涌,中国互联网用户已经接近9亿人,互联网的人口红利基本结束了。从互联网时代迈向人工智能时代是当下最热门的话题。
因应人工智能热,要回答两个问题:
第一,互联网时代之后会不会是人工智能时代?
我们通常所讲的时代或者时代特征,是在讲环境和范式,一是指能够影响意识和存在形态的客观环境变迁;二是指在这个特定的客观环境条件下形成最广泛共识的范式。工业革命时代的范式是“分工”、互联网时代的范式是“连接”、人工智能时代如果能够成立的话,它的范式应该是“替代”。
凡是规则清晰、能够形成数据闭环的应用场景,都可以用人工智能“替代”人工。人工智能时代能否成立,取决于人工智能能够解决多少实际应用问题,人工智能能否渗透到足够广泛的应用场景,在多大程度上实现人工智能工具化。
第二,人工智能走到哪一步了?
这一轮人工智能浪潮,有两个标志性事件,一个是阿尔法狗,毫无悬念地完胜世界顶尖棋手们;另一个是无人驾驶汽车,全球首款L4级别无人驾驶汽车正式量产”,第100辆阿波龙在厦门金龙客车生产线下线。
人工智能真正能够成气候,回过头去看,互联网、大数据、云计算都是用来为人工智能服务的,或者是人工智能进化的充分条件。类似人类进化的生物、社会和自然条件。
乐观的判断是人类现在已经站在了人工智能时代的入口,所以起步越早,积累越多,受益越快,竞争对手越难以追赶。当然,起步过早,会付出试错成本。 Gartner有一个技术成熟度曲线,被引用的比较多,Gartner给所有的技术发展定义了五个阶段:萌芽期、泡沫期、滑坡期、复苏期和成熟期。目前来看人工智能的成熟度应该处于萌芽期和泡沫期之间。
如果互联网时代之后确实是人工智能时代,如果现在已经站在了人工智能时代的入口,那么,接下来面临的就是一场环境和范式变化下的重新洗牌。各行各业都在做人工智能应用,你不用,别人用,别人的效率就比你高,你就处于劣势。
抢先拿到人工智能时代的船票,是未来建立行业竞争优势的关键。
应用场景与案例
人工智能的定义:基于大数据、算法和算力,以计算机程序模拟人的智能,能够自主对标的物进行感知、识别、分析和判断;能够自主采取有针对性、有目的、有控制的行动;能够自主响应和处理环境条件的变化;并且能够具有自主深度学习的能力。
目前人工智能技術比较成熟的主要领域: 语音识别,已经达到97%的准确率;图像识别,人脸识别的准确率已经达到99.7%;自然语言处理,成熟度低于语音和图像识别;机器学习,包括模拟人的认知与推理能力、深度学习、甚至不依赖经验数据的强化学习。
AI典型应用场景包括: 智能行业顾问、智能运营作业、智能客户服务、智能信息系统运维、智能风控。
典型的人工智能应用案例:
一、从阿尔法狗到阿尔法元
围棋棋盘上有361个点位,每一盘棋大概要下150手,每一手棋平均有250种可选的下法,150的250次方的量级。“阿尔法狗”的算法能够穷尽围棋量级的局面变化,而且能够通过自学习提高取舍能力,控制运算量。 “无师自通”的阿尔法元完全从零开始,不需要任何历史棋谱的指引,不需要参考人类的经验和知识,完全靠自身强化学习完胜阿尔法狗。阿尔法狗需要在48个TPU上,花几个月的时间,学习3000万棋局,才打败了人类。阿尔法元打败阿尔法狗只用了4个TPU,花三天时间,自己左右互搏490万棋局就做到了。
从阿尔法狗到阿尔法元的意义在于:证明人工智能可以用算法复制人类的智慧,从而模仿甚至超越人类的智慧。
二、百度无人车
去年7月5日,李彦宏把搭载Apollo1.0的无人车开上北京五环;去年9月20日,Apollo1.5发布上线,解锁了障碍物感知、决策规划、云端仿真、高精地图服务、End-to-End等五方面能力;今年1月8日,Apollo2.0发布上线,搭载Apollo 2.0的无人车第一次在美国加州公路上进行测试;4月24日百度商用级无人驾驶巴士“阿波龙”面向公众试乘;7月4日李彦宏在百度AI开发者大会上兑现去年的承诺:“是的,我们去年吹的牛实现了!全球首款L4级别的无人车量产下线!”百度“阿波龙”已经具备了在简单城市道路下完全自动驾驶的能力,无需任何干预,包括变道、等红灯、避让等等都由无人车自主完成;腾讯也自主开发出无人驾驶“AI in car生态系统”,放言2019年量产;阿里巴巴也推出了斑马智行汽车操作系统。无人车的商业化进程在加速。
AI最核心的技术是在无人驾驶汽车上的先驱。
三、张学友演唱会人脸识别抓逃犯
4月7日晚张学友南昌演唱会、5月5日晚张学友赣州演唱会、5月20日晚张学友嘉兴演唱会上,警方应用人脸识别技术在现场连续抓获三名网上逃犯。人脸识别系统,包括动态人脸卡口检测和静态人脸大库检索,利用人脸检测及识别技术,从高清视频监控画面中抓拍人脸照片,即时分析人脸特征,快速完成人脸照片与后端数据库的黑名单的比对与识别,实现智能化的视频监控,即使在茫茫人海中,警察也能快速分辨出每个人,从而锁定逃犯位置。
人脸识别技术经过前几年的发展,已经进入到具体的落地运用阶段,比如通过摄像头比对身份证信息、上班人脸打卡考勤、支付宝的人脸支付、智能手机上的人脸解锁等等。
四、蚂蚁金服车辆事故定损
蚂蚁金服于2017年6月推出的国内首个车辆事故图像定损AI技术,将过去由人工肉眼判定车损的环节升级为用人工智能做标准化统一定损。事先喂大量图片给AI,然后手把手教它——车型、部位、损失程度、修理成本,AI逐渐会从中学习到分辨图片的细节,完成车辆事故定损。据称“定损宝1.0”推出不到一年提供定损调用服务超过千万次,共计节省定损人员工作量超75万个小时,为保险行业节省案例处理成本超过10亿元,减少理赔渗漏约10亿元。 定损宝2.0已经在今年5月份上线,由照片定损升级为视频定损,支持车主用手机按照系统指引拍摄视频即可自助定损。
五、中国太保的阿尔法保险
“阿尔法保险”是中国太保打造的业内首个人工智能保险顾问。产品使用大数据分析和机器学习算法,融合保险、精算专家团队经验,通过基本信息、家庭结构、收入支出、资产负债、社保福利、生活习惯6组问题,为客户测算家庭风险防御能力指数,量身定做家庭理想保险保障建议。阿尔法保险2017年9月1日上线,当天访问量就超过20万用户,三天累计访问量突破了100万,目前累计访问量近500万,访问用户在朋友圈的分享率持续超过10%。
策略与路径
“AI优先”的策略选择:“All in”、“聚焦”和“优先”是三种不同的策略选择。All in是孤注一掷,全力以赴、全押上;聚焦是高度关注,突出重点、集中资源;优先是根据轻重缓急,优先排序、资源倾斜。
在重要性和紧迫性矩阵中,人工智能目前应该定位在重要但不十分紧迫的象限,无论从短期成效和长期机会看,都适用优先排序策略。
确立“AI优先”的意义,一是进一步动员和倾斜企业资源,强化AI应用产品的研发能力;二是形成协同研发体系;三是在行业中率先确立“AI优先”,有利于形成先发效应。
“AI优先”工程的路径设计:
1.AI的企业级应用研发不要“最前沿”而要“最实用”的成熟AI技术。
2.AI应用研发以内部效率提升和改善外部客户体验并重。
3.建立企业级AI产品研发清单
目前企业级AI应用研发呈现碎片化,缺乏应用场景及需求的系统规划;缺乏底部基础层和中间能力层的平台支持,导致单打独斗和重复建设,也缺乏外部合作伙伴的统筹管理。往往事倍功半。應该在存量开发项目全面梳理和系统挖掘增量需求的基础上,建立企业级AI产品研发清单,统一筹划,配套资源,协同运作,强力推进。
4.启动AI技术平台建设
AI技术平台架构是AI应用研发的重要基础设施和先决条件,包括应用层、中间能力算法层和底部基础资源层。应用层直接面向各种业务场景的需求,提供感知、识别、分析、判断和行动的应用软件和服务。中间能力算法层承上启下,在底部基础层提供资源的支持下,为应用层提供数据库和算法,以及耦合接口。底部基础资源层提供计算和存储资源。中间能力算法层和底部基础资源层要建设企业级的共享平台。
AI平台、大数据平台、云计算平台,是下一代信息系统建设的骨干项目。
5.选择合适的AI合作伙伴
“AI优先”需要引进外部合作伙伴,因为传统企业在AI技术领域基本是空白,且AI技术日新月异。搭便车事半功倍。合作模式有两种选择,一是锁定主要伙伴,长期深度合作;二是多管齐下,广域随机合作。
选择主要AI合作伙伴的主要考量要素:AI技术的资质和能力;对合作的定位;对行业AI应用的理解;具体合作内容与方式。
6.培育AI人才队伍
AI人才包含三个层次:一是AI业务需求团队,对业务场景有深刻理解,对AI应用高度敏感,能够完成有质量的AI业务需求交付,并配合算法建模团队完成知识图谱和实体知识库的建设任务,AI业务需求团队散布于各个业务领域的前中后台;二是AI算法建模团队,有大数据和建模的专业基础,熟悉业务场景及业务需求,能够协调AI业务需求团队和IT开发团队共同完成知识图谱、实体知识库的建模及拟合算法的系统开发需求交付,AI算法建模团队应该是一个专家级的团队;三是IT开发团队,大数据平台、云计算平台、应用软件架构和编程的专业基础扎实,能够完成AI平台建设、AI应用软件的开发及部署,具有自主研发交付能力。
AI人才队伍建设包括内部培养和外部引进。尤其在AI算法建模团队适度引进外部AI领域有项目实践经验的专家级人才可能是一条捷径。
知识图谱建设
行业知识图谱建设是人工智能应用领域的战略制高点,也是人工智能时代行业竞争的核心竞争力。
人工智能应用要件包括场景、实体知识库、知识图谱、算法拟合,一个都不能少。人工智能的能源是数据,人工智能的引擎是知识图谱。
什么是知识图谱?举一个例子,图形识别领域的正方形知识图谱:有四条直线;这四条直线首尾相连形成闭环;这四条线是相互垂直的;这四条线长度相等;并且它们必须在一个平面上。
用这个知识图谱建立算法,机器就可以完成识别一个正方形的任务。人工智能在本质上就是用计算机程序执行类似的逻辑。
知识图谱的建立是由场景驱动的,场景才是盘活存量数据、生产增量数据,完成知识图谱定义集,最终实现人工智能的应用价值。从这个意义上讲,场景比算法重要。而没有建立知识图谱的实体知识库也只是原材料,从这个意义上讲,算法确实比数据重要。
归纳一下关于知识图谱建设的几个要点:人工智能是基于实体知识库和知识图谱的;知识图谱要做的是让实体知识库可以被有效访问、判断和推理;知识图谱是实体知识库所使用的标签体系和组织框架,有别于“实体知识库”;如果要用人工智能解决某个特定领域问题,首先要建立相关领域的知识图谱。
建立知识图谱的实战步骤:1.基于垂直领域应用场景抽象出知识图谱——领域实体知识的标签体系和组织框架;2.用知识图谱与样本建立映射关系,验证知识图谱能否穷尽场景和领域实体知识;3.不断喂食数据以丰富知识图谱和领域实体知识库;4.完善算法后形成垂直领域的人工智能应用场景解决方案。
著名的“费米问题”,是讲在信息不充分的条件下,凭借对事物本质的深刻理解和洞察,采用变通和量纲分析,直接做出一些假设和估算,把难题变成简单可解的问题。费米问题的案例:算一算地球的周长是多少?已知纽约到洛杉矶3000英里,时差3小时,3小时是一天的1/8,而一天即地球自转一周的时间,所以,地球的周长就是3000乘以8,等于24000英里。与精确值的24902.45英里相比,误差不到4%。这是一个标准的费米问题。
人工智能和知识图谱的建设,也需要解决“费米问题”的能力。即想象力和创造力。
在人工智能这件事情上,行业知识图谱的建设要耗费海量人力、财力、数据和专业知识,尤其是时间,数据库和数据标注的工作量可能是以年/人为单位的。比如人工智能车辆事故定损,要建立车损知识图谱,需要全球所有车型、每种车型所有部位、每个部位不同距离角度光线、不同损失程度的图片,这个实体数据库是大数据级的。这种事情你想到了也不一定有能力去做出来,只能由智猪博弈中的“大猪”来做。
即便是免费时代,“天底下没有免费的午餐”的商业逻辑仍然成立。互联网经济流行“羊毛出在羊身上狗来买单”,精准广告推送分成,是一种商业模式;流量故事找风投,估值溢价,通过IPO变现是另一种商业模式;免费使用产品,隐性对价是用户隐私,海量数据建设领域知识图谱,数据资产通过人工智能变现,又是一种商业模式。互联网经济的商业模式比一手交钱 一手交货的交易结构更复杂更隐蔽而已。
尤瓦尔在《未来简史》中提到牛津大学的一份研究报告,这份研究报告预测了2033年的人工智能替代率:电话营销员99%、保险代理人99%、运动赛事裁判员98%、收银员97%、厨师96%、服务生94%、律师94%、导游91%、面包师89%、公交车司机89%、建筑工人88%、兽医86%、安保人员84%、船员83%、调酒师77%、档案管理员76%、木匠72%、救生人员67%。
各行各业的总体替代率是47%。
每一位读者无论相信不相信这份报告,都会下意识地对号入座吧。
面对人工智能的步步紧逼,人类最后的手段也许只剩下拔掉电源插头了。
(作者为中国太平洋保险集团首席数字官,编辑:袁满)