论文部分内容阅读
机器学习正在不断地纵深发展。IDC数据显示:2023年,人工智能系统支出会达到979亿美元,相比2019年增长2.5倍,Gartner数据显示,75%的企业在2024年底会把机器学习从试点转向生产系统,需要经过反复迭代才能真正改变客户体验或者提升效率,而这样的生产系统也在整个行业加速。
“亚马逊有零售和硬件设备,比如,Alexa、Echo以及Prime Air,可以说二十年前亚马逊就开始了自己的机器学习实践,而且在运营和运作的背后到处都是机器学习的身影。”亚马逊云科技大中华区云服务产品管理总经理顾凡在接受笔者的采访时表示,亚马逊利用机器学习有一个核心理念,即“亚马逊+机器学习”等于客户体验的提升。“所有案例中的关键不是算法,而是从解决客户体验的问题入手,然后在思考机器学习是否以工具的方式进行使用。”
事实上,亚马逊云科技的所有技术和服务同样在赋能给亚马逊自身快速地进行创新。“亚马逊和亚马逊云科技完全可以想像为一个小飞轮,亚马逊就是亚马逊云科技最大的客户,二者是客户和平台的关系,既然是客户就会给亚马逊云平台提供大量的使用实例和需求,亚马逊云科技产生的服务和产品又可以让亚马逊零售包括硬件部门充分使用起来,形成一个客户和平台之间互动的关系。”顾凡透露,亚马逊云科技的服务已经超过200多种,计算、存储、网络数据库、分析、IoT、AI/ML和安全等,其中很重要的一点就是,开始机器学习之前需要做好数据准备、清理和筹备的工作。
亚马逊云科技一直强调,AI/ML普惠是其的核心使命,但是想要完成这样一个使命的关键在于是否可以为不同行业的客户提供一个全面的工具集。值得一提的是,从2016年到2020年,亚马逊云科技的工具集重塑和演进一直在保持稳定的增长,仅去年一年时间,就新增了250多项机器学习的功能。
“谈到AI/ML工具集,亚马逊云科技一直有一个核心的理念——授人以鱼,不如授人以鱼,能够帮助客户独立完成快速迭代,开发和规模化产生数据模型的工具。”顾凡表示,AI/ML工具集可以从三个层面进行解读:首先是,针对没有数据科学家和算法开发工程师,但有数据、场景的客户,亚马逊云科技会提供开箱即用的服务。其次,针对数据科学家和开发人员,亚马逊云科技会提供完全托管的平台——Amazon SageMaker,集中资源深刻的了解业务,针对基础设施的管理,以及机器学习繁琐的步骤打包成云服务,实现自动化运营,提高开发人员的效率。最后是,面对深层用户,亚马逊云科技会提供ML框架和基础架构。
其中,比较关键的一点是,Amazon SageMaker作为一个开放且对机器学习框架广泛支撑的平台,除了三大框架之外,客户可以将自己的机器学习框架与SageMaker进行DIY机器学习集成。
“亚马逊云科技为了实现机器学习的普惠一直在开源的领域持续不断地努力,AutoGluon自动化机器学习也是非常热门的话题,真正达到客户写几行代码就可以做出模型,把特征的调取、参数的调优、模型的建立都自动化完成,更进一步地拉低整个机器学习的门槛。”顾凡表示,无论是AutoGluon、DGL还是MxNet都是开源的,亚马逊云科技要不遗余力地推进开源生态系统,让更多的开发者加入到机器学习这样低门槛的开发环境当中。
如今,我们看到Amazon SageMaker机器学习服务越来越多地在中国各个行业相继落地:医疗行业,益体康利用亚马逊云科技的机器学习服务快速构建了智能远程心电平台的AI训练和推理场景,提升了模型训练的速度;教育行业,叽里呱啦使用 Amazon Polly 和 Amazon EC2 P3 实例,依托 亚马逊云科技 先进的人工智能与机器学习技术快速地构建具有逼真语音体验的在线学习平台,让儿童获得具有沉浸式体验的纯正英语发音学习环境。工业智能领域,天和荣在开发即视通门铃产品的人脸识别功能过程中,采用了开箱即用的 Amazon Rekognition,短时间内就为即视通平台增加了人形侦测、人脸识别等能力。
亚马逊云科技一直在强调未来传统行业一定是机器学习发力的点,所以在和传统行业的客户交流的过程中,主要方向包含四个方面:数据策略、找到ML技术切入点、数据科学家业务化,以及应对技能差距。
山东淄博市热力集团有限责任公司是一家有着30余年供热历史的供热企业,通过使用亚马逊云科技丰富的AL/ML技术和服务,构建、训练和部署机器学习模型,实现了精准供热,可以根据气象、工控数据、建筑物维护结构等信息计算出最佳的供热模式,并给出具体的操作指令,既让用户室温始终保持人体最佳舒适温度,又做到尽可能节约成本。
其中,精准供热模型使用Amazon SageMaker为核心开发平台,而基于亚马逊云科技的无服务器架构搭建的大数据智能分析平台,帮助淄博热力提升了客户满意度。
为了更好地服务中国市场的客户,亚马逊云科技将会在中国区持续落地新的机器学习服务:Amazon Personalize,开发人员无需具备机器学习专业知识,用户可用它训练、调整和部署自己定制的机器学习模型,构建个性化推荐系统,用于产品推荐、个性化营销、个性化搜索和定制化直销等广泛的个性化推荐场景。
此外,已经落地中国一周年的Amazon SageMaker也迎来了7项新的功能更新:SageMaker Data Wrangler,简化机器学习的数据准备工作;SageMaker Feature Store,完全托管且专门构建的特征存储库,用于存储、更新、检索和共享机器学习特征;SageMaker Clarify,让机器学习开发人员可以更好地掌控其训练数据和模型,从而识别和限制偏差并解释做出相关预测的原因;Distribued Training,为训练大型深度学习模型和数据集提供易用的方法;SageMaker Debugger v2.0,实时捕获训练指标,自动识别机器学习训练任务中正在出现的复杂问题;Model Monitor v2.0,帮助客户时刻保持机器学习模型的准确性; SageMaker Pipelines,针对机器学习专门构建、易于使用的持续集成和持续交付服务,通过编排和自动化提高机器学习工作的效率。
“算力永远是机器学习最基础的基础。”顾凡透露,Amazon EC2 Inf1计算实例即将落地中国区域,Inf1计算实例基于亚马逊设计的首款定制机器学习芯片Amazon Inferentia,与成本最低的基于GPU的实例相比,可以提高30%的吞吐量,每次推理成本最高能够降低45%,对于机器学习的框架都完美支持。
据了解,亚马逊Alexa团队已经将其高度复杂的“文本转语音”模型迁移到了Amazon Inferentia,该模型生成了类似于人的语音,目前有80%的Alexa语音响应在Inf1实例上合成,节省30%的成本的同时,降低了25%的响应延迟。
“我们始终在强调亚马逊云科技的核心优势:开放的态度以及与客户授人以鱼不如授人以渔的合作模式。”顾凡表示,无论是上云还需要机器学习服务,客户都不希望被某一种服务锁定。所以,在提供深度与宽度兼具的服务同时,亚马逊云科技必要要保持开放的态度,做到真正与中国市场相结合,幫助客户重塑竞争力。
“亚马逊有零售和硬件设备,比如,Alexa、Echo以及Prime Air,可以说二十年前亚马逊就开始了自己的机器学习实践,而且在运营和运作的背后到处都是机器学习的身影。”亚马逊云科技大中华区云服务产品管理总经理顾凡在接受笔者的采访时表示,亚马逊利用机器学习有一个核心理念,即“亚马逊+机器学习”等于客户体验的提升。“所有案例中的关键不是算法,而是从解决客户体验的问题入手,然后在思考机器学习是否以工具的方式进行使用。”
事实上,亚马逊云科技的所有技术和服务同样在赋能给亚马逊自身快速地进行创新。“亚马逊和亚马逊云科技完全可以想像为一个小飞轮,亚马逊就是亚马逊云科技最大的客户,二者是客户和平台的关系,既然是客户就会给亚马逊云平台提供大量的使用实例和需求,亚马逊云科技产生的服务和产品又可以让亚马逊零售包括硬件部门充分使用起来,形成一个客户和平台之间互动的关系。”顾凡透露,亚马逊云科技的服务已经超过200多种,计算、存储、网络数据库、分析、IoT、AI/ML和安全等,其中很重要的一点就是,开始机器学习之前需要做好数据准备、清理和筹备的工作。
亚马逊云科技一直强调,AI/ML普惠是其的核心使命,但是想要完成这样一个使命的关键在于是否可以为不同行业的客户提供一个全面的工具集。值得一提的是,从2016年到2020年,亚马逊云科技的工具集重塑和演进一直在保持稳定的增长,仅去年一年时间,就新增了250多项机器学习的功能。
“谈到AI/ML工具集,亚马逊云科技一直有一个核心的理念——授人以鱼,不如授人以鱼,能够帮助客户独立完成快速迭代,开发和规模化产生数据模型的工具。”顾凡表示,AI/ML工具集可以从三个层面进行解读:首先是,针对没有数据科学家和算法开发工程师,但有数据、场景的客户,亚马逊云科技会提供开箱即用的服务。其次,针对数据科学家和开发人员,亚马逊云科技会提供完全托管的平台——Amazon SageMaker,集中资源深刻的了解业务,针对基础设施的管理,以及机器学习繁琐的步骤打包成云服务,实现自动化运营,提高开发人员的效率。最后是,面对深层用户,亚马逊云科技会提供ML框架和基础架构。
其中,比较关键的一点是,Amazon SageMaker作为一个开放且对机器学习框架广泛支撑的平台,除了三大框架之外,客户可以将自己的机器学习框架与SageMaker进行DIY机器学习集成。
“亚马逊云科技为了实现机器学习的普惠一直在开源的领域持续不断地努力,AutoGluon自动化机器学习也是非常热门的话题,真正达到客户写几行代码就可以做出模型,把特征的调取、参数的调优、模型的建立都自动化完成,更进一步地拉低整个机器学习的门槛。”顾凡表示,无论是AutoGluon、DGL还是MxNet都是开源的,亚马逊云科技要不遗余力地推进开源生态系统,让更多的开发者加入到机器学习这样低门槛的开发环境当中。
如今,我们看到Amazon SageMaker机器学习服务越来越多地在中国各个行业相继落地:医疗行业,益体康利用亚马逊云科技的机器学习服务快速构建了智能远程心电平台的AI训练和推理场景,提升了模型训练的速度;教育行业,叽里呱啦使用 Amazon Polly 和 Amazon EC2 P3 实例,依托 亚马逊云科技 先进的人工智能与机器学习技术快速地构建具有逼真语音体验的在线学习平台,让儿童获得具有沉浸式体验的纯正英语发音学习环境。工业智能领域,天和荣在开发即视通门铃产品的人脸识别功能过程中,采用了开箱即用的 Amazon Rekognition,短时间内就为即视通平台增加了人形侦测、人脸识别等能力。
亚马逊云科技一直在强调未来传统行业一定是机器学习发力的点,所以在和传统行业的客户交流的过程中,主要方向包含四个方面:数据策略、找到ML技术切入点、数据科学家业务化,以及应对技能差距。
山东淄博市热力集团有限责任公司是一家有着30余年供热历史的供热企业,通过使用亚马逊云科技丰富的AL/ML技术和服务,构建、训练和部署机器学习模型,实现了精准供热,可以根据气象、工控数据、建筑物维护结构等信息计算出最佳的供热模式,并给出具体的操作指令,既让用户室温始终保持人体最佳舒适温度,又做到尽可能节约成本。
其中,精准供热模型使用Amazon SageMaker为核心开发平台,而基于亚马逊云科技的无服务器架构搭建的大数据智能分析平台,帮助淄博热力提升了客户满意度。
为了更好地服务中国市场的客户,亚马逊云科技将会在中国区持续落地新的机器学习服务:Amazon Personalize,开发人员无需具备机器学习专业知识,用户可用它训练、调整和部署自己定制的机器学习模型,构建个性化推荐系统,用于产品推荐、个性化营销、个性化搜索和定制化直销等广泛的个性化推荐场景。
此外,已经落地中国一周年的Amazon SageMaker也迎来了7项新的功能更新:SageMaker Data Wrangler,简化机器学习的数据准备工作;SageMaker Feature Store,完全托管且专门构建的特征存储库,用于存储、更新、检索和共享机器学习特征;SageMaker Clarify,让机器学习开发人员可以更好地掌控其训练数据和模型,从而识别和限制偏差并解释做出相关预测的原因;Distribued Training,为训练大型深度学习模型和数据集提供易用的方法;SageMaker Debugger v2.0,实时捕获训练指标,自动识别机器学习训练任务中正在出现的复杂问题;Model Monitor v2.0,帮助客户时刻保持机器学习模型的准确性; SageMaker Pipelines,针对机器学习专门构建、易于使用的持续集成和持续交付服务,通过编排和自动化提高机器学习工作的效率。
“算力永远是机器学习最基础的基础。”顾凡透露,Amazon EC2 Inf1计算实例即将落地中国区域,Inf1计算实例基于亚马逊设计的首款定制机器学习芯片Amazon Inferentia,与成本最低的基于GPU的实例相比,可以提高30%的吞吐量,每次推理成本最高能够降低45%,对于机器学习的框架都完美支持。
据了解,亚马逊Alexa团队已经将其高度复杂的“文本转语音”模型迁移到了Amazon Inferentia,该模型生成了类似于人的语音,目前有80%的Alexa语音响应在Inf1实例上合成,节省30%的成本的同时,降低了25%的响应延迟。
写在最后
“我们始终在强调亚马逊云科技的核心优势:开放的态度以及与客户授人以鱼不如授人以渔的合作模式。”顾凡表示,无论是上云还需要机器学习服务,客户都不希望被某一种服务锁定。所以,在提供深度与宽度兼具的服务同时,亚马逊云科技必要要保持开放的态度,做到真正与中国市场相结合,幫助客户重塑竞争力。