搞机器学习还敲什么代码

2021年12月16日 14:06    发布者:科技新思路
不写代码也能搞机器学习?!这是亚马逊云科技在最近亚马逊云科技 re:Invent 大会上公布的新工具,用于实现无代码可视化机器学习。亚马逊云科技 re:Invent 大会可谓是云计算行业的“春晚”,IT 技术领域风向标级活动,连他们自家的西雅图总部大厦也随其更名为大会名,品牌影响之强,可见一斑。10年来,这一活动上诞生了无数云计算乃至 AI 行业标杆产品,如 Amazon Mechanical Turk、Amazon Rekognition、Amazon SageMaker 等等。今年亚马逊云科技 re:Invent 2021 同样信息量巨大,最引人关注的,莫过亚马逊云科技的机器学习平台服务 Amazon SageMaker 迎来了一次“大爆发”。不只有无代码开发机器学习模型这一道“菜品”,整个 AI 餐桌上,纵向看,亚马逊云科技的12项产品已经覆盖了整个 AI 产业链——再从横向看,从为个人开发者准备的入门免费算力池,到大厂专业人士所需的 AI 模型优化工具,相应发布也一应俱全。甚至,考虑到 AI 发展迅猛的中国市场用户,亚马逊云科技还在B站提供带中文字幕的大会实录。现场演讲中,CEO 还专门强调:「亚马逊云科技会提供最广泛最完整的全栈式机器学习服务」。不妨跟着我们一起回顾全程亮点,对亚马逊云科技的 AI 产品脉络有一番全面认识。
不用代码的机器学习
还是先探探一开始提及的无代码机器学习预测服务,看它是否真能让不懂代码的人上手。按官方介绍,这款产品名为 Amazon SageMaker Canvas,面向零机器学习经验群体,他们中,也许有人是业务分析师,也许有人从事人力资源、财务或营销等工作。可预见,上述群体中,多数人并没有机器学习经验,甚至对代码也毫无认知,却肯定有通过数据来衡量当前策略、预测市场趋势的需求。Amazon SageMaker Canvas 就是将机器学习模型的诸多步骤可视化为可交互的 UI,旨在解决他们的业务问题,号称:不写一行代码,快速生成机器学习预测模型。生成模型后,还可共享给数据科学家等合作伙伴,帮业务人员来进一步检查或者优化这些的模型。看完官方这一案例,该可视化界面的确有两把刷子——那么合作方体验又如何?目前,宝马集团已将亚马逊云科技 AI/ML 技术投入实际业务流程中的600多个应用中,涵盖生产线到销售端的多个场景,此外宝马还有1500万台互联汽车介入其中,一天产生数以百万公里数据均交由 Amazon SageMaker Canvas 分析预测。西门子能源也是上手吃螃蟹者之一。他们将 Amazon SageMaker Canvas 作为自家机器学习工具包的补充,一位应用部门的数据科学组组长表示:Canvas 让我们能与数据科学团队共享协作,有助于生产更多机器学习模型,并确保模型符合质量标准和规范。还有很多名不见经传的巨头也是 Canvas 体验者,比如全球最大的非上市公司科赫集团的子公司英威达,也已经用 Amazon SageMaker Canvas 来辅助处理业务流程中的数据科学问题。多方评价及直观展示结果看完,大致可以判断,此次 Amazon SageMaker Canvas 确实值得期待。毕竟图形界面相比代码释放生产力创造价值的定律在过去已被反复证明。
免费的线上 AI 实验室
前文提及,在年度重磅发布会亚马逊云科技放下豪言:提供最广泛最完整的全栈式机器学习服务,既然是「最广泛最完整」,仅靠一个 Amazon SageMaker Canvas 的发布当然不够——对广大学研机构、AI 爱好者们,前沿技术巨人也需要对得起自己的口号。总结下来,三个字,降门槛。最直观的,提供算力资源。近年来,高昂的硬件价格、复杂软件配置一直阻碍初学者入门 AI 的脚步,也是限制行业发展,为更多人认知熟悉的巨大障碍。亚马逊云科技发布功能 Amazon Sagemaker Studio Lab 提供一大团可薅的「羊毛」。无需额外环境配置、无需注册账户、直接用电子邮件就能登录进去的线上实验室。在这一环境中,任何人创建的项目,都能直接拥有12个小时的 CPU 计算时间、4小时的 GPU 计算时间,以及15GB的存储空间:不仅自己发光发热,亚马逊云科技还拉上英特尔,Udacity 做起联名活动,面向16岁以上的经济困难、残疾等社会弱势群体发放2500份奖学金。获得经济支持之外,这些弱势人群们也能得到 Udacity 导师、亚马逊云科技和英特尔技术大咖长达一年时间的指导和帮助。
机器学习“工业化”重塑
无论零代码机器学习发布,还是面向更广人群的普惠,背后还是技术撑腰。毕竟功能开发需要深刻场景理解及技术积淀,而「普惠」二字考验的,还是技术企业的降本水平。相比上述两者,亚马逊云科技 re:Invent2021 面向专业从业者发布的 Amazon SageMaker 诸项新功能,更直观展现亚马逊云科技技术水准,从中,更可见技术巨头对 AI/ML 未来的谋划。对于广大的 MLer 来说,一套完整的机器学习流程,包括数据准备、数据标注、训练、推理、部署。最终模型推理效果如何,既依赖于开发者个人的水平,也会受架构、算力、数据这些外化因素的影响。亚马逊云科技之所以这么做,是想要降低个人水平影响,用他们的话说:让 AI/ML 从手工作坊走向工业化。具体来看,为一揽子解决问题,Amazon SageMaker 给出一套组合拳,涵盖机器学习全流程:在数据准备阶段,数据工程师常常需要离开当前开发环境,手动配置一个满足正在运行的模型或分析要求的集群。为此,Amazon SageMaker Studio 与 Amazon EMR 进行了集成,可直接从 Amazon SageMaker Studio Notebook中使用 SparkUI 来监视和调试运行在 Amazon ECR 集群上的 Spark 作业。鉴于无论执行数据预处理、开发还是模型部署,都不必离开这个环境,上述动作无疑向一个理想的完全集成开发环境迈进了一步。无论是打通 AI/ML 工业化规模应用流程,还是硬件自研芯片发布,更宏观层面看——上述发布动作昭示了亚马逊云科技在 AI/ML 业务肉眼可见的延伸。
亚马逊云科技正在拓展 AI 疆界
根据 IDC 的数据,从2013年至2020年的7年内,全球 AI/ML 年支出规模从0迅速扩大到约500亿美元,该增速几乎是亚马逊云科技老本行云计算的2倍。正是看见这一趋势,亚马逊云科技多路出击似乎也是必然。从无代码机器学习、无服务器应用深入 AI/ML,到底层算力继续升级,乃至诸多普惠计划…令人眼花缭乱的发布无不昭示亚马逊云科技正在重新划定机器学习的全新的疆界。尽管上述发布还未落地结果,其展现出的价值普通大众一时未必肉眼可见,但从另一个视角看,所谓追求长期价值,所谓看重基础设施布局,不就显而易见地写在亚马逊云科技 DNA 里么?回想1997年,贝索斯发布了那封广为人知的「致股东一封信」。彼时初代互联网泡沫正在累积,「快钱」之于很多人尚且是全新概念,当时的 Amazon 就提出客户、销售和品牌增长无不为了长期价值服务,同样为长期价值,贝索斯强调了对「系统及其它基础设施」的持续投入。此后,Amazon Web Services 独立运作,将云计算从「概念」变成实实在在的一个行业,更有 Amazon Redshift、Amazon Lambda 带出云原生数仓、无服务器路线发展…一切的一切,似乎都早早写下序章。现在亚马逊云科技带着同样心态持续押注 AI/ML 领域,本身也就不令人意外了。这既是身为技术巨头的责任所在,也的确让人有所期待,正呼应今年亚马逊云科技 re:Invent 2021 的 Slogan :引领风向,重塑未来。我们已能看到,AI/ML 领域人群覆盖在扩大,其行业场景在延伸,其技术也相应继续深探,这一过程还在被行业技术探路者们持续推进。未来,AI/ML 的疆域究竟有多大?亚马逊云科技正在一点点划定新的轮廓。