「动手学深度学习」在B站火到没谁,加这个免费实操平台,妥妥天花板

2021年12月24日 11:24    发布者:科技新思路
论 AI 圈活菩萨,非李沐老师莫属。前有编写「动手学深度学习」,成就圈内入门经典,后又在B站免费讲斯坦福 AI 课,一则艰深硬核讲论文的视频播放量36万,不少课题组从导师到见习本科生都在追番。如此给劲的分享,难怪不少人骄傲自称「已拜在老师门下」——而最近,我发现有平台干了个更给劲的事。这个平台无偿提供算力不说,还将入门经典「动手学深度学习」放进平台,免费供大家学习和实操,名曰:Amazon SageMaker Studio Lab 。按介绍说法,该平台基于 JupyterLab,提供免费 GPU 和 CPU 算力+15G永久存储功能,还与 GitHub 链接,支持主流机器学习工具组件和开源资源包使用,开发者可结合「动手学深度学习」教材自行训练模型、看结果。而且,他们还号称申请只需一个邮箱,不要官方账号,更不用填什么信用卡。真有这么好的事?今天就带着大家一起亲测试试。
1.真能实操「动手学深度学习」案例?通过链接 studiolab.sagemaker.aws ,我们即可登入 web 端平台,探探虚实。
[*]哪能找到「动手学深度学习」?
从界面能看到,平台提供 GPU/CPU 算力选择,而且,可直接开启使用,确实无需付款。右下角,我们就能看到那本 Dive into Deep Learning (缩写为 D2L )。直接点击 Open D2L notebooks 可打开:到这,就可以通过平台结合课程内容与实操来学习深度学习了——那么实操效果如何?
[*]哪儿哪儿的代码,都能运行给你看
以经典中的经典的 AlexNet 部分为例,感受一下。平台上,AlexNet 沿袭发展、基础原理解释均呈现出来,模型的定义构建代码均可运行。为保证初学者更好理解,还能构建单通道数据示例,观察 AlexNet 内部8个层的输出情况,目的嘛,在于帮我们直观了解不同层的作用:△眼看曲线缓缓慢慢画出来值得一提的是,由于整个界面都能作为 Notebook 添加代码,记录学习思考——因此,即便我们课程完成,还能在文末添加代码栏,对照着章节末尾习题,编程实现作业。
[*]从数理基础到实操环境配置,都安排得明明白白
上面展示还只是一个小节。其实,从全连接层、卷积、池化等概念介绍,到 ResNet、DenseNet 讲解…在 Amazon SageMaker Studio Lab 免费环境中均有呈现及实操,都安排得明明白白。平台还贴心地考虑到我们的高数线性代数基础不一,不是每个人都过了90分,还把单变量微积分、最大似然等数理基础介绍和代码实现都给出来了,还附上环境配置方法,一副很靠谱的架势。经过上面验证,这个 Amazon SageMaker Studio Lab 确实可免费又完整地实操大神的「动手学深度学习」——对希望入门乃至深度掌握 AI/ML 这门技术的人来说,这种理论+实践型的研习方式自然更为高效,日后切换到实际工作或科研甚至创业中,过渡也更为无缝。事实上,它的能力还不仅这个水平。
2.一个面向开发者的免费平台从名字上你也发现了,推出 Amazon SageMaker Studio Lab 的幕后企业是亚马逊云科技。这家前沿技术大厂此次推出免费平台,不只将「动手学深度学习」做成理论+实操练习场,更想面向数据科学家、企业开发者、高校师生——提供一个免费低门槛入门机器学习的普惠机会。其实在亚马逊云科技之前,业内已有多个开放机器学习平台——那么,这回的 Amazon SageMaker Studio Lab ,又有什么值得关注的新亮点?我们一起先从配置看起。平台提供15G以上永久存储,16G内存,4个 CPU ,GPU 为英伟达 Tesla T4 ,比目前其他主流平台稍高。由于使用了较新架构的英伟达 Tesla T4 ,其混合精度运算速度指标相应也更高,此外,免费版与 SageMaker Studio 使用相同架构,相当于叠加一层企业级 Buff ,稳定性更有保障。不过,为保证大家早日通过申请用起来,有些 Tips ,希望大家留意:建议语言用英文,填写清楚相关机构名称,所留邮箱后缀与所在机构英文名匹配,这样的申请更可信靠谱。满足上述条件,亲测24小时内就能获得邀请,注意查收邮箱。
3.无缝迁移的进阶版前面已经提到了, Amazon SageMaker Studio Lab 与专业版 Amazon SageMaker Studio 为同一架构,所以,如果想从初学免费版迁移专业版,肯定不是大事儿。对专业开发者来说,这当然提供更多进阶科研及创业的可能。更具体看,专业版 Amazon SageMaker Studio 从头到尾已经提供给开发者一套相当全面的功能:比如提供大规模分布式训练,面向我们生产性的大模型训练需求。使用分区算法,在 GPU 实例中自动拆分大模型和数据集,提升并行度加快训练速度。比如数据标注功能 Ground Truth Plus ,拉上了人类专家,结合机器学习辅助预标记,大幅降低标注错误,提升标注速率。再比如 Amazon SageMaker Data Wrangler ,该功能面向机器学习中的数据准备阶段,可通过可视化界面进行数据选择、清理、探查。只需一键导入,无需代码即可快速标准化、转换大批量、结构五花八门的数据。「四大」之一的德勤就采用了该项功能,原本几个月才能完成的数据准备,现在压缩到几天完成。
4.技术大厂退居幕后最后,如何评价亚马逊云科技的 SageMaker Studio Lab ?经营角度看,这些做法对未来自家生态构建当然有利,是头部企业保持身位的必要动作。此外,大批企业动辄年薪50万招相关从业者,对很多开发者也是好事。毕竟,人工智能短缺肉眼可见,大部分开发者有丰富编程经验和数理基础,唯一挡板就是:不熟悉机器学习。补上这块就喝汤,何乐不为?不过,从行业维度看,上述动作也确实在推动前沿技术落地——不过这里的推动,不在于更快,而在于更广。要知道,一百年前汽车刚发明,只有机械专家才能成为车主,以至于当时社会,司机都是一个手握前沿技术的职业。也要知道,三十年前,PC 和互联网只是少部分开发者的玩具,以至于开发网站都能让人迅速暴富,积累起万丈高楼一样高的资产。所以,百年前的人无法理解一个人人可开车的社会,所以,30年前的人们也很难想象自己可以动动手指拥有属于自己的互联网平台。今天放在机器学习上也一样。即便是最前沿的科技界大师,也只能窥见AI落地版图的小部分状貌。只有一再降维,这项技术才能走进千行百业场景,在不同背景不同经历的人手里才会产生不同频率的回响——这既是亚马逊云科技普惠布局的价值体现,也是李沐老师等大拿的公心所在。那么,将来 AI 技术还能释放多大能量?答案还得从每位个体开发者、每个场景裂隙里,去寻找。