瑞萨电子与Syntiant共同开发结合先进视觉与语音技术的语音控制多模态AI解决方案
2021年07月28日 15:05 发布者:eechina
全新方案在物联网和边缘应用中实现对嵌入式视觉AI系统的低功耗语音控制操作瑞萨电子集团Syntiant今日宣布,共同开发出一款语音控制的多模态AI解决方案,在基于视觉AI的物联网和边缘系统(如自助收银机、安全摄像头和视频会议系统)以及智能家电(如扫地机器人等)中实现低功耗、非接触式的图像处理。
全新解决方案结合了瑞萨RZ/V系列视觉AI微处理器(MPU)和低功耗多模态、多功能Syntiant NDP120 Neural Decision Processor,以提供先进的语音和图像处理功能。该解决方案具备常开功能,可从待机模式快速通过语音激活,以执行物体识别、面部识别等视觉任务,以及其它安防摄像机等系统的关键功能。如当用户定义的语音提示激活并运行系统时,视觉AI将识别跟踪操作员的行为,并控制操作或在检测到可疑行为时发出警告。
多模态架构使得为基于视觉AI的系统创建非接触式用户体验变得更加容易。由于可以独立于视觉AI功能进行软件开发,因此利用专用的高能效芯片进行语音识别可降低待机功耗,并加速系统开发。
瑞萨电子高级副总裁、物联网及基础设施事业本部SoC事业部部长新田启人表示:“我们预计,作为提高易用性和安全性的一种有效途径,对采用多输入信息流(包括图像和语音)的多模态系统需求将会增加。拥有先进低功耗图像AI技术的瑞萨与语音AI技术优秀供应商Syntiant紧密合作,将加速低功耗、超小型智能语音AI技术在嵌入式系统中的应用,并为全球客户带来新的综合解决方案。”
Syntiant CEO Kurt Busch表示:“基于语音的用户界面让客户获得全新用户体验,将下一代创新理念从概念变为现实。我们的深度学习NDP全球出货量已超过1500万片,为各类消费和工业物联网应用实现了常开语音功能。我们同瑞萨的合作打造了强大、低功耗的语音及图像解决方案,相信它将会加速推动全球客户在丰富设备和案例中的应用。”
用于视觉AI的瑞萨RZ/V系列MPU集成了瑞萨独有的DRP-AI(动态可配置处理器-AI)加速器,并将高精度AI推理与业界领先能效充分结合。卓越能效可消除对散热片或冷却风扇等散热措施的需求,从而降低材料清单(BOM)成本,使视觉AI集成至广泛的嵌入式应用成为可能。
Syntiant NDP120芯片集成了复杂的AI功能,可用于众多高精度免提语音应用,包括演讲人识别、关键词检测、多唤醒词和本地命令识别等。NDP120与Syntiant Core 2神经网络推理引擎封装,还可同时运行多个应用程序,并将功耗降至1mW电池功率。
全新语音控制多模态AI解决方案作为瑞萨电子“成功产品组合”的一部分,从瑞萨更广泛的产品组合中选取多个相互兼容的器件,为客户构建更高阶的原型设计平台,以加速上市并降低风险。瑞萨“成功产品组合”包含卓越的模拟、电源和嵌入式处理产品组合,可帮助客户加速设计并缩短上市时间。
供货信息
全新多模态AI解决方案的参考设计现已推出,其中包括电路图和BOM清单。更多信息,请访问:多模态AI解决方案