人工智能技术带动助听器的音频革命
2022年11月21日 15:56 发布者:eechina
来源:艾睿电子对许多听障朋友来说,助听器是他们日常生活中不可或缺的设备,随着各种技术的进步,助听器将变得更小、更为省电、声音更为清晰可辨,人工智能技术也将提升助听器的效能与功能。本文将为您介绍助听器的技术发展,以及由安森美(onsemi)所推出的Ezairo® 8300音频处理器的产品特性。
新科技缩小助听器的尺寸并提升效能表现
约在十几年前,许多人佩戴的助听器的体积仍然又大又突兀,使用者需要不断地摆弄调整它们的位置、更换电池,并抱怨他们仍听不清楚说话的内容。但在近几年来,技术的进步已使这些设备从令人沮丧的来源,转变为先进的音频设备,在基于物联网的现代生态系统中进行联接,从而为用户提供大量好处及出色的音频性能。
助听器的演化第一步是实施基于频率的非线性放大,每个频段将根据该频段所含的能量水平进行放大。因此,大噪声被削弱,安静被放大,这将大大增强了助听器用户的体验。
这一进步主要是由数字信号处理(DSP)的出现所推动的,它使助听器具有对不同频率进行定制放大的粒度,使其能针对用户进行调整和优化,特别是当他们的听力随着时间的推移而退化时。借助DSP,可用高度选择性的数字滤波器以全新的方式处理音频信号,这些滤波器可隔离频率,因此也可处理声音类型。
助听器的智能也因DSP而增长,使其能适应环境。例如,助听器可推断出佩戴者处于嘈杂的环境中,如人群、移动的车辆或大型公共场所。助听器将根据实时控制和调整数字滤波器的算法来重新配置到音频环境,从而在所有场景中提供尽可能好的音频体验。
此外,随着无线通信技术的快速发展,如蓝牙低功耗(Bluetooth® Low Energy, BLE)联接提供的个人区域网络,也对助听器技术产生了积极的影响。现代的联网助听器可由智能手机应用过程控制,并可用于电话/视频通话或收听智能手机、平板电脑,或任何其他具有BLE功能设备的任何其他形式的音频,包括语音助手。
助听器通过人工智能添加更多健康功能
另一方面,人工智能(AI)和机器学习等技术正开始进入助听器,进一步扩展其功能和性能。许多人认为,这项技术将产生前所未有的影响。展望未来,人耳还提供了相当多的传感机会。在不远的未来,许多助听器将包括用于医疗目的的传感器,如心率监测、血氧、血糖测量和跌倒检测。此外,同样的传感器可用于面向消费者的像是计步等健康功能。
随着助听器提供更多的增值功能,如从个人设备上传输音频,它们与被称为辅听耳机(非处方助听器、耳塞等)的新兴产品群之间的区别正变得越来越小。辅听技术开辟了许多潜在的收入来源,包括实时翻译、听写和导航服务。事实上,任何可以通过BLE联接提供声音的东西,都可通过辅听方案(包括现代助听器)来提供。
如果没有近几十年来半导体制造技术的巨大进步,以及DSP和BLE技术等其他重大进展,就不会有现代助听器。追踪处理器随时间的演变通常是基于集成晶体管的数量。第一批个人电脑(PC)处理器有数以万计的晶体管,采用半导体工艺制造,特征尺寸在数微米范围内。今天,这些处理器拥有数以百亿计的晶体管,其技术节点小了几千倍。这种集成水平不仅使PC行业受益,整个半导体行业都可用这不断发展的技术,使所有垂直市场的制造商都向前大迈进。
具体而言,助听器市场受益于多核并行处理架构,其处理能力呈指数级提高,时钟周期最小化,并大幅降低功耗。这种内核可处理高度精密的算法,包括AI。
音频处理器是高端无线音频应用的绝佳选择
许多现代音频产品将受益于安森美基于DSP的EZAIRO®系列音频处理器方案的最新器件。Ezairo® 8300专为助听器和辅听设备设计和开发,具有六个处理内核,每个内核都针对这一应用领域优化了性能。这包括三个DSP内核、一个微控制器和两个硬件加速器,其中一个是神经网络加速器,设计用于以高能效执行AI和机器学习功能,而无需额外的处理器能力。
Ezairo® 8300包括六个可编程或半可编程处理内核,提供高度的并行性和灵活性,包括CFX这种开放式可编程双哈佛(dual−Harvard)24位DSP,支持任何类型的音频信号处理,Arm® Cortex®-M3处理器则是一个32位RISC处理器,支持通用处理和与外部组件的接口,结合HEAR可配置加速器内核,可针对音频信号处理中经常需要的预编程功能进行了优化,还包含过滤引擎可允许时域过滤,并支持超低延迟音频路径。此外,还有LPDSP32是一种开放式可编程双哈佛32位DSP,以及允许Ezairo® 8300以高效和灵活的方式执行神经网络计算的神经网络加速器。
Ezairo® 8300包括4个具有信号检测模式的ADC,和2个直接数字输出驱动器,具有高质量和超低功耗性能。当与非易失性存储器和无线收发器结合使用时,Ezairo® 8300还包括使其成为完整硬件平台所需的外围设备和接口。
Ezairo® 8300具有108 dB系统动态范围,和高达48 kHz采样频率的高保真音频系统,可支持从1.28 MHz到61.44 MHz的动态可选系统时钟速度,适用于1433 kB内存的多功能内存架构。
Ezairo® 8300提供在超低功耗下的高保真操作、多个接口、最大限度提高功耗性能的灵活性,以及对BLE连接的支持,使Ezairo® 8300成为高端无线音频应用的绝佳选择。
运用神经网络加速器为音频产品添加人工智能
Ezairo® 8300内置多个DSP进行信号处理,可提升接收到音频的清晰度,并对音频信号做更进一步的分析,还内置神经网络加速器(NNA),这是一种可配置的硬件加速器模块,专用于支持具有高能效的神经网络。它允许复杂的神经网络以节能的方式运行。加速器可以在单个任务中执行单层完全填充或稀疏填充的神经网络,而无需任何处理器干预,并可支持多达1023个输入和1023个输出的层。
NNA包含16个乘法器、16个累加器、16个输入寄存器和16个系数寄存器。它包括输入和系数“获取器”,一旦配置后,就会自动管理数据和系数内存访问,包括对系数压缩/解压缩和修剪的支持,有助于最大限度地减少所需的系数数量,可降低对系统处理器的负担,提升人工智能处理的效能表现。
Ezairo® 8300可应用于高分辨率立体声音频流、强化音频处理、用于蓝牙音频的ULP配套芯片,常见的最终产品包括无线助听器、耳塞/耳戴式设备、个人扩音产品(PSAP)、非处方(OTC)助听器、耳机等。
安森美并提供适用于Ezairo® 8300的开放式可编程评估和开发套件(EDK),并以订阅形式提供,可选择2、5或10个用户席位。
结语
随着科技的快速发展,助听器已经不仅用于助听功能,还可以结合音频播放的耳机功能,以及搭配传感器的健康功能,造福更多的听障人士。安森美的Ezairo® 8300音频处理器除了可应用于助听器外,也是各种耳机与音频播放装置的理想选择,其内置的多款DSP与NNA,将可提升音频产品的附加价值,在市场上取得产品差异化,增加产品的竞争力,将值得您更进一步了解与采用。
266176