一篇论文被Sensors(SCI/EI索引)期刊录用

Enabling Real-Time On-Chip Audio Super Resolution for Bone-Conduction Microphones(Authors:Yuang Li, Yuntao Wang*, Xin Liu, Yuanchun Shi, Shwetak Patel, Shao-Fu Shih)被Sensors期刊录用。

摘要:在嘈杂的环境中使用空气传导麦克风进行通信会导致语音清晰度降低。骨传导麦克风(BCM)虽然可以抵抗环境噪声,但由于其传感机制的限制,有效带宽有限。虽然现有的音频超分辨率算法可以恢复高频损失以实现高保真音频,但它们需要比低功耗便携设备提供的计算资源更多。本文提出了第一个基于骨传导麦克风的实时芯片内语音音频超分辨率系统。为了实现这一目标,我们构建并比较了一系列轻量级的音频超分辨率深度学习模型。在所有这些模型中,ATS-UNet是成本最高效的,因为所提出的新型音频时间偏移模块(ATSM)在保持足够的语音音频时间特征的同时,降低了网络的维度。然后,我们对ATS-UNet进行了量化和部署到低端ARM微控制器单元上,以实现实时嵌入式原型。评估结果显示,我们的系统在Cortex-M7上实现了实时推理速度,并与基线音频超分辨率方法相比具有更高的质量。最后,我们对十个专家和十个业余听众进行了用户研究,以评估我们的方法对人耳的有效性。与使用原始BCM或配备先进噪声降低算法的空气传导麦克风相比,两组用户都感觉到我们的方法具有更高的语音质量。

相关