• 果壳说
1223
需用时 02:26
Google,让AI“听见”更多声音

全球听力受损人群超过15亿人,占全球人口的20%。这个数目非常巨大,如果汇集起来,超过中国和印度,是世界人口“第一大国”了。到2050年,据世界卫生组织估计,亚洲国家将占全球病例的一半以上,数量高达 15 亿。

从2018年开始,联合国大会将每年9月23日设定为国际手语日,并将其作为国际聋人周的一部分,为的是提高社会各界对听障人士的重视程度。科技公司成为不可或缺的一方力量。

在上个月的Google中国开发者大会(Google I/O Connect China)上,“无障碍”是一个重要议题。其中,针对听障群体,Google与一些无障碍组织合作开发了例如“手语村“、“听语精灵”等项目。

“手语村”是一个将手语信息化的项目。利用MediaPipe Holistic 模型和 TensorFlow 框架等技术,实时识别和分析身体语言、面部表情和手语动作,使用机器学习模型来识别和预测手语的含义,并提供学习反馈,帮助学习者更快掌握正确的手语表达。

“听语精灵”是给没有完全丧失听说能力的儿童提供的陪伴式口语训练,比如“能说会道”,结合图像识别和数字人技术生成带有口型引导的声音输出,为孩子提供正确的发音指导。

Live Transcribe 这样的对话实时转录为文字的技术,从2019年推出后,不仅有效帮助到了大量听障群体,也应用到了很多实时字幕场合——一些由无障碍启发的技术,因为被愈发广泛地应用,得以走得更远。

如果说,手语村,Live Transcribe 这样的项目研发了如何将声音转化为其他模态信息的辅助技术,那么声音,本身就有很多信息可以被利用。

Google在无障碍和数字健康的技术研发上脚步不停。

Google 与科利耳(Cochlear)、澳大利亚国家声学实验室合作,开发下一代智能听力辅助设备。对比以往的助听器,放大声音来提高听力;或是绕过耳朵受损部分,通过听觉神经直接向大脑发送声音信号的原理,Google结合机器学习和听力学知识,研发以下听觉方案;

一:听力计算建模。通过使用听力的计算建模和深度学习来改进听力设备的基础算法,让声音更接近自然听觉的效果,不受听力损失的影响。

二:智能降噪。使用AI技术来移除不需要的声音,从而使在嘈杂的现实环境中聆听变得更加容易。对于自然听力,大脑获取足够的信息来识别和关注感兴趣的声音。

三:听力设备更加个性化。根据每个用户的听力受损特征,个性化地调整听力设备的参数。

AI与声音的结合,除了能用来改善人与人之间的倾听和沟通质量,还能帮助我们更好地观察和了解身体,解读人体中大量的健康信息。

AI 在诊断和监测健康方面,一大受限是数据。

Google 在今年推出了 HeAR,这是一个基于 AI 的生物声学基础模型,用于分析身体声音模式(如咳嗽声)来进行早期疾病诊断,特别是结核病。

HeAR 模型经过 3 亿音频数据的训练,能够识别健康相关的声音模式。如今,研究人员可以使用 HeAR,以更少的数据、设置和计算来帮助创建定制的生物声学模型的开发。比如,呼吸健康公司 Salcit Technologies 开发了一款名为 Swaasa 的产品,通过使用 HeAR 模型来增强其 AI 模型,通过分析咳嗽声音评估肺部的健康状况,帮助早期检测结核病。

另外Google正在用AI提升乳腺癌检查效率。

乳腺的X光检查是乳腺癌筛查的黄金标准。但由于成本高,尤其是在资源匮乏的环境中,并非人人都能使用。超声波结合 AI 的乳腺癌检测方法,增加了乳腺癌检测的可及性并且有助于早期检测乳腺癌。

Google 与长庚纪念医院合作开发 AI 模型,能够在超声波图像中检测癌症迹象,最终目标是简化超声波的使用并扩大其应用范围,尤其针对高风险人群。

总的来说,技术让“声音”的利用价值不断扩大,从一部分人的听力改善方案,到标记人体疾病早期迹象。我们有理由相信,AI将带来医疗健康领域的变革,让更多人受益于此。

The End

举报这篇文章

果壳说

果壳作者

pic