新冠病毒还能用语音识别？AI模型“听”咳嗽声判断是否感染

发布时间：2020-05-03 06:36:26 所属栏目：智能家居来源：网络整理

导读：MIT研究人员推出了一个用实时数据训练的AI语音识别模型，可以通过咳嗽声判断出用户是否感染了新冠病毒。

副标题[/!--empirenews.page--] 新冠病毒还能用语音识别？AI模型“听”咳嗽声判断是否感染

智东西（公众号：zhidxcom）
编 | 董温淑

智东西4月29日消息，近日，麻省理工学院Auto-ID Labs研究小组研发了一个基于语音的新冠肺炎AI检测工具——Sigma。Sigma可以“听”出健康人和新冠肺炎患者咳嗽声的差别，从而区分出用户是否感染了COVID-19。

与之前的AI抗疫方案不同的是，研究小组希望用“众包”的方式获取模型训练数据，并根据实时训练数据同步更新模型。

4月9日，研究小组在学术网站arXiv上发表文章介绍Sigma计划，文章名称为《“嗨Sigma，我感染了冠状病毒吗？”呼吁用新的AI方法来支持应对新冠病毒大流行的专业医疗****人员（“Hi Sigma，do I have the Coronavirus?”：Call for a New Artificial Intelligence Approach to Support Health Care Professionals Dealing With The COVID-19 Pandemi）》。

论文链接：https://arxiv.org/pdf/2004.06510.pdf

新冠病毒还能用语音识别？AI模型“听”咳嗽声判断是否感染

目前这项研究还在持续推进，研究进展在https://opensigma.mit.edu网站更新。

一、语音识别算法能“认出”肺炎患者咳嗽声

截至4月22日，全球新冠肺炎累计确诊人数已经超过250万，死亡人数超17万。巨大的感染者基数使医疗系统不堪重负，疑似病例检测同样需要占用医疗资源。在这种情况下，已经有许多研究机构推出AI解决方案，协助医疗人员进行COVID-19检测或提供预检。

但是，麻省理工学院Auto-ID Labs研究小组指出，现有的研究要么使用静态数据集、要么在大企业牵头下进行，都具有一定局限性。静态数据集难以反映出疫情的发展变化，大公司牵头的方案也因隐私风险而饱受质疑。

Auto-ID Labs研究小组试图解决这些问题。最终，他们从之前的一项研究中得到了灵感。该研究证明，AI模型可以通过咳嗽声录音，区分出肺炎患者与正常人，哪怕是来自廉价手机的录音也不会影响判断结果。

对新冠病毒感染者咳嗽声的研究也得出了相同结论。

新冠病毒还能用语音识别？AI模型“听”咳嗽声判断是否感染

▲AI模型可识别出健康人咳嗽声和感染者咳嗽声的不同

在针对神经类疾病患者的另一项研究中，语音识别算法也比人类专家更早判断出病人发病情况（样本量小于50的精神病患者和样本量小于1000的认知障碍患者）。

因此，研究小组提议，可以设计一款AI语音识别工具，并用大规模收集的实时数据对其进行训练。

经过几次尝试，研究小组打造出了AI语音识别模型Sigma。

二、模型搭建：基于CNN，学会区分健康人和肺炎患者

Sigma模型基于一个卷积神经网络（CNN，convolutional neural network）进行训练。

首先，研究人员利用一个日常谈话数据库对CNN模型进行预训练；

然后，研究人员用大量相似但不同的数据训练模型。这一过程被称为迁移学习，可以提高模型的预测能力。

在迁移学习的第一阶段中，模型需要学习分辨咳嗽和不咳嗽的声纹。研究人员认为这一阶段最为重要，因此，他们比较了支持向量机（SVM）、K-近邻算法（k-Nearest Neighbors algorithm）、随机森林（Random Fores）、逻辑回归（Logistic Regression）这4种浅层机器学习算法的准确性，试图找出最佳方案。

结果显示，逻辑回归算法的准确性最高。

新冠病毒还能用语音识别？AI模型“听”咳嗽声判断是否感染