吴恩达带斯坦福ML组发了新论文:深度学习攻克心律不齐难题
2017年07月07日
吴恩达带领的斯坦福机器学习组(Stanford ML Group)最近开发了一种深度学习新算法,能诊断14类心律不齐,准确率可以媲美人类医生。 他们的论文周四公布在了Arxiv上,题为Cardiologist-Level Arrhythmia Detection with Convolutional Neural Networks,用卷积神经网络进行心脏病专家级的心律不齐检测,作者包括Pranav Rajpurkar、Awni Hannun、Masoumeh Haghpanahi、Codie Bourn和吴恩达。 心律不齐的诊断难题 如果患者疑似有心律不齐症状,通常会去医院做个心电图。但是,在医院做的几分钟或者十几分钟心电图,往往发现不了问题,这时候医生就可能会给患者一个可穿戴的心电图监测器,要戴两周。 两周,就要产生几百小时的心电图数据,医生要一秒一秒地检查,从中找出患者是否出现了有问题的心律不齐。 更难的是,还得把有问题的心律不齐和安全无害的心律不齐区分开,它们在心电图上看起来非常像。 论文的主要作者之一、斯坦福大学研究生Pranav Rajpurkar说:“心律信号之间的差异可能非常细微,比如说,有两种心律不齐都叫做二度房室传导阻滞的,它们在心电图上的表现也非常相似,但一种需要立刻治疗,一种不需要。” 吴恩达带领的斯坦福机器学习小组把这看作一个数据科学问题。 深度学习方法 斯坦福机器学习组的同学们,要用深度神经网络,从心电图中识别14类心律不齐。
△ iRhythm的可穿戴心电图监测器Zio 他们和可穿戴心电图监测设备厂商iRhythm合作,收集并标注了来自29163名患者的64121份心电图数据,以200 Hz的频率采样,构建了大规模的训练集和校验集,用来训练神经网络。 随后,他们又从328名患者处收集了336份心电图数据,构成了测试集。 数据集中的心电图样本每段30秒,都经过专业医生标注。测试集的数据标注则经过3名心脏病专家组成的委员会“会诊”得出。 为识别心电图,他们构建了34层神经网络,包括33个卷积层、一个全连接层和softmax,以原始心电图时间序列为输入,每秒输出一次预测标签。 下图展示了这个深度神经网络的结构:
结果 最后,他们找了6名心脏病专家,分别从测试集的心电图中识别心律不齐,又以3名专家会诊的结果作为标准,将人类识别的结果、算法识别的结果与之进行比较。 他们发现,算法的准确率与受过专业训练的人类心脏病专家相当,在很多情况下甚至比人类更好。
上图蓝色表示算法的识别成绩,黄色是人类专家的识别成绩;Sequence F1表示算法/人类预测与标准结果之间多个标签平均重合度,Set F1表示唯一分类标签的重合度。 识别准确率差不多的情况下,这个算法与人类相比有着巨大优势:它看几百小时的心电图也不会累,可以持续、即时地诊断心律不齐。 长期来看,斯坦福ML组希望能借助专家级的心律不齐识别算法,让更多无法及时就医的人能获得诊断,也希望能让可穿戴设备在危险的心律不齐发生时,能及时进行提醒。 吴恩达说,这正是深度学习提高患者诊断质量、帮医生节约时间的机会之一。
|