1
“心迹”的计算:隐性知识的人工智能途径
1.5.1 4.1 整体判读
4.1 整体判读

计算机辅助心电图分析工作通常包括数据预处理、特征识别与提取、症状分类3个环节。第一个环节要滤除或降低噪声(无用信号),加强或突出有效信号的特征;第三个环节是根据特征(第二个环节)得到分类结果,有赖于前两个环节,尤其是第二个环节。有时候第二、第三个环节因互相耦合而不予区分,有时候直接将心电图记录作为输入,其输出就是最后结果。图4-2是心电图波形及其特征示意,有两个心动周期(或心搏),包括特征幅度、间期、斜率、形态以及平均趋势等,它们本身及其特征的组合就构成了一种种疾病的判断依据,正常心电图自然也由一组特征组合表示。医生在诊断过程中关注特征、特征间的关系及综合结果。每个心搏的QRS波群或主波即R波识别是心电图分析的基础。临床上完整的心电图包含12导联的信息,为此,要从宏观到微观分层对待整体特征而不仅是单个导联或某个心搏的特征。

图4-2 心电图特征示意[2]

数十年来,利用从逻辑推理到知识工程、从人工神经网络和到支持向量机、从决策树到模板匹配等,包括傅立叶变换、高斯模型、隐马尔可夫模型,主成分分析、独立成分分析、小波分析、线性判别分析等特征提取方法,计算机辅助心电图分析工作有丰富的阶段性成果。[3-5]其准确性都超过了90%,有的甚至高达99%以上。然而,面对实际的临床数据,性能却急剧下降。

第一,测试数据规模很有限,比如标准数据库MIT-BIH-AR(MIT BIH arrhythmia),[6]该数据集虽然能够提取出10万多个心搏,但仅来自47个病人的48条记录,每条心电图记录均由2个导联的数据组成,时长约30分钟,且并非所有导联都相同,仅有40条记录均有Ⅱ导联和Ⅴ1导联数据。在这样的数据库上做测试,明显降低了问题的复杂度。

第二,它们是病人内的数据分类,其特点是训练集和测试集包含同一个病人的不同时刻的心搏,而病人间数据分类用的训练集和测试集的心搏所属个体没有交集。基于AAMI标准[7]和MIT-BIH-AR构造由来自不同基本原因如下。记录的心搏所组成的训练集和测试集的工作,[8-9]一定程度上考虑了个体间的差异,此时算法性能变化明显。

第三,忽视临床要求。有研究[10]针对心电图的两个导联的数据分别构建分类器,然后通过贝叶斯方法进行融合、选择而增强可信性,在MIT BIH AR上效果同样很好。但这样的做法有两个显然的问题:一是不同导联的不同特征有不同的疾病表征意义而不能互相替代;二是临床诊断依赖于全导联而不仅是两导联信息。每个导联都有有助于判断的特征信息。

《IEEE生物医学工程汇刊》近年下载次数最多论文中名列前茅的心电图R波检测方法[11-12]不止一次,该刊新近发表的研究工作中的心电图分类方法[13]在MIT-BIH-AR数据库上的准确率为99.81%,而我们提出的方法[14]取得了目前最高的准确率99.86%。然而,这种提高在临床上意义不大。

因为我们的根本任务是模拟领域专家的思维过程的计算机(网络)环境,完成原来完全依靠有经验的医生做的诊断、咨询和服务工作,而非仅仅在标准数据库上的有限数据集上得到好的结果。有人说这不必强调,哪个专家系统不是这样?但事实上,对于复杂的思维过程,教科书上可参考的规则与例子往往简略、不完整,诸多细节和微妙之处不见体现。因此应当特别关注专家思维过程中尚未表述或难以表达的内容及其独特的作用,即前述隐性知识,这可导致算法性能的差异。

我们在过去10余年的计算机辅助心电图分析的研究过程中,在逐步满足实际需求的同时,形成了包括医学经验中隐性知识的获取和表达、形态特征的刻画和识别、在训练集和测试集中区分病人个体数据和病人间的数据、构建开放数据集以及设计针对不同特征的分类器的思路,进而达到模拟领域专家思维过程的目的。基本内容包括:

●思维过程的刻画。

●领域经验的整理。

●隐性知识的表达。

●学习机制的构造。

●不同方法的融合。

这里强调“辅助”,意味着不是要让计算机代替人,而是某种程度上给人以帮助,因此是人与机器的分工合作,谁做什么、如何交流等都应有约定。相应的算法可以在网络医院的服务器上运行,帮助医生进行正常、异常信号的分类或常见心律失常疾病的诊断,提高工作效率;也可以简化后在终端上工作,为最终用户提供实时的参考,使之及时得知自己的身体状况。

2007年发表的论文中,关于GE-Marquette心电图机的诊断结果有个统计,共有2 112例心电图,总准确率约为88%,其中窦性心律的心电图判读准确率为95%,非窦性心律的判读准确率仅为53.5%。[15]2012年的相似工作统计了576例心电图,发现Philips的准确率是80%,而Draeger的为75%。而3名普通医生的心电图判读准确率平均为85%。[16]医学涉及的不单单是演绎推理、统计思维,而是复杂的因果网。医学专家不但具备丰富的领域知识,而且在实践过程中对知识系统进行了良好的整理,尽量消除了各种冗余,使之具有良好的层次结构。即便如此,误诊总是难免。

就实际的疾病分类目标而言,区分正常与否是一种分类;区分心律失常、高血压是一种分类;区分期前收缩、动脉粥样硬化同样是一种分类,它们的出发点和粒度都不同。问题是目前所识别的特征是分类的充要条件吗?一方面,目前所识别的特征均有同等程度的重要性吗?另一方面,是否还有未被重视的特征?图4-3是MIT-BIH-AR标准数据库中标记为“正常”的心电图记录,实际上是间歇性预激,该认识是对机器结果分析后形成的。[4]主要特征为主波QRS波宽大畸形,起始段有预激波(δ波),伴ST段和T波改变,PQ间期缩短,正常心电图与间歇性预激交替出现。

MIB-BIH-AR误标记的原因是其所用的判断规则中遗漏了医生实际使用的一些经验,比如观察动态变化以把握全面情况。图4-4是正常心电图,2~4 s箭头处是噪声导致的信号下移,使得提取ST段、P波形态、PR间期等特征时出错,由于难以排除该噪声,现有的分析算法常常将其误判为异常。

图4-3 在MIT-BIH-AR中被标为正常的异常心电图

图4-4 正常心电图

图4-5中,医生通过RR间期这一直观参数,能够很容易找到RR间期突变的心搏(8~10 s处),根据脑海中模板,辨别出它是房性期前收缩,是实际可能出现的突变心搏,该心搏将作为一个重要结论出现在诊断结果中。而对于在2~4 s处的T波异常的突变心搏,理论上不可能会突然发生,是噪声所致,医生将直接忽略之。

图4-5 窦性心动过缓,肢体导联低电压偶发房性期前收缩T波低平

概言之,临床诊断中,有经验的医生面对心电图做如下处理。

第一,以整体情况为基础进行判读,先看心电图是否有大的异常噪声。比如,突变的信号通常不会是心电图信号,如果出现该类信号,可直接将其放一边,不做后续判断。若噪声水平大于正常的主波,也停止分析。同时关注节拍、形态等是否大致一致。也就是说,先进行整体上的初步估计,而不限于单个心搏。

第二,一方面提取心搏之间局部特征的趋势和对比关系,另一方面把心搏进行分类,寻找心电图中的“平均心搏”和“突变心搏”。短时间内,疾病导致的突变可能性较小,且一般只出现一种形态的突变,如果出现多种突变,则噪声引起的可能性很大。略过不合理的“突变心搏”,寻找代表性心搏,把握基本趋势。

第三,对上述结果进行进一步的区分。一条心电图记录只允许出现某些种类的突变心搏,对于不会出现的突变心搏,可直接判断为噪声。元素较多一类可划归为“平均心搏”,该类代表了总体情状,包括平均间期、大致幅度、相似程度、对比关系、变化趋势等。而其他类则是“突变心搏”,代表疾病或者属于无效心搏。

而计算机辅助分析还要考虑系统的性能、指标的范围、运算的效率等。相应地,以往的分类器设计工作中则存在一些共性问题。

第一,忽视医生的介入,缺乏对医生识别诊断过程的理解,特别是忽视了医生经验的作用,有“自言自语”之嫌。

第二,部分数据的测试会使结果“太好”,需要更大规模的数据库;而盲目应用某种数学工具的结果往往难陈其详。

第三,医生把握症状是由宏观到微观的过程,形态特征十分重要。图4-6、图4-7和图4-8是QRS波群及P波与T波的一些形态特征例子。[17]

QRS波群中不同正向与负向波(子波)的组合与命名方式是:第一个向下的子波称为Q波;第一个向上的子波称为R波;R波之后的第一个向下的子波称为S波;R波之后的第一个向上的子波称为R′波;S波之后第一个向下的子波称为S′波。通过不同的Q、R、S、R′和S′的组合,能够产生诸多不同的QRS形态。例如,一个完全正向的QRS波称为R型;一个完全向下的QRS波称为QS型;其他还有QR、qRs、RSR′、rSr′等。这里大写的子波字母用于表示振幅较大的子波,小写的字母表示振幅较小的子波。目前临床上还没有能够给出统一的振幅大与小的准确边界值,而幅值的比例是可以参考的又一种参数。

图4-6 QRS波群的基本形态特征

图4-7 QRS波群中的粗钝与切迹

图4-8 P波与T波的形态

医生判读的结果或计算机辅助心电图分析的目标如图4-9所示。

图4-9 分类器层次结构