基于第二心音统计特征的先天性心脏病相关肺动脉高压诊断方法_《生物医学工程学杂志》

作者：

杨炫锴 ¹ , 孙静 ¹ , 杨宏波 ^2,3 , 郭涛 ^2,3 , 潘家华 ^2,3 ,  王威廉 ¹

1. 云南大学信息学院（昆明 650504）;
2. 昆明医科大学附属心血管病医院（昆明 650102）;
3. 云南省阜外心血管病医院（昆明 650102）;

关键词：

心音先天性心脏病肺动脉高压高频分量统计特征极端梯度提升算法

DOI：

10.7507/1001-5515.202304037

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

针对先天性心脏病相关肺动脉高压听诊特征不明显，已有的机器辅助诊断算法相对复杂等问题，提出一种基于第二心音信号高频分量统计特征的分析方法。首先，采用端点检测自适应分割方法提取第二心音。其次，使用离散小波变换分解出高频分量，并提取该分量的赫斯特（Hurst）指数、勒佩尔-齐夫（Lempel-Ziv）信息和样本熵等统计特征。最后，使用这些特征训练极端梯度提升算法（XGBoost）分类器，在三分类中准确率达到了80.45%。该方法无需进行降噪处理，特征提取速度快，且只需三个特征即可实现较好的多分类效果，有望用于先天性心脏病相关肺动脉高压早期筛查。

引用本文： 杨炫锴, 孙静, 杨宏波, 郭涛, 潘家华, 王威廉. 基于第二心音统计特征的先天性心脏病相关肺动脉高压诊断方法. 生物医学工程学杂志, 2024, 41(1): 41-50. doi: 10.7507/1001-5515.202304037 复制

0 引言

肺动脉高压（pulmonary arterial hypertension，PAH）是一种潜在致命性心血管疾病，其特征为肺动脉压力升高，当压力超过一定阈值时，会使得右心房扩大，最终导致右心衰竭^[1]。然而，PAH的症状通常在疾病晚期才显现，早期筛查很容易遗漏。PAH的病因复杂，其中约40%是由先天性心脏病（congenital heart disease，CHD）引起的^[2]。CHD是一种胎儿时期发育异常导致的心血管畸形，心脏缺陷导致肺循环的压力与容量超负荷，最终形成PAH。CHD相关PAH（CHD-associated PAH，CHD-PAH）由于同时夹杂着两种症状，致死率更高。有创介入式的右心导管术是诊断PAH的金标准，但存在较大的风险。目前无创诊断最有价值的评估方法是超声心动图检查，但在偏远地区，由于缺乏设备和技术人员支持，且该设备不便携带，难以在大规模筛查中推广。

心音是一种机械振动，是心脏血流动力学和心血管系统相互作用的结果。由于心音包含了大量有关心血管系统生理状况的信息，因此可以用于评估心脏的健康状况^[3]。计算机智能辅助诊断（computer-aided diagnosis，CAD）通过提取心音信号的病理特征，进行机器学习训练并构建模型用于疾病辅助诊断，能有效配合超声心动图，提高筛查效率，主要步骤分为信号预处理、特征提取、构建分类器等。

预处理阶段主要为降噪与分割。降噪能抑制采集中的呼吸音、杂音等。Dwivedi等^[4] 结合稳态小波变换与集合经验模态分解（ensemble empirical mode decomposition，EEMD），来抑制环境音和噪声，以提高后续分类准确率（accuracy，Acc）。Simonneau等^[5]研究表明，第一心音（first heart sound，S1）和第二心音（second heart sound，S2）与PAH的严重程度相关。其中PAH患者的S2病理特征更明显，会出现异常亢进与分裂，有助于提高PAH的诊断Acc^[6]。但从心音中人工提取S2，困难且复杂^[7]，而现有的心音分割算法则没有提取S2，转而通过分割出单个心动周期来研究病理特征，如基于多尺度的希尔伯特包络分割^[8]和持续时间隐马尔可夫分割等^[9]。因此，如果能高效准确地分割出S2，将是目前有助于促进PAH诊断的一个研究方向。

特征提取的质量会影响分类的结果，Kaddoura等^[10]研究心音信号的声学特征，估计心音信号的频谱对数并进行傅里叶逆变换，以创建倒谱特征对PAH与正常心音进行二分类。Alqudah等^[11]提取心音信号中S2的能量比作为特征，来区分PAH患者和健康受试者。Ge等^[12]提取心动周期和S2的时频域特征等150个特征用于后续分类。

分类阶段，当数据集充足时神经网络能有效提升分类Acc。Wang等^[7]基于长短时记忆方法建立了一种小波散射卷积网络，提取受试者的小波散射系数作为特征，来对正常心音与CHD二分类。对于CHD-PAH这样的小样本数据，经典的机器学习能够有效根据信号特征对心音进行分类，不易受小数据量的影响而产生过拟合。已有研究报道，随机森林（random forest，RF）^[9]和K近邻法（k-nearest neighbor，KNN）^[13]在心音二分类上有一定效果。

目前大多数研究都是针对PAH和正常心音的二分类^[5.10-11]，CHD-PAH的多分类问题仍有待改进，比如在预处理阶段，降噪算法有可能滤除病理信息且耗时，达不到实际应用的要求。在心音分割中，大多数分割算法依赖于同步采集心电信号来对心音信号进行辅助分割，对信号采集要求高，只通过心音信号对S2部分进行分割是目前研究的难点。特征提取阶段，目前的研究集中于提取心音的声学和时频域特征，如梅尔倒谱系数（Mel-scale frequency cepstral coefficients，MFCC）^[14]和梅尔频谱系数（Mel-frequency spectral coefficient，MFSC）^[15]等。然而，声学特征是针对语音信号设计的，而心音信号是由血液流动冲击瓣膜所产生的信号，与语音信号存在一定的差异，并且在听诊中，PAH和CHD-PAH仅通过听觉是很难区分，因为它们之间的声学与时频特征相似度高，分类效果不理想。此外，对于CHD-PAH的多分类诊断依赖于大量特征^[12]，特征提取耗时长，不利于大规模的早期筛查任务。在分类器阶段，由于CHD-PAH的数据量少，神经网络在少量数据上容易出现过拟合的问题，传统机器学习更适用于小样本数据分类。

鉴于上述现状，本文旨在建立一个快速有效的CHD-PAH诊断算法。在预处理阶段，不进行降噪，使用自适应的双阈值分割法得到心音S2部分，再提取S2高频分量中的统计特征，包括赫斯特（Hurst）指数、勒佩尔-齐夫（Lempel-Ziv）复杂度（Lempel-Ziv complexity，LZC）和样本熵（sample entropy，SampEn）。与传统方法不同的是，本文算法专注于研究心音的高频特性而非声学相关特性，这些高频分量被用来描述短而突然的变化特征杂音，能更有效地凸显出PAH患者S2亢进、分裂的特征。最后，采用贝叶斯优化的极端梯度提升算法（extreme gradient boosting，XGBoost）对正常、CHD和CHD-PAH进行三分类诊断。

1 方法

本文算法通过以下几个步骤对CHD-PAH进行诊断：① 使用一种自适应分割方法来截取出心音信号中S2部分。② 对S2部分进行离散小波变换（discrete wavelet transformation，DWT）分解，提取出高频分量。③ 使用Hurst指数、LZC和样本熵进行复杂性度量，提取出S2高频分量的统计特征。④ 特征通过XGboost分类器进行CHD-PAH的三分类诊断。CHD-PAH分类流程如图1所示。

图1 CHD-PAH流程图 Figure1. CHD-PAH flow chart

图选项

预处理	t/s	心音分类评价指标
预处理	t/s	Acc	P_r	R_e	MAcc	F₁
小波降噪	247.641	66.9%	66.7%	66.7%	65.5%	66.8%
EEMD降噪	1 303.812	70.4%	69.9%	70.1%	69.6%	69.8%
S2分割+高频分量	178.621	80.5%	80.6%	78.9%	79.8%	80.1%

特征	心音分类评价指标
特征	Acc	P_r	R_e	MAcc	F₁
Hurst指数	59.3%	60.4%	57.3%	58.9%	59.3%
LZC	72.9%	75.2%	71.6%	73.4%	72.6%
样本熵	72.9%	73.4%	71.2%	72.3%	73.1%
Hurst指数 + LZC + 样本熵	80.5%	80.6%	78.9%	79.8%	80.1%

特征	分类器	心音分类评价指标
特征	分类器	Acc	P_r	R_e	MAcc	F₁
MFCC	KNN	72.8%	72.9%	72.8%	72.9%	72.6%
	RF	73.0%	72.6%	72.3%	72.7%	72.5%
	XGBoost	73.5%	74.6%	74.2%	74.9%	74.3%
MFSC	KNN	72.1%	72.3%	71.9%	72.0%	71.6%
	RF	76.6%	76.4%	76.3%	76.4%	76.3%
	XGBoost	76.7%	76.4%	76.6%	76.3%	76.5%
Hurst指数+ LZC+样本熵	KNN	73.6%	73.8%	71.9%	72.8%	73.0%
	RF	78.2%	78.3%	76.4%	77.3%	78.1%
	XGBoost	80.5%	80.6%	78.9%	79.8%	80.1%

心音	预处理	特征	分类器	心音分类评价指标
心音	预处理	特征	分类器	Acc	P_r	R_e	MAcc	F₁
20个心动周期	小波降噪+ ICEEMDAN	多尺度样本熵	SVM	70.3%	70.1%	70.4%	70.2%	69.7%
			LR	70.1%	69.9%	70.3%	70.4%	69.8%
			XGBoost	71.9%	72.4%	71.3%	72.9%	72.1%
7.5个心动周期	CEEMDAN+ 希尔伯特变换	排列熵	SVM	74.1%	74.8%	74.9%	74.8%	74.2%
			LR	74.5%	75.1%	74.8%	74.9%	74.8%
			XGBoost	75.3%	75.5%	74.2%	75.6%	75.4%
S2部分	高频分量	Hurst+LZC+样本熵	SVM	77.0%	77.2%	77.1%	77.2%	76.9%
			LR	77.6%	78.7%	77.5%	77.6%	77.7%
			XGBoost	80.5%	80.6%	78.9%	79.8%	80.1%

1.	Ruopp N F, Cockrill B A. Diagnosis and treatment of pulmonary arterial hypertension: a review. JAMA, 2022, 327(14): 1379-1391.
2.	Abman S H, Mullen M P, Sleeper L A, et al. Characterisation of paediatric pulmonary hypertensive vascular disease from the PPHNet Registry. European Respiratory Journal, 2022, 59(1): 2003337.
3.	Alnajjar M K, Abu-naser S S. Heart sounds analysis and classification for cardiovascular diseases diagnosis using deep learning. International Journal of Academic Engineering Research, 2022, 6(1): 7-23.
4.	Dwivedi A K, Ranjan H, Menon A, et al. Noise reduction in ECG signal using combined ensemble empirical mode decomposition method with stationary wavelet transform. Circuits, Systems, and Signal Processing, 2021, 40: 827-844.
5.	Simonneau G, Montani D, Celermajer D S, et al. Haemodynamic definitions and updated clinical classification of pulmonary hypertension. European Respiratory Journal, 2019, 53(1): 1801913.
6.	Chen Y, Wei S, Zhang Y. Classification of heart sounds based on the combination of the modified frequency wavelet transform and convolutional neural network. Med Biol Eng Comput, 2020, 58(9): 2039-2047.
7.	Wang M, Wang J, Hu Y, et al. Detection of pulmonary hypertension with six training strategies based on deep learning technology. Computational Intelligence, 2022, 38(5): 1684-1706.
8.	Shukla S, Singh S K, Mitra D. An efficient heart sound segmentation approach using kurtosis and zero frequency filter features. Biomedical Signal Processing and Control, 2020, 57: 101762.
9.	Kui Haoran, Pan Jiahua, Zong Rong, et al. Heart sound classification based on log Mel-frequency spectral coefficients features and convolutional neural networks. Biomedical Signal Processing and Control, 2021, 69: 102893.
10.	Kaddoura T, Vadlamudi K, Kumar S, et al. Acoustic diagnosis of pulmonary hypertension: automated speech-recognition-inspired classification algorithm outperforms physicians. Scientific Reports, 2016, 6: 33182.
11.	Alqudah A M, Alquran H, Qasmieh I A. Classification of heart sound short records using bispectrum analysis approach images and deep learning. Network Modeling Analysis in Health Informatics and Bioinformatics, 2020, 9: 1-16.
12.	Ge B, Yang H, Ma P, et al. Detection of pulmonary arterial hypertension associated with congenital heart disease based on time–frequency domain and deep learning features. Biomedical Signal Processing and Control, 2023, 81: 104451.
13.	Juniati D, Khotimah C, Wardani D, et al. Fractal dimension to classify the heart sound recordings with KNN and fuzzy c-mean clustering methods//Proceedings of the Journal of Physics: Conference Series F, IOP Publishing, 2018, 953: 012202.
14.	Yildirim M. Automatic classification and diagnosis of heart valve diseases using heart sounds with MFCC and proposed deep model. Concurrency and Computation: Practice and Experience, 2022, 34(24): e7232.
15.	Mahesh Kumar S V, Dhinakar P, Nishanth R. Aortic stenosis detection using spectral statistical features of heart sound signals. EAI Endorsed Transactions on Pervasive Health and Technology, 2022, 8(4): e5.
16.	何沛光, 宋伟, 吴杰, 等. 基于分割的自适应特征提取诊断心音方法. 计算机科学与应用, 2021, 11(8): 2051-2063.
17.	Xu W, Yu K, Ye J, et al. Automatic pediatric congenital heart disease classification based on heart sound signal. Artificial Intelligence in Medicine, 2022, 126: 102257.
18.	Lahmiri S, Bekiros S. Complexity measures of high oscillations in phonocardiogram as biomarkers to distinguish between normal heart sound and pathological murmur. Chaos, Solitons & Fractals, 2022, 154: 111610.
19.	陈是扦, 彭志科, 周鹏. 信号分解及其在机械故障诊断中的应用研究综述. 机械工程学报, 2020, 56(17): 91-107.
20.	周克良, 刘亚亚. 新阈值小波变换的心音去噪. 计算机工程与设计, 2020, 41(9): 2476-2481.
21.	陈强强, 成建波, 张刚, 等. 短时间序列的复杂程度分析方法研究. 舰船电子工程, 2022, 42(4): 145-150.
22.	杨洋, 郭兴明, 郑伊能, 等. 基于ICEEMDAN-MSE的左室舒张功能障碍心音信号的识别研究. 仪器仪表学报, 2022, 43(1): 274-281.
23.	刘美君, 吴全玉, 丁胜, 等. 自适应噪声完备经验模态分解排列熵结合支持向量机的心音分类方法研究. 生物医学工程学杂志, 2022, 39(2): 311-319.
24.	李亚茹, 张宇来, 王佳晨. 面向超参数估计的贝叶斯优化方法综述. 计算机科学, 2022, 49(S1): 86-92.

《生物医学工程学杂志》

基于第二心音统计特征的先天性心脏病相关肺动脉高压诊断方法

摘要 全文 图表 视频 参考文献 施引文献 补充材料

0 引言

1 方法

1.1 预处理

1.2 特征提取

1.2.1 高频分量的分解

1.2.2 统计特征提取

1.3 分类识别

2 实验与分析

2.1 数据与说明

2.2 实验环境

2.3 评价指标

2.4 实验方案设计

2.5 实验结果与分析

2.5.1 贝叶斯参数优化实验

2.5.2 预处理实验

2.5.3 消融实验

2.5.4 三分类实验

2.5.5 对比分类实验

3 结论

0 引言

1 方法

1.1 预处理

1.2 特征提取

1.2.1 高频分量的分解

1.2.2 统计特征提取

1.3 分类识别

2 实验与分析

2.1 数据与说明

2.2 实验环境

2.3 评价指标

2.4 实验方案设计

2.5 实验结果与分析

2.5.1 贝叶斯参数优化实验

2.5.2 预处理实验

2.5.3 消融实验

2.5.4 三分类实验

2.5.5 对比分类实验

3 结论

上一篇

下一篇

Format

Content

摘要全文图表视频参考文献施引文献补充材料