基于卷积神经网络的肺结节检测方法_《生物医学工程学杂志》

作者：

刘一鸣 , 侯智超 ,  李晓琴 , 王学栋

北京工业大学生命科学与生物工程学院（北京 100124）;

关键词：

计算机断层扫描计算机辅助检测肺结节卷积神经网络交叉验证

DOI：

10.7507/1001-5515.201902001

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

本文提出一种在图像精细预处理条件下，通过二维卷积神经网络对低剂量计算机断层扫描（CT）图像进行肺结节检测的方法。通过图像剪切、归一化操作等算法对 CT 图像预处理，对正样本进行扩充以平衡正负样本数量，训练二维卷积神经网络并在过程中不断优化网络参数，最终得到性能最优的模型。本文采用美国 2016 年肺结节分析（LUNA16）挑战赛开源数据集进行五折交叉验证，取每组模型实验结果的平均值，最终准确率为 92.3%、敏感性为 92.1%、特异性为 92.6%，相较于已有的其他肺结节自动检测分类方法在各项指标上均有所提高。随后本文在此基础上进行模型微扰实验，实验结果表明，模型稳定且具有一定的抗干扰能力，可以有效地识别肺结节，期望可为肺癌早期筛查提供辅助诊断意见。

引用本文： 刘一鸣, 侯智超, 李晓琴, 王学栋. 基于卷积神经网络的肺结节检测方法. 生物医学工程学杂志, 2019, 36(6): 969-977. doi: 10.7507/1001-5515.201902001 复制

引言

肺癌是对人类生命和健康威胁最大的肿瘤^[1]，早期发现对于患者的生存和康复至关重要。临床上，肺结节检测是肺癌筛查的第一步。如何检测作为肺癌早期特征之一的肺结节，近几年引发了广泛讨论和关注^[2]。

传统的肺结节检测方法是医生通过肉眼直接观察肺部计算机断层扫描图像（computed tomography，CT），来评估患者肺部是否存在肺结节。但一位患者的 CT 图像往往有上百张切片，对这些图像采用人工方式进行观察、判断，工作量巨大，且一些 CT 图像上较小的肺结节由于不易观察可能会造成遗漏^[3]。因此，迫切需要开发新的计算机辅助检测肺结节的方法提升肺结节的检测效率。

近几年人工智能技术，尤其是深度学习方法，发展十分迅速，应用在识别图像方面有很好的效果，因此相关应用也扩展至医学领域^[4]。深度学习是以图像特征的识别和分类来训练模型，并利用模型的准确率、特异性等多重评价标准来反向指导特征的提取^[5]，从而实现端到端的映射学习。Liu 等^[6]以肺实质区域提取、获取候选结节集、模型的特征提取训练以及肺结节分类 4 个步骤为基本流程确立了肺结节计算机辅助设计（computer aided design，CAD）分类系统。Shen 等^[7]提出以多尺度 CT 图像作为输入的肺结节分类模型，该研究截取三种不同尺度的肺结节图像作为卷积神经网络（convolutional neural network，CNN）模型的输入，从而在训练过程中让模型可以更好地学习到肺结节特征，增加分类器的准确率。Kumar 等^[8]提出一种肺结节良恶性 CAD 分类系统，该研究首先利用一个 5 层栈式自动编码器提取出肺结节的特征，之后利用二值决策树对结节分类，该研究在肺图像数据库联盟（Lung Image Database Consortium，LIDC）数据集表现良好，且准确率优于其他的精度度量方法。Hua 等^[9]将深度信念网络（deep belief network，DBN）与 CNN 网络分别应用于肺结节分类检测中，DBN 网络的敏感性达到 73.40%，CNN 网络的敏感性达到 73.30%。上述研究使用了包括深度学习在内的各种方法，设计完成了肺结节 CAD 分类系统，并取得了良好的效果。

随着技术的不断发展，肺结节的识别与检测不断取得新进展，但依然存在一些问题。首先，在原始数据的预处理方面，大多数的研究对医学图像的处理方法比较粗略，一定程度上会损失一些包含关键特征的细节信息，从而无法提高最后分类的准确率；其次，在训练网络模型时所使用的数据量不够大，且数据中的正负样本数量不均衡，使得训练后的模型泛化能力较弱；最后，在运用深度学习网络模型学习特征并分类时，网络过于繁杂，使得训练成本过高但准确率提升不大。针对以上问题，本文设计了一种基于 CNN 的肺结节自动检测方法，建立了一套针对肺部 CT 图像的预处理流程，并针对正负样本数据量不均衡问题对正样本数据进行扩增，有效提升了模型的泛化能力，并在 CNN 中加入丢弃（dropout）层^[10]，用于防止模型在训练中出现过拟合的现象，最终建立了一个稳定可靠的肺结节检测系统，可以有效地识别检测肺结节，或可为肺癌早期筛查提供辅助诊断意见。

1 实验数据

本文采用的研究数据来源于美国国家癌症研究所（National Cancer Insitute，NCI）发起收集的肺部图像数据库联盟和图像数据库资源倡议（Lung Image Database Consortium and Image Database Resource Initiative，LIDC-IDRI）开源数据集（网址为：https://wiki.cancerimagingarchive.net/display/Public/LIDC-IDRI）和基于 LIDC-IDRI 开源数据集的美国 2016 年肺结节分析挑战赛（Lung Nodule Analysis 2016，LUNA16）^[11]开源数据集（网址为：https://luna16.grand-challenge.org/），该数据集提供了患者的肺部 CT 图像及医生的标注信息，旨在为研究肺结节的检测分类和肺癌的辅助诊断提供帮助。

LUNA16 数据集将 LIDC-IDRI 数据集中切片厚度大于 2.5 mm 的 CT 图像以及切片像素不一致或不完整的 CT 图像去除，最终形成了包含 888 个样本的 CT 数据集，且图像信息均以.mhd 为扩展名的头信息文件和以.raw 为扩展名的像素信息文件存储。

LIDC-IDRI 数据集中每幅 CT 图像均由 4 名专业的影像科医生分两阶段标注。第一阶段，每位医生分别独立诊断肺部 CT 图像，对其进行标注并分为三类：非结节、直径大于 3 mm 的结节、直径小于 3 mm 的结节。第二阶段，每位医生分别复审其他三位医生的标注，最终给出自己的诊断结果。在 LUNA16 数据集中，最终选取 LIDC-IDRI 数据集中三位及三位以上医生标注的且直径大于 3 mm 的结节作为肺结节的标准标注，共有 1 186 个肺结节。

2 实验方法

本文提出了一种基于 CNN 的肺结节检测方法，方法流程图如图 1 所示，由以下 4 个步骤组成:

图1 本文方法流程图 Figure1. Flow chart of the method in this paper

图选项

	训练集	验证集	测试集	总计
模型 1	8 997	2 930	2 934	14 861
模型 2	8 900	3 031	2 930	14 861
模型 3	8 798	3 032	3 031	14 861
模型 4	8 895	2 934	3 032	14 861
模型 5	8 993	2 934	2 934	14 861

	TN	FN	FP	TP	总计	准确率	敏感性	特异性
模型 1	1 272	124	96	1 442	2 934	92.5%	92.0%	92.9%
模型 2	1 228	113	112	1 477	2 930	92.3%	92.8%	91.6%
模型 3	1 236	132	103	1 560	3 031	92.2%	92.2%	92.2%
模型 4	1 257	155	83	1 537	3 032	92.6%	92.5%	92.6%
模型 5	1 267	117	101	1 449	2 934	92.3%	92.1%	92.6%

网络	数据集	准确率	敏感性	特异性
3D - CNN^[21]	ELCAP	84.6 %	88.9 %	80.3 %
2D - CNN^[22]	LUNA16	89.5 %	77.3 %	89.7 %
ANN^[23]	LUNA16	90.6 %	92.3 %	89.5 %
本文模型	LUNA16	92.3 %	92.1 %	92.6 %

1.	Siegel R L, Miller K D, Jemal A. Cancer statistics. CA: A Cancer Journal for Clinicians, 2015, 65: 5-29.
2.	Hu Baotian, Lu Zhengdong, Li Hang, et al. Convolutional neural network architectures for matching natural language sentences. Advances in neural information processing systems 3, 2015. arXiv: 1503.03244.
3.	Armato I S, Roberts R Y, Mcnitt-Gray M F, et al. The lung image database consortium (LIDC): ensuring the integrity of expert-defined " truth”. Acad Radiol, 2007, 14(12): 1455-1463.
4.	Suzuki K. Overview of deep learning in medical imaging. Radiol Phys Technol, 2017, 10(3): 257-273.
5.	Anirudhi R, Thiagarajan J J, Bremer T, et al. Lung nodule detection using 3D convolutional neural networks trained on weakly labeled data//Medical Imaging 2016: Computer-Aided Diagnosis, San Diego, 2016, 9785: 978532.
6.	Liu Jikui, Jiang Hongyang, Gao Mengdi, et al. An assisted diagnosis system for detection of early pulmonary nodule in computed tomography images. J Med Syst, 2017, 41(2): 1-9.
7.	Shen Wei, Zhou Mu, Yang Feng, et al. Multi-crop convolutional neural networks for lung nodule malignancy suspiciousness classification. Pattern Recognit, 2017, 61: 663-673.
8.	Kumar D, Wong A, Clausi D A. Lung nodule classification using deep features in CT images//2015 12th Conference on Computer and Robot Vision (Crv 2015), 2015: 133-138.
9.	Hua K L, Hsu C H, Hidayati H C, et al. Computer-aided classification of lung nodules on computed tomography images via deep learning technique. Onco Targets Ther, 2015, 8: 2015-2022.
10.	Srivastava N, Hinton G, Krizhevsky A A, et al. Dropout: a simple way to prevent neural networks from overfitting. Journal of Machine Learning Research, 2014, 15(1): 1929-1958.
11.	Setio A A, Traverso A, de Bel T, et al. Validation, comparison, and combination of algorithms for automatic detection of pulmonary nodules in computed tomography images: the LUNA16 challenge. Med Image Anal, 2017, 42: 1-13.
12.	孙少燕. 基于像素灰度的医学图像刚性配准方法研究. 大连: 大连理工大学, 2007.
13.	Lumsden A B, Heyman E R. Prospective randomized study evaluating an absorbable cyanoacrylate for use in vascular reconstructions. J Vasc Surg, 2006, 44(5): 1002-1009.
14.	Choi W J, Choi T S. Genetic programming-based feature transform and classification for the automatic detection of pulmonary nodules on computed tomography images. Information Sciences, 2012, 212(2): 57-78.
15.	Bishop C. Training with noise is equivalent to Tikhonov regularization. Neural Comput, 1995, 7(1): 108-116.
16.	Krizhevsky A, Sutskever I, Hinton G. ImageNet classification with deep convolutional neural networks. Advances in Neural Information Processing Systems 25(NIPS 2012), Curran Associates Inc. 2012: 1097-1105.
17.	Wang Shuo, Zhou Mu, Liu Zaiyi, et al. Central focused convolutional neural networks: developing a data-driven model for lung nodule segmentation. Med Image Anal, 2017, 40: 172-183.
18.	Dou Qi, Chen Hao, Yu Lequan, et al. Multilevel contextual 3-D CNNs for false positive reduction in pulmonary nodule detection. IEEE Trans Biomed Eng, 2017, 64(7): 1558-1567.
19.	李飞腾. 卷积神经网络及其应用. 大连: 大连理工大学, 2014: 20-25.
20.	Murphy K, van Ginneken B, Schilham A, et al. A large-scale evaluation of automatic pulmonary nodule detection in chest CT using local image features and k-nearest-neighbour classification. Med Image Anal, 2009, 13(5): 757-770.
21.	吕晓琪, 吴凉, 谷宇, 等. 基于三维卷积神经网络的低剂量 CT 肺结节检测. 光学精密工程, 2018, 26(5): 1211-1218.
22.	金奇樑. 基于CT图像的肺结节自动识别系统研究. 杭州: 浙江大学, 2016: 40-50.
23.	Dandil E, Çakiroğlu M, Ekşi Z, et al. Artificial neural network-based classification system for lung nodules on computed tomography scans//2014 6th International Conference of Soft Computing and Pattern Recognition (SoCPaR), IEEE, 2014: 382-386.

	TN	FN	FP	TP	总计	准确率	敏感性	特异性
测试集 1	48	1	2	49	100	97%	98%	96%
测试集 2	47	2	3	48	100	95%	96%	94%
测试集 3	44	11	6	39	100	83%	78%	88%

	TN	FN	FP	TP	总计	准确率	敏感性	特异性
测试集 1	48	1	2	49	100	97%	98%	96%
测试集 2	47	2	3	48	100	95%	96%	94%
测试集 3	44	11	6	39	100	83%	78%	88%

《生物医学工程学杂志》

基于卷积神经网络的肺结节检测方法

摘要 全文 图表 视频 参考文献 施引文献 补充材料

引言

1 实验数据

2 实验方法

2.1 数据集预处理

2.1.1 归一化处理

2.1.2 数据降维

2.1.3 正样本扩充

2.1.4 数据集分类

2.2 二维卷积神经网络

2.2.1 卷积层

2.2.2 池化层

2.2.3 dropout 层

3 实验结果

3.1 模型评估指标

3.2 实验结果与分析

3.3 验证实验结果与分析

3.4 肺结节检测实验结果与分析

4 结论

引言

1 实验数据

2 实验方法

2.1 数据集预处理

2.1.1 归一化处理

2.1.2 数据降维

2.1.3 正样本扩充

2.1.4 数据集分类

2.2 二维卷积神经网络

2.2.1 卷积层

2.2.2 池化层

2.2.3 dropout 层

3 实验结果

3.1 模型评估指标

3.2 实验结果与分析

3.3 验证实验结果与分析

3.4 肺结节检测实验结果与分析

4 结论

上一篇

下一篇

Format

Content

摘要全文图表视频参考文献施引文献补充材料