引用本文: 黄玉阳, 赵春玲, 张冰璐, 房怡菲, 代丽萍, 欧阳松云. FUT7甲基化联合CT影像特征预测肺腺癌发生风险的列线图模型. 中国呼吸与危重监护杂志, 2024, 23(2): 95-104. doi: 10.7507/1671-6205.202309053 复制
2018年全世界有960万人因癌症死亡,肺癌占全球癌症死亡总数的18.4%,居全球癌症死亡首位[1]。美国国家肺癌筛查试验报告显示,低剂量CT(low-dose computed tomography,LDCT)扫描可使肺癌高危患者病死率降低20%[2]。然而,LDCT筛查的高敏感性也导致大量的非肿瘤性肺结节被检测出,给筛查者造成过度的诊疗和不必要的心理负担,甚至是辐射有关的肺癌死亡[3]。结合CT影像可以排除一部分良性肺结节,但仍有部分结节经手术切除病理确诊为良性[4]。因此,需要寻找新的方法或生物标志物来预测肺结节的恶性倾向。表观遗传学在许多疾病的发生和发展中起着至关重要的作用,DNA甲基化是研究最充分的表观遗传修饰之一[5]。异常的DNA甲基化促进肿瘤发生,在肺腺癌的发展过程中,DNA甲基化改变甚至在非典型腺瘤样增生形成之前就已经发生[6]。岩藻糖基转移酶(fucosyltransferase,FUTs)催化GDP-岩藻糖残基转移到受体分子完成岩藻糖基化,参与多种生物学过程,包括肿瘤进展、细胞黏附和分化[7-9]。FUT7属于α1,3/4岩藻糖基转移酶家族,催化合成α1,3-岩藻糖[10]。研究发现,血液中FUT7的低甲基化与肺癌发生相关[11-12],但甲基化联合其他指标的研究目前鲜有发表。在肺癌的组织学亚型中,肺腺癌是最常见的类型,占国内肺癌总数的45.12%[13]。LDCT筛查发现的肺癌,病理类型也多为腺癌[2,14-15]。部分可切除的肺恶性结节中,术后最常见的病理类型也是腺癌[16-17]。在临床肺结节患者诊断中早期识别肺腺癌,可以极大地提高患者的生存率[18]。本研究旨在联合外周血FUT7甲基化与CT影像特征、临床特征来进一步预测肺结节中腺癌的发生。
1 资料与方法
1.1 临床资料
纳入2021年—2022年就诊于郑州大学第一附属医院经组织病理学确诊的肺腺癌患者132例,良性肺结节患者87例。检索信息包括性别、年龄、吸烟史、恶性肿瘤个人史、恶性肿瘤家族史、CT影像特征和病理细节等。纳入标准:① 病理检查前2周完成胸部CT扫描;② 肺结节最大直径≤3 cm,无肺不张,胸腔积液;③ 既往未接受过肺结节治疗(放疗、化疗等)、穿刺、气管镜活检或手术切除;④ 病理检查前2周内留有血标本的患者。排除标准:① 未经CT引导下肺穿刺或支气管镜或手术获得组织病理学诊断;② 病理学诊断为除肺腺癌以外的肺部恶性肿瘤;③ 病理证实为其他部位转移的腺癌;④ 病历资料和影像学资料不完整;⑤ 胸部CT层厚大于1.5 mm。本研究得到郑州大学第一附属医院伦理委员会批准(伦理批准号2021-KY-1057-002)。
1.2 方法
1.2.1 CT影像特征读取
图像由16排螺旋CT(西门子公司,型号SOMATOM Perspective)获得。患者取仰卧位,于吸气末屏气行CT扫描,扫描范围从胸廓入口到肾脏中部。肺窗水平为-600 Hounsfield单位(HU),宽度为1 500 HU;纵隔窗水平为30 HU,宽度为400 HU。放射学特征由2名经验丰富的胸部放射科医生审查,他们对患者的临床和病理信息不知情。评估位置(上叶和非上叶)、结节性质(实性和亚实性)、病灶大小(肺窗最大直径)、分叶征、毛刺征、血管征、胸膜征、支气管截断征、支气管充气征、钙化、边界(清楚和不清楚)、形状(规则和不规则)。
1.2.2 组织病理分析
组织病理学结果由2位接受过胸部病理诊断培训的病理科医生进行判读,切除肺病变组织根据2015年世界卫生组织肺肿瘤分类进行分类[19]。浸润性肺腺癌标本由手术、CT引导下肺穿刺活检或纤维支气管镜获得,如果病理结果不一致以手术标本为准。原位腺癌、微浸润性腺癌、不典型腺瘤样增生均由手术切除标本确诊。
1.2.3 样品处理
外周血样本均采用EDTA采血管采集,4 ℃保存不超过24 h,然后–80 ℃保存备用。DNA提取试剂盒(TANTICA,南京,中国)用于从全血中提取DNA,根据标准方案(Zymo Research,Orange,美国)使用EZ-96 DNA甲基化试剂盒进一步进行亚硫酸氢盐转化。所有样品均并行处理。
1.2.4 MALDI-TOF质谱分析
参与者的亚硫酸氢盐转化DNA均通过亚硫酸氢盐特异性引物进行扩增。引物中不存在单核苷酸多态性和CpG位点。正向引物:5'-aggaagagagTAAAATGTT GGGATTATAGTTTGGG-3',反向引物:5'-cagtaatacgactcactatagggagaaggctAAAACCAAATTCCTT CTCTACACC-3'。大写字母表示序列特异性区域,非特异性标签以小写字母表示。PCR产物通过基质辅助激光解吸电离飞行时间质谱(matrix-assisted laser desorption/ionzation time of flight mass spectrometry,MALDI-TOF)进行分析,以在单一CpG分辨率下半定量测量DNA甲基化强度(Agena Bioscience,加利福尼亚州,美国)。简而言之,将PCR扩增产物与虾碱性磷酸酶一起孵育,并根据Agena EpiTyper测定(Agena Bioscience,加利福尼亚州,美国)的标准方案通过T7转录酶进一步转录为RNA。RNA被RNase消化成小片段,然后用树脂清洗离子。最终产品在384 SpectroCHIP上分配。通过比较甲基化和非甲基化片段的强度来半定量测定DNA甲基化水平。数据通过SpectroACQUIRE v3.3.1.3软件收集并通过EpiTyper v1.3软件可视化。
1.3 统计学方法
采用SPSS27.0统计软件进行数据分析,所有数据均未有缺失。使用随机数法将肺腺癌和良性肺结节患者按照7∶3随机拆分为训练集(n=154)和验证集(n=65)。计量资料符合正态分布的用均数±标准差(x±s)描述,比较采用独立样本t检验,不符合正态分布的用中位数(四分位数)[M(P25,P75)]描述,比较采用Mann-Whitney U检验。分类资料采用例数及对应百分比进行描述,比较采用χ2检验或Fisher确切概率法。受试者操作特征(receiver operator characteristic,ROC)曲线之间的比较采用DeLong检验。P<0.05为差异有统计学意义。在训练集建模过程中,我们将FUT7甲基化数据按三分位数转换为分类变量,并利用最高三分位数(T3)作为参考组。训练集中单因素分析P<0.05的变量进入多因素Logistics回归分析,最终P<0.05的变量用于构建回归模型。将最终得到的独立危险因素引入R软件(The R Foundation for Statistical Computing,Vienna,Austria)4.2.2版构建列线图。ROC分析和DeLong检验使用“pROC”完成。Calibration校准曲线使用“rms”完成,并通过加强Bootstrap法重复抽样1 000次进行内外部验证。决策曲线分析(decision curve analysis,DCA)使用“rmda”完成。
2 结果
2.1 肺结节病理结果分析
根据组织病理学结果将患者分为肺腺癌组和肺良性结节组,肺腺癌组包括浸润性腺癌96例(72.7%)、微浸润腺癌28例(21.2%)、原位腺癌8例(6.1%)。肺良性结节组包括不典型腺瘤样增生6例(6.9%)、肺组织慢性炎44例(50.6%)、肉芽肿性炎20例(23.0%)、错构瘤7例(8.0%)、硬化性肺细胞瘤2例(2.3%)、其他8例(9.2%)。按结节性质分析发现实性结节中包含浸润性腺癌56例(42.4%)、微浸润腺癌2例(1.5%)、原位腺癌0例、不典型腺瘤样增生1例(0.8%)、肺组织慢性炎37例(28.0%)、肉芽肿性炎19例(14.4%)、错构瘤7例(5.3%)、硬化性肺细胞瘤2例(1.5%)、其他8例(6.0%)。亚实性结节中包含浸润性腺癌40例(46.0%)、微浸润腺癌26例(29.9%)、原位腺癌8例(9.2)、不典型腺瘤样增生5例(5.7%)、肺组织慢性炎7例(8.0%)、肉芽肿性炎1例(1.1%)、错构瘤0例、硬化性肺细胞瘤0例、其他0例。
2.2 训练集与验证集基线特征的差异性比较
训练集与验证集的基线特征仅肺窗最大直径在肺腺癌组中差异有统计学意义(P<0.05),其余各变量差异均无统计学意义(P>0.05)。结果见表1。
2.3 两组患者的临床特征、FUT7甲基化、影像特征分析
本研究中训练集共154例患者,其中男64例,女90例。肺腺癌组患者年龄更大、女性发病率更高、吸烟史比例更低(P<0.05)。FUT7_CpG_4、FUT7_CpG_6甲基化水平在肺腺癌患者中表达更低(P<0.05)。在CT影像上,肺腺癌患者更多表现为亚实性结节,并且分叶征、毛刺征和血管征占比更高(P<0.05)。结果见表2。
2.4 肺结节患者腺癌风险的多因素Logistic回归
将单因素分析P<0.05的变量纳入多因素Logistic回归分析,显示性别、年龄、FUT7_CpG_4、FUT7_CpG_6、性质、分叶征、毛刺征是肺腺癌的独立危险因素(P<0.05)。结果见表3。
2.5 列线图模型构建
根据多因素Logistic回归分析结果构建肺腺癌预测模型列线图,将毛刺征等7个独立危险因素纳入列线图的构建(图1)。根据列线图模型中各个危险因素对结局变量的影响程度,对每个变量进行打分,相加得到总分,最后通过总分计算肺腺癌的发生概率。
2.6 预测模型验证与效能评价
预测模型的区分度,将各变量带入该模型,预测肺腺癌的ROC曲线下面积(area under ROC curve,AUC)为0.925(95%CI 0.877~0.972,P<0.05),最大约登指数对应的临界值为0.562,此时敏感性为89.25%,特异性为86.89%,阳性预测值为91.21%,阴性预测值为84.13%。使用验证集数据验证该模型,得到AUC为0.892(95%CI 0.815~0.968,P<0.05),最大约登指数对应的临界值为0.834,此时敏感性为66.67%,特异性为96.15%,阳性预测值为96.30%,阴性预测值为65.79%。结果见图2。使用DeLong检验比较训练集和验证集的ROC曲线,差异无统计学意义(P=0.471),提示本预测模型在训练集和验证集都具有较好的区分度。
预测模型的校准度,训练集和验证集中的校准曲线和实际曲线均靠近理想曲线(图3),提示预测模型肺腺癌预测风险与实际发生风险高度一致。
预测模型的适用度,DCA曲线显示当模型的阈概率为0.02~0.80(图4),应用列线图的净获益水平明显高于“不干预”和“全干预”方案,提示列线图具有较好的临床净收益。
2.7 预测模型在CT高危征象中的应用
根据位置、血管征和胸膜征,使用收集到的219名肺结节患者来评估在不同亚组患者中预测模型的表现。结果显示预测模型在各亚组中均表现出较高的敏感性、特异性、阳性预测值和阴性预测值,具有较高的诊断价值。结果见表4。
3 讨论
随着CT筛查的普及,肺结节的管理对临床医生提出了新的挑战。Fleischner指南建议胸部CT偶然发现的肺结节的随访和处理[20]。低风险结节定期随访,而风险较高的结节接受正电子发射计算机体层显像仪/X射线计算机体层摄影、活组织检查或手术。然而,在目前的实践中,许多良性肺结节患者接受了侵入性检查,其中包括22% CT筛查发现的结节[21-23]。寻找一种无创的,可重复的生物标志物与胸部CT结合起来辅助诊断早期肺癌势在必行。肺腺癌是最常见的肺癌组织学亚型[13],其在LDCT筛查或者早期可切除恶性结节中占比更高[14]。研究发现早期诊断并完全切除的原位腺癌和微浸润腺癌,10年疾病特异性生存率均为100%,总生存率分别为95.3%和97.8%[18]。因此,本研究创建了一个量化肺腺癌的风险的统计预测模型,为临床医生对CT筛查或偶然发现的肺结节患者提出治疗建议时提供支持。最终模型确定了2个临床指标(年龄较大、女性),3个CT影像学指标(亚实性结节、分叶征、毛刺征)和2个血清标志物指标(FUT7_CpG_4、FUT7_CpG_6)与估计肺腺癌的可能性相关。
目前,已经开发并验证了多种预测模型来评估肺结节中恶性肿瘤的可能性,如Mayo(AUC=0.752)[24]和Brock(AUC=0.878)[25]模型。Mayo模型中,年龄、吸烟史、胸腔外癌症史、最大结节直径、毛刺征和位于肺上叶是恶性肿瘤的预测因子。Brock模型中癌症的预测因子包括年龄较大、女性、肺癌家族史、肺气肿、结节较大、结节位于上叶、部分实性结节类型、较少的结节计数和毛刺征。不同于这些以临床指标和CT影像学指标[26-28]建立的模型,我们的研究首次将新的潜在生物标志物FUT7_CpG_4和FUT7_CpG_6纳入了肺腺癌的统计预测模型中。FUT7属于α1,3/4-岩藻糖基转移酶家族,包括FUT3、4、5、6、7、9、10和11,催化岩藻糖基化糖复合物合成的最后一步[10,29]。异常的岩藻糖基化与肿瘤增殖、转移和血管生成有关[30-31],低甲基化水平FUT7的表达与肺癌风险增加相关[11]。肺腺癌在女性中更多见[32],分叶征和毛刺征是肺癌在胸部CT上的常见征象[25,33-34],这些发现与既往研究一致。混杂密度结节是肺癌的危险因素[25],且其包含的实性比例与肺腺癌的侵袭性有关[35]。但有研究发现放射科医生间及其自身对结节划分为实性、混杂磨玻璃、纯磨玻璃的一致性均显得极不稳定,主要是由于对固体成分的大小和存在与否意见不一[36]。因此本研究将混杂磨玻璃结节与纯磨玻璃结节一起归入亚实性结节中进行分析,最终结果显示亚实性结节较实性结节肺腺癌概率更高,良性病变如肉芽肿性炎、肺组织慢性炎比例更低。位于上叶、血管征和胸膜征也有报道与恶性肺结节相关[37-38],但在本研究中并不是肺腺癌发生的独立危险因素。为进一步评估模型在以上单一胸部CT恶性征象人群中的应用价值,将收集到的全部肺结节患者按照有无上叶、血管征和胸膜征各分为两组进行分析,结果显示模型在各亚组中均表现出了良好的诊断效能。因此,本模型不仅适用于LDCT筛查发现的肺结节患者,也可用于具有上述某一恶性CT征象的人群,尽可能避免过度诊疗的发生。
然而,我们的研究也有一些局限性。首先,本研究是单中心的回顾性研究,样本量较少,仅对模型进行了内部验证,未来开展大规模、多中心、前瞻性的临床研究将更有价值。其次,本研究人群为接受病理活检的患者,这可能高估了肺腺癌的患病率,也增加了常见胸部CT恶性征象的发生率。
总之,我们开发并内部验证了一种新的模型来预测肺结节中发生肺腺癌的风险,为临床提供了新的诊断思路和方法。此外,将模型应用于一些影像不易区分的亚组中(位于上叶、血管征和胸膜征),也具有较好的预测价值。这些结果表明,本模型可以有效地用于更广泛的患者群体,可以更及时地诊断恶性肺结节,减少良性结节不必要的侵入性检查和手术,为临床诊断肺腺癌提供新的诊断思路和理论依据。
利益冲突:本研究不涉及任何利益冲突。
2018年全世界有960万人因癌症死亡,肺癌占全球癌症死亡总数的18.4%,居全球癌症死亡首位[1]。美国国家肺癌筛查试验报告显示,低剂量CT(low-dose computed tomography,LDCT)扫描可使肺癌高危患者病死率降低20%[2]。然而,LDCT筛查的高敏感性也导致大量的非肿瘤性肺结节被检测出,给筛查者造成过度的诊疗和不必要的心理负担,甚至是辐射有关的肺癌死亡[3]。结合CT影像可以排除一部分良性肺结节,但仍有部分结节经手术切除病理确诊为良性[4]。因此,需要寻找新的方法或生物标志物来预测肺结节的恶性倾向。表观遗传学在许多疾病的发生和发展中起着至关重要的作用,DNA甲基化是研究最充分的表观遗传修饰之一[5]。异常的DNA甲基化促进肿瘤发生,在肺腺癌的发展过程中,DNA甲基化改变甚至在非典型腺瘤样增生形成之前就已经发生[6]。岩藻糖基转移酶(fucosyltransferase,FUTs)催化GDP-岩藻糖残基转移到受体分子完成岩藻糖基化,参与多种生物学过程,包括肿瘤进展、细胞黏附和分化[7-9]。FUT7属于α1,3/4岩藻糖基转移酶家族,催化合成α1,3-岩藻糖[10]。研究发现,血液中FUT7的低甲基化与肺癌发生相关[11-12],但甲基化联合其他指标的研究目前鲜有发表。在肺癌的组织学亚型中,肺腺癌是最常见的类型,占国内肺癌总数的45.12%[13]。LDCT筛查发现的肺癌,病理类型也多为腺癌[2,14-15]。部分可切除的肺恶性结节中,术后最常见的病理类型也是腺癌[16-17]。在临床肺结节患者诊断中早期识别肺腺癌,可以极大地提高患者的生存率[18]。本研究旨在联合外周血FUT7甲基化与CT影像特征、临床特征来进一步预测肺结节中腺癌的发生。
1 资料与方法
1.1 临床资料
纳入2021年—2022年就诊于郑州大学第一附属医院经组织病理学确诊的肺腺癌患者132例,良性肺结节患者87例。检索信息包括性别、年龄、吸烟史、恶性肿瘤个人史、恶性肿瘤家族史、CT影像特征和病理细节等。纳入标准:① 病理检查前2周完成胸部CT扫描;② 肺结节最大直径≤3 cm,无肺不张,胸腔积液;③ 既往未接受过肺结节治疗(放疗、化疗等)、穿刺、气管镜活检或手术切除;④ 病理检查前2周内留有血标本的患者。排除标准:① 未经CT引导下肺穿刺或支气管镜或手术获得组织病理学诊断;② 病理学诊断为除肺腺癌以外的肺部恶性肿瘤;③ 病理证实为其他部位转移的腺癌;④ 病历资料和影像学资料不完整;⑤ 胸部CT层厚大于1.5 mm。本研究得到郑州大学第一附属医院伦理委员会批准(伦理批准号2021-KY-1057-002)。
1.2 方法
1.2.1 CT影像特征读取
图像由16排螺旋CT(西门子公司,型号SOMATOM Perspective)获得。患者取仰卧位,于吸气末屏气行CT扫描,扫描范围从胸廓入口到肾脏中部。肺窗水平为-600 Hounsfield单位(HU),宽度为1 500 HU;纵隔窗水平为30 HU,宽度为400 HU。放射学特征由2名经验丰富的胸部放射科医生审查,他们对患者的临床和病理信息不知情。评估位置(上叶和非上叶)、结节性质(实性和亚实性)、病灶大小(肺窗最大直径)、分叶征、毛刺征、血管征、胸膜征、支气管截断征、支气管充气征、钙化、边界(清楚和不清楚)、形状(规则和不规则)。
1.2.2 组织病理分析
组织病理学结果由2位接受过胸部病理诊断培训的病理科医生进行判读,切除肺病变组织根据2015年世界卫生组织肺肿瘤分类进行分类[19]。浸润性肺腺癌标本由手术、CT引导下肺穿刺活检或纤维支气管镜获得,如果病理结果不一致以手术标本为准。原位腺癌、微浸润性腺癌、不典型腺瘤样增生均由手术切除标本确诊。
1.2.3 样品处理
外周血样本均采用EDTA采血管采集,4 ℃保存不超过24 h,然后–80 ℃保存备用。DNA提取试剂盒(TANTICA,南京,中国)用于从全血中提取DNA,根据标准方案(Zymo Research,Orange,美国)使用EZ-96 DNA甲基化试剂盒进一步进行亚硫酸氢盐转化。所有样品均并行处理。
1.2.4 MALDI-TOF质谱分析
参与者的亚硫酸氢盐转化DNA均通过亚硫酸氢盐特异性引物进行扩增。引物中不存在单核苷酸多态性和CpG位点。正向引物:5'-aggaagagagTAAAATGTT GGGATTATAGTTTGGG-3',反向引物:5'-cagtaatacgactcactatagggagaaggctAAAACCAAATTCCTT CTCTACACC-3'。大写字母表示序列特异性区域,非特异性标签以小写字母表示。PCR产物通过基质辅助激光解吸电离飞行时间质谱(matrix-assisted laser desorption/ionzation time of flight mass spectrometry,MALDI-TOF)进行分析,以在单一CpG分辨率下半定量测量DNA甲基化强度(Agena Bioscience,加利福尼亚州,美国)。简而言之,将PCR扩增产物与虾碱性磷酸酶一起孵育,并根据Agena EpiTyper测定(Agena Bioscience,加利福尼亚州,美国)的标准方案通过T7转录酶进一步转录为RNA。RNA被RNase消化成小片段,然后用树脂清洗离子。最终产品在384 SpectroCHIP上分配。通过比较甲基化和非甲基化片段的强度来半定量测定DNA甲基化水平。数据通过SpectroACQUIRE v3.3.1.3软件收集并通过EpiTyper v1.3软件可视化。
1.3 统计学方法
采用SPSS27.0统计软件进行数据分析,所有数据均未有缺失。使用随机数法将肺腺癌和良性肺结节患者按照7∶3随机拆分为训练集(n=154)和验证集(n=65)。计量资料符合正态分布的用均数±标准差(x±s)描述,比较采用独立样本t检验,不符合正态分布的用中位数(四分位数)[M(P25,P75)]描述,比较采用Mann-Whitney U检验。分类资料采用例数及对应百分比进行描述,比较采用χ2检验或Fisher确切概率法。受试者操作特征(receiver operator characteristic,ROC)曲线之间的比较采用DeLong检验。P<0.05为差异有统计学意义。在训练集建模过程中,我们将FUT7甲基化数据按三分位数转换为分类变量,并利用最高三分位数(T3)作为参考组。训练集中单因素分析P<0.05的变量进入多因素Logistics回归分析,最终P<0.05的变量用于构建回归模型。将最终得到的独立危险因素引入R软件(The R Foundation for Statistical Computing,Vienna,Austria)4.2.2版构建列线图。ROC分析和DeLong检验使用“pROC”完成。Calibration校准曲线使用“rms”完成,并通过加强Bootstrap法重复抽样1 000次进行内外部验证。决策曲线分析(decision curve analysis,DCA)使用“rmda”完成。
2 结果
2.1 肺结节病理结果分析
根据组织病理学结果将患者分为肺腺癌组和肺良性结节组,肺腺癌组包括浸润性腺癌96例(72.7%)、微浸润腺癌28例(21.2%)、原位腺癌8例(6.1%)。肺良性结节组包括不典型腺瘤样增生6例(6.9%)、肺组织慢性炎44例(50.6%)、肉芽肿性炎20例(23.0%)、错构瘤7例(8.0%)、硬化性肺细胞瘤2例(2.3%)、其他8例(9.2%)。按结节性质分析发现实性结节中包含浸润性腺癌56例(42.4%)、微浸润腺癌2例(1.5%)、原位腺癌0例、不典型腺瘤样增生1例(0.8%)、肺组织慢性炎37例(28.0%)、肉芽肿性炎19例(14.4%)、错构瘤7例(5.3%)、硬化性肺细胞瘤2例(1.5%)、其他8例(6.0%)。亚实性结节中包含浸润性腺癌40例(46.0%)、微浸润腺癌26例(29.9%)、原位腺癌8例(9.2)、不典型腺瘤样增生5例(5.7%)、肺组织慢性炎7例(8.0%)、肉芽肿性炎1例(1.1%)、错构瘤0例、硬化性肺细胞瘤0例、其他0例。
2.2 训练集与验证集基线特征的差异性比较
训练集与验证集的基线特征仅肺窗最大直径在肺腺癌组中差异有统计学意义(P<0.05),其余各变量差异均无统计学意义(P>0.05)。结果见表1。
2.3 两组患者的临床特征、FUT7甲基化、影像特征分析
本研究中训练集共154例患者,其中男64例,女90例。肺腺癌组患者年龄更大、女性发病率更高、吸烟史比例更低(P<0.05)。FUT7_CpG_4、FUT7_CpG_6甲基化水平在肺腺癌患者中表达更低(P<0.05)。在CT影像上,肺腺癌患者更多表现为亚实性结节,并且分叶征、毛刺征和血管征占比更高(P<0.05)。结果见表2。
2.4 肺结节患者腺癌风险的多因素Logistic回归
将单因素分析P<0.05的变量纳入多因素Logistic回归分析,显示性别、年龄、FUT7_CpG_4、FUT7_CpG_6、性质、分叶征、毛刺征是肺腺癌的独立危险因素(P<0.05)。结果见表3。
2.5 列线图模型构建
根据多因素Logistic回归分析结果构建肺腺癌预测模型列线图,将毛刺征等7个独立危险因素纳入列线图的构建(图1)。根据列线图模型中各个危险因素对结局变量的影响程度,对每个变量进行打分,相加得到总分,最后通过总分计算肺腺癌的发生概率。
2.6 预测模型验证与效能评价
预测模型的区分度,将各变量带入该模型,预测肺腺癌的ROC曲线下面积(area under ROC curve,AUC)为0.925(95%CI 0.877~0.972,P<0.05),最大约登指数对应的临界值为0.562,此时敏感性为89.25%,特异性为86.89%,阳性预测值为91.21%,阴性预测值为84.13%。使用验证集数据验证该模型,得到AUC为0.892(95%CI 0.815~0.968,P<0.05),最大约登指数对应的临界值为0.834,此时敏感性为66.67%,特异性为96.15%,阳性预测值为96.30%,阴性预测值为65.79%。结果见图2。使用DeLong检验比较训练集和验证集的ROC曲线,差异无统计学意义(P=0.471),提示本预测模型在训练集和验证集都具有较好的区分度。
预测模型的校准度,训练集和验证集中的校准曲线和实际曲线均靠近理想曲线(图3),提示预测模型肺腺癌预测风险与实际发生风险高度一致。
预测模型的适用度,DCA曲线显示当模型的阈概率为0.02~0.80(图4),应用列线图的净获益水平明显高于“不干预”和“全干预”方案,提示列线图具有较好的临床净收益。
2.7 预测模型在CT高危征象中的应用
根据位置、血管征和胸膜征,使用收集到的219名肺结节患者来评估在不同亚组患者中预测模型的表现。结果显示预测模型在各亚组中均表现出较高的敏感性、特异性、阳性预测值和阴性预测值,具有较高的诊断价值。结果见表4。
3 讨论
随着CT筛查的普及,肺结节的管理对临床医生提出了新的挑战。Fleischner指南建议胸部CT偶然发现的肺结节的随访和处理[20]。低风险结节定期随访,而风险较高的结节接受正电子发射计算机体层显像仪/X射线计算机体层摄影、活组织检查或手术。然而,在目前的实践中,许多良性肺结节患者接受了侵入性检查,其中包括22% CT筛查发现的结节[21-23]。寻找一种无创的,可重复的生物标志物与胸部CT结合起来辅助诊断早期肺癌势在必行。肺腺癌是最常见的肺癌组织学亚型[13],其在LDCT筛查或者早期可切除恶性结节中占比更高[14]。研究发现早期诊断并完全切除的原位腺癌和微浸润腺癌,10年疾病特异性生存率均为100%,总生存率分别为95.3%和97.8%[18]。因此,本研究创建了一个量化肺腺癌的风险的统计预测模型,为临床医生对CT筛查或偶然发现的肺结节患者提出治疗建议时提供支持。最终模型确定了2个临床指标(年龄较大、女性),3个CT影像学指标(亚实性结节、分叶征、毛刺征)和2个血清标志物指标(FUT7_CpG_4、FUT7_CpG_6)与估计肺腺癌的可能性相关。
目前,已经开发并验证了多种预测模型来评估肺结节中恶性肿瘤的可能性,如Mayo(AUC=0.752)[24]和Brock(AUC=0.878)[25]模型。Mayo模型中,年龄、吸烟史、胸腔外癌症史、最大结节直径、毛刺征和位于肺上叶是恶性肿瘤的预测因子。Brock模型中癌症的预测因子包括年龄较大、女性、肺癌家族史、肺气肿、结节较大、结节位于上叶、部分实性结节类型、较少的结节计数和毛刺征。不同于这些以临床指标和CT影像学指标[26-28]建立的模型,我们的研究首次将新的潜在生物标志物FUT7_CpG_4和FUT7_CpG_6纳入了肺腺癌的统计预测模型中。FUT7属于α1,3/4-岩藻糖基转移酶家族,包括FUT3、4、5、6、7、9、10和11,催化岩藻糖基化糖复合物合成的最后一步[10,29]。异常的岩藻糖基化与肿瘤增殖、转移和血管生成有关[30-31],低甲基化水平FUT7的表达与肺癌风险增加相关[11]。肺腺癌在女性中更多见[32],分叶征和毛刺征是肺癌在胸部CT上的常见征象[25,33-34],这些发现与既往研究一致。混杂密度结节是肺癌的危险因素[25],且其包含的实性比例与肺腺癌的侵袭性有关[35]。但有研究发现放射科医生间及其自身对结节划分为实性、混杂磨玻璃、纯磨玻璃的一致性均显得极不稳定,主要是由于对固体成分的大小和存在与否意见不一[36]。因此本研究将混杂磨玻璃结节与纯磨玻璃结节一起归入亚实性结节中进行分析,最终结果显示亚实性结节较实性结节肺腺癌概率更高,良性病变如肉芽肿性炎、肺组织慢性炎比例更低。位于上叶、血管征和胸膜征也有报道与恶性肺结节相关[37-38],但在本研究中并不是肺腺癌发生的独立危险因素。为进一步评估模型在以上单一胸部CT恶性征象人群中的应用价值,将收集到的全部肺结节患者按照有无上叶、血管征和胸膜征各分为两组进行分析,结果显示模型在各亚组中均表现出了良好的诊断效能。因此,本模型不仅适用于LDCT筛查发现的肺结节患者,也可用于具有上述某一恶性CT征象的人群,尽可能避免过度诊疗的发生。
然而,我们的研究也有一些局限性。首先,本研究是单中心的回顾性研究,样本量较少,仅对模型进行了内部验证,未来开展大规模、多中心、前瞻性的临床研究将更有价值。其次,本研究人群为接受病理活检的患者,这可能高估了肺腺癌的患病率,也增加了常见胸部CT恶性征象的发生率。
总之,我们开发并内部验证了一种新的模型来预测肺结节中发生肺腺癌的风险,为临床提供了新的诊断思路和方法。此外,将模型应用于一些影像不易区分的亚组中(位于上叶、血管征和胸膜征),也具有较好的预测价值。这些结果表明,本模型可以有效地用于更广泛的患者群体,可以更及时地诊断恶性肺结节,减少良性结节不必要的侵入性检查和手术,为临床诊断肺腺癌提供新的诊断思路和理论依据。
利益冲突:本研究不涉及任何利益冲突。