您的位置: 首页 > 2026年3月 第57卷 第3期 > 文字全文
2023年7月 第38卷 第7期11
目录

基于机器学习的结肠息肉术后复发风险预警模型构建

Machine learning-based development of a recurrence risk prediction model for post-polypectomy colonic polyps

来源期刊: 广州医药 | 315-326 发布时间:2026-03-20 收稿时间:2026/5/8 12:57:43 阅读量:43
作者:
关键词:
机器学习结肠息肉复发影响因素预警模型
machine learningcolonic polypsrecurrenceinfluencing factorsrisk prediction model
DOI:
10. 20223 / j. cnki. 1000-8535. 2026. 03. 008
收稿时间:
2025-07-21 
修订日期:
 
接收日期:
 
引用总数:
0  
       目的  探讨结肠镜下息肉切除术后复发的危险因素,并基于机器学习算法构建复发风险预警模型,为防治对策提供依据。方法  回顾性收集2018年9月—2023年9月六安市人民医院1 058例初次行无痛结肠镜下息肉切除术患者的临床资料,使用单因素和多因素Logistic回归分析筛选复发危险因素。采用7∶3随机抽样分为训练集和验证集,分别通过决策树、贝叶斯及Logistic回归算法构建预测模型,并以受试者工作特征曲线(ROC)曲线下面积(AUC)、灵敏度、特异度等指标来评估模型效能。结果  单因素分析显示,性别、吸烟、代谢综合征、息肉数量、息肉位置、山田分型、组织病理学类型、切除方式、复查时间、肠息肉直径、手术时间是复发的危险因素(P<0.05)。多因素分析显示,性别、代谢综合征、息肉数量、息肉直径、肠息肉位置、山田分型、组织学病理类型、切除方式、手术时间均是结肠息肉内镜下切除术后复发的危险因素。模型评估显示,决策树算法、贝叶斯算法、Logistic回归算法的ROC曲线下面积(AUC)分别为0.849、0.818、0.811;灵敏度分别为85.14%、81.62%、79.43%;特异度分别为81.69%、79.45%、74.18%;约登指数分别为0.534、0.551、0.573;95%CI分别为0.810~0.876、0.794~0.860、0.782~0.850;决策树算法模型效能最佳,Logistic回归算法的性能最差。结论  性别、代谢综合征、肠息肉特征(数量、直径、位置等)是术后复发的关键危险因素。决策树模型在风险预测中表现最优,可为临床制定个体化随访策略提供参考。
       Objective  To explore the  risk factors for  recurrence after painless colonoscopic polypectomy and construct a recurrence risk warning model based on machine learning algorithms to provide evidence for prevention and treatment strategies.Methods  A retrospective analysis was conducted on clinical data from 1 058 patients who underwent their first painless colonoscopy-guided polypectomy at our hospital between September 2018 and September 2023.Univariate and multivariate Logistic  regression analyses were performed to identify recurrence risk factors.The dataset was randomly divided into training and validation sets using a 7∶3 ratio.Prediction models were constructed using decision tree,Bayesian,and Logistic regression algorithms,and their performance was evaluated using metrics such as the area under the receiver operating characteristic curve(AUC),sensitivity,specificity,and others.Results  Univariate analysis revealed that gender,smoking,metabolic syndrome,number of polyps,polyp location,Yamada classification,histopathological type,resection method,follow-up time,polyp diameter,and operation duration were risk factors for recurrence(P<0.05).Multivariate analysis identified gender,metabolic syndrome,number of polyps,polyp diameter,polyp location,Yamada classification,histopathological type,resection method,and operation duration as independent risk factors for recurrence after endoscopic polypectomy.Model evaluation showed AUC values of 0.849,0.818,and 0.811 for the decision tree,Bayesian,and Logistic regression algorithms,respectively.Sensitivity values were 85.14%,81.62%,and 79.43%;specificity values were 81.69%,79.45%,and 74.18%;Youden’s indices were 0.534,0.551,and 0.573;and 95% confidence intervals(CIs)were 0.810–0.876,0.794–0.860,and 0.782–0.850,respectively.The  decision tree algorithm demonstrated the best predictive performance,while the Logistic regression algorithm performed the least favorably.Conclusions  Gender,metabolic syndrome,and polyp characteristics(number,diameter,location,etc.)are key  risk factors for recurrence after polypectomy.The decision tree algorithm exhibited optimal predictive efficacy,offering valuable insights for developing individualized follow-up strategies in clinical practice.
       近年来,我国结直肠癌的流行病学特征呈现显著变化。在过去20年中,50岁以下的人群结直肠癌发病率迅速上升,提示疾病谱呈现明显的年轻化趋势[1],作为公认的癌前病变,腺瘤性息肉在结直肠癌发生发展中发挥关键作用[2]。文献报[3-4]显示,约65.3%的结直肠息肉为腺瘤性病变,且60%~70%的结直肠癌病例存在腺瘤-癌演进证据[3-4];目前无痛结肠镜下息肉切除术作为首选治疗方式,虽然能有效降低结直肠癌发病率,但术后复发问题仍亟待解决。研究显示,术后1、3、5年的累计复发率分别为10.9%、38.2%、52.5%[5],提示建立有效的复发风险评估体系具有重要临床价值,旨在明确结肠息肉复发的危险因素、确定合理的随访间隔并预测复发风险。现有研究多基于传统统计方法(如Logistic回归)分析复发危险因素,这类方法在揭示变量间复杂的非线性关系及多维交互作用方面存在局限。相比之下,机器学习算法在医疗预测模型构建中展现出独特优势[6],通过特征工程技术,可有效识别高维数据中的潜在模式,并建立具有更强泛化能力的预测模型[7-8]。本研究通过分析结直肠息肉内镜治疗后复发的独立危险因素,并利用机器学习算法构建风险预测模型,为个体化随访策略的制定提供循证依据。

1  资料与方法

1.1  一般资料

       回顾性纳入2018年9月—2023年9月于我院消化内科行无痛结肠镜下息肉切除术,符合纳入与排除标准的患者共1 058例,其中男性745例,女性313例;年龄20~82岁,年龄为(55.82±9.93)岁。根据术后有无复发将其分为复发组(552例)和未复发组(506例)。纳入标准:(1)年龄≥18岁;(2)依据《中国结直肠癌筛查与早诊早治指南(2020,北京)》[9]诊断标准确诊为结肠息肉,并经内镜检查证实;(3)肠道清洁度达标,确保黏膜观察清晰且不影响手术操作;(4)完成结肠镜下息肉切除术,并获取完整的息肉病理学检查结果;(5)术后具备规律随访条件。排除标准:(1)息肉已发生癌变;(2)存在结肠癌或其他消化道恶性肿瘤病史;(3)合并炎症性肠病或可能导致结肠黏膜损伤的疾病;(4)患有免疫缺陷疾病或正在接受免疫抑制治疗;(5)存在严重心、肝、肾等器官功能障碍;(6)因其他原因无法进行无痛结肠镜下息肉切除术。本研究方案经医院伦理委员会审查批准,伦理批件号:2024LL(研)015。

1.2  患者临床资料

       通过查询病历资料收集:包括性别、年龄、BMI、伴随症状、吸烟史、饮酒史、代谢综合征、冠心病史、结直肠息肉家族史、胆囊切除术史、癌胚抗原(carcinoembryonic antigen,CEA)、复查时间、息肉特征(数量、大小、位置、病理类型、山田分型、切除方式、手术时间)等资料。(注:根据腺瘤的自然生长史,其1年内的净增长平均约为0.1 cm[10]。所以,短时间内出现新发息肉的可能性较小。因此,首次结肠镜治疗后6个月内所有复查发现的息肉均被视为首次治疗漏诊息肉,归入首次结肠镜检查结果;6个月后发现的息肉通常归为新发息肉;息肉完整切除6个月后发现的息肉,或末次肠镜结果作为随访终点;再次发现息肉的时间或末次肠镜时间作为随访间隔[11]。)

1.3  统计学方法

       采用Python对数据进行单因素及多因素分析。单因素分析:计量资料经离散化转为计数资料,计数资料采用χ 2 检验;多因素分析:根据结肠息肉患者的临床特征,首先通过LASSO回归分析对所有变量进行降维处理,筛选出系数不为零的预测因素作为结肠息肉内镜下切除术后复发的影响因素,再经十折交叉验证筛选出最优的术后复发预测参数,以结肠息肉内镜下切除术后是否复发作为因变量,将LASSO回归分析筛选的变量作为自变量进行多因素Logistic回归分析。结果输出结肠息肉内镜下切除术后复发的独立危险因素,相关因素分析结果以P<0.05表示差异有统计学意义。

1.4  模型构建、验证与评估

       经随机抽样方法以7︰3将其分为训练集、验证集,通过机器学习的决策树算法、贝叶斯算法、Logistic回归算法构建预测结肠息肉内镜下切除术后复发的风险预警模型。模型先在训练集上完成拟合,随后于验证集开展评估,借此检验模型的泛化能力与预测表现。预测效能借助受试者作特征曲线(receiver operating characteristic,ROC)曲线进行评价,通过计算曲线下面积(area under the curve,AUC)衡量模型的诊断效能。与此同时,进一步分析灵敏度、特异度、约登指数、95%置信区间(95%CI)及标准误(SE),从多维度评估模型在不同分类场景中的预测效果。

2  结 果

2.1  复发组和未复发组患者的临床资料比较

       复发组和未复发组患者在年龄、BMI、伴随症状、饮酒史、冠心病史、结直肠息肉家族史、胆囊切除术、CEA方面比较,差异无统计学意义(P>0.05),而复发组和未复发组患者在性别、吸烟史、代谢综合征、复查时间、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间方面比较,差异具有统计学意义(P<0.05),见表1。

   表1 复发组未复发组患者的临床资料对比 [n(%)]

项目

分类

复发组(n=552

未复发组(n=506

χ2

P

性别

410(74.28)

335(66.21)

8.253

0.004

 

142(25.72)

171(33.79)

 

 

年龄

≤50岁

27(4.89)

144(28.46)

1.011

0.799

 

51~60岁

245(44.38)

220(43.48)

 

 

 

61~70岁

277(50.18)

108(21.34)

 

 

 

>70岁

3(0.54)

34(6.72)

 

 

BMI

<18 kg/m2

0(0.00)

2(0.40)

9.265

0.055

 

18 χ<21kg/m2

27(4.89)

45(8.89)

 

 

 

21 χ<24 kg/m2

245(44.38)

215(42.29)

 

 

 

24 χ<28 kg/m2

277(50.18)

240(47.43)

 

 

 

28kg/m2

3(0.54)

4(0.79)

 

 

伴随症状

219(39.67)

170(33.60)

3.404

0.065

 

333(60.33)

333(66.40)

 

 

吸烟史

214(38.77)

155(30.63)

7.693

0.006

 

338(61.23)

351(69.37)

 

 

饮酒史

158(28.62)

130(25.69)

1.145

0.285

 

394(71.38)

367(74.31)

 

 

代谢综合征

295(53.44)

200(39.53)

20.536

<0.001

 

257(46.56)

306(60.47)

 

 

冠心病史

115(20.83)

128(25.30)

2.972

0.085

 

437(79.17)

378(74.70)

 

 

结直肠息肉家族史

66(11.96)

51(10.08)

0.002

0.961

 

486(88.04)

445(89.92)

 

 

胆囊切除术

98(17.75)

109(21.54)

2.170

0.141

 

454(82.25)

398(78.46)

 

 

CEA

<5.0 ng/mL

537(97.28)

487(96.25)

0.814

0.339

 

≥5.0 ng/mL

15(2.72)

19(3.75)

 

 

复查时间

6~12

169(30.62)

269(53.16)

55.945

<0.001

 

13~24

366(66.30)

223(44.07)

 

 

 

>24

17(3.08)

14(2.77)

 

 

肠息肉数

<3

114(2.54)

177(34.98)

32.800

<0.001

 

310

368(66.67)

196(38.74)

 

 

 

>10

70(12.68)

33(6.52)

 

 

肠息肉直径

0.5 cm

10(1.81)

11(2.17)

14.295

0.003

 

0.5<χ1.0 cm

360(65.22)

276(54.55)

 

 

 

1.0<χ2.0 cm

168(30.43)

209(41.30)

 

 

 

>2.0 cm

14(2.54)

10(1.98)

 

 

肠息肉位置

近端

134(24.28)

110(21.74)

9.536

0.008

 

远端

183(33.15)

214(42.29)

 

 

 

全结肠

235(42.57)

182(35.97)

 

 

山田分型

I型

131(23.73)

186(36.76)

104.009

<0.001

 

Ⅱ型

100(18.12)

180(35.57)

 

 

 

Ⅲ型

203(36.78)

77(15.22)

 

 

 

Ⅳ型

118(21.38)

63(12.45)

 

 

组织病理学类型

非肿瘤

30(5.43)

229(45.26)

235.345

<0.001

 

腺瘤性息肉

388(70.29)

221(43.68)

 

 

 

低级别

113(20.47)

55(10.87)

 

 

 

高级别

21(3.80)

1(0.20)

 

 

切除方式

活检钳切除术

256(46.38)

178(35.18)

37.047

<0.001

 

EMR

102(18.48)

161(31.82)

 

 

 

ESD

40(7.28)

59(11.66)

 

 

 

热活检钳电凝钳切除术

154(27.90)

108(21.34)

 

 

手术时间

<0.5 h

242(43.84)

269(53.16)

31.838

<0.001

 

0.5χ<1 h

261(47.28)

158(31.23)

 

 

 

1 h

49(8.88)

79(15.61)

 

 

注:近端结肠包括盲肠、升结肠、肝曲、横结肠、脾区;远端结肠包括降结肠、乙状结肠和直肠;全结肠为多发息肉位于上述2个部位。多发息肉患者的分类是按照息肉的大小、部位及病理组织学分别以最大息肉、最近端部位以及最高病理形态息肉进行分类。

2.2  结肠息肉内镜下切除术后复发的预测因素分

       根据结肠息肉患者的临床资料和特征,通过LASSO回归分析对所有变量(性别、年龄、BMI、伴随症状、吸烟史、饮酒史、代谢综合征、冠心病史、结直肠息肉家族史、胆囊切除术、CEA、复查时间、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间)指标进行降维处理,共计筛选出14项系数不为零的预测因素作为结肠息肉内镜下切除术后复发的影响因素,见图1。经10折交叉验证筛选出9个术后复发因素,包括性别、代谢综合征、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间,见图1。
20260509151836_3856.png
图 1  LASSO 回归分析结果

2.3  基于Logistic回归算法构建结肠息肉内镜下切除术后复发的预测模型

       以结肠息肉内镜下切除术后复发与否作为因变量,将LASSO回归筛选的变量,包括性别、代谢综合征、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间,作为自变量,变量赋值见表2,进行Logistic回归分析。结果显示,性别、代谢综合征、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间均为结肠息肉内镜下切除术后复发的危险因素。结果见表3。

 表2 变量赋值

变量

赋值方式

术后复发

否=“0”;=“1”

性别

女性=“0”;男性=“1”

代谢综合征

=“0”;=“1”

肠息肉数量

<3=“0”;3x10=“1”;10=2

肠息肉直径

0.5=“0 cm”;0.5<χ1.0=“1 cm”;1.0<χ2.0=2 cm”;>2.0=3 cm

肠息肉位置

近端=“0”;远端=“1”;全结肠=2

山田分型

Ⅳ型=“0”;Ⅱ型=“1”;I型=2”;Ⅲ型=3

组织病理学类型

非肿瘤=“0”;腺瘤性息肉=“1”;低级别=2”;高级别=3

切除方式

活检钳钳除术=“0”;EMR=“1”;ESD=2”;热活检钳电凝钳除术=3

手术时间

<0.5=“0”;0.5χ<1=“1”;≥1.0=2

 

  表3 结肠息肉内镜下切除术后复发的Logistic回归分析

因素

回归系数

标准误

Wald χ2

P

OR

95%置信区间

截距

-5.793

1.389

17.399

<0.001

 

 

 

男性

0.456

0.175

6.753

0.009

1.577

1.118

2.224

代谢综合征有

0.741

0.174

18.159

<0.001

2.099

1.492

2.952

肠息肉数量3~10

0.764

0.335

5.198

0.023

2.147

1.113

4.142

肠息肉数量10

0.509

0.305

2.779

0.096

1.664

0.914

3.027

肠息肉直径>2.0 cm

1.326

0.797

2.766

0.096

3.767

0.789

17.978

肠息肉直径1.0<χ≤2.0 cm

1.052

0.557

3.575

0.059

2.864

0.962

8.527

肠息肉直径0.5<χ≤1.0 cm

1.359

0.547

6.181

0.013

3.894

1.333

11.372

肠息肉位置远端

0.128

0.213

0.358

0.550

1.136

0.748

1.726

肠息肉位置全结肠

0.383

0.192

3.958

0.047

1.466

1.006

2.138

山田分型I型

0.989

0.240

16.944

<0.001

2.688

1.679

4.304

山田分型Ⅲ型

1.135

0.255

19.785

<0.001

3.111

1.887

5.129

山田分型Ⅳ型

-0.676

0.262

6.655

0.010

0.509

0.305

0.850

组织学病理类型高级别

5.302

1.073

24.420

<0.001

200.711

24.508

1643.715

组织病理学类型低级别

2.572

1.055

5.943

0.015

13.095

1.656

103.565

组织病理学类型腺瘤性息肉

2.469

1.066

5.366

0.021

11.807

1.462

95.335

切除方式活检钳钳除术

-0.053

0.213

0.062

0.804

0.948

0.624

1.440

切除方式EMR

0.983

0.244

16.152

<0.001

2.671

1.654

4.313

切除方式ESD

0.655

0.452

2.101

0.147

1.924

0.794

4.663

手术时间0.5 h

-0.395

0.352

1.255

0.263

0.674

0.338

1.344

手术时间0.5≤χ<1 h

-1.154

0.350

10.903

0.001

0.315

0.159

0.626

 

2.4  决策树算法构建结肠息肉内镜下切除术后复发的预测模型

      基于性别、代谢综合征、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间构建了结肠息肉内镜下切除术后复发的决策树模型。该决策树生长6层,共计28个节点,其中16个为终末节点,见图2。模型选择了代谢综合征、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间8个临床特征作为模型节点,其中病理组织学类型对了结肠息肉内镜下切除术后复发的预测价值最大,见图3。
20260509152021_2821.png
图 2   结肠息肉内镜下切除术后复发的决策树模型
20260509152040_7401.png
图 3   重要性排序

2.5  结肠息肉内镜下切除术后复发的贝叶斯网络模型

       基于性别、代谢综合征、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间构建结肠息肉内镜下切除术后复发风险的贝叶斯网络模型,该模型包含8个节点和15条有向边,通过该模型,可以得出代谢综合征、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间与结肠息肉内镜下切除术后复发存在直接关联,见图4。采用最大似然估计法计算各节点的风险概率,代谢综合征、肠息肉数量、肠息肉直径、肠息肉位置、山田分型、病理组织学类型、切除方式、手术时间为直接影响术后复发的风险概率,见表4。
20260509152137_7967.png
图 4   结肠息肉内镜下切除术后复发的贝叶斯网络模型

  表4 直接节点的结肠息肉内镜下切除术后复发情况的风险概率

代谢综合征

肠息肉数量/个

肠息肉直径/cm

肠息肉位置

山田分型

组织病理学类型

切除方式

手术时间/h

术后复发率

3~10

0.5<χ≤1.0

全结肠

山田I型

腺瘤性息肉

活检钳切除术

0.5≤χ<1

0.933

3~10

0.5<χ≤1.0

远端

山田I型

腺瘤性息肉

活检钳切除术

<0.5

0.878

3~10

1.0<χ≤2.0

全结肠

山田Ⅲ型

腺瘤性息肉

EMR

0.5≤χ<1

0.955

10

0.5<χ≤1.0

远端

山田I型

腺瘤性息肉

活检钳切除术

<0.5

0.922

3~10

0.5<χ≤1.0

全结肠

山田Ⅳ型

高级别

活检钳切除术

0.5≤χ<1

1.000

3~10

0.5<χ≤1.0

远端

山田I型

低级别

活检钳切除术

≥1.0

0.906

0

0.5<χ≤1.0

远端

山田Ⅱ型

腺瘤性息肉

活检钳切除术

<0.5

0.649

3~10

0.5<χ≤1.0

近端

山田I型

低级别

活检钳切除术

0.5≤χ<1

0.879

3~10

0.5<χ≤1.0

近端

山田Ⅲ型

腺瘤性息肉

ESD

0.5≤χ<1

0.828

<3

0.5<χ≤1.0

远端

山田Ⅱ型

腺瘤性息肉

活检钳切除术

<0.5

0.648

     (注:内镜下黏膜切除术(Endoscopic Mucosal ResectionEMR);内镜下黏膜剥离术(Endoscopic Submucosal DissectionESD)

2.6  模型的预测效能评估

       比较Logistic回归、决策树及贝叶斯网络模型对结肠息肉内镜下切除术后复发预测效能的结果显示,各模型的AUC值均较高,分别为0.811、0.849和0.818。Delong检验显示,决策树与贝叶斯网络模型的预测效能略高于Logistic回归模型,其中决策树的灵敏度与特异度最高,贝叶斯网络模型次之,Logistic回归最低,见图5和表5。采用决策曲线分析评估不同风险阈值下三个模型的临床适用性与净获益,结果表明,3个模型都有很高的临床净获益,其中决策树模型表现最优。见图6。
20260509152349_1503_thumb.png

表5 结肠息肉内镜下切除术后复发预测模型的效能

模型

AUC

灵敏度/%

特异度/%

约登指数

95% CI

SE

P

Logistic回归

0.811

79.43

74.18

0.573

0.782~0.850

0.030

<0.001

贝叶斯网络模型

0.818

81.62

79.45

0.551

0.794~0.860

0.032

<0.001

决策树模型

0.849

85.14

81.69

0.534

0.810~0.876

0.035

<0.001

3  讨 论

       结直肠息肉内镜治疗后复发风险的准确预测是优化随访管理的关键。既往研究显示,息肉直径、数量及病理分型是复发的独立危险因素,但针对代谢综合征、手术操作参数等潜在影响因素的探索尚不充分。本研究通过回顾性收集1 058例接受内镜治疗的患者,采用单因素及多因素分析其临床特征及手术参数,发现性别(男OR=1.577)、代谢综合征(合并代谢综合征OR=2.099)、肠息肉数量(3~10枚OR=2.147、OR>10=1.664)、肠息肉直径(OR0.5<x≤1.0=3.894、OR1.0<x≤2.0=2.864、OR>2=3.767)、肠息肉位置(全结肠分布OR=1.466、OR远端=1.136)、山田分型(OR山田Ⅲ型=3.111、OR山田Ⅳ型=2.688、OR山田Ⅱ型=0.509)、组织学病理类型(OR高级别=200.711、OR低级别=13.095、OR腺瘤性息肉=11.807)、切除方式(OREMR=2.671、ORESD=1.924、OR活检钳切除术=0.948)、手术时间(OR<0.5 h=0.674、OR0.5≤x<1 h=0.315)等9项参数与结肠息肉内镜下切除术后复发显著相关(P<0.05)。在此基础上,构建了融合决策树、贝叶斯及Logistic回归的机器学习预测模型,这些模型有助于临床医护人员评估无痛结肠镜息肉切除术后患者的复发风险。本研究的创新之处在于应用机器学习技术构建风险预测模型,对结肠息肉内镜治疗后患者个体化随访方案的制定提供了新工具。
       本研究纳入的1 058例结肠息肉患者术后随访显示复发率为52.2%,与既往研究报道的复发率范围(45.1%~51.92%)接近[12-13]。本研究通过Logistic回归分析,发现性别(OR=1.577,95% CI:1.118~2.224)、代谢综合征、息肉数量、息肉直径、息肉位置、山田分型、组织学病理类型、切除方式、手术时间均为结肠息肉复发的独立预测因子。相较于李云霞等[14]提出的三因素(年龄>60岁、息肉数量>3个、息肉直径>2 cm),以及张宁博等[15]和张杰[16]提示息肉大小、数量和病理类型与息肉复发显著相关的结果;本研究纳入了代谢综合征、切除方式等动态可干预变量,构建了更全面的风险评估体系。本研究结果与Jin等[17]关于年龄、肠息肉数量多、直径较大、组织病理学类型和了代谢综合征的存在是影响内镜高频电切除术后肠息肉复发的因素的结果一致。赵利娜等[18]报道,男性、息肉部位多发于全结肠、息肉个数>10个均为息肉再发的危险因素,而增生性息肉再发风险低;CEA水平与息肉再发相关;其中,男性及息肉部位多发于全结肠与息肉再发密切相关。这与本研究关于病理类型分层的结论相印证。本研究中发现息肉数量、息肉直径、息肉位置、山田分型、组织学病理类型和切除方式为结肠息肉复发的独立危险因素与上述多篇报道建立的预测模型具有一致性。然而,本研究发现性别是结肠息肉复发的独立危险因素,男性患者的复发风险较女性升高,可能与性激素的影响有关[19],雌激素可能具有保护作用;绝经前女性雌激素水平较高,可能通过抑制细胞增殖和促进DNA修复来降低息肉形成风险。分子机制研究表明,雌激素受体β(estrogen receptor beta,ERβ)在结肠隐窝基底的高表达可能通过调控Wnt/β-catenin通路抑制异常增殖,从而可能抑制肿瘤生长。其次,本研究发现手术操作时间超过30 min(OR=0.674,95%CI0.338~1.344)被证实为独立危险因素,可能与以下原因有关[20]:手术时间较长可能反映息肉切除的复杂性(如体积大、位置特殊、形态不规则或多发)。复杂的息肉可能需要反复操作或使用更复杂的技术(如分片切除),从而增加残留风险,进而提高复发率。而且长时间操作可能导致复杂息肉处理过程中黏膜损伤程度的增加(如电凝过度),引发局部炎症和修复反应,而炎症微环境可能介导息肉复发过程(再生性增生)。最后,复杂手术本身可能延长操作时间,增加术者疲劳,影响操作精准度,从而间接导致残留。
       Gould等[21]利用机器学习算法构建了肺癌预测筛查模型,并证明该模型相比现有的筛查标准具有更高的准确性(AUC为0.86)。Dinh等[22]基于机器学习构建了糖尿病和心血管疾病预测模型,构建的两种预测模型的AUC分别为0.831和0.862,表现出不俗的预测性能。而岳果林等[23]基于机器学习构建的支持向量机与 Logistic 回归模型也均能较好地预测重型颅脑损伤患者肠内营养相关性腹泻的发生风险。类似地,杨正霞等[24]用RF建立的甲减风险预测模型具有良好的预测性能,可用于早期监测和发现甲减的高危人群。本研究首次将集成模型应用于结肠息肉复发预测,利用机器学习决策树算法、贝叶斯算法和Logistic回归算法3种算法识别了结肠镜下息肉切除术后复发的相关危险因素,并结合了临床参数与手术参数,通过十折交叉验证筛选出9个核心预测因子。验证结果显示各预测模型的AUC均超过0.8,具有良好的预测性能,而决策树算法(AUC:0.849)、贝叶斯网络模型(AUC:0.818)在预测结肠息肉术后复发方面优于Logistic回归算法构建的模型(AUC:0.811),结肠息肉复发预测灵敏度最高的是决策树算法85.14%(95% CI0.810~0.876)。这与陆浩轩等[25]应用机器学习算法构建冠心病预测分类模型,得出决策树算法显示了最高的准确性和AUC,决策树及朴素贝叶斯算法相比于传统逻辑回归方法均表现出明显的优越性的研究结论相一致。因此,机器学习算法适用于结肠息肉复发风险预测,具有良好的预测性能,可以为结肠息肉内镜下切除术后复发的防治对策制定提供参考。
       本研究存在以下方法学局限性,首先,数据采集局限于单一三级医疗中心(n=1 058),样本来源的同质性可能导致选择偏倚,特别是未能涵盖不同地域人群,这可能影响模型在异质人群中的泛化能力。其次,随访设计存在限制,本研究的人群都在相同背景下,随访间隔较短,未能充分观察息肉复发的趋势,仅关注了初次肠镜发现的息肉,未对复发息肉进行持续随访,可能无法捕捉远期复发事件;此外,未对复发息肉进行分子分型追踪,无法区分新生息肉与残留病灶的生物学差异;再者,尽管内镜质量控制采用了窄带成像(narrow band imaging,NBI)国际标准(日本窄带成像技术专家团队分类  Japan NBI  Expert Team classification,JNET分型),但操作者经验差异(5~30年资历跨度),可能影响新生病变与漏诊病灶的精确区分。因此尚需更多的多中心、高质量前瞻性研究加以验证结肠息肉复发的影响因素。
       综上,本研究初步证明了机器学习算法对结肠息肉复发风险可实现精准风险分层,其预测效能优于传统Logistic回归算法。故基于机器学习的结肠息肉复发风险预测模型具有较好的应用前景,可为结肠息肉内镜治疗后患者的个体化随访方案制定提供指导。未来可在此基础上进一步改良机器学习算法,同时发掘更多与结肠息肉复发具有相关性的临床数据,随着大规模结肠息肉数据库的完善,这项研究的临床应用可推广性将被进一步评估,机器学习在结肠息肉复发风险评估中的应用前景将更加广阔,有望为临床决策和个体化治疗提供有力支持。
1、PATEL S G,AHNEN D J.Colorectal cancer in the young[J].Curr Gastroenterol Rep,2018,20 (4):15.PATEL S G,AHNEN D J.Colorectal cancer in the young[J].Curr Gastroenterol Rep,2018,20 (4):15.
2、WANG Q P,HE X X,XU T,et al.P ol y p recurrence after colonoscopic polypectomy[J].Chin Med J(Engl),2020,133(17):2114-2115.WANG Q P,HE X X,XU T,et al.P ol y p recurrence after colonoscopic polypectomy[J].Chin Med J(Engl),2020,133(17):2114-2115.
3、SULLIVAN B A,NOUJAIM M,ROPER J.Cause, epidemiology,and histology of polyps and pathways to colorectal cancer[J].Gastrointest Endosc Clin N Am,2022,32(2):177-194.SULLIVAN B A,NOUJAIM M,ROPER J.Cause, epidemiology,and histology of polyps and pathways to colorectal cancer[J].Gastrointest Endosc Clin N Am,2022,32(2):177-194.
4、SNINSKY J A,SHORE B M,LUPU G V,et al. Risk factors for colorectal polyps and cancer[J]. Gastrointest Endosc Clin N Am,2022,32(2): 195-213.SNINSKY J A,SHORE B M,LUPU G V,et al. Risk factors for colorectal polyps and cancer[J]. Gastrointest Endosc Clin N Am,2022,32(2): 195-213.
5、HARRINGTON L X,WEI J W,SURIAWINATA A A,et al.Predicting colorectal polyp recurrence using time-to-event analysis of medical records[J]. AMIA Jt Summits Transl Sci Proc,2020(2020): 211-220.HARRINGTON L X,WEI J W,SURIAWINATA A A,et al.Predicting colorectal polyp recurrence using time-to-event analysis of medical records[J]. AMIA Jt Summits Transl Sci Proc,2020(2020): 211-220.
6、HANDELMAN G S,KOK H K,CHANDRA R V, et al.eDoctor:Machine learning and the future of medicine[J].J Intern Med,2018,284(6): 603-619.HANDELMAN G S,KOK H K,CHANDRA R V, et al.eDoctor:Machine learning and the future of medicine[J].J Intern Med,2018,284(6): 603-619.
7、DEO R C.Machine learning in medicine[J]. Circulation,2015,132(20):1920-1930.DEO R C.Machine learning in medicine[J]. Circulation,2015,132(20):1920-1930.
8、RAJKOMAR A,DEAN J,KOHANE I.Machine learning in medicine[J].N Engl J Med,2019, 380(14):1347-1358.RAJKOMAR A,DEAN J,KOHANE I.Machine learning in medicine[J].N Engl J Med,2019, 380(14):1347-1358.
9、陈万青,李霓,兰平,等.中国结直肠癌筛查与 早诊早治指南(2020,北京)[J].中国肿瘤, 2021,30(1):1-28.陈万青,李霓,兰平,等.中国结直肠癌筛查与 早诊早治指南(2020,北京)[J].中国肿瘤, 2021,30(1):1-28.
10、LIEBERMAN D A,REX D K,WINAWER S J, et al.Guidelines for colonoscopy surveillance after screening and polypectomy:A consensus update by the US Multi-Society Task Force on Colorectal Cancer [J].Gastroenterology,2012,143(3):844- 857.LIEBERMAN D A,REX D K,WINAWER S J, et al.Guidelines for colonoscopy surveillance after screening and polypectomy:A consensus update by the US Multi-Society Task Force on Colorectal Cancer [J].Gastroenterology,2012,143(3):844- 857.
11、刘娜.结肠息肉切除术后复发及随访间隔的研究 [D].青岛:青岛大学,2018.刘娜.结肠息肉切除术后复发及随访间隔的研究 [D].青岛:青岛大学,2018.
12、高静静,鲁仕昱,杜晟楠,等.结肠息肉术后复发 的影响因素分析[J].中国医药导报,2022,19 (23):104-108.高静静,鲁仕昱,杜晟楠,等.结肠息肉术后复发 的影响因素分析[J].中国医药导报,2022,19 (23):104-108.
13、DU J Y,HUANG G Y,XIE Y C,et al.High levels of triglycerides,apolipoprotein B,and the number of colorectal polyps are risk factors for colorectal polyp recurrence after endoscopic resection:A retrospective study[J].J Gastrointest Oncol,2022,13(4): 1753 - 1760.DU J Y,HUANG G Y,XIE Y C,et al.High levels of triglycerides,apolipoprotein B,and the number of colorectal polyps are risk factors for colorectal polyp recurrence after endoscopic resection:A retrospective study[J].J Gastrointest Oncol,2022,13(4): 1753 - 1760.
14、李云霞,张云芳,季永志.功能性便秘病人结肠镜 检查前肠道准备护理方案的构建与应用[J].全 科护理,2024,22(10):1800-1805.李云霞,张云芳,季永志.功能性便秘病人结肠镜 检查前肠道准备护理方案的构建与应用[J].全 科护理,2024,22(10):1800-1805.
15、张宁博.结肠息肉经内镜下结肠黏膜切除术后不 同结局的原因分析[J].临床研究,2021,29 (8):10-12.张宁博.结肠息肉经内镜下结肠黏膜切除术后不 同结局的原因分析[J].临床研究,2021,29 (8):10-12.
16、张杰.影响结肠息肉术后复发的因素分析[J]. 现代养生,2023,23(15):1138-1141.张杰.影响结肠息肉术后复发的因素分析[J]. 现代养生,2023,23(15):1138-1141.
17、JIN J,YAN B,YANG S,et al.Factors associated with intestinal polyp recurrence after electroresection [J].J Coll Physicians Surg Pak,2023,33 (6):633 - 637.JIN J,YAN B,YANG S,et al.Factors associated with intestinal polyp recurrence after electroresection [J].J Coll Physicians Surg Pak,2023,33 (6):633 - 637.
18、赵利娜,王恺疌,罗琦,等.251例结肠息肉切除 术后再发危险因素分析[J].新医学,2022,53 (7):491-495.赵利娜,王恺疌,罗琦,等.251例结肠息肉切除 术后再发危险因素分析[J].新医学,2022,53 (7):491-495.
19、CHOI Y,KIM N.Sex difference of colon adenoma pathway and colorectal carcinogenesis[J].World J Mens Health,2024,42(2):256 - 282.CHOI Y,KIM N.Sex difference of colon adenoma pathway and colorectal carcinogenesis[J].World J Mens Health,2024,42(2):256 - 282.
20、夏森林.内镜下治疗结肠息肉20例临床分析[J]. 特别健康,2018(14):221.夏森林.内镜下治疗结肠息肉20例临床分析[J]. 特别健康,2018(14):221.
21、GOULD M K,HUANG B Z,TAMMEMAG I M C,et al.Machine learning for early lung cancer identification using routine clinical and laboratory data[J].Am J Respir Crit Care Med,2021,204 (4):445-453.GOULD M K,HUANG B Z,TAMMEMAG I M C,et al.Machine learning for early lung cancer identification using routine clinical and laboratory data[J].Am J Respir Crit Care Med,2021,204 (4):445-453.
22、DINH A,MIERTSCHIN S,YOUNG A,et al. A data-driven approach to predicting diabetes and cardiovascular disease with machine learning[J]. BMC Med Inform Decis Mak,2019,19(1):211.DINH A,MIERTSCHIN S,YOUNG A,et al. A data-driven approach to predicting diabetes and cardiovascular disease with machine learning[J]. BMC Med Inform Decis Mak,2019,19(1):211.
23、岳果林.基于机器学习的重型颅脑损伤患者肠内营 养相关性腹泻风险预测模型构建与验证[D].贵阳:贵州医科大学,2023.岳果林.基于机器学习的重型颅脑损伤患者肠内营 养相关性腹泻风险预测模型构建与验证[D].贵阳:贵州医科大学,2023.
24、杨正霞,王和勇,贺施琪,等.基于随机森林算法 建立甲状腺功能减退患病风险预测模型[J].广 州医药,2023,54(7):16-24.杨正霞,王和勇,贺施琪,等.基于随机森林算法 建立甲状腺功能减退患病风险预测模型[J].广 州医药,2023,54(7):16-24.
25、陆浩轩,徐瑾妍,程可爱,等.基于多因素回归 分析和机器学习算法的冠心病预测模型构建及比 较[J].宁波大学学报(理工版),2022,35 (3):57-62.陆浩轩,徐瑾妍,程可爱,等.基于多因素回归 分析和机器学习算法的冠心病预测模型构建及比 较[J].宁波大学学报(理工版),2022,35 (3):57-62.
上一篇
下一篇
出版者信息








《广州医药》公众号
目录