当前位置>主页 > 期刊在线 > 信息化应用 >

信息化应用23年7期

基于 Logistic 回归与决策树的心脏病确诊因素分析
张小胡
(重庆工商大学 数学与统计学院,重庆 400067)

摘  要:通过利用加州大学欧文分校数据库的心脏病数据集,通过建立 logistic 模型和决策树模型分析确诊心脏病的危险因素。采用 ROC 曲线和 AUC 面积作为标准来评价模型预测效果,结果显示两种模型对于数据的拟合都表现不错。与此同时两种模型显示胸痛类型、静息血压、荧光染色法测定的主要血管数和是否患地中海贫血症对于最终是否确诊心脏病有显著影响。


关键词:逻辑回归;决策树;logistic 模型



DOI:10.19850/j.cnki.2096-4706.2023.07.029


中图分类号:TP391;O212.1                            文献标识码:A                                 文章编号:2096-4706(2023)07-0117-04


Analysis of Diagnostic Factors of Heart Disease Based on Logistic Regression and Decision Tree

ZHANG Xiaohu

(School of Mathematics and Statistics, Chongqing Technology and Business University, Chongqing 400067, China)

Abstract: By using the heart disease data set of the University of California Irvine database, the risk factors of diagnostic heart disease are analyzed by establishing the Logistic Regression model and Decision Tree model. The ROC curve and AUC area are used as criteria to evaluate the prediction effect of the model. The results show that the two models perform well in fitting the data. At the same time, the two models show that the type of chest pain, resting blood pressure, the number of main blood vessels measured by fluorescent staining and whether or not suffering from thalassemia has a significant impact on whether the final diagnosis of heart disease occurs.

Keywords: Logistic Regression; Decision Tree; logistic model


参考文献:

[1] BARKHUIZEN M,ABELLA R,VLES J S H,et al. Antenatal and Perioperative Mechanisms of Global Neurological Injury in Congenital Heart Disease [J].Pediatr Cardiol,2021,42(1):1-18.

[2] 王敏红,尹巧绵,孙艳丽,等 . 胎儿及新生儿先天性心脏病的筛查经随访后的确诊和结局 [J]. 中国医刊,2012,47(12):72-74.

[3] 陈井英 . 心脏彩色多普勒超声在高血压心脏病诊断工作中的应用分析 [J]. 中国实用医药,2022,17(16):103-105.

[4] 谢金华,陈冠民,陈华 . Ⅱ型糖尿病并发心脏病危险因素的 logistic 回归分析 [J]. 医学新知杂志,1999(3):124-125+148.

[5] 程颖,崔运涛 . 基于 PCA 的决策树算法在心脏病诊断中的应用 [J]. 计算机与数字工程,2009,37(10):171-174.

[6] 曹雨,王峰,黄沃,等 . 应用统计学 [M]. 北京:人民邮电出版社,2013:246.

[7] 任海燕,梁雨,左彭湘 . 基于 logistic 回归与决策树模型的母乳喂养影响因素分析 [J]. 中国卫生统计,2019,36(4):532-534.

[8] 刘兵,李苹,朱玫烨,等 . 决策树模型与 logistic 回归模型在胃癌高危人群干预效果影响因素分析中的应用 [J]. 中国卫生统计,2018,35(1):70-73.

[9] AMINI P,AHMADINIA H,POOROLAJAL J,et al. Evaluating the high risk groups for suicide:a comparison of logistic regression,support vector machine,decision tree and artificial neural network [J].Iran J Public Health,2016,45(9):1179-1187.

[10] 张宇瑶,葛榕榕,孙刚 . 基于二元 logistics 回归的患者过度医疗检查认知及影响因素研究 [J]. 中国卫生事业管理,2020,37(12):893-895+899.

[11] 严进锦,邬海,韩斌德 . 结核性脓胸术后残腔形成的危险因素多因素Logistics回归分析 [J].中国医学创新,2020,17(18):128-131.


作者简介:张小胡(1995—),男,汉族,四川宜宾人,硕士研究生,研究方向:数理统计。