Comparative performance analysis of Boruta, SHAP, and Borutashap for disease diagnosis: A study with multiple machine learning algorithms.

Ejiyi, Chukwuebuka Joseph; Qin, Zhen; Ukwuoma, Chiagoziem Chima; Nneji, Grace Ugochi; Monday, Happy Nkanta; Ejiyi, Makuachukwu Bennedith; Ejiyi, Thomas Ugochukwu; Okechukwu, Uchenna; Bamisile, Olusola O

Ejiyi, Chukwuebuka Joseph; Qin, Zhen; Ukwuoma, Chiagoziem Chima; Nneji, Grace Ugochi; Monday, Happy Nkanta; Ejiyi, Makuachukwu Bennedith; Ejiyi, Thomas Ugochukwu; Okechukwu, Uchenna; Bamisile, Olusola O.

Afiliación

Ejiyi CJ; School of Information and Software Engineering, University of Electronic Science and Technology of China, Chengdu, China.
Qin Z; School of Information and Software Engineering, University of Electronic Science and Technology of China, Chengdu, China.
Ukwuoma CC; School of Information and Software Engineering, University of Electronic Science and Technology of China, Chengdu, China.
Nneji GU; Software Engineering Department, Sino-British Collaborative Education, Chengdu University of Technology, Oxford Brookes University, Chengdu, China.
Monday HN; Software Engineering Department, Sino-British Collaborative Education, Chengdu University of Technology, Oxford Brookes University, Chengdu, China.
Ejiyi MB; Pharmacy Department, University of Nigeria Nsukka, Enugu, Nigeria.
Ejiyi TU; Department of Pure and Industrial Chemistry, University of Nigeria Nsukka, Enugu, Nigeria.
Okechukwu U; Pharmacy Department, University of Nigeria Nsukka, Enugu, Nigeria.
Bamisile OO; Sichuan Industrial Internet Intelligent Monitoring and Application Engineering Technology Research Centre, Chengdu University of Technology, Chengdu, China.

Network ; : 1-38, 2024 Mar 21.

Article en En | MEDLINE | ID: mdl-38511557

ABSTRACT

ABSTRACT

Interpretable machine learning models are instrumental in disease diagnosis and clinical decision-making, shedding light on relevant features. Notably, Boruta, SHAP (SHapley Additive exPlanations), and BorutaShap were employed for feature selection, each contributing to the identification of crucial features. These selected features were then utilized to train six machine learning algorithms, including LR, SVM, ETC, AdaBoost, RF, and LR, using diverse medical datasets obtained from public sources after rigorous preprocessing. The performance of each feature selection technique was evaluated across multiple ML models, assessing accuracy, precision, recall, and F1-score metrics. Among these, SHAP showcased superior performance, achieving average accuracies of 80.17%, 85.13%, 90.00%, and 99.55% across diabetes, cardiovascular, statlog, and thyroid disease datasets, respectively. Notably, the LGBM emerged as the most effective algorithm, boasting an average accuracy of 91.00% for most disease states. Moreover, SHAP enhanced the interpretability of the models, providing valuable insights into the underlying mechanisms driving disease diagnosis. This comprehensive study contributes significant insights into feature selection techniques and machine learning algorithms for disease diagnosis, benefiting researchers and practitioners in the medical field. Further exploration of feature selection methods and algorithms holds promise for advancing disease diagnosis methodologies, paving the way for more accurate and interpretable diagnostic models.

Palabras clave

Boruta; BorutaShap;; Diagnosis; Machine Learning (ML); SHAP (SHapley Additive exPlanations)

Texto completo

Añadir a Mi BVS

Imprimir

XML

PubMed Links

Buscar en Google

Texto completo: 1 Colección: 01-internacional Base de datos: MEDLINE Idioma: En Revista: Network Asunto de la revista: NEUROLOGIA Año: 2024 Tipo del documento: Article País de afiliación: China Pais de publicación: Reino Unido

Texto completo

Añadir a Mi BVS

Imprimir

XML

PubMed Links

Buscar en Google