An Explainable Machine Learning Model to Explain the Influential Climate Parameters Based on Rainfall Prediction
##plugins.themes.academic_pro.article.main##
Abstract
Prediksi curah hujan yang akurat dan dapat ditafsirkan sangat penting untuk pengambilan keputusan yang tepat dalam bidang pertanian, manajemen bencana, dan ketahanan iklim. Studi ini mengusulkan kerangka kerja pembelajaran mesin (ML) yang komprehensif dan dapat ditafsirkan yang tidak hanya meningkatkan akurasi prediksi tetapi juga menjelaskan faktor-faktor utama yang mendorong kejadian curah hujan. Dengan memanfaatkan data iklim selama sembilan tahun dari Climate Data Services - Bureau of Meteorology of Australia, enam model ML—XGBoost, CatBoost, LightGBM, Random Forest, Decision Tree, dan Logistic Regression—dikembangkan dan dievaluasi secara ketat. Alur kerja praproses data mencakup pembersihan, rekayasa fitur, dan penanganan ketidakseimbangan kelas melalui Synthetic Minority Oversampling (SMOTE). Untuk memastikan transparansi dan wawasan yang dapat ditindaklanjuti, teknik Kecerdasan Buatan yang Dapat Dijelaskan (XAI) seperti SHAP dan LIME diintegrasikan, yang menyediakan interpretasi global dan lokal dari prediksi model. Hasil penelitian mengungkapkan bahwa XGBoost mencapai akurasi tertinggi sebesar 95,35%, mengungguli model lainnya. Analisis SHAP mengidentifikasi Humidity3pm dan Pressure3pm sebagai prediktor yang paling berpengaruh, sementara LIME memberikan wawasan terperinci tentang variasi prediksi lokal. Temuan ini menggarisbawahi kehandalan framework yang diusulkan: kinerja prediktif yang baik dan interpretabilitas yang ditingkatkan, yang memungkinkan para pakar untuk lebih memahami dinamika iklim yang mendasarinya. Studi ini memberikan pendekatan ML yang baru dan dapat diinterpretasikan untuk prediksi curah hujan, menjembatani kesenjangan antara kompleksitas model dan penerapan praktis. Penelitian di masa mendatang dapat memperluas kerangka kerja ini untuk menggabungkan berbagai kumpulan data, mengeksplorasi implementasi waktu nyata, dan meningkatkan interpretabilitas untuk aplikasi iklim yang lebih luas.