ABSTRAK
Di sektor keuangan, risiko kredit merupakan masalah kritis, dan prediksi yang akurat sangat penting untuk mengurangi risiko keuangan dan memastikan stabilitas ekonomi. Meskipun metode kecerdasan buatan dapat mencapai akurasi yang memuaskan, menjelaskan hasil prediktifnya menimbulkan tantangan yang signifikan, sehingga mendorong penelitian tentang interpretabilitas. Penelitian saat ini terutama berfokus pada metode interpretabilitas individu dan jarang menyelidiki aplikasi gabungan dari beberapa pendekatan. Untuk mengatasi keterbatasan penelitian yang ada, studi ini mengusulkan model interpretabilitas dua tahap yang mengintegrasikan SHAP dan penjelasan kontrafaktual. Pada tahap pertama, SHAP digunakan untuk menganalisis pentingnya fitur, mengkategorikan fitur menjadi subset menurut dampak positif atau negatifnya pada hasil yang diprediksi. Pada tahap kedua, algoritma genetika menghasilkan penjelasan kontrafaktual dengan mempertimbangkan pentingnya fitur dan menerapkan gangguan dalam berbagai arah berdasarkan subset yang telah ditentukan sebelumnya, sehingga secara akurat mengidentifikasi sampel kontrafaktual yang dapat mengubah hasil yang diprediksi. Kami melakukan eksperimen pada kumpulan data kredit Jerman, kumpulan data HMEQ, dan kumpulan data Taiwan Default of Credit Card Clients menggunakan SVM, XGB, MLP, dan LSTM sebagai pengklasifikasi dasar. Hasil eksperimen menunjukkan bahwa frekuensi perubahan fitur dalam penjelasan kontrafaktual yang dihasilkan sangat sesuai dengan pentingnya fitur yang diperoleh dari metode SHAP. Berdasarkan metrik evaluasi efektivitas dan kelangkaan, kinerja menunjukkan peningkatan baik pada metode penjelasan kontrafaktual dasar maupun kontrafaktual berbasis prototipe. Lebih jauh, studi ini menawarkan rekomendasi berdasarkan fitur yang diperoleh dari hasil analisis SHAP dan penjelasan kontrafaktual untuk mengurangi risiko klasifikasi sebagai gagal bayar.
Model Interpretabel Dua Tahap untuk Menjelaskan Klasifikasi dalam Prediksi Risiko Kredit
