Quay trở lại danh sách
TẠP CHÍ SỐ 192

Phạm Thủy Tú - Ứng dụng các thuật toán machine learning trong thẩm định hồ sơ tín dụng tại ngân hàng

13/09/2024 14:13:52
Từ khóa: Hồ sơ tín dụng, máy học (machine learning), ngân hàng, thẩm định tín dụng.
JEL Classifications: C53; E37; G17; G21; E27.
Mã số: 192.3FiBa.31

Ứng dụng các thuật toán Machine Learning thẩm định hồ sơ tín dụng được đánh giá mang lại nhiều thế mạnh trong xử lý dữ liệu tài chính. Nghiên cứu ứng dụng các thuật toán như Logistic Regression, Naive BayesK-Nearest NeighborsDecision Tree, Random Forest, Support Vector Machine, XGBoost mô phỏng khả năng phân loại hồ sơ tín dụng tại ngân hàng theo ba loại: tốt, xấu và đủ tiêu chuẩn. Kết quả thu được cho thấy Random Forest mang lại hiệu suất cao nhất với độ chính xác trên 92%; Naive Bayes, K-Nearest NeighborsDecision Tree đạt hiệu suất dự đoán trên 80%; Logistic Regression và Support Vector Machine mang lại hiệu suất thấp (59% và 48%). Nhằm tăng cường tính phù hợp của dữ liệu đầu vào huấn luyện, nghiên cứu cũng sử dụng kết hợp một số kỹ thuật tiền xử lý dữ liệu như: tạo biến mới phù hợp với tiêu chí đánh giá từ bộ dữ liệu ban đầu, gán nhãn, xử lý giá trị ngoại lệ, phân tích lựa chọn đặc trưng tốt nhất, chuẩn hoá dữ liệu, cân bằng dữ liệu,... Kết quả cho thấy các kỹ thuật tiền xử lý dữ liệu cải thiện hiệu suất huấn luyện. Các kết quả thu được kỳ vọng có thể bổ sung thêm bằng chứng thực nghiệm đáng tin cậy cho các nghiên cứu khác có liên quan đến đề tài thẩm định hồ sơ tín dụng bằng các thuật toán machine learning.