Phân cụm K-Means và mô hình RFM trong phân cụm khách hàng Priority Ngân hàng

Mã số
MS019
Tác giả
Vũ Minh Hoàng; Đào Văn Khánh
Đơn vị
CĐCS Vietcombank Nam Hải Phòng

1. Mục tiêu và bối cảnh

Ý tưởng ứng dụng thuật toán K-means để phân cụm khách hàng Priority ngân hàng dựa trên nhiều đặc điểm tài chính, bao gồm số dư tiền gửi bình quân 12 tháng, số dư tiền vay bình quân 12 tháng, doanh số chi tiêu thẻ 12 tháng, và các chỉ số RFM (Recency, Frequency, Monetary) của giao dịch tài khoản thanh toán. Dữ liệu của các khách hàng Priority tại chi nhánh được phân tích để xác định các phân khúc khách hàng có giá trị. Kết quả xác định được 5 cụm khách hàng riêng biệt với đặc điểm hành vi tài chính khác nhau. Nghiên cứu cung cấp những hiểu biết sâu sắc giúp các ngân hàng thiết kế chiến lược tiếp thị phù hợp, nâng cao trải nghiệm khách hàng và tối ưu hóa danh mục sản phẩm.

2. Phương pháp nghiên cứu

2.1. Dữ liệu và chỉ số sử dụng

  • TGBQ: Số dư tiền gửi bình quân 12 tháng
  • TVBQ: Số dư tiền vay bình quân 12 tháng
  • DSTHE: Doanh số chi tiêu thẻ 12 tháng
  • RFM: liên quan đến sao kê TK thanh toán 12 tháng gần nhất
  • Recency: Số ngày kể từ giao dịch gần nhất
  • Frequency: Số lượng giao dịch
  • Monetary: Tổng giá trị giao dịch

2.2. Tiền xử lý và chuẩn hóa

  • Loại bỏ dữ liệu thiếu
  • Chuẩn hóa Min-Max
  • Đảo ngược giá trị Recency để giá trị cao tương ứng với giao dịch gần

2.3. Phân cụm K-means

  • Ý tưởng áp dụng vào bộ dữ liệu cho 741 khách hàng Priority tại Chi nhánh tại thời điểm 01/01/2025, từ đó đạt được kết quả:
  • Xác định số cụm tối ưu bằng phương pháp Elbow, Silhouette, Davies-Bouldin, Calinski-Harabasz
  • Số cụm tối ưu: 5 cụm
  • Đánh giá hiệu suất:
  • Silhouette: 0.50 (Phân cụm khá tốt, cho thấy phân cụm hiệu quả.)
  • CH Index: 312.74 (Tốt, cho thấy độ gắn kết tốt trong cụm)
  • DBI: 1.08 (Trung bình, cho thấy các cụm tương đối tách biệt)

3. Kết quả phân cụm và chiến lược đề xuất

  • Dựa trên các đặc điểm phân biệt, doanh mục khách hàng được đặt tên và mô tả chi tiết cho từng cụm khách hàng như sau:
Cụm Đặc điểm chính Chiến lược ứng xử
1. Ổn định trung cấp (70.9%) Giao dịch đều, tài chính ổn định Cross/Up-selling, chăm sóc định kỳ
2. Ít hoạt động (9.7%) Giao dịch thưa, nguy cơ rời bỏ Giữ chân, đơn giản hóa dịch vụ
3. Chi tiêu cao (4.4%) Chi tiêu thẻ lớn, vay nhiều Tối ưu hóa thẻ, tư vấn tài chính
4. Cao cấp (9.0%) Giao dịch dày đặc, tài sản lớn Dịch vụ riêng biệt, đầu tư cao cấp
5. Vay tích cực (6.0%) Vay lớn, giao dịch đều Tư vấn nợ, khuyến khích tiết kiệm

4. Kết luận

Nghiên cứu này đã thành công trong việc kết hợp mô hình RFM với thuật toán phân cụm K-means để phân loại khách hàng sử dụng tài khoản thanh toán ngân hàng và các chi tiêu tài chính chủ yếu giao dịch trong 12 tháng gần nhất. Kết quả cho thấy:

  • Mô hình RFM cung cấp các chỉ số hiệu quả để đánh giá giá trị khách hàng trong ngành ngân hàng.
  • Thuật toán K-means có khả năng phân loại khách hàng thành các nhóm có ý nghĩa dựa trên hành vi giao dịch.
  • Việc phân loại khách hàng thành 5 cụm (Khách hàng ổn định trung cấp, Khách hàng ít hoạt động, Khách hàng chi tiêu cao, Khách hàng cao cấp, và Khách hàng vay tích cực) cung cấp cơ sở vững chắc cho việc phát triển các chiến lược tiếp thị và phát triển sản phẩm phù hợp với từng nhóm khách hàng.
  • Mô hình phân cụm cần được cập nhật thường xuyên để phản ánh sự thay đổi của hành vi khách hàng.
  • Kết quả phân cụm nên được tích hợp vào hệ thống quản lý quan hệ khách hàng để hỗ trợ dự báo giá trị vòng đời khách hàng và xác định khách hàng có khả năng rời bỏ.

Kết hợp K-Means và RFM đã chứng minh là công cụ hiệu quả giúp Ngân hàng nâng cao hiểu biết về khách hàng, tối ưu hóa chiến lược kinh doanh và tăng cường lợi thế cạnh tranh trong thị trường tài chính ngày càng cạnh tranh.

5. Hướng phát triển

  • Mở rộng dữ liệu: Thêm nhân khẩu học, hành vi online, mạng xã hội.
  • Phân cụm thời gian thực: Cập nhật liên tục theo hành vi mới
  • Tích hợp dự báo: Dự đoán xu hướng hành vi tương lai
  • Tối ưu thuật toán: Dùng K-means++ hoặc K-medoids
  • Ứng dụng đa kênh: Phân tích hành trình khách hàng toàn diện

Xem thêm