[TRI THỨC DỮ LIỆU & CHÍNH SÁCH - DATA & POLICY NEXUS] RA QUYẾT ĐỊNH DỰA TRÊN HỌC MÁY TRONG KỶ NGUYÊN DỮ LIỆU HIỆN ĐẠI

Hiệp hội Dữ liệu quốc gia giới thiệu bài nghiên cứu “Machine Learning Driven Decision Making in the Modern Data Era” (Tạm dịch: “Ra quyết định dựa trên học máy trong kỷ nguyên dữ liệu hiện đại”). Bài nghiên cứu được công bố trên tạp chí PERFRCT - Journal of Smart Algorithm (Tạm dịch: Tạp chí Thuật toán Thông minh PERFRCT), một ấn phẩm học thuật tập trung vào các nghiên cứu về trí tuệ nhân tạo, thuật toán và ứng dụng dữ liệu trong quản trị và công nghệ.

Công trình được thực hiện bởi nhóm tác giả gồm Hassan Raza, A. Singh, Tsendayush Erdenetsogt, Muhammad Mohsin Kabeer, Muhammad Shahrukh Aslam và Mazhar Farooq, và được phát hành trong tập3, số 1 vào ngày 06/01/2026.

Nghiên cứu bắt đầu bằng việc đặt vấn đề trong bối cảnh thế giới hiện đại, nơi các tổ chức đang tạo ra và tích lũy khối lượng dữ liệu khổng lồ từ nhiều nguồn khác nhau như tương tác trực tuyến, cảm biến, giao dịch tài chính hay hồ sơ y tế. Sự gia tăng nhanh chóng này đã mở ra những khả năng mới trong việc hiểu các vấn đề phức tạp, dự báo xu hướng và nâng cao chất lượng ra quyết định. Trong bối cảnh đó, học máy (Machine Learning - ML) nổi lên như một công cụ cốt lõi, cho phép hệ thống tự học từ dữ liệu và đưa ra dự đoán mà không cần lập trình chi tiết cho từng tình huống cụ thể. Điều này giúp vượt qua các phương pháp truyền thống vốn phụ thuộc nhiều vào trực giác con người hoặc mô hình thống kê đơn giản.

Quá trình phát triển của ra quyết định dựa trên dữ liệu cũng được phân tích qua nhiều giai đoạn. Ban đầu, các hệ thống chỉ dừng lại ở việc lưu trữ và mô tả dữ liệu. Sau đó, sự xuất hiện của các công cụ Business Intelligence (BI) và kho dữ liệu đã giúp doanh nghiệp phân tích xu hướng tốt hơn. Tuy nhiên, bước ngoặt thực sự diễn ra khi “big data” xuất hiện, kéo theo nhu cầu xử lý dữ liệu lớn, đa dạng và theo thời gian thực. Học máy trở thành giải pháp tất yếu nhờ khả năng phát hiện mẫu, cập nhật mô hình liên tục và đưa ra dự báo chính xác. Sự phát triển của điện toán đám mây càng làm cho các công nghệ này trở nên dễ tiếp cận và có khả năng mở rộng cao.

Về nền tảng, nghiên cứu chỉ ra rằng học máy được xây dựng trên bốn yếu tố chính: dữ liệu, thuật toán, thống kê và năng lực tính toán. Chất lượng dữ liệu đóng vai trò quyết định đến hiệu quả mô hình, trong khi các thuật toán như supervised learning (học có giám sát), unsupervised learning (học không giám sát) hay reinforcement learning (học tăng cường) giúp phục vụ những mục tiêu khác nhau trong phân tích và dự đoán.Đồng thời, các khái niệm thống kê cùng với năng lực xử lý của các hệ thống tính toán hiện đại - như GPU (bộ xử lý đồ họa có khả năng xử lý dữ liệu song song với tốc độ cao) và cloud computing (điện toán đám mây cho phép lưu trữ và xử lý dữ liệu qua internet mà không phụ thuộc vào máy tính cá nhân) - giúp đảm bảo mô hình hoạt động hiệu quả và có khả năng thích nghi linh hoạt với môi trường luôn biến đổi.

Bài nghiên cứu cũng làm rõ các kỹ thuật học máy được ứng dụng trong hệ thống ra quyết định, bao gồm phân loại, hồi quy, phân cụm, học tăng cường và deep learning. Những kỹ thuật này được áp dụng rộng rãi trong nhiều lĩnh vực như y tế (dự đoán bệnh), tài chính (phát hiện gian lận), thương mại điện tử (gợi ý sản phẩm), giao thông (tối ưu tuyến đường) và giáo dục (cá nhân hóa học tập). Bên cạnh đó, sự kết hợp giữa big data, điện toán đám mây và phân tích thời gian thực đã tạo nên một hệ sinh thái dữ liệu hiện đại, giúp các tổ chức đưa ra quyết định nhanh hơn và chính xác hơn.

Tuy nhiên, nghiên cứu cũng nhấn mạnh những thách thức đáng kể. Các vấn đề như chất lượng dữ liệu, thiên lệch thuật toán, thiếu minh bạch trong mô hình (black box), chi phí tính toán và nhu cầu bảo trì hệ thống đều ảnh hưởng đến độ tin cậy của học máy. Ngoài ra, các yếu tố đạo đức, pháp lý và xã hội như quyền riêng tư, công bằng và trách nhiệm giải trình cũng cần được xem xét nghiêm túc để đảm bảo việc ứng dụng AI một cách an toàn và có trách nhiệm.

Một điểm quan trọng khác là xu hướng hợp tác giữa con người và máy móc trong ra quyết định. Thay vì thay thế hoàn toàn con người, học máy đóng vai trò hỗ trợ, cung cấp dữ liệu và dự báo, trong khi con người vẫn đảm nhận việc đánh giá, cân nhắc yếu tố ngữ cảnh và đưa ra quyết định cuối cùng. Mô hình “human-in-the-loop” (Một mô hình trong đó con người tham gia trực tiếp vào quá trình ra quyết định của hệ thống AI/machine learning, thay vì để máy tự quyết hoàn toàn), mô hình này này giúp tăng tính chính xác, đồng thời đảm bảo yếu tố đạo đức và trách nhiệm.

Cuối cùng, nghiên cứu kết luận rằng học máy đã và đang làm thay đổi căn bản cách thức ra quyết định trong kỷ nguyên dữ liệu. Dù mang lại nhiều lợi ích về tốc độ, độ chính xác và khả năng thích nghi, việc triển khai học máy cần đi kèm với quản trị dữ liệu tốt, kiểm soát rủi ro và tuân thủ các chuẩn mực đạo đức. Trong tương lai, các xu hướng như Auto - Machine Learning (học máy tự động), AI giải thích được (Explainable Artificial Intelligence - XAI), phân tích thời gian thực và hợp tác người - máy sẽ tiếp tục định hình các hệ thống ra quyết định thông minh, hướng tới mục tiêu không chỉ hiệu quả mà còn minh bạch, công bằng và phù hợp với giá trị xã hội.