Báo chí dữ liệu: Giải pháp cho tương lai báo chí trong kỷ nguyên số

11/06/2025

Trong kỷ nguyên số, dữ liệu trở thành "nguyên liệu" quan trọng cho mọi hoạt động báo chí. Việc người làm báo thành thạo trong việc thu thập dữ liệu từ nhiều nguồn, biết cách xử lý phân tích dữ liệu bằng các công cụ thống kê và trí tuệ nhân tạo sẽ là kỹ năng quan trọng để tòa soạn đó phát triển bền vững trong kỷ nguyên số.

Số hóa dữ liệu để xây dựng mô hình dữ liệu lớn cho tòa soạn

Báo chí dữ liệu là một loại hình báo chí đa phương tiện mà ở đó, nhà báo nắm bắt được cách thức xác minh, sàng lọc, liên kết, phân tích và sắp xếp các dữ liệu thống kê để kể một câu chuyện bằng hình ảnh trực quan, dễ hiểu cho độc giả. Ở góc nhìn hiện đại, báo chí dữ liệu không đơn thuần là việc sử dụng số liệu để minh họa cho một câu chuyện, mà đằng sau đó là một cuộc cách mạng một bước đột phá về thu thập, phân tích và trình bày thông tin.

Sản phẩm báo chí dữ liệu được tạo ra từ sự kết hợp giữa kỹ năng báo chí truyền thống và khả năng làm việc với dữ liệu lớn (big data), khả năng thống kê và các công cụ trực quan hóa. Bằng cách khai thác sức mạnh của con số và thuật toán, báo chí dữ liệu mở ra góc nhìn mới mẻ, đa chiều, có sự biến động và giải mã những vấn đề phức tạp của xã hội, chính trị, kinh tế... Mọi thứ đều được thể hiện bằng những con số thống kê cụ thể, thay vì chỉ đánh giá chung chung mang tính cảm tính, thiếu khách quan.

Ngoài ra, báo chí nhờ AI cũng có khả năng phân tích dữ liệu phản hồi từ công chúng, xu hướng ngành hoặc hành vi tiêu dùng để đề xuất các chiến dịch phù hợp – điều vốn đòi hỏi nhiều thời gian và nguồn lực khi con con người đảm nhiệm.

Luôn đi tắt đón đầu, vận dụng linh hoạt những công nghệ tiên tiến vào hoạt động, nhiều cơ quan báo chí của trong nước đã phối hợp với những công ty công nghệ về dữ liệu của người Việt để xây dựng và hình thành nên hệ thống quản lý, khai thác, sử dụng dữ liệu của riêng tòa soạn mình. Rất nhiều đơn vị xác định trong chuyển đổi số và xây dựng tòa soạn thông minh, dữ liệu đóng vai trò rất quan trọng, là tài sản, tài nguyên và là điều kiện tiên quyết để thực hiện chuyển đổi số. Việc phát triển báo chí dữ liệu là điều kiện tiên quyết để hướng đến sự phát triển ổn định và bền vững cho mỗi tòa soạn.

PGS,TS Nguyễn Thành Lợi, Tổng Biên tập Báo Kinh tế & Đô thị cho biết, trong những năm gần đây chúng tôi đã tập trung đầu tư hệ thống lưu trữ cho hệ thống dữ liệu nội bộ, lưu trữ ảnh báo chí, xây dựng được cơ sở dữ liệu cho báo điện tử, báo in và các ấn phẩm phục vụ tốt cho mô hình tòa soạn hội tụ. Hiện báo đang tập trung đầu tư sản xuất các sản phẩm báo chí dữ liệu đồng thời đưa cơ sở dữ liệu lên các nền tảng số.

“Năm 2025, chúng tôi phát triển và xây dựng các sản phẩm báo chí số, nền tảng số, số hóa dữ liệu để xây dựng mô hình dữ liệu lớn, từ đó xây dựng và triển khai mô hình kinh tế số, triển khai dịch vụ thu phí đọc báo dựa trên các nền tảng ICT của báo. Đồng thời, xây dựng các công cụ thu thập dữ liệu, đánh giá, dự báo, theo dõi, giám sát chất lượng báo chí. Hình thành trung tâm dữ liệu Kinh tế & Đô thị, xây dựng các dịch vụ để chuyển hóa dữ liệu phục vụ phát triển kinh tế số” PGS,TS Nguyễn Thành Lợi chia sẻ thêm.

Ngoài Báo Kinh tế & Đô thị, nhiều cơ quan báo chí khác cũng xây dựng hệ thống dữ liệu vào hoạt động của tòa soạn. Như gần đây nhân dịp kỷ niệm 50 năm Ngày Giải phóng miền Nam, thống nhất đất nước, Báo Sài Gòn Giải Phóng (SGGP) chính thức ra mắt công trình báo chí dữ liệu. Công trình sử dụng các công cụ AI để số hóa, phân tích và trình bày dữ liệu, từ chuyển văn bản thành âm thanh, khôi phục các trang báo bị hỏng, đến nhận diện đặc trưng hình ảnh và tìm kiếm nhanh thông tin. Công trình được trình bày dưới nhiều hình thức đa phương tiện như Longform, Infographic và video, giúp bạn đọc dễ dàng tiếp cận thông tin và trải nghiệm.

Báo chí dữ liệu xu hướng không thể đảo ngược

Không thể phủ nhận việc ứng dụng báo chí dữ liệu vào đời sống, tuy nhiên mọi thứ đều có tồn tại bên cạnh những mặt tích cực mà công nghệ mang lại. Nhờ dữ liệu, người làm báo có thể tạo bài viết nhanh chóng từ dữ liệu lớn, nhưng nội dung bài viết mà công cụ tạo ra thường khô cứng, thiếu chiều sâu phân tích, ngôn ngữ khuôn mẫu và không tạo được kết nối cảm xúc với độc giả.

Nhận định về việc này, ThS. Nguyễn Phương Anh – Học viện Báo chí và Tuyên truyền chia sẻ: Mặc dù AI có thể thay thế con người ở khâu trình bày dữ liệu, nhưng nó chưa đủ khả năng thay thế tư duy phản biện, cái nhìn nhân văn và đạo đức nghề nghiệp của nhà báo. Vấn đề đặt ra là làm sao để khai thác AI hiệu quả, mà vẫn giữ được bản lĩnh, trách nhiệm và đạo đức người làm báo trong kỷ nguyên số.

ThS. Nguyễn Phương Anh nhận định: “Về bản chất, AI chỉ có thể tạo ra phản hồi dựa trên kho dữ liệu đã được đưa vào, hoàn toàn thiếu cảm xúc con người hay nhận thức sâu sắc về bối cảnh lịch sử, kinh tế, văn hóa, xã hội cụ thể, không có lý tưởng báo chí, không có sự nhạy cảm chính trị, càng không mang trong mình các giá trị nhân văn hay ý thức trách nhiệm xã hội như nhà báo, những lao động sống gắn bó trực tiếp với thực tiễn đời sống”.

Thực tế cho thấy, các hệ thống AI có thể tự động tạo nội dung dựa trên dữ liệu đầu vào, nhưng lại không có khả năng thẩm định giá trị đạo đức, độ tin cậy của nguồn tin hay bối cảnh lịch sử, xã hội cụ thể. Điều này dễ dẫn đến việc lan truyền thông tin sai lệch, tin giả, tin giật gân hoặc nội dung phiến diện, phân biệt gây tổn thương đến tổ chức, cá nhân.

Có thể nói, việc sử dụng báo chí dữ liệu sẽ là xu hướng không thể đảo ngược với mỗi cơ quan báo chí. Tuy nhiên, điều quan trọng nhất là sử dụng như thế nào, việc đào tạo, hướng dẫn cho người làm báo xây dựng kho dữ liệu và khai thác bài bản, tạo ra hiệu quả cao ra sao.

Để giải quyết bài toán này, Tiến sĩ Lương Đông Sơn, giảng viên Viện Báo chí - Truyền thông, Học viện Báo chí và Tuyên truyền cho rằng: “Cần bổ sung các môn học chuyên sâu về báo chí dữ liệu và phân tích dữ liệu lớn. Trong kỷ nguyên số, dữ liệu trở thành "nguyên liệu" quan trọng cho mọi hoạt động báo chí. Chương trình đào tạo bồi dưỡng sẽ giúp người làm báo, sinh viên báo chí thành thạo trong việc thu thập dữ liệu từ nhiều nguồn và xử lý dữ liệu, phân tích dữ liệu bằng các công cụ thống kê và trí tuệ nhân tạo. Có như vậy mới trực quan hóa dữ liệu thành biểu đồ và đồ họa thông tin và cuối cùng là kể chuyện bằng dữ liệu một cách hấp dẫn”.

Trong kỷ nguyên số, dữ liệu trở thành nguồn tài nguyên quý giá để phát hiện các xu hướng, các thông tin ẩn hoặc các mẫu hành vi của công chúng. Mỗi nhà báo cần có khả năng khai thác, xử lý và phân tích dữ liệu từ các nguồn khác nhau như mạng xã hội, cơ sở dữ liệu công khai, hoặc dữ liệu thu thập qua các hệ thống tự động.

Điều này đòi hỏi kiến thức về các phương pháp thống kê, phân tích dữ liệu, cũng như kỹ năng sử dụng các công cụ, phần mềm phân tích dữ liệu chuyên dụng. Chỉ như vậy các nhà báo, phóng viên mới có thể tạo ra các nội dung có chiều sâu, chính xác, phản ánh đúng các xu hướng đang diễn ra, giúp độc giả hiểu rõ hơn về các vấn đề phức tạp.