1. Nhận biết dạng thức và giá trị của một tài nguyên mới trong cách mạng công nghiệp 4.0
Tại sao hiện nay người ta coi dữ liệu là một tài nguyên mới?
Vài thập niên gần đây nhân loại đã bắt đầu vào một trình độ phát triển mới với các dấu hiệu đổi mới trong quá trình sản xuất, trao đổi, tiêu dùng và quản lý. Các Mác (Karl Marx) có một tư tưởng: Thời đại này khác với thời đại khác không phải ở chỗ chúng sản xuất ra cái gì mà là ở chỗ sản xuất bằng phương thức nào.
Chúng ta đang ở điểm giao thời của thời đại mà tài nguyên - một trong những “đầu vào” của các quá trình kể trên, đang được bổ sung một dạng thức mới: dữ liệu thông tin. Thật ra, nó không mới, vì quá trình sản xuất hàng hóa của nhân loại, từ lâu đã bắt đầu bằng những dữ liệu thông tin. Chẳng hạn chúng góp phần trả lời câu hỏi mà bất cứ doanh nghiệp nào cũng phải đặt ra: sản xuất cái gì, bán cho ai, làm thế nào để tối ưu hóa giá trị.
Nhưng trong kỷ nguyên kinh tế tri thức hiện nay, vấn đề dữ liệu đang xuất hiện mạnh mẽ hơn, có vai trò to lớn hơn trước đây rất nhiều. Nhiều nhà nghiên cứu đã coi nó như tài nguyên, là vốn thậm chí là tài sản để định đoạt quy mô của một doanh nghiệp. Trước đây người giàu có được lượng hóa tài sản bằng tiền bạc, đất đai, tư liệu sản xuất... đã sở hữu hoặc chiếm dụng được, thì ngày nay quy mô giàu có và quyền lực lại thêm một thước đo mới: sở hữu được nhiều dữ liệu, thông tin. Dữ liệu là một trong những tài sản ảo của một chủ thể.

Vậy dữ liệu là gì? Nhận thức một cách khái quát nhất, dữ liệu (data) là một một khái niệm rộng dùng để chỉ một số thông tin hoặc kiến thức hiện có (bao gồm các số liệu, dữ kiện, hình ảnh, sự kiện, xu hướng...) diễn ra trong đời sống, được nhận thức của con người phản ánh, ghi nhận và được máy tính điện tử mã hóa. Nó giúp cho người ta những giai đoạn ban đầu của nhận thức lý tính: cảm giác, tri giác, biểu tượng và khái niệm; sau khi đã đủ dữ liệu thì phán đoán và suy lý là công việc cuối của nhận thức con người. Trước đây khi chưa có cơ sở dữ liệu (database) trên máy tính thì con người hầu như phải làm trọn các khâu của quá trình nhận thức, để từ đó mà đưa ra các quyết định một cách “thủ công”. Dĩ nhiên công việc đó vô cùng vất vả, chậm chạp và thường là ít ỏi.
Trong sản xuất, dịch vụ và quản lý hiện đại, dữ liệu và thông tin đã được coi là đầu vào của các quá trình thực tiễn. Hiệu quả của các quá trình này về cơ bản được quy định bởi 2 yếu tố là công nghệ và quyết định của nhà sản xuất hoặc nhà quản lý. Quyết định như thế nào lại tùy thuộc vào việc anh ta có đủ hay không các dữ liệu đầu vào.
Các dạng thức tồn tại của dữ liệu
Hiện nay khoa học về dữ liệu đã phân loại nó theo một số tiêu chí gắn liền với vai trò là tài nguyên, qua đó ta thấy được một vài dạng thức tồn tại cơ bản:
Dữ liệu là “tài nguyên thô” hay “dữ liệu không có cấu trúc”, bao gồm các con số, sự kiện, vấn đề... khá rời rạc, “trung tính” và mang nhiều hàm ý khác nhau tùy theo chủ thể nhận thức tiếp nhận dữ liệu. Ví dụ thông tin về biến đổi khí hậu toàn cầu đang diễn ra ở Nam Mỹ với hạn hán hoặc lụt lội, có thể “trung tính” với người nghe bình thường và là dữ liệu không có cấu trúc; nhưng với người sản xuất cà phê ở Việt Nam là một dữ liệu tham khảo có ích để đưa ra quyết định về sản xuất và giá cả... Trên thế giới hiện nay, 80% dữ liệu là dữ liệu “tài nguyên thô”.
Dữ liệu là “tài nguyên tinh” hay dữ liệu đã được xử lý hoặc “dữ liệu có cấu trúc” là những thông tin đã được sắp xếp, có hệ thống, có định hướng, khá chính xác và có ý nghĩa, có giá trị với người tiếp nhận để từ đó ra các quyết định đúng đắn. Trên thế giới hiện nay chỉ có 20 % dữ liệu được coi là tài nguyên tinh, tức là dữ liệu đã được xử lý. Chẳng hạn, các dữ liệu về xu thế cạn kiệt tài nguyên dầu mỏ than đá; về ứng xử giảm phát thải cacbon để giảm hiện tượng khí hậu trái đất nóng lên; xu thế thay thế các loại xe có động cơ đốt trong dùng xăng dầu bằng các loại xe chạy bằng điện; hệ quả là tăng nhu cầu về đất hiếm để chế tạo ắc quy - pin... Tất cả thông tin trên đều là những dữ liệu có cấu trúc và hữu ích với nhà quản trị quốc gia để ra quyết định về “tăng cường quản lý tài nguyên đất hiếm”.
Điểm qua một vài dạng thức tồn tại của dữ liệu để thấy rằng với người Việt Nam, nó không quá xa lạ. Nhiều người trong chúng ta đang tham gia vào quá trình xây dựng, xử lý, sử dụng và tái tạo tài nguyên dữ liệu một cách tự giác hoặc không tự giác.
Cần hiểu rõ hơn về tài nguyên dữ liệu
Vốn là một quốc gia đang phát triển, ở nước ta không phải ai cũng đã hiểu và sử dụng đúng đắn về tài nguyên “mới” này. Các nghiên cứu của khoa học dữ liệu và quản trị thông tin cho biết:
Trước hết, có sự khác biệt giữa dữ liệu và thông tin. Dữ liệu có thể là một tập hợp tản mạn với những con số, sự kiện, tư liệu tản mạn và chưa rõ ý nghĩa, giá trị. Khi nó được xắp xếp, chỉnh lý và có tính định hướng cho một hoạt động với ý nghĩa rõ ràng và hữu ích cho việc ra quyết định thì khi đó mới là thông tin. Như vậy dữ liệu phải qua xử lý mới là thông tin. Thông tin là kết quả của việc xử lý và sắp xếp dữ liệu.
Dữ liệu và thông tin đều có tính đa trị:
Nó là tiền đề của các quyết định trong sản xuất, dịch vụ và quản lý. Thiếu thông tin rất có thể đưa ra những quyết định thiếu chính xác. Ở góc độ này dữ liệu và thông tin là tài nguyên, là đầu vào cho quá trình ra quyết định.
Mặt khác, dữ liệu có thể có giá trị hữu ích với người này, nhưng lại “trung tính” với người khác là bởi trình độ sản xuất, góc tiếp cận và nhu cầu khác nhau. Trình độ sản xuất càng cao thì nhu cầu về thông tin càng lớn. Gần nửa thế kỷ trước, Việt Nam mới chỉ bán những cái mình có. Đến nay, trong quá trình đổi mới và hội nhập, nền kinh tế hướng tới xuất khẩu của nước ta đã “bán những cái mà thế giới cần”. Muốn đạt tới trình độ cao của sản xuất hàng hóa thì trước tiên phải đầy đủ các thông tin về nhu cầu khách hàng, đặc điểm của thị trường, phương thức tiếp thị...
Dữ liệu và thông tin có thể giống nhau nhưng cách xử lý khác nhau có thể đưa đến kết quả những kết quả khác nhau. Sự khác biệt này, xét đến cùng lại do lượng thông tin - tri thức tích lũy được của chủ thể xử lý dữ liệu. Truyện cổ tích “Đồng tiền Vạn Lịch” có những chi tiết thú vị: người chồng là dân chài cầm thoi vàng ném đuổi gà vì anh ta không biết đó là vật có giá trị cao. Người vợ trách, anh ta bảo vì không biết, nhưng anh đã thấy thứ này khá nhiều dưới sông. Như vậy, thiếu thông tin và thông tin chưa được xử lý, kết nối là vấn đề lớn nhất.

Hiểu rõ các đặc tính của dữ liệu
Dữ liệu nảy sinh từ hoạt động thực tiễn cho nên nó tăng lên hàng ngày, theo cấp số nhân. Theo đó, quá trình tích lũy và xử lý dữ liệu là không ngừng.
Lĩnh vực nào cũng cần dữ liệu và thông tin và có thể thông tin của lĩnh vực này là dữ liệu của lĩnh vực khác, vì vậy quản trị dữ liệu đã trở thành một ngành sản xuất, vì nó giúp cho tất cả các lĩnh vực hoạt động có hiệu quả.
Dữ liệu và thông tin đang ngày càng trở nên cần thiết và có giá trị cao; cho nên các hoạt động liên quan như trao đổi dữ liệu, tích hợp, tái sử dụng dữ liệu, chuyển từ sở hữu riêng dữ liệu sang chia sẻ dữ liệu sử dụng chung và cùng hưởng các lợi ích mà dữ liệu mang lại... thì các vấn đề như đánh cắp thông tin, thông tin giả, lộ lọt thông tin... cũng xuất hiện thường xuyên và cần được quản trị bằng các bộ luật với sự hỗ trợ của các công nghệ hiện đại.
2. Nhận thức đầy đủ giá trị và đẩy mạnh khai thác, tái tạo và bảo vệ tài nguyên dữ liệu để đất nước phát triển với trình độ mới
Sự nghiệp đẩy mạnh toàn diện CNH, HĐH và chủ động tích cực hội nhập với thế giới đang hướng tới CMCN 4.0 là cơ sở thực tiễn để chúng ta đổi mới tư duy về khai thác và sử dụng dữ liệu.
Nhận thức dữ liệu là tài nguyên mới của quốc gia, yếu tố then chốt cho quá trình chuyển đổi số là một tư duy mới trong quản trị quốc gia. Quan điểm chung mà “Chiến lược dữ liệu quốc gia đến năm 2030” nêu rõ là: “Dữ liệu là nguồn tài nguyên mới, là yếu tố then chốt cho chuyển đổi số quốc gia, tạo ra giá trị mới thúc đẩy phát triển kinh tế - xã hội, nâng cao năng lực cạnh tranh quốc gia và phục vụ lợi ích người dân.”
Với tầm nhìn: “Dữ liệu của Việt Nam mở ra không gian hoạt động và phát triển mới cho Chính phủ số, kinh tế số và xã hội số; cơ bản phản ánh đầy đủ mọi mặt hoạt động kinh tế - xã hội trên môi trường số và là nhân tố thúc đẩy tăng năng lực cạnh tranh quốc gia, đảm bảo cho tiến trình chuyển đổi số thành công, đưa Việt Nam trở thành quốc gia số an toàn. Dữ liệu góp phần chuyển đổi cơ cấu nền kinh tế, đưa Việt Nam vượt qua mức thu nhập trung bình thấp, đạt mức thu nhập trung bình cao vào năm 2030 và đạt mức thu nhập cao vào năm 2045.”
Mục tiêu của Chiến lược này đến năm 2030 bao gồm: “Phát triển hạ tầng dữ liệu”, “Phát triển dữ liệu phục vụ Chính phủ số”, “Phát triển dữ liệu phục vụ kinh tế số, xã hội số” và “Bảo đảm an toàn thông tin, an ninh mạng”.
Để khai thác, sử dụng, làm giàu và bảo vệ tài nguyên mới này, Thủ tướng Chính phủ xác định ba trọng tâm: Một là đẩy mạnh việc tạo lập dữ liệu thông qua việc kết nối, chia sẻ, khai thác các cơ sở dữ liệu quốc gia; Hai là đẩy mạnh đầu tư phát triển, nâng cấp, hiện đại hóa hạ tầng số. Ba là, tăng cường công tác truyền thông về chuyển đổi số.
Chủ thể của quá trình này không chỉ là các bộ, ngành, địa phương mà còn là toàn dân. Chung tay với Đảng và Nhà nước, tham gia tích cực vào quá trình xây dựng, xử lý, chia sẻ và bảo vệ dữ liệu và thông tin, mỗi người dân hãy góp phần để xây dựng chính phủ số, xã hội số và Việt Nam trở thành một quốc gia phát triển thông minh.