Dữ liệu "lên sàn": dễ bàn, khó bán

HOA KIM 23/10/2024 06:37 GMT+7

TTCT - Một sàn giao dịch nơi dữ liệu có thể được mua bán một cách công khai, minh bạch và hợp pháp là mô hình phù hợp với nhu cầu thực tế nhưng không dễ triển khai hiệu quả.

Dữ liệu "lên sàn":dễ bàn, khó bán - Ảnh 1.

Ảnh: McKinsey

Kinh nghiệm quốc tế cho thấy dữ liệu là một món hàng có nhu cầu cao nhưng lại không dễ mua bán, nhất là khi mục tiêu là quản lý các giao dịch này một cách quy củ.

Một nhu cầu cấp thiết

Theo IBM, sàn giao dịch dữ liệu là một nền tảng trực tuyến nơi các nhà cung cấp và bên tiêu thụ dữ liệu có thể đăng bán, mua sắm và trao đổi dữ liệu. "Tại các cửa hàng kỹ thuật số này, nhà cung cấp có thể quảng bá, quản lý và bán dữ liệu của mình một cách hiệu quả, trong khi người tiêu dùng có thể khám phá, so sánh và mua nhiều tập dữ liệu khác nhau thông qua giao diện tự phục vụ thân thiện với người dùng" - trang chủ công ty công nghệ Mỹ viết.

Thường được lưu trữ trên các dịch vụ đám mây, những nền tảng này cho phép bên bán dễ dàng tải lên bộ dữ liệu mà họ có, trong khi bên mua cũng được hỗ trợ bởi các tính năng tìm kiếm và bộ lọc nâng cao để tìm kiếm dữ liệu phù hợp với từng yêu cầu cụ thể.

Trước đây, bên có nhu cầu mua dữ liệu cần tiếp cận nhiều nhà cung cấp khác nhau, đàm phán hợp đồng và quản lý việc chuyển dữ liệu theo một quy trình khá phức tạp. Sự phổ biến của dữ liệu lớn (big data) đã khiến một sàn giao dịch tập trung cho dữ liệu trở thành yêu cầu cấp thiết đối với các doanh nghiệp muốn biến dữ liệu trở thành món hàng dễ tiếp cận và dễ sử dụng hơn cho các sáng kiến công nghệ mới, chẳng hạn như huấn luyện các mô hình ngôn ngữ lớn phục vụ trí tuệ nhân tạo (AI).

"Các tổ chức trong nhiều ngành nghề khác nhau hiểu rằng dữ liệu họ thu thập và tạo ra không chỉ là phụ phẩm của hoạt động kinh doanh mà còn là tài sản có giá trị có thể được tận dụng để đạt được lợi thế cạnh tranh" - IBM giải thích.

Các doanh nghiệp có thể sử dụng dữ liệu để duy trì và mở rộng vị thế thị trường của họ. Chẳng hạn, các chuỗi bán lẻ sử dụng dữ liệu để quản lý hàng tồn kho hiệu quả hơn, dự đoán xu hướng bán hàng và tối ưu hóa khâu hậu cần. Các công ty công nghệ phân tích dữ liệu người dùng để cải thiện tính năng sản phẩm và nhắm mục tiêu quảng cáo hiệu quả hơn.

Khi năng lực học máy (machine learning) và AI được nâng cao, dữ liệu nội bộ của các tổ chức không còn đủ để xây dựng các mô hình chính xác và có ý nghĩa, càng thúc đẩy nhu cầu tiếp cận kho dữ liệu đồ sộ do các bên thứ ba cung cấp. 

Bên thứ ba ở đây không chỉ là các công ty tư nhân chuyên kinh doanh dữ liệu mà còn có thể là các chương trình dữ liệu mở của chính phủ hay dữ liệu từ hệ thống cảm biến tích hợp trong những đô thị thông minh, theo IBM.

Đừng để dữ liệu "ngồi không"

Đầu năm 2024, Văn phòng Nội các Vương quốc Anh ký thỏa thuận trị giá 4,2 triệu bảng Anh để xúc tiến kế hoạch xây dựng một sàn giao dịch dữ liệu đóng vai trò như một "cánh cửa chính", qua đó công chức nhà nước có thể truy cập và chia sẻ thông tin được tạo ra bởi các cơ quan chính phủ khác nhau, trang Public Technology đưa tin.

Kế hoạch xây dựng nền tảng này được trình bày lần đầu trong lộ trình dữ liệu và kỹ thuật số liên chính phủ năm 2022, sau đó một phiên bản chứng minh tính khả thi của nền tảng đã được hoàn thiện. 

Thỏa thuận lần này được ký với công ty công nghệ Agrimetrics - một đơn vị có kinh nghiệm xây dựng sàn giao dịch dữ liệu trong lĩnh vực môi trường, thực phẩm và nông nghiệp - và kéo dài 14 tháng để phát triển phiên bản thử nghiệm nội bộ cho 5 cơ quan chính phủ chủ chốt sử dụng.

Theo bản thỏa thuận do Public Technology dẫn lại, nền tảng do Agrimetrics phát triển dự kiến cho phép "xuất bản và thu thập siêu dữ liệu chuẩn hóa hiệu quả giữa các cơ quan chính phủ từ danh mục dữ liệu của các sở ban ngành và các kho lưu trữ khác". 

Một mục tiêu khác là xây dựng quy trình công việc chuẩn hóa đối với việc chia sẻ dữ liệu giữa các cơ quan, đồng thời tích hợp nó vào các quy trình hiện hữu. Sàn giao dịch này cũng sẽ cung cấp giải pháp quản lý định danh và phân quyền người dùng đối với từng dịch vụ cụ thể.

Nền tảng mà Anh đang muốn xây dựng chỉ là một phần nhỏ của thị trường dữ liệu được định giá hàng nghìn tỉ USD, theo Ngân hàng Thế giới (WB). Còn theo Diễn đàn kinh tế thế giới (WEF), đến năm 2025 lượng dữ liệu được tạo mới mỗi năm được dự báo sẽ vượt 175 zettabyte - đơn vị tính tương đương 175.000 tỉ gigabyte, tăng gấp 5 lần so với năm 2018. Tuy nhiên, phần lớn dữ liệu này sẽ "ngồi không trong các máy chủ và ổ cứng - không được sử dụng, không được phân tích, và có lẽ tệ hơn cả là không được chia sẻ" - WEF phân tích.

Dữ liệu chỉ có giá trị khi nó nằm trong tay đúng người, và những con số thống kê vô nghĩa của người này có thể là mỏ vàng của người khác. "Nếu người đó là nhà dịch tễ học, nhà khoa học môi trường hay thành viên lực lượng cứu nguy khẩn cấp trong thiên tai, giá trị của dữ liệu được chia sẻ còn có thể được tính bằng mạng sống" - WEF giải thích.

Món hàng đặc biệt

Dù biết dữ liệu là mỏ vàng, nhiều đơn vị đã thử và thất bại trong việc xây dựng một sàn giao dịch dữ liệu thành công. Trang cung cấp nền tảng chia sẻ dữ liệu Harbrdata dẫn một số ví dụ về các nền tảng sàn giao dịch dữ liệu từng phải nói lời chia tay trong quá khứ: Microsoft Azure Data Marketplace đóng cửa năm 2018, Kasabi đóng cửa năm 2012 sau 2 năm hoạt động, BuzzData với mô hình "xã hội hóa dữ liệu" cũng ngậm ngùi ngừng hoạt động năm 2013 sau 3 năm ra mắt...

Có nhiều lý do gây thất bại của các mô hình kinh doanh một món hàng tưởng chừng cung không đủ cầu này. Đầu tiên, không giống với những món hàng "trao tay" có thể xác định quyền sở hữu một khi giao dịch hoàn tất, dữ liệu là thứ có thể dễ dàng sao chép.

Đối với sàn giao dịch chứng khoán, khi đã khớp lệnh, cổ phiếu xem như không còn thuộc về bên bán, và chỉ một người có thể sở hữu cổ phiếu đó tại một thời điểm. 

"Dữ liệu thì khác. Nó có thể được sao chép, đồng nghĩa bạn có thể bán hoặc tặng nó cho một bên khác trong khi vẫn giữ nó để sử dụng cho riêng mình. Dữ liệu có thể có nhiều "chủ sở hữu" cùng lúc" - WEF giải thích. 

Điều này tạo ra thách thức đặc thù đối với giao dịch dữ liệu khi thứ được quan tâm nhiều hơn là tính xác thực thay vì tính độc quyền: dữ liệu này có chính xác không? Liệu nó có từng bị thay đổi hoặc can thiệp kể từ thời điểm thu thập hay không?

Dữ liệu "lên sàn":dễ bàn, khó bán - Ảnh 2.

Những tính chất đặc thù của "món hàng" dữ liệu cũng khiến việc xây dựng một sàn giao dịch chúng trở nên đặc biệt khó khăn. 

Theo trang Harbrdata, dữ liệu có thể được thay đổi đến mức không còn khả năng truy nguyên về hình thái ban đầu của nó: một người dùng có thể lấy một bảng dữ liệu thô rồi "dọn dẹp" nó, kết hợp với những tập dữ liệu khác, và thực hiện các thao tác tính toán để cho ra một báo cáo không còn đặc điểm nhận dạng gì của dữ liệu ban đầu. 

Điều này khiến việc xác định các giao dịch dữ liệu bất hợp pháp hoặc "đánh bản quyền" dữ liệu của đơn vị cung cấp chính thức trở nên khó khăn.

Thách thức cuối cùng là định giá dữ liệu sao cho hợp lý khi giá trị của dữ liệu có thể dao động rất lớn phụ thuộc vào mục đích sử dụng, đối tượng khách hàng, thẩm quyền đối với dữ liệu và cả kiến thức của các bên liên quan. "Điều này có thể dẫn đến các cuộc thương thảo kéo dài, có khả năng diễn ra với nhiều bên cùng lúc" - Harbrdata nhận xét.

Nói cách khác, xây dựng sàn giao dịch dữ liệu là một chuyện, làm sao cho người ta sử dụng nó là chuyện khác. Như WEF kết luận: "Làn sóng dữ liệu đang dâng cao của thế giới có thể được sử dụng cho mục đích tốt, nhưng đầu tiên chúng ta cần biết cách chia sẻ những dữ liệu đó".

Tháng 7-2024, trang Netzpolitik (Đức) đưa tin sàn giao dịch dữ liệu Databroker của Bỉ gần như đã "cho không biếu không" dữ liệu cá nhân của hàng ngàn người là công dân Đức, Pháp, Bỉ, Hà Lan, Hungary, Estonia và Anh. Theo đó, suốt vài tuần, ai cũng có thể tải chỗ dữ liệu này từ trang chủ của Databroker, được xem là "hàng mẫu" để khách tham khảo trước khi quyết định bỏ tiền mua bản đầy đủ.

Databroker không sử hữu những dữ liệu này, nhưng đóng vai trò như một sàn giao dịch trung gian nơi người dùng có thể mua bán dữ liệu. Những thông tin bị rò rỉ có vẻ như là dữ liệu thật khi Netzpolitik đã tiếp cận nhiều cái tên xuất hiện trong danh sách và được họ xác nhận thông tin cá nhân bị lộ là chính xác.

Bình luận Xem thêm
Bình luận (0)
Xem thêm bình luận