“Dữ liệu lớn” ở thời “thông tin là vàng bạc”

(TBKTSG) – Hiện nay, dân chúng tại nhiều nước có thể bầu tổng thống, đại biểu quốc hội… bằng cách lên mạng chọn người mình muốn bầu, nhắp chuột vi tính là hoàn thành nhiệm vụ công dân. Thế nhưng có rủi ro là hệ thống bầu cử hiện đại ấy dễ bị tin tặc thâm nhập và có thể gây ảnh hưởng đến kết quả. Nhiều nước châu Âu đang trong mùa bầu cử đã lên tiếng đe nẹt sẽ ra tay nếu tin tặc phá đám.

Càng hòa nhập, nối mạng, càng rủi ro. Sao không bầu cử như Gambia – một nước châu Phi: mỗi lá phiếu là một viên bi ve, người đi bầu thích ai thì lấy viên bi bỏ vào thùng dán hình người đó, ai được nhiều bi thì người đó đắc cử.

Những nơi nối mạng Internet chê Gambia lạc hậu, nhưng nơi bầu bằng nhắp chuột chắc gì đã an toàn!

Thời của “dữ liệu lớn”

Nhưng đúng là con người hiện đại hôm nay không thoát khỏi mối quan hệ ràng buộc, tương tác của cơ sở dữ liệu kỹ thuật số mà nay được nhiều người Việt biết tới với cái tên gọi “dữ liệu lớn”. Công nghệ tin học hiện đại và kỹ thuật số, cộng với băng thông Internet đã mở ra khả năng khai thác thông tin với khối lượng khổng lồ.

Hàng tỉ tỉ hành động, hành vi, suy nghĩ, trao đổi… của con người đều được nạp vào các máy chủ, miễn ở đâu có nối mạng với hệ thống máy chủ tìm kiếm dữ liệu như thư điện tử, mạng xã hội hay những trang mua bán trực tuyến…, tất tất đều được (hay bị) nạp liệu và tồn trữ.

Sức mạnh chi phối của dữ liệu lớn

Nhờ kỹ thuật số, mọi hành tung của con người đều được chuyển thành thông tin và được các máy chủ ghi lại. Ngoài phương tiện Internet, nền công nghệ kỹ thuật số đang cập nhật và phát triển cực nhanh các thiết bị kết nối và tồn trữ dữ liệu, như hệ thống phát hiện sự hiện diện của con người, hệ thống định vị toàn cầu GPS, các dữ liệu tiêu thụ điện, hệ thống liên lạc nội thành…, tất cả đều nằm trong các ổ “dữ liệu lớn”.

Nên đừng vội tưởng rằng con người ta sống với đầy đủ phương tiện, thông tin liên lạc, kết nối toàn cầu… là được tự do. Không như vậy đâu. Hãy nhớ rằng mỗi chúng ta đều bị các hoạt động của nguồn dữ liệu lớn chi phối. Khi nói điện thoại, gửi một tin nhắn, trao đổi e-mail, thậm chí đi gửi xe…, bạn đã tạo nên dấu vết. Giả sử có ai đó ghi lại các hành tung ấy, tích vào nguồn dữ liệu trong máy chủ của họ dưới dạng kỹ thuật số… thì đó chính là “nguồn vốn” có thể kiếm bộn tiền. Các thông tin ấy càng trở nên rất đắt giá nếu chúng được xếp đặt, phân tích và cho kết quả nhanh như Google, Yahoo, Facebook, Twitter… Có lẽ vì vậy mà ngày nay người ta có câu vè: “Muốn con hay chữ cứ tra Google”!

Như vậy, “dữ liệu lớn” là sự chuyển đổi tất cả hành động, hành vi tương tác “vô tổ chức” của chúng ta thành những thông tin được xếp đặt ổn định cho một hệ thống như Google, Yahoo, Microsoft, Apple, Facebook, Twitter, Gmail… và vô số máy chủ tìm dữ liệu, mạng xã hội, hệ thống mua bán nối mạng trực tuyến khác. Cứ mỗi giây đồng hồ có hàng tỉ tỉ dữ liệu được “nhập thô” vào máy cái mà theo các chuyên gia, sau mỗi 18 tháng, khối lượng dữ liệu lại tăng gấp đôi. Chính vì thế, các “chủ chứa” phải tìm các công thức thông minh và nhanh nhất để phân tích và phân loại dữ liệu. Họ sẵn sàng tặng miễn phí công cụ phân tích và phân loại để người sử dụng tiện dùng theo từng mục đích riêng của mình, và cũng nhờ đó mà người sử dụng cứ tưởng mình được phục vụ chứ không bị phụ thuộc.

Thông tin là vàng bạc

Xưa có câu “thì giờ là vàng bạc”, nay lại có thêm câu “thông tin là vàng bạc”. Khi một doanh nghiệp cần số liệu thống kê của một thị trường nào đó, chẳng hạn như khuynh hướng tiêu dùng ô tô, thì đó chính là lúc các chủ máy “tung chiêu”. Thậm chí trong sản xuất và kinh doanh ô tô, qua phân tích dữ liệu lớn, người ta biết rõ đến từng chi tiết: vùng này thích xe hiệu gì, chạy bằng xăng hay diesel, vùng kia thích nội thất gì, màu nào…

Những phần mềm phân tích dữ liệu thông minh có thể cho một vị bác sĩ chuyên khoa ung bướu biết ở khu vực nào có nhiều bệnh nhân hơn, hoặc giúp các hãng bảo hiểm tránh rủi ro khi đưa ra các sản phẩm bảo hiểm cho một xứ, một vùng.

Tại các sàn chứng khoán, đặc biệt trên thị trường tài chính phái sinh như các sàn giao dịch kỳ hạn và quyền chọn hàng hóa nông sản chẳng hạn, nếu người tham gia chỉ cần biết vị thế dư mua dư bán trước 1/100 giây đồng hồ, một quỹ đầu tư có thể lật thế cờ kiếm hàng trăm triệu đô la Mỹ nếu làm chủ được dữ liệu, khuynh hướng… đã được tích trữ trong các máy cái ở các trung tâm dữ liệu kinh tế. Chỉ cần một cú nhắp chuột “bán” hay “mua”, người nắm thông tin sẽ bán tháo hay mua khống kiếm lời. Tại nhiều cuộc hội thảo về thị trường tài chính phái sinh, các công ty môi giới cứ “khoe” hệ thống giao dịch của họ liên thông với sàn này sàn nọ nhưng hình như chưa thấy hết ngọn nguồn…, vậy thì có khác gì giao khách hàng và tài sản của mình như “giao trứng cho ác”.

“Ăn cắp như rươi”

Có vị chuyên gia trong ngành “dữ liệu lớn” từng than rằng mình sống ở thời hiện đại nhưng bị ăn cắp còn hơn thời trung cổ, nhưng khổ là ít ai biết và chú ý. Đã không ít lần danh sách điện thoại, địa chỉ e-mail, các chi tiết cá nhân của khách hàng như số tài khoản ngân hàng, địa chỉ nhà riêng… bị rò rỉ. Thật ra, có ai khác ngoài người trong các công ty cung cấp dịch vụ đem bán lấy tiền triệu, tiền tỉ?

Ở tầm quốc gia thì các nước “nghe lén” nhau để tìm thông tin kinh tế, quốc phòng, an ninh… nhằm đi trước đối thủ một bước.

Trong năm vừa qua, có hai vụ tin tặc gây ồn ào dư luận và công ty bị hại mất hàng chục, thậm chí hàng trăm triệu đô la Mỹ.

Tháng 8-2016, một nhóm tin tặc đem rao bán khoảng 200 triệu chi tiết các tài khoản Yahoo gồm tên người sử dụng, mật khẩu, ngày sinh, e-mail… từ năm 2012, mỗi dữ liệu được rao bán 3 bitcoins hay chừng 1.860 đô la Mỹ.

Không bao lâu sau, giá trị cổ phiếu đồng tiền ảo bitcoin giảm mạnh sau khi có tin hệ thống giao dịch của đồng tiền này bị tin tặc thâm nhập và kéo mất số tiền tương đương 60 triệu đô la Mỹ. Thiệt đơn thiệt kép khi sàn giao dịch Bitfinex ở Hồng Kông xác nhận mất tiền thông qua lỗ hổng kỹ thuật trên mạng xã hội, giá trị đồng tiền này giảm ngay 20%.

Hình như nhiều doanh nghiệp vẫn còn xem nhẹ thông tin từ “dữ liệu lớn”. Thời nay đâu có ai tặng bạn bữa cơm trưa miễn phí! Xây dựng trung tâm dữ liệu, thu nạp, phân tích và khai thác thông tin… đang là miếng đất màu mỡ của khởi nghiệp. Thế mà hiếm có, dù là một trung tâm nghiên cứu hay một trường đại học, chịu đứng ra cáng đáng việc này để phục vụ quốc kế dân sinh. Việc tổ chức và xây dựng hệ thống dữ liệu cho riêng mình càng chậm, “chảy máu” thông tin và chất xám càng nhiều, đất nước càng chịu phụ thuộc vào nguồn thông tin nước khác.

Xây dựng và bảo vệ nguồn thông tin “dữ liệu lớn” chính là vì nền độc lập dân tộc, vì sự nghiệp phát triển kinh tế thời số hóa.

NGUYỄN QUANG BÌNH, đăng trên TBKTSG ngày 23/3/2017

Hits: 89