Google dùng AI Gemini đọc tin tức để dự báo lũ quét

Bằng cách phân tích hàng triệu bài báo, mô hình AI của Google đã tạo ra một bộ dữ liệu đột phá để dự báo một trong những thảm họa thiên nhiên khó lường nhất.

Lũ quét là một trong những hiện tượng thời tiết nguy hiểm nhất thế giới và cũng là một trong những thảm họa khó dự báo nhất. Tuy nhiên, Google tin rằng họ đã tìm ra lời giải cho bài toán này bằng một phương pháp độc đáo: để AI đọc tin tức.

Vấn đề cốt lõi nằm ở việc thiếu hụt dữ liệu. Dù con người đã thu thập một lượng lớn dữ liệu thời tiết, lũ quét lại xảy ra quá nhanh và mang tính cục bộ, khiến việc đo lường toàn diện trở nên bất khả thi, không giống như cách nhiệt độ hay dòng chảy của sông được theo dõi liên tục. Khoảng trống dữ liệu này khiến các mô hình học sâu, vốn ngày càng có khả năng dự báo thời tiết, không thể dự đoán chính xác về lũ quét.

Để giải quyết vấn đề này, các nhà nghiên cứu của Google đã sử dụng Gemini - mô hình ngôn ngữ lớn của hãng - để sàng lọc 5 triệu bài báo từ khắp nơi trên thế giới. Từ đó, AI đã phân lập các báo cáo về 2,6 triệu trận lũ khác nhau và biến chúng thành một chuỗi dữ liệu thời gian được gắn thẻ địa lý có tên là "Groundsource". Theo Gila Loike, giám đốc sản phẩm tại Google Research, đây là lần đầu tiên công ty sử dụng mô hình ngôn ngữ cho loại công việc này.

Với "Groundsource" làm cơ sở dữ liệu thực tế, các nhà nghiên cứu đã huấn luyện một mô hình khác xây dựng trên mạng thần kinh Long Short-Term Memory (LSTM). Mô hình này tiếp nhận các dự báo thời tiết toàn cầu và tạo ra xác suất xảy ra lũ quét ở một khu vực nhất định.

Hiện tại, mô hình dự báo lũ quét của Google đang làm nổi bật các rủi ro cho các khu vực đô thị ở 150 quốc gia trên nền tảng Flood Hub của công ty, đồng thời chia sẻ dữ liệu với các cơ quan ứng phó khẩn cấp trên toàn thế giới. Ông António José Beleza, một quan chức ứng phó khẩn cấp tại Cộng đồng Phát triển Nam Phi, người đã thử nghiệm mô hình này, cho biết nó đã giúp tổ chức của ông ứng phó với lũ lụt nhanh hơn.

Tuy nhiên, mô hình này vẫn còn những hạn chế. Độ phân giải của nó còn khá thấp, chỉ xác định rủi ro trong các khu vực rộng 20 km vuông. Mô hình cũng không chính xác bằng hệ thống cảnh báo lũ của Dịch vụ Thời tiết Quốc gia Mỹ, một phần vì không tích hợp dữ liệu radar địa phương, vốn cho phép theo dõi lượng mưa theo thời gian thực.

Dù vậy, mục tiêu chính của dự án là hoạt động hiệu quả ở những nơi chính quyền địa phương không đủ khả năng đầu tư vào cơ sở hạ tầng cảm biến thời tiết đắt đỏ hoặc không có hồ sơ dữ liệu khí tượng sâu rộng. Juliet Rothenberg, giám đốc chương trình thuộc nhóm Resilience của Google, cho biết: "Bằng cách tổng hợp hàng triệu báo cáo, bộ dữ liệu Groundsource thực sự giúp tái cân bằng bản đồ. Nó cho phép chúng tôi ngoại suy đến các khu vực khác, nơi có ít thông tin hơn".

Nhóm nghiên cứu hy vọng rằng việc sử dụng các mô hình ngôn ngữ lớn để phát triển bộ dữ liệu định lượng từ các nguồn văn bản định tính có thể được áp dụng để dự báo các hiện tượng quan trọng khác như sóng nhiệt và sạt lở đất. 

Bạn cần đăng nhập để thực hiện chức năng này!

Bình luận không đăng nhập

Bạn không thể gửi bình luận liên tục.
Xin hãy đợi 60 giây nữa.