Công nghệ

"Bố già AI'" tại Meta ca ngợi DeepSeek của Trung Quốc

Tuấn Anh (Theo Business Insider)

29/01/2025 08:47 GMT+7

VTV.vn - Ông Yann LeCun, Giám đốc khoa học AI của Meta, đánh giá thành công của DeepSeek đã chứng minh rằng các mô hình AI mã nguồn mở đang vượt qua các sản phẩm độc quyền.

Theo ông LeCun, bài học lớn nhất từ thành công của DeepSeek không nằm ở sức ép cạnh tranh ngày càng tăng từ Trung Quốc, mà ở giá trị của việc duy trì các mô hình AI mã nguồn mở, giúp mọi người có thể tiếp cận và hưởng lợi.

"Không phải AI của Trung Quốc đang "vượt qua Mỹ", mà chính các mô hình mã nguồn mở đang vượt qua các mô hình độc quyền", ông LeCun viết trên mạng xã hội Threads.

Mô hình R1 của DeepSeek cũng là mã nguồn mở, tương tự như Llama của Meta. Trong khi đó, OpenAI - vốn được thành lập như một công ty AI mã nguồn mở với sứ mệnh tạo ra công nghệ phục vụ toàn nhân loại - gần đây đã chuyển hướng sang phát triển mã nguồn đóng. Ông LeCun nhận định DeepSeek đã "được hưởng lợi từ nghiên cứu mở và mã nguồn mở".

CEO Meta Mark Zuckerberg, một người luôn ủng hộ mạnh mẽ các mô hình mã nguồn mở, khẳng định rằng AI sẽ tiếp tục là trọng tâm trong chiến lược phát triển của Meta. "Một phần mục tiêu của tôi trong 10 - 15 năm tới là xây dựng các nền tảng mở và đưa chúng đến thành công. Tôi tin rằng điều này sẽ thúc đẩy ngành công nghệ trở nên sôi động hơn rất nhiều", ông nói hồi tháng 9/2024.

Những người ủng hộ mã nguồn mở lập luận rằng cách tiếp cận này cho phép công nghệ phát triển nhanh chóng, vì bất kỳ ai cũng có thể chỉnh sửa và phân phối lại mã nguồn. Tuy nhiên, các bên ủng hộ mã nguồn đóng lại cho rằng cách tiếp cận này an toàn hơn vì mã nguồn được giữ kín, khó chỉnh sửa và phát tán hơn.

Logo ứng dụng DeepSeek trên điện thoại (Ảnh: AFP)

Vào cuối tháng 12/2024, DeepSeek đã gây chú ý khi công bố mô hình ngôn ngữ lớn (LLM) DeepSeek V3 miễn phí. Dù vẫn tồn tại một số hạn chế trong phản hồi, mô hình này được đánh giá cao nhờ chỉ mất hai tháng để xây dựng với chi phí chưa đến 6 triệu USD. DeepSeek sử dụng GPU H800 đã bị Nvidia hạ cấp sức mạnh để tuân thủ lệnh cấm của Mỹ, thay vì các dòng chip AI mạnh nhất hiện nay.

Theo DeepSeek, mô hình được đào tạo trên tập dữ liệu khổng lồ gồm 14,8 nghìn tỷ token, cùng 671 tỷ tham số - lớn hơn khoảng 1,6 lần so với Llama 3.1 405B của Meta.

Tuy nhiên, V3 chưa phải là sản phẩm duy nhất. Ngày 20/1, DeepSeek tiếp tục ra mắt mô hình mới mang tên DeepSeek R1 với khả năng lý luận vượt trội và đã có mã nguồn trên Github. Theo đánh giá từ một số tổ chức bên thứ ba, DeepSeek R1 thậm chí còn thể hiện vượt trội hơn so với mô hình mới nhất của OpenAI trong nhiều bài kiểm tra hiệu năng.

Cùng với ông Geoffrey Hinton và ông Yoshua Bengio, ông Yann LeCun là một trong ba người được mệnh danh là "Godfather of AI" (Bố già AI). Với vai trò là người đặt nền móng cho trí tuệ nhân tạo hiện đại, ông LeCun nổi tiếng với quan điểm phủ nhận việc AI sẽ thống trị thế giới - điều hoàn toàn trái ngược với các tuyên bố mang tính cảnh báo của những doanh nhân như tỷ phú Elon Musk.