Trang ứng dụng DeepSeek hiển thị trên màn hình điện thoại tại Bắc Kinh, ngày 28/1/2025. (Ảnh: AP)
Theo Reuters, công ty khởi nghiệp trí tuệ nhân tạo DeepSeek ngày 24/4 đã giới thiệu bản xem trước của mô hình mới mang tên V4, được tối ưu để hoạt động trên nền tảng chip của Huawei.
Động thái này đánh dấu sự thay đổi so với trước đây khi DeepSeek chủ yếu sử dụng chip của Nvidia. Tuy nhiên, công ty không công bố cụ thể loại vi xử lý được dùng để huấn luyện mô hình mới.
Theo DeepSeek, phiên bản Pro của V4 có hiệu suất vượt nhiều mô hình mã nguồn mở trong các bài kiểm tra kiến thức tổng hợp, chỉ đứng sau Gemini-Pro-3.1 - một mô hình không mã nguồn mở. Ngoài ra, V4 cũng có phiên bản “flash” với chi phí thấp hơn. Đây mới là bản xem trước nhằm thu thập phản hồi trước khi hoàn thiện, và chưa có thời điểm ra mắt chính thức.
Việc công bố diễn ra trong bối cảnh căng thẳng công nghệ Mỹ - Trung gia tăng. Trước đó một ngày, Nhà Trắng cáo buộc Trung Quốc đánh cắp tài sản trí tuệ từ các phòng thí nghiệm AI của Mỹ, trong khi DeepSeek bị Washington nghi vi phạm kiểm soát xuất khẩu khi tiếp cận chip tiên tiến của Nvidia. Các công ty như OpenAI và Anthropic cũng cho rằng DeepSeek đã “chắt lọc” trái phép mô hình của họ.
DeepSeek thừa nhận từng sử dụng chip Nvidia nhưng chưa xác nhận liệu các chip này có nằm trong diện bị hạn chế xuất khẩu hay không. Công ty cho biết các mô hình trước đó được huấn luyện bằng dữ liệu thu thập tự nhiên từ Internet.
Về phía Trung Quốc, Đại sứ quán nước này tại Washington bác bỏ các cáo buộc và khẳng định Bắc Kinh coi trọng bảo vệ quyền sở hữu trí tuệ.
Trong khi đó, Huawei cho biết đã hợp tác chặt chẽ với DeepSeek để đảm bảo các mô hình V4 có thể chạy trên toàn bộ hệ thống hiệu năng cao thuộc dòng chip Ascend, một phần trong chiến lược giảm phụ thuộc vào công nghệ bán dẫn của Mỹ.
Kể từ khi Washington siết hạn chế xuất khẩu chip AI từ năm 2022, Trung Quốc đã đẩy mạnh tự chủ công nghệ, tạo cơ hội cho các doanh nghiệp nội địa như Huawei phát triển.
Sự nổi lên nhanh chóng của DeepSeek từ đầu năm 2025 cũng thúc đẩy xu hướng mô hình AI chi phí thấp, mã nguồn mở tại Trung Quốc, đồng thời gây áp lực cạnh tranh lên các công ty trong nước. Sau khi thông tin về V4 được công bố, cổ phiếu của một số doanh nghiệp AI Trung Quốc đã giảm mạnh.
Theo một báo cáo gần đây, DeepSeek đang tìm cách huy động vốn với định giá trên 20 tỷ USD, trong khi các tập đoàn lớn như Alibaba và Tencent được cho là đang cân nhắc đầu tư.
Bạn không thể gửi bình luận liên tục.
Xin hãy đợi 60 giây nữa.