Gã khổng lồ công nghệ đã dùng Hội nghị các nhà phát triển thường niên Google I/O 2024 để giới thiệu tới người dùng hàng loạt những sản phẩm mang đậm dấu ấn AI, trong đó có "mô hình trí tuệ nhân tạo nhẹ nhất và hiệu quả nhất". Google ra mắt hai phiên bản Gemini 1.5 Flash và Gemini 1.5 Pro với mức giá khác nhau.
Đây có thể coi là câu trả lời của Google dành cho đối thủ OpenAI với phiên bản GPT-4o mới nhất.
Google cho biết, Gemini 1.5 Flash có thể nhanh chóng tóm tắt các cuộc hội thoại, chú thích hình ảnh và video cũng như trích xuất dữ liệu từ các tài liệu và bảng dữ liệu lớn.
Phiên bản Gemini 1.5 Pro mới có thể hiểu được khổi lượng tài liệu khoảng 1.500 trang hoặc tóm tắt 100 email. Công cụ này cũng có thể xử lý một giờ nội dung video hoặc 30.000 dòng code.
"Bạn có thể nhanh chóng nhận được câu trả lời và thông tin chi tiết về các tài liệu dày đặc, chẳng hạn như tìm hiểu chi tiết về chính sách dành cho thú cưng trong hợp đồng thuê nhà hoặc so sánh các lập luận từ nhiều tài liệu nghiên cứu dài", đại diện Google cho hay.
Tại hội nghị, Google đã trình diễn tính năng "Gemini Live", trong đó Live là cách mới để trò chuyện với AI trên điện thoại, sử dụng công nghệ giọng nói chuyên biệt để làm cho việc trò chuyện với AI trở nên tự nhiên và dễ dàng.
Với câu hỏi của người dùng về việc chuẩn bị cho cuộc phỏng vấn xin việc với nghề pha đồ uống, Gemini ngay lập tức đưa ra các gợi ý như xem video về cách pha chế một số đồ uống đơn giản và luyện tập pha chế chúng tại nhà trước. Cuộc trò chuyện diễn ra tự nhiên, gần như người dùng đang nói chuyện với một người khác.
Điều ấn tượng nhất là nhân viên Google có thể ngắt lời Gemini giữa chừng, thêm hoặc thay đổi nội dung, giống như việc trò chuyện với một người bạn. Gemini phản ứng với những sự gián đoạn này một cách chuyên nghiệp và điều chỉnh các đề xuất và cuộc trò chuyện cho phù hợp.
CEO Google Sundar Pichai tại sự kiện Google I/O 2024
Ông Demis Hassabis, Giám đốc điều hành của Google DeepMind, cho biết: "Chúng tôi đã nghe từ các nhà phát triển rằng họ muốn thứ gì đó nhanh hơn và thậm chí tiết kiệm chi phí hơn".
Tại hội nghị, Google cũng công bố một số tính năng AI mới sẽ xuất hiện trên các sản phẩm và dịch vụ trong đó có tích hợp Gemini Nano vào trình duyệt Chrome. Người dùng điện thoại Pixel 8 series và Galaxy S24 đã có thể truy cập vào mô hình này, nó có thể sẽ sớm được đưa lên những thương hiệu điện thoại khác.
Gemini phiên bản mới được Google ra mắt trong bối cảnh những gã khổng lồ công nghệ tập trung phát triển những mô hình AI tổng hợp. Các chuyên gia nhận định những mô hình này có tầm quan trọng đặc biệt với Google bởi nó cung cấp cho người dùng những cách thức sáng tạo và tiên tiến hơn để truy cập thông tin so với tìm kiếm trên web truyền thống.
Trước Google 1 ngày, OpenAI cũng đã cho ra mắt mô hình AI mới và phiên bản ChatGPT dành cho máy tính để bàn, cùng giao diện mới. Công ty cho biết mô hình mới với tên gọi GPT-4o, nhanh gấp đôi GPT-4 Turbo và giá thành chỉ bằng một nửa. Công cụ mới của ChatGPT cũng có khả năng xử lý 50 ngôn ngữ khác nhau.
* Mời quý độc giả theo dõi các chương trình đã phát sóng của Đài Truyền hình Việt Nam trên TV Online và VTVGo!