Bản tóm tắt
- Gemini 2.0 Flash tạo hình ảnh, văn bản và âm thanh.
- Nó cũng có thể tự động hoàn thành nhiệm vụ cho bạn.
- Nó thậm chí còn là trợ lý chơi game ảo để phân tích lối chơi theo thời gian thực.
Cập nhật AI mới nhất của Google — Song Tử 2.0 — đã có ở đây và nó nhằm mục đích trở nên thông minh hơn, nhanh hơn và có nhiều khả năng hơn bất kỳ AI sáng tạo nào khác mà bạn đã mày mò trước đây.
Không giống như người tiền nhiệm của nó, Song Tử 1.5được ra mắt cách đây mười tháng, Gemini 2.0 có thể tạo hình ảnh, tạo âm thanh bằng giọng nói có thể tùy chỉnh và thậm chí thay mặt bạn thực hiện các hành động — như điền vào biểu mẫu hoặc nhấp vào liên kết trên trang web. Nó cũng có thể chạy các tìm kiếm trên Google và thậm chí giúp bạn chơi game tốt hơn. Nói cách khác, nó không chỉ trò chuyện. Phần tốt nhất là nó có thể xử lý tất cả các tác vụ mới này trong khi được cho là nhanh gấp đôi so với phiên bản trước.
Gemini 2.0 thực sự là một nhóm mô hình AI, nhưng mẫu đầu tiên có sẵn có tên là Gemini 2.0 Flash.
Gemini 2.0 thực sự là một nhóm mô hình AI, nhưng mẫu đầu tiên có sẵn có tên là Gemini 2.0 Flash. Các nhà phát triển có thể truy cập nó thông qua Google API trong Google AI Studio và Vertex AI. Tuy nhiên, nếu bạn không phải là nhà phát triển, bạn có thể dùng thử thông qua trợ lý Gemini AI trên máy tính để bàn hoặc thiết bị di động. Chỉ cần chọn kiểu Flash 2.0 từ menu của ứng dụng.
Các tính năng nâng cao như chuyển văn bản thành giọng nói (TTS) và tạo hình ảnh hiện bị giới hạn ở các đối tác truy cập sớm của Google.
Có liên quan
Gemini vs Apple Intelligence: Nền tảng AI nào tốt hơn?
Gemini và Apple Intelligence có thể có sẵn trên thiết bị bạn đã sở hữu, nhưng thiết bị nào thực sự đáng sử dụng?
1 Đầu ra đa phương thức
Gemini 2.0 Flash làm được tất cả
Gemini 2.0 Flash hiện có thể tạo hình ảnh, văn bản và âm thanh làm đầu ra chứ không chỉ xử lý chúng làm đầu vào. Nó có thể tạo hình ảnh tùy chỉnh từ đầu bằng văn bản và tạo ra âm thanh bằng nhiều ngôn ngữ. Bạn thậm chí có thể tùy chỉnh hoàn toàn giọng nói của âm thanh. Điều này được thực hiện nhờ tính năng chuyển văn bản thành giọng nói (TTS) mới có thể điều khiển được, cho phép bạn kiểm soát âm thanh phát ra như thế nào. Bạn có thể điều chỉnh âm sắc, tốc độ, giới tính và phong cách để nó nghe có vẻ trang trọng, thân thiện hoặc bình thường tùy theo nhu cầu của bạn.
Có liên quan
Google ra mắt Gemini 2.0, mở ra kỷ nguyên của các tác nhân AI
Gã khổng lồ công nghệ đã ra mắt Gemini 2.0 trên toàn cầu và tiết lộ một số dự án thử nghiệm được hỗ trợ bởi nó.
2 AI đặc vụ
Gemini 2.0 có thể hành động giúp bạn
Agentic AI đề cập đến các bot AI có thể tự động hoàn thành các nhiệm vụ thay mặt bạn và Gemini 2.0 tận dụng tối đa khả năng này. Thay vì chỉ trả lời câu hỏi của bạn, Gemini 2.0 có thể hành động thay bạn. Ví dụ: Google sắp ra mắt Project Mariner, một tiện ích mở rộng thử nghiệm của Chrome có thể tương tác với các trang web. Nó có thể nhấp vào liên kết, điền vào biểu mẫu và điều hướng các trangkhiến nó trở thành một công cụ có giá trị cho những người cần trợ giúp điều hướng các trang web lạ hoặc xử lý các tác vụ trực tuyến lặp đi lặp lại.
Có liên quan
Google ra mắt Gemini 2.0, mở ra kỷ nguyên của các tác nhân AI
Gã khổng lồ công nghệ đã ra mắt Gemini 2.0 trên toàn cầu và tiết lộ một số dự án thử nghiệm được hỗ trợ bởi nó.
AI tác nhân đề cập đến các bot AI có thể tự động hoàn thành các nhiệm vụ thay mặt bạn.
3 Bạn đồng hành chơi game ảo
Gemini 2.0 có thể quan sát lối chơi của bạn
Gemini 2.0 đang hỗ trợ một trợ lý chơi game mới có thể quan sát lối chơi trong thời gian thực và đưa ra các mẹo chiến lược tới người chơi. Điều này được xây dựng dựa trên lịch sử sử dụng trò chơi của Google DeepMind để huấn luyện AI về logic, lập kế hoạch và tuân theo quy tắc. Giờ đây, bằng cách tận dụng khả năng suy luận của Gemini 2.0, trợ lý của Google có thể phân tích lối chơi trên màn hình và đề xuất bước đi tốt nhất tiếp theo trong thời gian thực.
Google đang hợp tác với các nhà phát triển trò chơi như Supercell để kiểm tra khả năng xử lý các thử thách trong các trò chơi như Clash of Clans.
Có liên quan
Sự khác biệt giữa Song Tử và Song Tử Trực Tiếp là gì?
Trợ lý AI của Google đã có nhiều phiên bản khó hiểu. Đây là điểm khác biệt chính giữa hai phiên bản quan trọng hơn.
4 Cập nhật dự án Astra
Hiện được cung cấp bởi Gemini 2.0
Dự án Astra hiện sử dụng Gemini 2.0. Astra là trợ lý AI phổ quát có thể nhận dạng vật thể, trợ giúp điều hướng và thậm chí xác định vị trí các vật dụng bị thất lạc — như kính của bạn. Với Gemini 2.0, Astra có khả năng trò chuyện bằng nhiều ngôn ngữhiểu giọng và xử lý các cuộc hội thoại bằng nhiều ngôn ngữ. Nó cũng có thể truy cập các công cụ như Google Tìm kiếm, Ống kính và Bản đồ, giúp nó trở nên hữu ích hơn cho việc hỗ trợ hàng ngày.
Bạn có thể dùng thử Project Astra bằng cách sử dụng trợ lý Gemini AI trên điện thoại Android.
Có liên quan
Trợ lý AI Project Astra mới của Google làm tôi ngạc nhiên, nhưng nó vẫn chưa hoàn thành
Trợ lý kỹ thuật số mới nhất của Google cần nhiều công việc hơn trước khi sẵn sàng cho người tiêu dùng sử dụng.
Được tích hợp trong ứng dụng Gemini
Gemini 2.0 hiện tận dụng trực tiếp các công cụ của Google như Google Tìm kiếm, Google Ống kính và Google Maps. Thay vì phải mở nhiều ứng dụng, bạn có thể yêu cầu Gemini xử lý tất cả ở một nơi. Cần xác định một đối tượng trong một bức ảnh? Song Tử đã hiểu rồi. Bạn muốn tìm kiếm một vị trí và nhận chỉ đường? Tất cả đều có thể thực hiện được mà không cần chuyển đổi ứng dụng.
Gemini 2.0 không chỉ là một chatbot khác. Đó là một trợ lý thực tế có thể hoạt động, tạo và tùy chỉnh các phản hồi của nó để đáp ứng nhu cầu của bạn. Từ việc tạo hình ảnh và âm thanh tùy chỉnh đến thực hiện các hành động thay mặt bạn, Gemini 2.0 thông minh hơn, nhanh hơn và hữu ích hơn bao giờ hết.
Tuy nhiên, các tính năng nâng cao như chuyển văn bản thành giọng nói (TTS) và tạo hình ảnh hiện bị giới hạn ở các đối tác truy cập sớm của Google.
Có liên quan
4 tính năng này của Google Gemini giúp cuộc sống của tôi dễ dàng hơn rất nhiều
Kể từ khi chuyển sang Google Pixel 9 Pro, tôi đã dựa vào Gemini AI để xử lý một số nhiệm vụ nhàm chán trước đây.