Song Tử Live sắp trở nên thú vị hơn khi sử dụng

Bản tóm tắt

  • Google đang cập nhật Song Tử trực tiếp với các kỹ năng ngôn ngữ nâng cao và khả năng dịch thuật cho các tương tác mượt mà hơn.

  • Gemini Live cũng được thiết lập để mở rộng với chia sẻ màn hình và các tính năng phát video trực tiếp trong khi chỉ duy trì bảng điểm trò chuyện.

  • Gemini 2.0 đánh dấu sự khởi đầu của “ERA tác nhân” với Flash, một mô hình nhanh hơn có khả năng tạo hình ảnh, lời nói và văn bản.

Nói chuyện với AI thường cảm thấy như một thứ gì đó từ một bộ phim khoa học viễn tưởng, nhưng bây giờ nó chỉ là một phần của cuộc sống hàng ngày, cảm ơn các công cụ như Gemini Live. Với quyền truy cập ngay lập tức từ điện thoại của bạn, các trợ lý AI này đang thay đổi cách chúng tôi tương tác với công nghệ. Và Google không dừng lại ở đó, nó làm cho Song Tử sống thậm chí còn mượt mà hơn và hấp dẫn hơn để giữ cho các cuộc trò chuyện cảm thấy tự nhiên.

Màn hình thảo luận trực tiếp Gemini mở trên Pixel 9 Pro XL

Có liên quan

Gemini của Google là gì?

Trợ lý giọng nói mới của Google

Trong một email cho người dùng, Google đã tiết lộ một bản nâng cấp lớn cho Gemini Live, đóng gói trong mô hình AI mới nhất của mình để làm cho nó thông minh hơn. Mặc dù công ty đang giữ sự kết thúc của Nitty-gritty, nhưng có một điều rõ ràng: Song Tử Live đã đạt được các kỹ năng nâng cao hơn trong việc hiểu các ngôn ngữ, điểm nhấn và phương ngữ khác nhau, cộng với khả năng dịch thuật của nó mạnh hơn bao giờ hết.

Gemini Live cũng đang chuẩn bị cho những cách kết nối lớn hơn, bao gồm chia sẻ màn hình và phát video trực tiếp, theo email của Google. Để làm cho các tính năng này hoạt động trơn tru, Google sẽ bắt đầu lưu trữ dữ liệu âm thanh, video và màn hình của bạn trong hoạt động ứng dụng Song Tử của bạn (nếu được bật). Ngay bây giờ, chỉ có bảng điểm trò chuyện được lưu.

Cập nhật trực tiếp Song Tử

Song Tử 2 tạo ra hình ảnh, lời nói và văn bản

Với việc triển khai Gemini 2.0 vào cuối năm ngoái, API trực tiếp đa phương thức đã cung cấp cho các nhà phát triển các công cụ để xử lý tất cả các loại đầu vào, văn bản, âm thanh, video và phát ra phản hồi văn bản hoặc âm thanh. Rất có khả năng Gemini Live đang khai thác API này để cung cấp năng lượng cho các tính năng của nó, như đã ghi nhận bởi 9to5Google.

Google đang gọi Song Tử 2 là sự khởi đầu của “ERA đại lý”. Mô hình này ngang bằng với O1 của Openai nhưng với phần thưởng: nó có thể tạo ra hình ảnh, lời nói, văn bản, và nhiều hơn nữa. Lần đầu tiên trong đội hình là Gemini 2.0 Flash, mặc dù bây giờ nó vẫn được dán nhãn là “thử nghiệm”. Theo Google, Flash nhanh gấp đôi so với người tiền nhiệm, Gemini Pro 1.5 và đánh bại nó trên các điểm chuẩn hiệu suất chính.

Khi Song Tử 1.0 đến, về cơ bản chúng tôi đã ở sâu trong kỷ nguyên “Chatbot”, bạn có thể trò chuyện và sử dụng để đánh bật nội dung. Nhưng sau đó, O1 của Openai lăn vào, và mọi thứ đã thay đổi kể từ đó. Đột nhiên, chúng tôi đang ở trong “thời đại lý luận”, nơi AI có thể nghĩ giống chúng tôi hơn, đồng thời, “kỷ nguyên đại lý” đã khởi động, nơi AI bắt đầu tự mình làm nhiều hơn.


Khám phá thêm từ Phụ Kiện Đỉnh

Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.

Khám phá thêm từ Phụ Kiện Đỉnh

Đăng ký ngay để tiếp tục đọc và truy cập kho lưu trữ đầy đủ.

Tiếp tục đọc