Trợ lý AI của Google, Gemini, được thiết lập để giới thiệu các tính năng thú vị để cung cấp cho người dùng Android những cách mới để tương tác trực quan hơn với các thiết bị của họ. Tận dụng các khả năng nâng cao, Gemini sẽ sớm cho phép người dùng đặt câu hỏi về nội dung trên màn hình của họ, giống như tính năng chia sẻ màn hình hiện có trong Gemini 2.0 trên máy tính để bàn.
Trong một thông báo gần đây, Google đã tiết lộ các chức năng Gemini này, tập trung vào các câu hỏi tương tác và trên màn hình thời gian thực. Các tính năng này là một phần của dự án của Google Astra.
Chức năng mới
https://cdn.mos.cms.futurecdn.net/7nwGRGuGuB9HbZe2LuLFQi-480-80.gif 480w, https://cdn.mos.cms.futurecdn.net/7nwGRGuGuB9HbZe2LuLFQi-650-80.gif 650w, https://cdn.mos.cms.futurecdn.net/7nwGRGuGuB9HbZe2LuLFQi-970-80.gif 970w, https://cdn.mos.cms.futurecdn.net/7nwGRGuGuB9HbZe2LuLFQi-1024-80.gif 1024w, https://cdn.mos.cms.futurecdn.net/7nwGRGuGuB9HbZe2LuLFQi-1200-80.gif 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/7nwGRGuGuB9HbZe2LuLFQi.gif" data-pin-media="https://cdn.mos.cms.futurecdn.net/7nwGRGuGuB9HbZe2LuLFQi.gif"/>
Chức năng chia sẻ màn hình cho phép người dùng chia sẻ màn hình của họ với Song Tử và đặt câu hỏi dựa trên nội dung được hiển thị. Chẳng hạn, trong khi xem hình ảnh của một chiếc áo khoác, người dùng có thể yêu cầu các đề xuất giày để bổ sung cho trang phục.
Các tương tác video trực tiếp, chắc chắn là một phản hồi trực tiếp đối với tùy chọn giọng nói và tầm nhìn của TATGPT, cho phép người dùng tham gia vào các cuộc trò chuyện thời gian thực về môi trường xung quanh bằng cách cho phép máy ảnh trong ứng dụng Gemini.
Chức năng này cho phép Gemini cung cấp những hiểu biết dựa trên các nguồn cấp dữ liệu video trực tiếp, tương tự như trải nghiệm cuộc gọi video.
Các cải tiến này định vị Song Tử là trợ lý AI đa năng có khả năng hiểu và tương tác với nội dung trực quan để cung cấp hỗ trợ được cá nhân hóa và nhận thức theo ngữ cảnh hơn.
Tích hợp với các ứng dụng hiện có
https://cdn.mos.cms.futurecdn.net/rB7TJJ7XEyGFJGxq6ctoq3-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/rB7TJJ7XEyGFJGxq6ctoq3-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/rB7TJJ7XEyGFJGxq6ctoq3-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/rB7TJJ7XEyGFJGxq6ctoq3-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/rB7TJJ7XEyGFJGxq6ctoq3-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/rB7TJJ7XEyGFJGxq6ctoq3.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/rB7TJJ7XEyGFJGxq6ctoq3.jpg"/>
Các tính năng mới của Gemini được thiết kế để tích hợp liền mạch với các ứng dụng khác nhau như YouTube. Bây giờ, trong khi xem video, người dùng có thể kích hoạt Gemini để đặt câu hỏi về nội dung.
Ví dụ, người dùng có thể hỏi về một kỹ thuật cơ bắp hoặc thể dục cụ thể trong một hướng dẫn tập thể dục.
Ngoài ra, khi xem PDF, tùy chọn “Hỏi về PDF này” cho phép người dùng có được tóm tắt hoặc làm rõ, hợp lý hóa quy trình nghiên cứu mà không chuyển sang máy tính để bàn.
Các tính năng này nhằm mục đích làm cho việc truy xuất thông tin trực tiếp hiệu quả hơn, giảm nhu cầu tìm kiếm thủ công và nâng cao năng suất người dùng.
Dự án Astra
https://cdn.mos.cms.futurecdn.net/8UqjpR8BrHxfJLgXLGhi5-480-80.png 480w, https://cdn.mos.cms.futurecdn.net/8UqjpR8BrHxfJLgXLGhi5-650-80.png 650w, https://cdn.mos.cms.futurecdn.net/8UqjpR8BrHxfJLgXLGhi5-970-80.png 970w, https://cdn.mos.cms.futurecdn.net/8UqjpR8BrHxfJLgXLGhi5-1024-80.png 1024w, https://cdn.mos.cms.futurecdn.net/8UqjpR8BrHxfJLgXLGhi5-1200-80.png 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/8UqjpR8BrHxfJLgXLGhi5.png" data-pin-media="https://cdn.mos.cms.futurecdn.net/8UqjpR8BrHxfJLgXLGhi5.png"/>
Sự phát triển của các tính năng này thuộc dự án Astra của Google, một sáng kiến trợ lý AI đa phương thức. Dự án Astra tìm cách tạo ra một trợ lý để nhận thức và hiểu môi trường của nó, tạo điều kiện cho các tương tác tự nhiên hơn.
Bằng cách cho phép Gemini diễn giải các đầu vào trực quan và tham gia vào các cuộc trò chuyện theo ngữ cảnh, Google đang tiến tới trải nghiệm AI hấp dẫn hơn.
Có sẵn
Google có kế hoạch triển khai các tính năng này cho các thuê bao Advanced Advanced trên các thiết bị Android vào cuối tháng này.
Việc Google giới thiệu các khả năng nhận biết màn hình trong Song Tử đánh dấu một khoảnh khắc quan trọng trong phát triển trợ lý AI. Bằng cách cho phép người dùng đặt câu hỏi về nội dung trên màn hình, Song Tử đang vượt ra ngoài việc xem thụ động sang các trải nghiệm tương tác, nâng cao tiện ích của AI trong cuộc sống hàng ngày.
Khi các tính năng này trở nên có sẵn rộng rãi, chúng có tiềm năng xác định lại kỳ vọng của người dùng và đặt điểm chuẩn mới cho những gì trợ lý AI có thể đạt được.
Thêm từ hướng dẫn của Tom
Xem chi tiết và đăng kýKhám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.