Microsoft lần đầu tiên ra mắt Copilot Vision vào tháng 10 năm 2024 cho trình duyệt Edge, cho phép người dùng truy vấn nội dung trang web.
Giờ đây, Copilot Vision đang mở rộng sang ứng dụng Copilot Mobile, đạt được các tính năng đa phương thức để phân tích video và hình ảnh thời gian thực.
Tính năng được cập nhật này, tương tự như Gemini Live của Google, hiện chỉ có sẵn cho các thuê bao Copilot Pro trong Hoa Kỳ thông qua chế độ thoại của ứng dụng.
Bản tóm tắt
Kể từ khi Microsoft ra mắt AI Chatbot vào ngày 6 tháng 2 năm 2023, gã khổng lồ công nghệ đã chỉ đạo phần lớn nỗ lực của mình để phát triển Copilot và đảm bảo nó vượt qua sự cạnh tranh. Và nó chống lại một số đối thủ cạnh tranh nghiêm trọng, bắt đầu với Google Gemini. Đây là lý do tại sao Microsoft giảm các tính năng Copilot cứ sau vài ngày.
Đầu tháng 10 năm 2024, công ty đã công bố một lô lớn các tính năng Copilot, bao gồm Tầm nhìn Copilot. Tính năng này được thiết kế để quét một trang web và sau đó cho phép mọi người hỏi bất kỳ câu hỏi nào họ có thể có về nó. Khi ra mắt, Copilot Vision được giới hạn trong trình duyệt của Microsoft, Edge.
Có liên quan
Microsoft Copilot là gì?
Chatbot được cung cấp AI mới nhất trên thị trường có tiềm năng thực sự
Chuyển nhanh đến ngày 4 tháng 4 năm 2025, Microsoft đã tổ chức lễ kỷ niệm 50 năm của mình bằng cách tổ chức một sự kiện Copilot, nơi họ đã công bố nhiều tính năng mới, bao gồm bộ nhớ Copilot, Podcast AI, nghiên cứu sâu và trang. Đáng chú ý nhất, Microsoft cũng tuyên bố rằng Copilot Vision cuối cùng cũng được chuyển đến ứng dụng Microsoft Copilot trên cả Android và iOS (thông qua các tiêu đề Android).
Tầm nhìn Copilot đi đa phương thức, nhưng Song Tử Live đã đến đó trước
Phần tốt nhất không chỉ là tính năng được tích hợp vào ứng dụng di động. Đó là Copilot Vision hiện đang có được khả năng đa phương thức và có thể phân tích video và hình ảnh thời gian thực bạn đã lưu trữ trên thiết bị của mình. Từ đó, bạn có thể hỏi trợ lý AI bất kỳ câu hỏi nào bạn có thể có. Chẳng hạn, bạn có thể hướng máy ảnh của mình về phía văn phòng trống của bạn và yêu cầu các mẹo về cách trang trí nó.
Tại thời điểm viết, có thể tìm thấy tầm nhìn Copilot trong Tiếng nói Chế độ của ứng dụng di động Copilot – nhưng lưu ý rằng nó không có sẵn cho người dùng trên tầng miễn phí.
Copilot Vision chỉ có sẵn cho các thuê bao Copilot Pro ở Hoa Kỳ.
Nếu tính năng này nghe có vẻ quen thuộc từ xa, đó là bởi vì Google đã làm điều đó trước tiên với các tính năng dự án của nó cho Song Tử. Google đã giới thiệu các khả năng video trực tiếp mới của Gemini Live trong MWC 2025, hoạt động khá giống với cách các khả năng mới của Copilot Vision nhằm mục đích hoạt động. Với tính năng này, bạn có thể chia sẻ màn hình điện thoại của mình hoặc chế độ xem thời gian thực về nguồn cấp dữ liệu máy ảnh của bạn với Song Tử trực tiếp-sau đó, như bạn có thể đoán, bạn có thể hỏi AI bất kỳ câu hỏi nào bạn có thể có.
Nguồn: Google
Tính năng bắt đầu hạ cánh trên các thiết bị được chọn khoảng hai tuần trước, và sau đó cho người dùng Pixel vào cuối tuần trước. Mới hôm nay, Samsung đã thông báo rằng chế độ video mới của Gemini Live hiện có sẵn miễn phí trên tất cả các mẫu Galaxy S25, ngoài những người có thiết bị Pixel 9 của Google. Nói chung, rõ ràng là cả Google và Microsoft đang chiến đấu để xây dựng trợ lý AI cuối cùng.
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.