5 cách Google Gemini có thể cai trị AI vào năm 2025

Cảnh quan AI di chuyển nhanh. Google đã xây dựng động lực vào năm 2024 bằng cách lặp lại trên Gemini, giới thiệu máy tính xách tay và lái AI của nó vào các tích hợp không gian làm việc không gian hơn. Tuy nhiên, Google cần đưa ra những lời hứa sẽ dẫn đầu vào năm 2025. Bài viết này tìm hiểu làm thế nào Google có thể đạt được điều này bằng cách vượt qua Sora của Openai với công nghệ tạo video Lumiere, cải thiện hình ảnh và siêu nạp máy tính xách tay với AI Video Avatars.

Google phải vượt ra ngoài sự cường điệu “AI tác nhân” và cung cấp các cải tiến năng suất hữu hình trên hệ sinh thái sản phẩm của mình. Bằng cách tận dụng sức mạnh tổng hợp giữa bộ xử lý tenxơ và thiết bị pixel, Google có thể thể hiện sức mạnh của AI trên thiết bị và thể hiện khả năng của mình trong điện thoại thông minh Android.

Một máy tính bảng với trang web Notebooklm đã mở trên bàn với một cuốn sổ vật lý bên dưới nó

Có liên quan

Tôi đã kiểm tra sổ ghi chép và thấy lời hứa về một cái gì đó tuyệt vời

Notebooklm có rất nhiều vấn đề, nhưng ý tưởng đằng sau nó có tiềm năng

5

Vượt qua Sora

Google cần phải đánh lớn với Lumiere

Một con robot trong cơn bão tuyết của Sora

Sora của một robot trong một cơn bão tuyết thành phố New York

Sora của Openai đã thu hút được sự quan tâm bằng cách tạo ra các video Splashy có chiều dài tới 60 giây. Trường hợp các giải pháp trước đây đấu tranh để tạo ra những cảnh phức tạp và phong trào thực tế, Sora đã thể hiện lời hứa. Mặc dù chỉ có sẵn để trả tiền cho người đăng ký GPT-4, Sora không thất vọng. Thật thú vị khi sử dụng, có một yếu tố wow thực sự và mang lại quyền khoe khoang Openai trong phân khúc này.

Google phải tăng tốc các nỗ lực video AI của mình và vượt qua thành tích của Sora để cạnh tranh. Lumiere, câu trả lời sắp tới của Google cho Sora, cần phải ấn tượng. Lumiere có thể tạo dấu ấn bằng cách cung cấp trải nghiệm kể chuyện trực quan tuyệt đẹp được cung cấp bởi các lời nhắc văn bản đơn giản. Tận dụng chuyên môn của Google trong các lĩnh vực như tìm kiếm có thể mang lại cho nó một lợi thế trong bối cảnh và sự gắn kết. Kết hợp điều đó với khả năng đầu ra video dài hơn và bạn có người chiến thắng. Tôi háo hức muốn xem công ty có thể làm gì ở đây.

4

Đại tu Imagen (một lần nữa)

Đối thủ Dall-e sẽ im lặng các nhà phê bình

Imagen-sample-1

Nguồn: Google Research

Tôi đã chỉ trích Imagen. Tôi có thể tôn trọng sự cần thiết phải bảo vệ chống lại các mối đe dọa độc hại như Deepfakes. Tuy nhiên, việc nuốt một hệ thống hình ảnh AI có lịch sử thể hiện thành kiến ​​hơn. Tuy nhiên, có những dấu hiệu tưởng tượng có thể trở nên tốt hơn.

Imagen đã được phát hành lại một vài tháng trước và tôi đã có kết quả khác nhau. Hầu hết các hình ảnh nó tạo ra hoặc cảm thấy an toàn và được tưới nước hoặc không thú vị. Đã có một vài ngoại lệ. Vào một ngày khác, nó đã tạo ra một hình ảnh siêu thực tuyệt đẹp khi tôi nhắc nó “tạo ra một hình ảnh tuyệt đẹp của một hệ sinh thái hoàn chỉnh”. Trải nghiệm đó đã cho tôi hy vọng rằng Google sẽ liên tục lặp lại để cải thiện Imagen.

Bây giờ, nếu nó chỉ có thể tìm ra cách thể hiện hình ảnh hấp dẫn của mọi người mà không vấp vào một bãi mìn của sự sáng tạo của chính nó. Hãy hy vọng Imagen kéo theo đối thủ mở Dall-e của AI để giúp Google giành chiến thắng trong AI vào năm 2025.

3

Supercharge Notebooklm với máy chủ video AI

Notebooklm thậm chí còn tốt hơn với những người trình bày video

Notebooklm đã giúp tôi làm việc thông minh hơn vào năm 2024

Notebooklm đã tác động đến năng suất cá nhân và công việc của tôi. Đó là một cuốn sổ tay AI mà bạn có thể đào tạo dữ liệu cá nhân của mình. Nó không có tiếng ồn Internet và là một trợ lý nghiên cứu cá nhân nhanh chóng vô nhân đạo. Một bước ngoặt bất ngờ là máy tính xách tay có thể ghi chú, liên kết và các nguồn khác, phối hợp thông tin và tạo ra các podcast ảo thú vị và thông tin. Độ sâu của các cuộc trò chuyện mà nó tạo ra và tương tác giữa các máy chủ là kỳ lạ. Nó cung cấp một mức độ hiện thực năng động chưa từng có.

Một điều mà máy tính xách tay không có là khả năng xuất các podcast video có người trình bày ảo. Thêm khả năng xuất video được lưu trữ bởi những người thuyết trình ảo sẽ rất tuyệt vời. Notebooklm tạo ra chất lượng đối thoại tuyệt vời từ các vật liệu nguồn nhạt nhẽo. Vậy tại sao không bu lông về khả năng video avatar, chẳng hạn như các ứng dụng được tìm thấy trong các ứng dụng như synthesia? Điều này sẽ làm cho nội dung thú vị hơn và cung cấp các tùy chọn mới cho người sáng tạo và tiếp thị nội dung một cách nhanh chóng. Notebooklm cung cấp một đề xuất giá trị duy nhất và Google có thể nâng thanh xa hơn bằng cách thêm video.

2

Chứng minh rằng 'kỷ nguyên tác nhân' không chỉ là một câu khẩu hiệu

AI Agentic nghe có vẻ tuyệt vời, nhưng Google cần phải cung cấp trên sự cường điệu

Google-IO-Keynote-Gemini-For-Workspace-Hero
Google

“Thời đại tác nhân” của AI, được đặc trưng bởi các hệ thống AI chủ động và hợp tác, giữ lời hứa, chẳng hạn như quản lý chuỗi cung ứng phức tạp. Tuy nhiên, các giải pháp tác nhân đã cảm thấy giống như một phiên bản trợ lý của AMPED hơn là một cuộc cách mạng. Với quyền sở hữu đầy đủ và các loạt dữ liệu để suy ra bối cảnh và ý định, Google được định vị duy nhất để chứng minh rằng kỷ nguyên tác nhân không chỉ là một câu khẩu hiệu hay hoặc một cách mới để kiểm soát loa thông minh.

Tương lai của AI tác nhân cho các ứng dụng cá nhân cần bao gồm chủ động giải quyết các nhiệm vụ phức tạp hơn trên không gian làm việc và hơn thế nữa. Ví dụ, nó cần thực hiện các gia tăng giá trị năng suất như chủ động soạn thảo email, đề xuất thời gian họp và hợp tác về chuẩn bị.

Trong tuần trước, tôi đã nhận thấy rằng Gemini quét không gian làm việc của tôi thường xuyên và độc lập hơn cho bối cảnh và thông tin. Đây là một sự phát triển thú vị vì nó có khả năng pha trộn kiến ​​thức truyền thống của Gemini với khả năng bộ dữ liệu cá nhân của Notebooklm. Cho đến nay, kết quả của các truy vấn tự động này chưa được chú ý. Tôi cũng nhận thấy Gemini quét dữ liệu cá nhân của mình khi tôi muốn tìm câu trả lời dựa trên Internet cho truy vấn của tôi. Hãy hy vọng khoảnh khắc AH-ha của Google cho AI Agentic đang ở gần.

1

Cho chúng tôi xem những gì có thể với Tensor và Pixel 10

Sở hữu toàn bộ ngăn xếp là một lợi thế cạnh tranh rất lớn

Bốn điện thoại Google Pixel được sắp xếp trên bề mặt màu hồng bên cạnh chơi bài

Chip tenxơ của Google và điện thoại thông minh Pixel kết hợp nó mang lại lợi thế thị trường khổng lồ. Sở hữu ngăn xếp đầy đủ, từ phần mềm đến phần cứng, cung cấp cho Google những hiểu biết dữ liệu độc đáo, cơ hội tối ưu hóa và giao diện cho AI của nó. Bằng cách tích hợp phần cứng và phần mềm, Tensor cho phép các tính năng sáng tạo như dịch trực tiếp, xử lý hình ảnh nâng cao và trải nghiệm người dùng được cá nhân hóa.

8:45

Đây là tương lai của hình thu nhỏ điện thoại thông minh

Xem đánh giá của chúng tôi

Google Pixel 9: Đây là tương lai của điện thoại thông minh

Cái nhìn của chúng tôi về Google Pixel 9 đầy đủ

Bây giờ, Google cần tận dụng các bộ xử lý và điện thoại thông minh của mình để cung cấp một hệ sinh thái AI hoàn chỉnh. Nó phải giới thiệu các khả năng độc đáo của Google để giải quyết các mối quan tâm về độ trễ, quyền riêng tư và kết nối bằng cách mở rộng xử lý AI ngoài đám mây. Tuy nhiên, Tensor phải đối mặt với những lời chỉ trích vì không sống theo tiềm năng của nó. Một số chỉ ra các lỗ hổng hiệu suất so với các đối thủ cạnh tranh và sự vắng mặt của các tính năng đột phá, hỗ trợ AI.

Tôi muốn thấy Google giảm gấp đôi khả năng AI của Tensor trong Pixel 10. Điều này có nghĩa là mang lại sự cải thiện về tốc độ và hiệu quả, cùng với các tính năng sáng tạo thể hiện sức mạnh của AI trên thiết bị.

Điều gì tiếp theo cho Google AI?

Để dẫn đầu trong bối cảnh AI phát triển nhanh chóng, Google phải tận dụng các thế mạnh của mình vào năm 2025. Điều này có nghĩa là vượt qua Sora của Openai với công nghệ tạo video Lumiere, nhận ra toàn bộ tiềm năng của Imagen và Supercharging Notebooklm với AI Video Avatars. Hơn nữa, Google cần vượt ra ngoài sự cường điệu của “AI tác nhân” và cung cấp các cải tiến năng suất hữu hình trên hệ sinh thái sản phẩm của mình. Cuối cùng, bằng cách tận dụng hoàn toàn sức mạnh tổng hợp giữa bộ xử lý tenxơ và thiết bị pixel, Google có thể thể hiện sức mạnh của AI trên thiết bị và củng cố vị trí của nó là AI Pacesetter.


Khám phá thêm từ Phụ Kiện Đỉnh

Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.

Khám phá thêm từ Phụ Kiện Đỉnh

Đăng ký ngay để tiếp tục đọc và truy cập kho lưu trữ đầy đủ.

Tiếp tục đọc