Như thể khởi động một mô hình AI mới làm rung chuyển toàn bộ ngành công nghiệp là không đủ, khởi nghiệp của Trung Quốc Deepseek đã theo dõi trong tuần này bằng cách phát hành một trình tạo hình ảnh AI mà nó tuyên bố cung cấp “những tiến bộ đáng kể trong cả sự hiểu biết đa phương thức và theo dõi theo hình ảnh theo hình ảnh khả năng. “
Mô hình tạo hình ảnh mới được gọi là Janus-Pro, và nó nhằm mục đích cạnh tranh với các đối thủ của Hoa Kỳ như Dall-E 3 và khuếch tán ổn định. Mô hình mới tuyên bố vượt trội so với sự cạnh tranh của nó trong các lĩnh vực như chất lượng hình ảnh và độ chính xác.
Sự ra mắt của Janus-Pro chỉ diễn ra vài ngày sau khi phát hành mô hình R1 của Deepseek, tạo ra sóng với các phản ứng nhanh, rất logic và được đào tạo nhanh hơn và với chi phí của các mô hình Hoa Kỳ.
Mô hình của Deepseek được báo cáo chạy trên các chip NVIDIA kém tiên tiến hơn, đặt ra câu hỏi về cách Trung Quốc cạnh tranh mà không tiếp cận với công nghệ tiên tiến của Hoa Kỳ. Ứng dụng iOS đã vượt xa Chatgpt trong các bản tải xuống trên Apple App Store gần đây và vẫn là ứng dụng miễn phí số 1 vào ngày 31 tháng 1.
Các bản phát hành trở lại báo hiệu sự thúc đẩy của Trung Quốc để giành được bước chân trong cuộc đua vũ trang AI đang phát triển. Trong khi đó, tuần trước, Tổng thống Donald Trump đã công bố một sáng kiến cơ sở hạ tầng AI mới, cam kết lên tới 500 triệu đô la hợp tác với OpenAI và các công ty công nghệ khác.
Xem cái này: Deepseek AI là gì? Mọi thứ để biết về AI mới nổi tiếng
Việc phát hành R1 và Janus-Pro cũng trùng với sự xem xét kỹ lưỡng của các công ty công nghệ Trung Quốc, với những căng thẳng đã cao so với các mối quan tâm về quyền riêng tư dữ liệu của Tiktok.
Trong phần giới thiệu trên trang tải xuống của mình, DeepSeek nói: “Janus-Pro vượt qua mô hình hợp nhất trước đó của nó và phù hợp hoặc vượt quá hiệu suất của các mô hình cụ thể về nhiệm vụ. Sự đơn giản, tính linh hoạt cao và hiệu quả của Janus-Pro khiến nó trở thành một ứng cử viên mạnh mẽ cho Các mô hình đa phương thức thế hệ tiếp theo. “
Mô hình này có kích thước từ 1 tỷ đến 7 tỷ thông số, một yếu tố chính trong khả năng giải quyết vấn đề của nó.
Công ty gọi Janus-Pro là “Khung tự động mới lạ” giải quyết các thách thức trước đó bằng cách tách các bước để phân tích và tạo hình ảnh, trong khi vẫn sử dụng một hệ thống thống nhất duy nhất để xử lý mọi thứ.
“Việc tách rời không chỉ làm giảm bớt xung đột giữa vai trò của bộ mã hóa trực quan trong sự hiểu biết và tạo ra mà còn tăng cường tính linh hoạt của khung”, Deepseek viết.
Phản hồi của người dùng đối với Janus-Pro đã được trộn lẫn cho đến nay, với một số Redditor tuyên bố hình ảnh giống với những nỗ lực của đối thủ cạnh tranh từ những năm trước. Để hiểu được cách Janus-Pro so sánh với các trình tạo hình ảnh AI khác, hãy xem sự cố hiệu suất này giữa TATGPT 4O, QWEN 2.5 và Janus-Pro từ YouTuber Ejack Yao.
Janus-Pro hiện có sẵn để tải xuống trên nền tảng phát triển AI.
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.