Khởi nghiệp AI của Trung Quốc Deepseek đang nhanh chóng đạt được động lực trong cuộc đua AI toàn cầu. Công ty vừa phát hành Deepseek-R1-0528, chứng minh một lần nữa rằng đây là một bot để xem. Bản cập nhật mạnh mẽ đã thách thức các đối thủ như GPT-4O của Openai và Gemini của Google.
Phiên bản mới mang lại mức tăng hiệu suất lớn trong lý luận, mã hóa và logic phức tạp, đó là những lĩnh vực mà ngay cả các mô hình hàng đầu cũng thường vấp ngã.
Với giấy phép nguồn mở và nhu cầu đào tạo nhẹ, Deepseek đang chứng tỏ là nhanh hơn và thông minh hơn.
Một bước nhảy vọt trong hiệu suất điểm chuẩn
DeepSeek-r1-0528 ở đây! 🔹 Hiệu suất điểm chuẩn được cải thiện pic.twitter.com/KXCGFG9Z5LNgày 29 tháng 5 năm 2025
Trong các bài kiểm tra điểm chuẩn gần đây, DeepSeek-R1-0528 đã đạt được độ chính xác 87,5% trong thử nghiệm AIME 2025.
Đây là một bước nhảy đáng chú ý từ 70%của mô hình trước đó. Nó cũng được cải thiện đáng kể trên điểm chuẩn mã hóa LiveCodebench, chuyển từ 63,5% lên 73,3% và tăng hơn gấp đôi hiệu suất của nó trong kỳ thi cuối cùng của nhân loại khó khăn, tăng từ 8,5% lên 17,7%.
Đối với những người không quen thuộc với những bài kiểm tra điểm chuẩn này có ý nghĩa gì, về cơ bản, họ đề xuất mô hình của Deepseek có thể theo kịp và trong một số trường hợp vượt trội hơn, các đối thủ phương Tây của nó trong các lĩnh vực cụ thể.
Nguồn mở và dễ xây dựng trên
https://cdn.mos.cms.futurecdn.net/YYYnP59CnhF86cwY9RiKLo-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/YYYnP59CnhF86cwY9RiKLo-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/YYYnP59CnhF86cwY9RiKLo-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/YYYnP59CnhF86cwY9RiKLo-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/YYYnP59CnhF86cwY9RiKLo-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/YYYnP59CnhF86cwY9RiKLo.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/YYYnP59CnhF86cwY9RiKLo.jpg"/>
Không giống như Openai và Google, có xu hướng bảo vệ các mô hình tốt nhất của họ đằng sau API và Paywalls, Deepseek đang giữ mọi thứ mở. R1-0528 có sẵn theo giấy phép MIT, cho phép các nhà phát triển tự do sử dụng, sửa đổi và triển khai mô hình theo cách họ thích.
Bản cập nhật cũng bổ sung hỗ trợ cho các đầu ra và gọi chức năng của JSON, giúp xây dựng các ứng dụng và công cụ dễ dàng cắm trực tiếp vào mô hình.
Cách tiếp cận mở này không chỉ hấp dẫn các nhà nghiên cứu và nhà phát triển mà còn làm cho Deepseek trở thành một lựa chọn ngày càng hấp dẫn cho các công ty khởi nghiệp và các công ty tìm kiếm các lựa chọn thay thế cho các nền tảng đóng.
Được đào tạo thông minh hơn, không khó hơn
https://cdn.mos.cms.futurecdn.net/7PcydDXgbUhcuuW3JqdwKD-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/7PcydDXgbUhcuuW3JqdwKD-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/7PcydDXgbUhcuuW3JqdwKD-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/7PcydDXgbUhcuuW3JqdwKD-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/7PcydDXgbUhcuuW3JqdwKD-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/7PcydDXgbUhcuuW3JqdwKD.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/7PcydDXgbUhcuuW3JqdwKD.jpg"/>
Một trong những khía cạnh ấn tượng hơn của sự trỗi dậy của Deepseek là cách nó xây dựng các mô hình này một cách hiệu quả. Theo công ty, các phiên bản trước đó đã được đào tạo chỉ trong 55 ngày với khoảng 2.000 GPU với chi phí 5,58 triệu đô la, chỉ là một phần nhỏ mà thường chi phí để đào tạo các mô hình ở quy mô này ở Mỹ
Sự tập trung này vào đào tạo hiệu quả tài nguyên là một điểm khác biệt chính, đặc biệt là khi chi phí và dấu chân carbon của các mô hình ngôn ngữ lớn tiếp tục thu hút sự giám sát.
Điều này có ý nghĩa gì đối với tương lai của AI
Bản phát hành mới nhất của Deepseek là một dấu hiệu của sự thay đổi động lực trong thế giới AI. Với khả năng lý luận mạnh mẽ, cấp phép minh bạch và chu kỳ phát triển nhanh hơn, Deepseek đang định vị mình là đối thủ cạnh tranh nghiêm túc với các đối thủ nặng ký trong ngành.
Và khi cảnh quan AI toàn cầu trở nên đa cực hơn, các mô hình như R1-0528 có thể đóng vai trò chính trong việc định hình không chỉ những gì AI có thể làm, mà còn là ai để xây dựng nó, kiểm soát nó và hưởng lợi từ nó.
Thêm từ hướng dẫn của Tom
Quay lại máy tính xách tay
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.