Các phiên bản mới nhất của các mô hình AI Claude của Anthropic đã xuất hiện lần đầu tiên vào thứ năm, bao gồm một mô hình hạng nặng hơn được xây dựng dành riêng cho mã hóa và các nhiệm vụ phức tạp.
Anthropic đã ra mắt các mô hình Claude 4 Opus và Claude 4 mới trong mã của nó với Hội nghị nhà phát triển Claude và các giám đốc điều hành cho biết các công cụ mới đánh dấu một bước tiến đáng kể về mặt lý luận và kỹ năng tư duy sâu sắc.
Công ty đã ra mắt mô hình trước đó, Claude 3.7 Sonnet, vào tháng Hai. Kể từ đó, các nhà phát triển AI cạnh tranh cũng đã nâng cấp trò chơi của họ. Openai đã phát hành GPT-4.1 vào tháng Tư, với sự nhấn mạnh vào một cửa sổ bối cảnh mở rộng, cùng với gia đình mô hình lý luận O3 mới. Google theo dõi vào đầu tháng 5 với phiên bản cập nhật của Gemini 2.5 Pro mà nó nói là tốt hơn trong việc mã hóa.
Claude 4 Opus là một mô hình lớn hơn, sử dụng nhiều tài nguyên hơn để xử lý những thách thức đặc biệt khó khăn. Giám đốc điều hành nhân loại Dario Amodei cho biết người dùng thử nghiệm đã thấy nó nhanh chóng xử lý các nhiệm vụ có thể mất một người vài giờ để hoàn thành.
“Theo nhiều cách, như chúng ta thường tìm thấy với các mô hình lớn, các điểm chuẩn không hoàn toàn công bằng với nó”, ông nói trong sự kiện chính.
Nhân học cho biết Claude 4 đã ghi chú về cách điều hướng trong khi chơi Pokemon.
Claude 4 Sonnet là một mô hình nạc hơn, với những cải tiến được xây dựng trên mô hình Sonnet Claude 3.7 của Anthropic. Mô hình 3.7 thường có vấn đề với quá mức và đôi khi đã làm nhiều hơn người yêu cầu làm, Amodei nói. Mặc dù đây là một mô hình ít tài nguyên hơn, nhưng nó vẫn hoạt động tốt, ông nói.
“Nó thực sự cũng như OPUS trên một số điểm chuẩn mã hóa, nhưng tôi nghĩ nó gọn gàng hơn và tập trung hẹp hơn”, Amodei nói.
Anthropic cho biết các mô hình có khả năng mới, vẫn đang được thử nghiệm beta, trong đó họ có thể sử dụng các công cụ như tìm kiếm trên web trong khi tham gia vào lý luận mở rộng. Các mô hình có thể xen kẽ giữa lý luận và sử dụng các công cụ để nhận được phản hồi tốt hơn cho các truy vấn phức tạp.
Các mô hình cung cấp các chế độ phản ứng gần như cơ bản và các chế độ tư duy mở rộng.
Tất cả các gói trả phí đều cung cấp các mô hình OPUS và SONNET, trong khi kế hoạch miễn phí chỉ có mô hình Sonnet.
Arun Chandrasekaran, phó chủ tịch nổi tiếng, nhà phân tích tại Gartner cho biết, các mô hình mới cho thấy sự tập trung của Anthropic vào việc xây dựng các mô hình mã hóa mạnh mẽ. “Các mô hình Claude của Anthropic đã thiết lập sự lãnh đạo mạnh mẽ trong lĩnh vực kỹ thuật phần mềm và bản phát hành Claude 4 mới nhất mở rộng sự lãnh đạo đó.”
Nhân học kích hoạt các giao thức an toàn với các mô hình Claude mới
Khi ra mắt mô hình Claude Opus 4, Anthropic cho biết họ đang thực hiện các biện pháp phòng ngừa an toàn tăng lên để giảm nguy cơ Claude bị sử dụng sai. Trong một bài đăng trên blog, công ty cho biết họ chưa xác định liệu mô hình có thực sự yêu cầu các biện pháp bảo vệ tiêu chuẩn ASL-3 của mình hay không nhưng nó đang làm như vậy.
Các biện pháp phòng ngừa an toàn được thiết kế đặc biệt để ngăn chặn Claude giúp phát triển vũ khí hóa học, sinh học, phóng xạ hoặc hạt nhân. Anthropic cho biết họ hạn chế các cuộc tấn công được gọi là các vụ bẻ khóa phổ quát cho phép những kẻ tấn công đi xung quanh các giao thức hiện có. “Chúng tôi sẽ tiếp tục đánh giá khả năng CBRN của Claude Opus 4”, bài đăng trên blog của Anthropic cho biết. “Nếu chúng tôi kết luận rằng Claude Opus 4 đã không vượt qua ngưỡng khả năng có liên quan, thì chúng tôi có thể loại bỏ hoặc điều chỉnh các biện pháp bảo vệ ASL-3.”
Chandrasekaran cho biết việc thực hiện các tiêu chuẩn an toàn là đáng chú ý. “Điều này bao gồm các biện pháp an ninh mạng nâng cao và các phân loại kịp thời để giảm thiểu rủi ro liên quan đến các hệ thống AI mạnh mẽ”, ông nói. Các mô hình mới cho thấy công ty tập trung vào việc cân bằng công nghệ mới với sự an toàn, ông nói.
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.