Anthropic đã công bố phát hành các mẫu AI mới nhất của mình, Claude Opus 4 và Claude Sonnet 4, nhằm mục đích hỗ trợ nhiều nhiệm vụ chuyên nghiệp và học thuật vượt ra ngoài việc tạo mã.
Theo Anthropic, Claude Opus 4 được tối ưu hóa cho các phiên tập trung, mở rộng liên quan đến lý luận phức tạp, duy trì bối cảnh và sử dụng công cụ.
Thử nghiệm nội bộ cho thấy nó có thể hoạt động tự chủ trong tối đa bảy giờ, làm cho nó phù hợp với các nhiệm vụ đòi hỏi sự chú ý bền vững, như lập kế hoạch dự án, phân tích tài liệu và nghiên cứu.
Claude Sonnet 4, thay thế cho Claude 3.7 Sonnet, được thiết kế để cung cấp thời gian phản hồi nhanh hơn trong khi cải thiện lý luận, hướng dẫn theo sau và lưu loát ngôn ngữ tự nhiên.
Nó được định vị là một trợ lý nhẹ hơn cho người dùng cần đầu ra nhanh chóng, chính xác qua các quy trình viết, tiếp thị và giáo dục.
Cập nhật chính trong Claude 4
https://cdn.mos.cms.futurecdn.net/EDYF4jgpR9z7yoyg4kSUQi-480-80.png 480w, https://cdn.mos.cms.futurecdn.net/EDYF4jgpR9z7yoyg4kSUQi-650-80.png 650w, https://cdn.mos.cms.futurecdn.net/EDYF4jgpR9z7yoyg4kSUQi-970-80.png 970w, https://cdn.mos.cms.futurecdn.net/EDYF4jgpR9z7yoyg4kSUQi-1024-80.png 1024w, https://cdn.mos.cms.futurecdn.net/EDYF4jgpR9z7yoyg4kSUQi-1200-80.png 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/EDYF4jgpR9z7yoyg4kSUQi.png" data-pin-media="https://cdn.mos.cms.futurecdn.net/EDYF4jgpR9z7yoyg4kSUQi.png"/>
Claude 4 giới thiệu một hệ thống lý luận lai cho phép người dùng chuyển đổi giữa các phản hồi nhanh chóng cho các truy vấn đơn giản và xử lý chậm hơn, có chủ ý hơn cho các nhiệm vụ chuyên sâu như viết báo cáo, xem xét tài liệu hoặc so sánh kết quả nghiên cứu.
Cả hai mô hình cũng hỗ trợ sử dụng công cụ động-bao gồm tìm kiếm web, thực thi mã và phân tích tệp-trong quá trình lý luận mở rộng, cho phép tích hợp dữ liệu thời gian thực.
Nâng cấp đáng chú ý bao gồm:
Bộ nhớ được cải thiện: Claude hiện có thể nhớ và tham chiếu thông tin qua một phiên khi được phép truy cập các tệp cục bộ.
Công cụ song song sử dụng: Mô hình có thể đa nhiệm trên các công cụ và đầu vào khác nhau.
Xử lý nhanh chóng hơn: Claude hiểu rõ hơn về hướng dẫn sắc thái, cải thiện tính nhất quán cho các nhiệm vụ như viết và lập kế hoạch.
Công cụ phát triển: Claude Code SDK tiếp tục cung cấp các tính năng cho các tác vụ lập trình, hiện được định vị trong bộ năng suất rộng hơn.
Tóm tắt lý luận: Thay vì hiển thị nhật ký đầu ra thô, người dùng thấy các bản tóm tắt sạch sẽ, có thể truy cập của quy trình ra quyết định của mô hình.
Hiệu suất và so sánh
https://cdn.mos.cms.futurecdn.net/ViN7eYsoaKZT6hjyYSyiyB-480-80.png 480w, https://cdn.mos.cms.futurecdn.net/ViN7eYsoaKZT6hjyYSyiyB-650-80.png 650w, https://cdn.mos.cms.futurecdn.net/ViN7eYsoaKZT6hjyYSyiyB-970-80.png 970w, https://cdn.mos.cms.futurecdn.net/ViN7eYsoaKZT6hjyYSyiyB-1024-80.png 1024w, https://cdn.mos.cms.futurecdn.net/ViN7eYsoaKZT6hjyYSyiyB-1200-80.png 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/ViN7eYsoaKZT6hjyYSyiyB.png" data-pin-media="https://cdn.mos.cms.futurecdn.net/ViN7eYsoaKZT6hjyYSyiyB.png"/>
Báo cáo nhân loại rằng Claude Opus 4 đã đạt 72,5% trên điểm chuẩn mã hóa được xác minh trên băng ghế SWE, nhưng trọng tâm của mô hình vượt ra ngoài lập trình. Những cải tiến trong văn bản dài, phân tích có cấu trúc và thực hiện nhiệm vụ tổng thể cho thấy nó được thiết kế như một trợ lý AI đa năng.
Điểm chuẩn ban đầu cho thấy Claude 4 vượt trội so với GPT-4.1 và Gemini 1.5 Pro của Google trong các kịch bản doanh nghiệp cụ thể, đặc biệt là tính nhất quán và độ tin cậy thực tế.
Một cú hích rộng hơn cho tiện ích
Claude 4 dường như đang nhắm mục tiêu người dùng trên nhiều lĩnh vực, bao gồm cả nhân viên tri thức, nhà văn, nhà nghiên cứu và sinh viên. Với sự hỗ trợ cho bộ nhớ mở rộng, sử dụng công cụ song song và hiểu biết theo ngữ cảnh, các mô hình mới được dự định hoạt động giống như trợ lý kỹ thuật số hợp tác hơn so với các chatbot truyền thống.
Chúng tôi đã bắt đầu đưa Claude 4 qua các bước đi của nó, vì vậy hãy theo dõi các bài kiểm tra thực hành của chúng tôi.
Thêm từ hướng dẫn của Tom
Quay lại máy tính xách tay
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.