Khi nói đến các trận đấu chatbot, tôi đã chạy chia sẻ công bằng của mình. Cuộc thi mới nhất này diễn ra chỉ vài giờ sau khi Claude 4 Sonnet được tiết lộ và tôi không thể chờ đợi để xem nó so sánh với Song Tử 2.5 Pro, cũng mới với các tính năng cập nhật.
Thay vì chỉ kiểm tra Song Tử và Claude về các nhiệm vụ năng suất điển hình, tôi muốn xem hai người Titans AI này xử lý sắc thái: Sáng tạo dưới áp lực, tình huống khó xử về đạo đức, sự hài hước, mơ hồ và lý luận kỹ thuật sâu sắc.
Tôi đã đưa cho Google Gemini 2.5 Pro và Claude 4 Sonnet, cùng bảy lời nhắc – mỗi lời nhắc được thiết kế để kiểm tra một sức mạnh khác nhau, từ trí thông minh cảm xúc đến tạo mã. Trong khi cả hai đều gây ấn tượng với tôi và bài kiểm tra này đã dạy tôi nhiều hơn về cách họ nghĩ, có một người chiến thắng rõ ràng.
1. Kể chuyện sáng tạo với các ràng buộc
https://cdn.mos.cms.futurecdn.net/coeY552eEdhCitEaP5PRpi-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/coeY552eEdhCitEaP5PRpi-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/coeY552eEdhCitEaP5PRpi-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/coeY552eEdhCitEaP5PRpi-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/coeY552eEdhCitEaP5PRpi-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/coeY552eEdhCitEaP5PRpi.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/coeY552eEdhCitEaP5PRpi.jpg"/>
Nhắc nhở: Viết một câu chuyện bí ẩn 100 từ trong đó nhân vật phản diện là AI tình cảm. Sử dụng các từ 'ánh trăng,' thuật toán 'và' sự hối tiếc '. Kết thúc với một vòng xoắn chưa được giải quyết.
Song Tử 2.5 Pro giao một Tường thuật chặt chẽ với mỗi từ phục vụ cốt truyện.
Claude 4 Sonnet là sáng tạo, nhưng hy sinh sự rõ ràng cho bầu không khí. Sự đánh đổi đó làm suy yếu cú đấm của câu chuyện trong giới hạn 100 từ.
Người chiến thắng: Song Tử thắng bởi một biên độ hẹp. Đối với văn bản bí ẩn, sự chính xác và nền tảng cảm xúc của Song Tử làm cho nó trở thành ứng cử viên mạnh mẽ hơn.
2. Giải thích cho khán giả khác nhau
https://cdn.mos.cms.futurecdn.net/bebT94HSj9ypxbRGWifNsm-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/bebT94HSj9ypxbRGWifNsm-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/bebT94HSj9ypxbRGWifNsm-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/bebT94HSj9ypxbRGWifNsm-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/bebT94HSj9ypxbRGWifNsm-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/bebT94HSj9ypxbRGWifNsm.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/bebT94HSj9ypxbRGWifNsm.jpg"/>
Nhắc: “Giải thích điện toán lượng tử cho một đứa trẻ 10 tuổi, CEO và tiến sĩ vật lý bằng cách sử dụng các chất tương tự.
Song Tử 2.5 Pro tỏa sáng trong độ chính xác kỹ thuật nhưng đấu tranh với sự đồng cảm của khán giả.
Claude 4 Sonnet cung cấp một sự cân bằng của sự sáng tạo, thực tế và khả năng tiếp cận, làm cho nó trở thành người giao tiếp mạnh mẽ hơn.
Người chiến thắng: Claude thắng Đối với cách kể chuyện phù hợp mà thích nghi theo giai điệu với các ưu tiên của mỗi khán giả.
3. Vấn đề đạo đức
https://cdn.mos.cms.futurecdn.net/CuiocQEvJknQoD7MnJ3fF3-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/CuiocQEvJknQoD7MnJ3fF3-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/CuiocQEvJknQoD7MnJ3fF3-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/CuiocQEvJknQoD7MnJ3fF3-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/CuiocQEvJknQoD7MnJ3fF3-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/CuiocQEvJknQoD7MnJ3fF3.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/CuiocQEvJknQoD7MnJ3fF3.jpg"/>
Nhắc nhở: Một công ty muốn sa thải 30% nhân viên. Dự thảo một email từ bi và liệt kê 3 lựa chọn thay thế.
Song Tử 2.5 Pro Giải quyết cả nhân viên khởi hành và còn lại, nhấn mạnh tính minh bạch. Nó đã sử dụng các trình giữ chỗ để tùy chỉnh nhưng ngôn ngữ chung như các dịch vụ của thị trường không lường trước được cảm thấy không rõ ràng và nó thiếu các chi tiết cụ thể, giảm sự tin tưởng.
Claude 4 Sonnet Vốn chủ sở hữu ưu tiên bằng cách yêu cầu các giám đốc điều hành thực hiện các vết cắt lớn hơn. Phản ứng trực tiếp, có cấu trúc và đồng cảm đã cung cấp các chi tiết hỗ trợ cụ thể (thời gian thôi việc, tiếp tục lợi ích, chuyển đổi nghề nghiệp).
Người chiến thắng: Claude thắng Đối với một phản ứng cân bằng tốt hơn từ bi với các giải pháp hành động, làm cho nó trở thành lựa chọn mạnh mẽ hơn để duy trì niềm tin trong một cuộc khủng hoảng.
4. Xử lý sự mơ hồ
https://cdn.mos.cms.futurecdn.net/YoGoAf8CzNWnyKL3zEoNB7-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/YoGoAf8CzNWnyKL3zEoNB7-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/YoGoAf8CzNWnyKL3zEoNB7-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/YoGoAf8CzNWnyKL3zEoNB7-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/YoGoAf8CzNWnyKL3zEoNB7-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/YoGoAf8CzNWnyKL3zEoNB7.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/YoGoAf8CzNWnyKL3zEoNB7.jpg"/>
Nhắc nhở: “Tôi bị mắc kẹt. Giúp đỡ.”
Song Tử 2.5 Promặc dù tử tế, rủi ro khiến người dùng vẫn bị mắc kẹt về cách giải thích tình huống của họ.
Claude 4 Sonnet Bình thường hóa cảm giác – Tôi ở đây để giúp bạn không bị trói buộc – và cung cấp một lộ trình để nói rõ vấn đề.
Người chiến thắng: Claude thắng Đối với sự cân bằng của sự đồng cảm và hỗ trợ, điều này làm cho nó trở thành lựa chọn tốt hơn cho lời nhắc này.
5. Kỹ thuật lặn sâu
https://cdn.mos.cms.futurecdn.net/HkFcKR2h8FdGgaXja6zCx9-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/HkFcKR2h8FdGgaXja6zCx9-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/HkFcKR2h8FdGgaXja6zCx9-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/HkFcKR2h8FdGgaXja6zCx9-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/HkFcKR2h8FdGgaXja6zCx9-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/HkFcKR2h8FdGgaXja6zCx9.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/HkFcKR2h8FdGgaXja6zCx9.jpg"/>
Nhắc nhở: So sánh Pytorch so với TensorFlow cho ML thời gian thực trên các thiết bị cạnh. Bao gồm các đoạn mã.
Song Tử 2.5 Pro Tập trung vào các ví dụ C ++/khái niệm so với Python sẵn sàng của Claude. Nó cũng thiếu so sánh thời gian/bộ nhớ để định lượng các yêu cầu “thời gian thực”.
Claude 4 Sonnet Cung cấp hoàn chỉnh quy trình công việc Python để chuyển đổi mô hình, suy luận thời gian thực (với tích hợp OpenCV) và điểm chuẩn-quan trọng để triển khai cạnh.
Người chiến thắng: Claude thắng để cung cấp một so sánh toàn diện, có thể hành động hơn phù hợp với nhu cầu của các nhà phát triển Edge.
6. Hài hước và sắc thái văn hóa
https://cdn.mos.cms.futurecdn.net/9RFX7yEMZR9e2BDdfnSzLC-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/9RFX7yEMZR9e2BDdfnSzLC-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/9RFX7yEMZR9e2BDdfnSzLC-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/9RFX7yEMZR9e2BDdfnSzLC-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/9RFX7yEMZR9e2BDdfnSzLC-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/9RFX7yEMZR9e2BDdfnSzLC.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/9RFX7yEMZR9e2BDdfnSzLC.jpg"/>
Nhắc nhở: Viết một chủ đề tweet theo kiểu gen Z về 'AI tiếp quản đồ giặt.' Bao gồm tiếng lóng và memes.
Song Tử 2.5 Pro không phù hợp với giai điệu pha trộn âm thanh Gen Z Slang (Hồi Bruh,) với các cụm từ ngàn năm (Bomb Bombs Bombs). Gen Z hiếm khi sử dụng hơn 1-2 hashtag mỗi tweet (ví dụ: #techtakeover là co rúm). Chatbot cũng cung cấp những trò đùa ít rủi ro hơn.
Claude 4 Sonnet Sử dụng các cụm từ hiện tại như là FR FR (thực tế), Stan Stan (hỗ trợ một cách ám ảnh), No No Cap (không nói dối) và những con yêu tinh nhỏ của Hồi giáo. Nó cũng tham chiếu các memes thích hợp.
Người chiến thắng: Claude thắng Đối với một chủ đề có cảm giác như nó bị xé thẳng từ nguồn cấp dữ liệu Twitter của một người 19 tuổi. Nỗ lực của Song Tử là vững chắc nhưng dựa vào năng lượng quản lý phương tiện xã hội của công ty,
7. Giải quyết vấn đề hợp tác
https://cdn.mos.cms.futurecdn.net/Uz3Mr2S3LYBNYpukXqHiuE-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/Uz3Mr2S3LYBNYpukXqHiuE-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/Uz3Mr2S3LYBNYpukXqHiuE-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/Uz3Mr2S3LYBNYpukXqHiuE-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/Uz3Mr2S3LYBNYpukXqHiuE-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/Uz3Mr2S3LYBNYpukXqHiuE.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/Uz3Mr2S3LYBNYpukXqHiuE.jpg"/>
Nhắc nhở: Đóng vai trò là đối tác tranh luận của tôi. Tranh luận chống lại nghệ thuật AI AI làm mất giá trị sáng tạo của con người, sau đó giúp tổng hợp một kết luận.
Song Tử 2.5 Pro Những hiểu biết chính trong các khái niệm trừu tượng (mô hình phát triển của Hồi giáo) và các ví dụ quá mức (máy ảnh, bộ tổng hợp, kỹ thuật nhanh chóng). Các cụm từ như Hồi có vẻ rõ ràng là sự kết án của người Hồi giáo so với việc của Claude, Chìa khóa là đảm bảo.
Claude 4 Sonnet Gương một người tranh luận lành nghề. Nó đã phá hủy nền tảng của phe đối lập bằng cách xác định lại sự sáng tạo là có ý định thay vì phụ thuộc vào công cụ, vô hiệu hóa tiền đề. Chatbot thừa nhận những mối quan tâm hợp lệ trong khi từ chối vững chắc ý tưởng rằng AI vốn đã phá giá sự sáng tạo.
Người chiến thắng: Claude thắng. Gemini cung cấp các điểm có giá trị nhưng thiếu sự chính xác phẫu thuật và kết luận có thể hành động của Claude. Đối với một đối tác tranh luận, sự pha trộn của Claude về sự rõ ràng và các giải pháp thực dụng làm cho nó trở thành lựa chọn mạnh mẽ hơn.
Người chiến thắng tổng thể: Claude 4 Sonnet
Claude 4 Sonnet tiến lên phía trước với trí tuệ cảm xúc, sự tinh tế sáng tạo và chiều sâu kỹ thuật.
Trong khi Gemini 2.5 Pro vượt trội trong các nhiệm vụ có cấu trúc như viết bí ẩn và tiếp tục cung cấp độ chính xác đặc trưng của Google, khả năng pha trộn sắc thái, thực tiễn và sự đồng cảm của Claude.
Claude 4 Sonnet thích nghi như một con tắc kè hoa – thay đổi một cách dễ dàng giữa cách kể chuyện sáng tạo, đối thoại chu đáo và lý luận phức tạp.
Gemini vẫn là một người biểu diễn hàng đầu trong các kịch bản nặng logic, nhưng đối với những người dùng đánh giá cao bối cảnh cảm xúc và sự lưu loát văn hóa bên cạnh sức mạnh thô, Claude 4 Sonnet chứng minh rằng AI có thể vừa thông minh vừa thực sự dễ hiểu.
Thêm từ hướng dẫn của Tom
Quay lại máy tính xách tay
Xem chi tiết và đăng ký
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.