đéo có hình chó nó tin
Địt Bùng Đạo Tổ
Cộng đồng lập trình viên phát hiện Claude Code bỗng trở nên chậm chạp, hay quên và xử lý lỗi qua loa - và họ đúng.
Ngày 23/4, Anthropic công bố kết quả điều tra nội bộ, xác nhận rằng Claude Code - công cụ lập trình AI của hãng - đã trải qua giai đoạn suy giảm hiệu năng thực sự từ đầu tháng 3 đến ngày 20/4. Nguyên nhân không phải do mô hình bị cố tình hạ cấp, mà do ba thay đổi kỹ thuật riêng biệt chồng chéo lên nhau theo cách mà chính Anthropic cũng không lường trước được.
Ba thay đổi, một hệ quả khó nhận ra
Thay đổi đầu tiên diễn ra ngày 4/3: Anthropic hạ mức reasoning effort mặc định của Claude Code từ "high" xuống "medium", với lý do một số người dùng phản ánh giao diện bị đứng hình vì mô hình suy nghĩ quá lâu. Ngay sau khi triển khai, cộng đồng lập trình viên báo cáo Claude Code cảm giác kém thông minh hơn rõ rệt. Anthropic đã hoàn tác thay đổi này vào ngày 7/4, đồng thời nâng mặc định lên "xhigh" cho Opus 4.7 và "high" cho các mô hình còn lại.
Lỗi thứ hai xuất hiện ngày 26/3, khi một bản cập nhật tối ưu bộ nhớ đệm bị cài đặt sai. Thay vì chỉ xóa lịch sử suy luận của phiên làm việc đã dừng hơn một tiếng, đoạn code lỗi khiến Claude xóa lịch sử đó sau mỗi lượt hội thoại, dẫn đến tình trạng mô hình liên tục quên lý do tại sao nó đã thực hiện các thao tác trước đó. Biểu hiện bên ngoài là Claude hay lặp lại thao tác, chọn cách xử lý sai, và ngày càng thiếu nhất quán trong các tác vụ phức tạp. Lỗi này cũng khiến bộ nhớ đệm liên tục bị bỏ qua, đẩy chi phí token lên cao bất thường và làm cạn kiệt giới hạn sử dụng nhanh hơn dự kiến. Anthropic sửa lỗi này vào ngày 10/4.
Thay đổi thứ ba đến ngày 16/4, khi Anthropic thêm vào system prompt một đoạn giới hạn độ dài phản hồi - không quá 25 từ giữa các lần gọi công cụ, và không quá 100 từ cho câu trả lời cuối cùng - nhằm kiềm chế tình trạng Opus 4.7 trả lời quá dài dòng. Kiểm tra nội bộ ban đầu không phát hiện vấn đề, nhưng sau khi triển khai cùng Opus 4.7, các bài đánh giá sâu hơn cho thấy chất lượng lập trình giảm 3% trên cả Opus 4.6 lẫn 4.7. Đoạn lệnh này bị hoàn tác ngày 20/4.
Người dùng cảm nhận đúng - nhưng phải mất hai tháng để được thừa nhận
Điều đáng chú ý là cộng đồng lập trình viên đã phát hiện vấn đề rất sớm, nhưng Anthropic ban đầu phủ nhận có bất kỳ sự thay đổi thực chất nào. Nhân viên của Anthropic, trong nhiều tuần liên tiếp, khăng định mô hình vẫn hoạt động tốt và những gì người dùng phàn nàn chỉ là thay đổi giao diện hiển thị, không ảnh hưởng đến năng lực suy luận thực sự của mô hình.
Bước ngoặt đến từ một báo cáo bất thường. Ngày 2/4, Stella Laurenzo - giám đốc cấp cao nhóm AI tại AMD - đăng lên GitHub một phân tích chi tiết dựa trên 6.852 phiên làm việc Claude Code, 17.871 khối suy luận và 234.760 lượt gọi công cụ, kết luận rằng Claude Code đã không còn đủ tin cậy để thực hiện các tác vụ kỹ thuật phức tạp.
Dữ liệu cho thấy độ sâu suy luận trung bình giảm từ 2.200 ký tự vào tháng 1 xuống còn 600 ký tự vào tháng 3 - tức giảm 73%. Tỷ lệ số file đọc trước khi chỉnh sửa cũng giảm từ 6,6 xuống còn 2,0, cho thấy mô hình đang chuyển từ phong cách "đọc kỹ rồi mới sửa" sang "sửa luôn không cần hiểu bối cảnh". Một đoạn hook tự động mà Stella Laurenzo xây dựng để phát hiện hành vi bỏ giữa chừng hoặc né tránh trách nhiệm chưa kích hoạt lần nào trước ngày 8/3, nhưng sau đó kích hoạt 173 lần chỉ trong 17 ngày.
Stella Laurenzo cho biết đội của bà đã chuyển sang dùng nhà cung cấp khác, đồng thời để lại cảnh báo: "Sáu tháng trước, Claude đứng một mình ở tầng năng lực suy luận và thực thi. Nhưng các đối thủ cần được theo dõi và đánh giá rất cẩn thận. Anthropic không còn đơn độc ở tầng năng lực mà Opus từng chiếm giữ."
Anthropic phản hồi và cam kết thay đổi
Tính đến ngày 23/4, Anthropic đã reset giới hạn sử dụng cho toàn bộ người dùng để bù đắp cho lượng token bị tiêu tốn thừa do các lỗi trên.
Về phòng ngừa trong tương lai, Anthropic cam kết bắt buộc nhiều nhân viên nội bộ hơn phải sử dụng đúng bản public build của Claude Code thay vì bản thử nghiệm nội bộ, đồng thời thắt chặt quy trình kiểm tra trước mỗi thay đổi system prompt và mở tài khoản @ClaudeDevs trên X để thông báo minh bạch hơn về các quyết định sản phẩm.
Sự cố này phơi bày một vấn đề mang tính cấu trúc: các thay đổi ở tầng cấu hình bao quanh mô hình - mức độ suy luận mặc định, cách quản lý bộ nhớ đệm, giới hạn độ dài phản hồi - có thể tác động đến trải nghiệm người dùng đáng kể không kém gì thay đổi trọng số mô hình, nhưng lại ít được kiểm soát và thông báo hơn nhiều.
Anthropic thừa nhận lỗi kỹ thuật làm suy giảm hiệu năng Claude Code suốt gần hai tháng qua
Cộng đồng lập trình viên phát hiện Claude Code bỗng trở nên chậm chạp, hay quên và xử lý lỗi qua loa - và họ đúng.
