OpenAI ra mắt GPT-5.5: mô hình AI thông minh nhất của OpenAI - cạnh tranh với Opus 4.7

vinh705

Thanh niên hoi
https://tinhte.vn/thread/openai-ra-...-that-cho-nguoi-dung-va-doanh-nghiep.4128116/
9007531_cover-gpt-5.jpg

OpenAI vừa giới thiệu GPT-5.5, thế hệ mô hình mới được định vị như một “trợ lý làm việc” thông minh hơn, bám sát quy trình thực tế hơn và đặc biệt là có thể tự gánh nhiều phần việc thay con người trên máy tính.

Theo OpenAI, GPT-5.5 hiểu ý định người dùng nhanh hơn, có khả năng tự lên kế hoạch, dùng công cụ, kiểm tra lại kết quả và xử lý các nhiệm vụ nhiều bước mà không cần bạn phải cầm tay chỉ việc từng lệnh một. Mô hình này nổi bật ở các mảng viết và debug code, tìm kiếm và tổng hợp thông tin trên mạng, phân tích dữ liệu, tạo tài liệu, bảng tính, thuyết trình, vận hành phần mềm và di chuyển qua lại giữa nhiều công cụ cho đến khi hoàn thành công việc.

CleanShot 2026-04-24 at 10.17.53@2x.jpg

CleanShot 2026-04-24 at 10.18.40@2x.jpg

CleanShot 2026-04-24 at 10.18.48@2x.jpg

Về hiệu năng, GPT-5.5 được mô tả là mang lại một bước nhảy về “trí thông minh” nhưng vẫn giữ được tốc độ gần như tương đương GPT-5.4 ở độ trễ trên mỗi token khi phục vụ thực tế. Mô hình cũng tiêu tốn ít token hơn để hoàn thành cùng một tác vụ trong Codex, nghĩa là vừa mạnh hơn vừa hiệu quả hơn về chi phí.


Các đội nội bộ tại OpenAI đã dùng GPT-5.5 trong nhiều quy trình thật, từ kỹ thuật cho tới vận hành, tài chính, truyền thông, marketing, khoa học dữ liệu và quản lý sản phẩm, với hơn 85% nhân sự sử dụng Codex hằng tuần. Bộ phận truyền thông, chẳng hạn, dùng GPT-5.5 để phân tích dữ liệu yêu cầu phát biểu trong 6 tháng, xây dựng khung điểm số và rủi ro, rồi kiểm tra một bot Slack tự động để các yêu cầu rủi ro thấp được xử lý tự động, còn những trường hợp nhạy cảm vẫn chuyển về người thật.

Ở mảng tài chính, đội ngũ OpenAI dùng GPT-5.5 trong Codex để rà soát 24.771 form K-1 với tổng cộng 71.637 trang, trong một quy trình đã được thiết kế để loại trừ thông tin cá nhân, giúp rút ngắn công việc xuống nhanh hơn 2 tuần so với năm trước. Đội Go-to-Market thì dùng mô hình để tự động hóa việc tạo báo cáo kinh doanh hàng tuần, tiết kiệm mỗi người khoảng 5–10 giờ công một tuần.

GDPval.png

Trên các bài kiểm tra mô phỏng công việc văn phòng và nghiệp vụ, GPT-5.5 đạt kết quả cao, ví dụ 84,9% trên GDPval – bộ đánh giá khả năng tạo sản phẩm knowledge work chi tiết cho 44 ngành nghề – và 54,1% trên OfficeQA Pro, tập trung vào câu hỏi tài liệu phức tạp.

OSWorld-Verified.png

Trên OSWorld-Verified, bài test xem mô hình có tự vận hành môi trường máy tính thật hay không, GPT-5.5 đạt 78,7%, cho thấy mức độ “tự thao tác” trên máy ở mức có thể gánh phần lớn việc lặp lại và tốn thời gian trong công sở.

Ở phiên bản GPT-5.5 Thinking trong ChatGPT, người dùng gói Plus, Pro, Business và Enterprise sẽ có các câu trả lời súc tích hơn nhưng xử lý được bài toán khó hơn, đặc biệt hữu ích cho công việc như nghiên cứu, tổng hợp thông tin, phân tích tài liệu dài và các đầu việc cần suy luận nhiều bước. Còn GPT-5.5 Pro được tinh chỉnh cho những nhiệm vụ đòi hỏi độ chính xác cao hơn nữa, với độ trễ được cải thiện để phù hợp hơn cho các tác vụ nặng như pháp lý, giáo dục, kinh doanh hay khoa học dữ liệu.

OpenAI trang bị cho GPT-5.5 bộ khung an toàn và kiểm duyệt chặt chẽ nhất từ trước tới nay, bao gồm đánh giá theo toàn bộ hệ thống tiêu chuẩn an toàn và “preparedness framework”, hợp tác với đội ngũ red team nội bộ và bên ngoài, kiểm thử chuyên biệt cho các năng lực nhạy cảm như an ninh mạng và sinh học, đồng thời thu thập phản hồi từ gần 200 đối tác thử nghiệm sớm trước khi phát hành.

Ngay từ hôm nay, GPT-5.5 bắt đầu được triển khai cho người dùng ChatGPT gói Plus, Pro, Business và Enterprise, cũng như trên Codex. Riêng GPT-5.5 Pro sẽ dành cho người dùng Pro, Business và Enterprise. OpenAI cho biết phiên bản API của GPT-5.5 và GPT-5.5 Pro sẽ sớm xuất hiện sau khi hoàn tất yêu cầu an toàn và bảo mật cho việc phục vụ ở quy mô lớn.
Quảng cáo




Ngay sau khi OpenAI ra mắt GPT-5.5 thì NVIDIA cũng đã deploy mô hình GPT-5.5 (Codex) cho 10.000 nhân viên của mình trên toàn cầu trước đó vài tuần. Việc triển khai được thực hiện trên hệ thống GB200 NVL72 với bảo mật cấp doanh nghiệp và khả năng quan sát đầy đủ. NVIDIA đã biến các tác nhân AI thành đồng nghiệp an toàn, có thể kiểm toán được bằng cách kết nối ứng dụng Codex do GPT-5.5 cung cấp vào các máy ảo đám mây (cloud VMs) của từng nhân viên, với chính sách không lưu trữ dữ liệu và chỉ có quyền truy cập chỉ đọc vào các hệ thống sản xuất.

Kết quả là quá trình debugging rút ngắn từ ngày xuống còn giờ, các thay đổi cấu trúc đa tệp và các thử nghiệm phức tạp diễn ra chỉ sau một đêm.
 

Có thể bạn quan tâm

Top