Cursor AI xài mô hình AI Trung Quốc, 80% startup AI ở Silicon Valley đều như vậy, kết quả người dùng thường xuyên nhận câu trả lời bằng chữ Hán

đéo có hình chó nó tin

Địt Bùng Đạo Tổ
Thật bất ngờ khi sự lựa chọn hàng đầu của phần lớn startup AI Mỹ lại là các mô hình mã nguồn mở của Trung Quốc chứ không phải của các hãng danh tiếng như OpenAI hay Anthropic.

Một thống kê gây chấn động vừa được tiết lộ từ trái tim Silicon Valley đang khiến giới công nghệ Mỹ phải nghiêm túc đánh giá lại vị thế trong cuộc đua trí tuệ nhân tạo. Martin Casado, đối tác của Andreessen Horowitz - một trong những quỹ đầu tư mạo hiểm hàng đầu nước Mỹ, cho biết tới 80% startup AI đến gặp ông để xin vốn hiện đang sử dụng các mô hình mã nguồn mở từ Trung Quốc thay vì những cái tên quen thuộc như OpenAI hay Anthropic.

Con số này đã trở thành chủ đề viral trên cộng đồng Reddit với tiêu đề "Mô hình AI mã nguồn mở Trung Quốc càn quét các startup Mỹ".

Casado không phải người bình thường nói những điều bình thường. Ông là general partner tại a16z, phụ trách quỹ infrastructure trị giá 12,5 tỷ USD trong nhiều năm, đã đầu tư vào hàng loạt startup nổi tiếng trong lĩnh vực AI và hạ tầng như World Labs, Cursor, Ideogram và Braintrust.


Mô hình AI Trung Quốc lặng lẽ xâm chiếm Thung lũng Silicon: 80% Startup AI Mỹ phụ thuộc vào công nghệ này- Ảnh 1.
DeepSeek là mô hình đầu tiên của Trung Quốc làm chấn động thị trường AI


Trước đó, ông đồng sáng lập công ty ảo hóa mạng Nicira được bán cho VMware với giá 1,2 tỷ USD năm 2012, được coi là một trong những sự kiện mang tính bước ngoặt trong thương mại hóa mạng định nghĩa bằng phần mềm. Ông được xem là một nhà tiên tri trong lĩnh vực hạ tầng doanh nghiệp, góp phần hình thành ngăn xếp điện toán đám mây hiện đại.

Cuộc cách mạng lặng lẽ này bắt đầu từ tháng 1 năm nay khi DeepSeek, một startup Trung Quốc, làm chấn động thị trường chứng khoán toàn cầu bằng việc phát hành miễn phí một mô hình AI tiên tiến được phát triển với chi phí cực thấp.

Kể từ đó, các mô hình từ Alibaba và nhiều công ty công nghệ Trung Quốc khác âm thầm tiếp tục giành thêm chỗ đứng ở nước ngoài. Andrew Ng, chuyên gia AI hàng đầu tại Đại học Stanford, gần đây gọi đây là "cuộc đấu tranh sinh tử theo thuyết Darwin" giữa các nhà phát triển mô hình ngôn ngữ lớn mã nguồn mở của Trung Quốc.


Mô hình AI Trung Quốc lặng lẽ xâm chiếm Thung lũng Silicon: 80% Startup AI Mỹ phụ thuộc vào công nghệ này- Ảnh 2.
Ngoài DeepSeek, mô hình Qwen của Alibaba cũng đang dần trở nên phổ biến


Một bằng chứng đáng kinh ngạc khác đến từ bảng xếp hạng Design Arena, nền tảng đánh giá thiết kế do AI tạo ra lớn nhất thế giới dựa trên sở thích người dùng thực tế. Kỹ sư phần mềm Rohan Paul gần đây phát hiện một hiện tượng gây sốc: 16 mô hình AI mã nguồn mở hàng đầu trên bảng xếp hạng toàn cầu đều đến từ Trung Quốc.

Mô hình phi-Trung Quốc tốt nhất, GPT-oss-120B, chỉ đứng thứ 17. Ông thở dài rằng Trung Quốc đã gần như hoàn toàn thống trị lĩnh vực mã nguồn mở, thật đáng kinh ngạc khi các đội như DeepSeek, Zhipu, Kimi và Qwen có thể đạt được điều này trong khi vẫn kiên trì với mã nguồn mở.

Nói chính xác hơn, Trung Quốc đang chuyên sâu vào các mô hình "open-weight" - khác với phần mềm mã nguồn mở thực sự ở chỗ chỉ cung cấp các tham số số học mà mô hình đã học được trong quá trình huấn luyện, chứ không phải mã nguồn hay dữ liệu cơ bản.

Tuy nhiên bất kể gọi chúng là gì, trong nhiều bài kiểm tra trí thông minh, các mô hình Trung Quốc phát hành năm nay đã vượt qua các đối thủ mở tương tự từ Mỹ như những mô hình từ Meta. Hơn nữa, khả năng của chúng đang tiến gần tới các mô hình độc quyền tốt nhất.


Mô hình AI Trung Quốc lặng lẽ xâm chiếm Thung lũng Silicon: 80% Startup AI Mỹ phụ thuộc vào công nghệ này- Ảnh 3.
OpenAI cố bắt kịp đối thủ với gpt-oss nhưng tính năng giới hạn lại làm người dùng không hài lòng.


Áp lực này đã buộc ngay cả OpenAI phải thay đổi chiến lược. Tháng này, OpenAI đã phát hành mô hình ngôn ngữ mã nguồn mở đầu tiên kể từ năm 2019 có tên gpt-oss để cố gắng đuổi kịp các đối thủ Trung Quốc. Tuy nhiên, việc mô hình mở này có nhiều thiếu sót so với những phiên bản độc quyền của OpenAI – trái ngược với các mô hình Trung Quốc – đã khiến người dùng thất vọng.

Ngay cả Meta cũng thay đổi, dù họ từng đi đầu trong việc mã nguồn mở dự án Llama. Nhưng giờ đây Mark Zuckerberg, người đứng đầu công ty, đang tập trung vào việc xây dựng cái gọi là siêu trí tuệ. Trong tương lai, công ty của ông sẽ thận trọng hơn về những gì họ chọn để mở, ông đã nói. Với việc Alexandr Wang gia nhập Meta và thúc đẩy điều chỉnh chiến lược, dự án Llama đang dần chuyển sang mô hình closed-source.

Từ góc độ kinh doanh, doanh thu được tạo ra bởi các mô hình độc quyền của Mỹ vẫn lớn hơn nhiều so với các mô hình open-weight của Trung Quốc. Định giá của các công ty Mỹ - lên tới 500 tỷ USD trong trường hợp của OpenAI - làm lu mờ các công ty Trung Quốc, toàn bộ vốn hóa thị trường của Alibaba chỉ là 285 tỷ USD. Dễ dàng kiếm tiền hơn từ các mô hình độc quyền, và số tiền thu được có thể được đổ trở lại vào đổi mới.


Mô hình AI Trung Quốc lặng lẽ xâm chiếm Thung lũng Silicon: 80% Startup AI Mỹ phụ thuộc vào công nghệ này- Ảnh 4.


Tuy nhiên, mã nguồn mở không chỉ dành cho những kẻ thua cuộc. Percy Liang, đồng sáng lập Together AI - một nền tảng cho các mô hình ngôn ngữ lớn open-weight, cho biết các mô hình này thúc đẩy các hình thức áp dụng khác so với công nghệ độc quyền. Chúng có thể dễ dàng được điều chỉnh bởi các công ty, chính phủ và nhà nghiên cứu cho những trường hợp sử dụng cụ thể, và giúp người dùng chạy các công cụ AI của họ tại chỗ thay vì dựa vào đám mây. Tiền vẫn có thể kiếm được từ các dịch vụ phụ trợ, bao gồm hỗ trợ tùy chỉnh.

Nói cách khác, trong khi các phòng thí nghiệm Mỹ đang đặt cược lớn vào vận may sẽ được tạo ra bằng cách đẩy ranh giới của trí thông minh, các đối thủ Trung Quốc với mô hình open-weight tập trung nhiều hơn vào việc khuyến khích áp dụng AI. Nếu họ thành công, cú sốc DeepSeek có thể chỉ là khởi đầu. Như một người dùng châm biếm, nếu 80% startup Mỹ đang sử dụng mô hình Trung Quốc, bạn có thể giả định một cách an toàn rằng trên toàn cầu, tỷ lệ này có thể tiến gần tới 100%.

 
Thật bất ngờ khi sự lựa chọn hàng đầu của phần lớn startup AI Mỹ lại là các mô hình mã nguồn mở của Trung Quốc chứ không phải của các hãng danh tiếng như OpenAI hay Anthropic.

Một thống kê gây chấn động vừa được tiết lộ từ trái tim Silicon Valley đang khiến giới công nghệ Mỹ phải nghiêm túc đánh giá lại vị thế trong cuộc đua trí tuệ nhân tạo. Martin Casado, đối tác của Andreessen Horowitz - một trong những quỹ đầu tư mạo hiểm hàng đầu nước Mỹ, cho biết tới 80% startup AI đến gặp ông để xin vốn hiện đang sử dụng các mô hình mã nguồn mở từ Trung Quốc thay vì những cái tên quen thuộc như OpenAI hay Anthropic.

Con số này đã trở thành chủ đề viral trên cộng đồng Reddit với tiêu đề "Mô hình AI mã nguồn mở Trung Quốc càn quét các startup Mỹ".

Casado không phải người bình thường nói những điều bình thường. Ông là general partner tại a16z, phụ trách quỹ infrastructure trị giá 12,5 tỷ USD trong nhiều năm, đã đầu tư vào hàng loạt startup nổi tiếng trong lĩnh vực AI và hạ tầng như World Labs, Cursor, Ideogram và Braintrust.


Mô hình AI Trung Quốc lặng lẽ xâm chiếm Thung lũng Silicon: 80% Startup AI Mỹ phụ thuộc vào công nghệ này- Ảnh 1.
DeepSeek là mô hình đầu tiên của Trung Quốc làm chấn động thị trường AI


Trước đó, ông đồng sáng lập công ty ảo hóa mạng Nicira được bán cho VMware với giá 1,2 tỷ USD năm 2012, được coi là một trong những sự kiện mang tính bước ngoặt trong thương mại hóa mạng định nghĩa bằng phần mềm. Ông được xem là một nhà tiên tri trong lĩnh vực hạ tầng doanh nghiệp, góp phần hình thành ngăn xếp điện toán đám mây hiện đại.

Cuộc cách mạng lặng lẽ này bắt đầu từ tháng 1 năm nay khi DeepSeek, một startup Trung Quốc, làm chấn động thị trường chứng khoán toàn cầu bằng việc phát hành miễn phí một mô hình AI tiên tiến được phát triển với chi phí cực thấp.

Kể từ đó, các mô hình từ Alibaba và nhiều công ty công nghệ Trung Quốc khác âm thầm tiếp tục giành thêm chỗ đứng ở nước ngoài. Andrew Ng, chuyên gia AI hàng đầu tại Đại học Stanford, gần đây gọi đây là "cuộc đấu tranh sinh tử theo thuyết Darwin" giữa các nhà phát triển mô hình ngôn ngữ lớn mã nguồn mở của Trung Quốc.


Mô hình AI Trung Quốc lặng lẽ xâm chiếm Thung lũng Silicon: 80% Startup AI Mỹ phụ thuộc vào công nghệ này- Ảnh 2.
Ngoài DeepSeek, mô hình Qwen của Alibaba cũng đang dần trở nên phổ biến


Một bằng chứng đáng kinh ngạc khác đến từ bảng xếp hạng Design Arena, nền tảng đánh giá thiết kế do AI tạo ra lớn nhất thế giới dựa trên sở thích người dùng thực tế. Kỹ sư phần mềm Rohan Paul gần đây phát hiện một hiện tượng gây sốc: 16 mô hình AI mã nguồn mở hàng đầu trên bảng xếp hạng toàn cầu đều đến từ Trung Quốc.

Mô hình phi-Trung Quốc tốt nhất, GPT-oss-120B, chỉ đứng thứ 17. Ông thở dài rằng Trung Quốc đã gần như hoàn toàn thống trị lĩnh vực mã nguồn mở, thật đáng kinh ngạc khi các đội như DeepSeek, Zhipu, Kimi và Qwen có thể đạt được điều này trong khi vẫn kiên trì với mã nguồn mở.

Nói chính xác hơn, Trung Quốc đang chuyên sâu vào các mô hình "open-weight" - khác với phần mềm mã nguồn mở thực sự ở chỗ chỉ cung cấp các tham số số học mà mô hình đã học được trong quá trình huấn luyện, chứ không phải mã nguồn hay dữ liệu cơ bản.

Tuy nhiên bất kể gọi chúng là gì, trong nhiều bài kiểm tra trí thông minh, các mô hình Trung Quốc phát hành năm nay đã vượt qua các đối thủ mở tương tự từ Mỹ như những mô hình từ Meta. Hơn nữa, khả năng của chúng đang tiến gần tới các mô hình độc quyền tốt nhất.


Mô hình AI Trung Quốc lặng lẽ xâm chiếm Thung lũng Silicon: 80% Startup AI Mỹ phụ thuộc vào công nghệ này- Ảnh 3.
OpenAI cố bắt kịp đối thủ với gpt-oss nhưng tính năng giới hạn lại làm người dùng không hài lòng.


Áp lực này đã buộc ngay cả OpenAI phải thay đổi chiến lược. Tháng này, OpenAI đã phát hành mô hình ngôn ngữ mã nguồn mở đầu tiên kể từ năm 2019 có tên gpt-oss để cố gắng đuổi kịp các đối thủ Trung Quốc. Tuy nhiên, việc mô hình mở này có nhiều thiếu sót so với những phiên bản độc quyền của OpenAI – trái ngược với các mô hình Trung Quốc – đã khiến người dùng thất vọng.

Ngay cả Meta cũng thay đổi, dù họ từng đi đầu trong việc mã nguồn mở dự án Llama. Nhưng giờ đây Mark Zuckerberg, người đứng đầu công ty, đang tập trung vào việc xây dựng cái gọi là siêu trí tuệ. Trong tương lai, công ty của ông sẽ thận trọng hơn về những gì họ chọn để mở, ông đã nói. Với việc Alexandr Wang gia nhập Meta và thúc đẩy điều chỉnh chiến lược, dự án Llama đang dần chuyển sang mô hình closed-source.

Từ góc độ kinh doanh, doanh thu được tạo ra bởi các mô hình độc quyền của Mỹ vẫn lớn hơn nhiều so với các mô hình open-weight của Trung Quốc. Định giá của các công ty Mỹ - lên tới 500 tỷ USD trong trường hợp của OpenAI - làm lu mờ các công ty Trung Quốc, toàn bộ vốn hóa thị trường của Alibaba chỉ là 285 tỷ USD. Dễ dàng kiếm tiền hơn từ các mô hình độc quyền, và số tiền thu được có thể được đổ trở lại vào đổi mới.


Mô hình AI Trung Quốc lặng lẽ xâm chiếm Thung lũng Silicon: 80% Startup AI Mỹ phụ thuộc vào công nghệ này- Ảnh 4.


Tuy nhiên, mã nguồn mở không chỉ dành cho những kẻ thua cuộc. Percy Liang, đồng sáng lập Together AI - một nền tảng cho các mô hình ngôn ngữ lớn open-weight, cho biết các mô hình này thúc đẩy các hình thức áp dụng khác so với công nghệ độc quyền. Chúng có thể dễ dàng được điều chỉnh bởi các công ty, chính phủ và nhà nghiên cứu cho những trường hợp sử dụng cụ thể, và giúp người dùng chạy các công cụ AI của họ tại chỗ thay vì dựa vào đám mây. Tiền vẫn có thể kiếm được từ các dịch vụ phụ trợ, bao gồm hỗ trợ tùy chỉnh.

Nói cách khác, trong khi các phòng thí nghiệm Mỹ đang đặt cược lớn vào vận may sẽ được tạo ra bằng cách đẩy ranh giới của trí thông minh, các đối thủ Trung Quốc với mô hình open-weight tập trung nhiều hơn vào việc khuyến khích áp dụng AI. Nếu họ thành công, cú sốc DeepSeek có thể chỉ là khởi đầu. Như một người dùng châm biếm, nếu 80% startup Mỹ đang sử dụng mô hình Trung Quốc, bạn có thể giả định một cách an toàn rằng trên toàn cầu, tỷ lệ này có thể tiến gần tới 100%.

Nó cho mày chọn model để reasoning chứ có phải build trên mỗi deepseek đâu


Xem thằng này nó chọn model nào, chọn deepseek rồi nó ra chữ tầu thì lại thắc mắc
 
Nó cho mày chọn model để reasoning chứ có phải build trên mỗi deepseek đâu


Xem thằng này nó chọn model nào, chọn deepseek rồi nó ra chữ tầu thì lại thắc mắc
Mày xài mấy cái translate AI là hiểu.

Cứ chọn model AI của Tàu là dịch kiểu đéo gì từ Anh qua Việt cũng xen lẫn tiếng Tàu trong đó.

Lỗi này lâu lắm rồi, dân tình nói hoài mà giống kiểu nó đéo thể fix luôn.
 
Mày xài mấy cái translate AI là hiểu.

Cứ chọn model AI của Tàu là dịch kiểu đéo gì từ Anh qua Việt cũng xen lẫn tiếng Tàu trong đó.

Lỗi này lâu lắm rồi, dân tình nói hoài mà giống kiểu nó đéo thể fix luôn.
Thì đó là do base model mà, nó cho mày chọn nhiều base model khác nhau, chọn model AI tàu thì tất nhiên bị thế, nhưng bài viết mày dẫn quy chụp là các hãng lớn chỉ chọn model tàu để train vì giá thành là không đúng, vì họ thực ra cho mày nhiều lựa chọn. Con số 80% startup cũng là quy chụp nốt, AI tàu mà được dùng nhiều thế chết mẹ nó rồi vì bọn tàu đéo có đủ chip AI để chạy, đợt deepseek chạy pr hồi đầu năm, dân vào dùng làm nó chết lên chết xuống
 
Tao dùng qwen lâu nay có thấy chữ hán cặc mẹ nào đâu
Chất lượng tốt
Bị lòi chữ hán khi mày hỏi nó tiếng anh là lỗi, lỗi đấy chỉ có khi AI được train với data tiếng tàu, nhiều thằng chọn model tàu bị lòi chữ hán xong kêu giờ startup toàn dùng AI tàu
 
Bị lòi chữ hán khi mày hỏi nó tiếng anh là lỗi, lỗi đấy chỉ có khi AI được train với data tiếng tàu, nhiều thằng chọn model tàu bị lòi chữ hán xong kêu giờ startup toàn dùng AI tàu
Chơi mấy cái model củ Lồn deepseek các kiểu mới thế
Chứ tao sài qwen dùng đủ các loại tiếng mà có thấy ra chữ tàu đâu
Qwen 3 coder
 
Thì đó là do base model mà, nó cho mày chọn nhiều base model khác nhau, chọn model AI tàu thì tất nhiên bị thế, nhưng bài viết mày dẫn quy chụp là các hãng lớn chỉ chọn model tàu để train vì giá thành là không đúng, vì họ thực ra cho mày nhiều lựa chọn. Con số 80% startup cũng là quy chụp nốt, AI tàu mà được dùng nhiều thế chết mẹ nó rồi vì bọn tàu đéo có đủ chip AI để chạy, đợt deepseek chạy pr hồi đầu năm, dân vào dùng làm nó chết lên chết xuống
mày dở à, 80% starup dùng là có kéo model về dùng local đấy, nó run local để suy luận luôn hoặc fine-tune thêm, liên quan đéo gì đến Tầu đủ chip AI đâu.
 
Chơi mấy cái model củ lồn deepseek các kiểu mới thế
Chứ tao sài qwen dùng đủ các loại tiếng mà có thấy ra chữ tàu đâu
Qwen 3 coder
công nhận thằng qwen trên reddit được bọn nó đánh giá ổn, instruction, coder, vl đều ra kết quả ngon hơn mấy thằng model khác.
 
Cái đó là chuyện hiển nhiên, ai ở trong ngành cũng rõ, với nguồn dữ liệu code của Tàu mà phương tây đéo crawl được thì mô hình của phương tây thua đứt đuôi

về cơ bản mấy mô hình của tàu đang sử dụng dữ liệu khủng hơn, kể cả kín, chưa kể bọn nó lại tối ưu theo kiểu phần cứng, giảm giá gen code

còn đứa nào cứ khăng khăng mô hình ai của phương tây thì do bị nhồi sọ giai đoạn đầu mạnh quá, và ko biết thử nghiệm các mô hình khác

với cả nhiều mô hình của tàu cũng ko rầm rộ quảng cáo như của mỹ, ai tìm hiểu thì mới rõ
 

Có thể bạn quan tâm

Top