- Trong vài tuần qua, hai công ty Trung Quốc đã công bố 3 nghiên cứu ấn tượng, phá vỡ ưu thế của Mỹ trong lĩnh vực AI
- DeepSeek đã tạo ra một mô hình có hiệu suất tương đương các mô hình hàng đầu nhưng chỉ tốn 1/50 chi phí đào tạo so với các mô hình trước đây
- ByteDance (công ty mẹ của TikTok) công bố mô hình mới với chi phí thấp hơn nữa
- Một phòng thí nghiệm tại Hong Kong cũng phát triển phiên bản r1 với ít dữ liệu đào tạo hơn
- OpenAI đang gặp khó khăn:
+ Doanh thu khoảng 5 tỷ USD, thấp hơn nhiều so với chi phí
+ Chưa ra mắt được GPT-5
+ Nhiều nhân sự cấp cao đã rời đi
+ Đã phải giảm giá 2 lần trong vài ngày qua
- Nvidia có thể bị ảnh hưởng nặng vì:
+ Các mô hình ngôn ngữ lớn có thể được đào tạo hiệu quả hơn
+ Không còn phụ thuộc nhiều vào chip cao cấp của Nvidia
- CHIPS Act của Mỹ đã phản tác dụng:
+ Thúc đẩy Trung Quốc phát triển chip riêng
+ Khiến Trung Quốc tìm cách làm việc hiệu quả hơn với nguồn lực hạn chế
- Dự báo trong 3 năm tới:
+ Các tiến bộ sẽ dần trở nên nhỏ giọt
+ Mô hình sẽ rẻ và hiệu quả hơn nhưng vẫn tồn tại vấn đề về độ tin cậy
+ Không quốc gia nào đạt được AGI vào cuối năm 2027
📌 Cuộc đua AI đã thay đổi hoàn toàn khi Trung Quốc bắt kịp Mỹ chỉ trong vài tháng. OpenAI đang gặp khó khăn với doanh thu 5 tỷ USD không đủ bù chi phí. Các công ty Trung Quốc như DeepSeek đã tạo ra mô hình hiệu quả hơn 50 lần về chi phí đào tạo.
https://fortune.com/2025/01/27/ai-stargate-china-deepseek-openai-nvidia/
Trung Quốc vừa tái định nghĩa cuộc đua AI toàn cầu – với những tác động to lớn đối với OpenAI, Nvidia, và chính sách đối ngoại
BY Gary Marcus
Gary Marcus, giáo sư danh dự tại NYU, là một trong những tiếng nói hàng đầu về trí tuệ nhân tạo, nổi tiếng với việc thách thức các quan điểm đương thời về AI. Ông là một nhà khoa học, tác giả sách bán chạy và từng là nhà sáng lập kiêm CEO của Geometric.AI, một công ty học máy được Uber mua lại.
Ngày 27 tháng 1 năm 2025, lúc 11:32 PM GMT+7
Cuộc đua giành "ưu thế AI" đã kết thúc, ít nhất là hiện tại, và Hoa Kỳ không phải là người chiến thắng. Trong vài tuần qua, 2 công ty ở Trung Quốc đã công bố 3 bài báo khoa học ấn tượng, phá vỡ mọi giả định rằng Hoa Kỳ đang dẫn đầu một cách chắc chắn. Vào cuối tháng 12, một công ty có tên DeepSeek – ban đầu được xây dựng để phục vụ giao dịch định lượng chứ không phải LLM – đã cho ra đời một mô hình gần đạt mức tiên tiến nhất nhưng chỉ cần khoảng 1/50 chi phí đào tạo so với các mô hình trước đó. Điều này ngay lập tức đưa công ty này vào hàng ngũ các tên tuổi lớn của Mỹ như OpenAI, Google và Anthropic, cả về hiệu năng và đổi mới.
Chỉ vài tuần sau, công ty này tiếp tục ra mắt một lựa chọn cạnh tranh (dù chưa hoàn toàn hoàn thiện) với o1 của OpenAI, được gọi là r1. Vì minh bạch hơn trong quy trình nội bộ so với o1, r1 đang được nhiều nhà nghiên cứu ưa chuộng hơn o1 của OpenAI (được giới thiệu với nhiều sự chú ý vào tháng 9 năm 2024). Sau đó, ByteDance (công ty mẹ của TikTok) tiếp tục tạo ra một cú sốc thứ ba với một mô hình mới có chi phí rẻ hơn nữa. Hôm qua, một phòng thí nghiệm ở Hồng Kông lại công bố một bước tiến thứ tư, tạo ra một phiên bản r1 tạm ổn dù kém mạnh hơn, nhưng sử dụng ít dữ liệu đào tạo hơn.
Tuy nhiên, điều này không có nghĩa Trung Quốc đã thắng cuộc đua AI hay thậm chí đã vượt qua Hoa Kỳ. Các công ty Mỹ sẽ áp dụng những kết quả mới này và tiếp tục tạo ra những bước tiến mới của riêng mình.
Thay vào đó, thực tế cho thấy chúng ta đang nhanh chóng tiến tới thế cân bằng – với một số điểm cộng dành cho Trung Quốc, vì họ làm được rất nhiều điều mà không cần đến hàng trăm ngàn Nvidia H100.
Các bên khác cũng có thể bắt kịp, vì LLM giờ đây đã rẻ hơn nhiều, và vì thế yêu cầu về lượng lớn phần cứng chuyên dụng đã giảm đáng kể. Gần như không còn bất kỳ "hào sâu" nào nữa; những lợi thế kỹ thuật mới chỉ tồn tại trong thời gian rất ngắn, được đo bằng tháng hoặc thậm chí tuần, chứ không phải năm.
Hầu hết các xu hướng mà tôi dự đoán trong dòng tweet này cách đây 1 năm đã được tăng tốc mạnh mẽ:
Có rất nhiều câu hỏi mà chúng ta có thể đặt ra lúc này, và cũng có không ít bài học cần rút ra. Dưới đây là một vài câu hỏi mà chúng ta có thể suy nghĩ:
§
Về câu hỏi đầu tiên, những tiến bộ gần đây của Trung Quốc là tin xấu đối với OpenAI. Hai năm trước, OpenAI đứng trên đỉnh cao thế giới khi vừa ra mắt ChatGPT và đạt được một thỏa thuận lớn với Microsoft. Không có công ty nào sở hữu một mô hình có thể so sánh với GPT-4; báo chí liên tục đưa tin về OpenAI; khách hàng nhanh chóng đón nhận. OpenAI có thể đặt giá gần như tùy ý, vì cả thế giới đều tò mò và không có nhà cung cấp nào khác. Sam Altman gần như được yêu mến toàn cầu. Mọi người tưởng tượng ra doanh thu gần như vô hạn và lợi nhuận khổng lồ.
Nhưng bây giờ, điều gì còn thực sự độc đáo ở OpenAI (nếu có) đã trở nên ít rõ ràng hơn nhiều.
Hiểu rằng họ không còn là "đỉnh cao công nghệ" nữa đã trở nên rõ ràng, và nếu họ có một lợi thế kỹ thuật mang tính quyết định, điều đó cũng không còn hiển nhiên. Các đối thủ cạnh tranh đã gần như bắt kịp, và trong nhiều trường hợp, còn cạnh tranh bằng mức giá thấp hơn. Khách hàng đang cân nhắc các lựa chọn khác; không còn cảm giác rằng OpenAI là nhà cung cấp duy nhất mà khách hàng có thể dựa vào. Quan hệ đối tác giữa OpenAI và Microsoft đã xấu đi. Uy tín của Altman bị suy giảm; kế hoạch cơ sở hạ tầng mới nhất của ông đang bị chế giễu công khai (thêm về điều này trong một bài viết khác). Hàng chục nhân viên, bao gồm ít nhất 2 nhà đồng sáng lập và giám đốc công nghệ (CTO), đã rời đi (một số chuyển sang các công ty đối thủ như Anthropic và một số khác thành lập công ty riêng).
GPT-5 vẫn chưa ra mắt, và mỗi khi OpenAI giới thiệu các mô hình mới, các đối thủ cạnh tranh nhanh chóng bắt kịp. Không còn thấy một "hào sâu" rõ ràng nào. Một tin đồn tôi nghe được tại Davos, phù hợp với một số bài báo trước đây từ Wall Street Journal và một nguồn tin khác đáng tin cậy mà tôi vừa đọc gần đây, là OpenAI đang gặp khó khăn trong việc phát triển GPT-5, thay vào đó tập trung vào giao diện người dùng nhằm tìm kiếm một lợi thế khác, ít mang tính kỹ thuật hơn.
Trong khi đó, doanh thu (khoảng 5 tỷ USD) vẫn khiêm tốn so với chi phí lớn hơn nhiều; chưa có một ứng dụng "đột phá" nào thực sự xuất hiện để bù đắp cho các khoản chi phí khổng lồ. Kinh tế học đơn giản là không còn hợp lý, và tại thời điểm này, DeepSeek dường như còn cởi mở và sáng tạo hơn OpenAI.
Những nhận thức về DeepSeek đã và đang gây ra hiệu ứng lớn. Altman gần đây đã giảm giá 2 lần chỉ trong vài ngày, và như chính lời khai của ông, OpenAI đã lỗ với ChatGPT Pro; như Grady Booch nhận xét trên X, “Giờ đây ông ấy sẽ lỗ nhanh hơn.”
Tôi đã nói điều này trước đây, và tôi sẽ nói lại lần nữa – OpenAI rất có thể sẽ trở thành "WeWork của ngành AI."
Nvidia cũng có thể sớm chịu một cú đánh nghiêm trọng, vì 2 lý do. Thứ nhất, các kết quả từ DeepSeek cho thấy rằng các mô hình ngôn ngữ lớn có thể được đào tạo hiệu quả hơn nhiều trong tương lai. Nvidia về cơ bản đã trở nên giàu có nhờ bán (các sản phẩm thiết kế cực kỳ tốt) như "xẻng" trong cơn sốt vàng, nhưng có thể sắp đối mặt với một thế giới nơi mọi người đột nhiên cần ít "xẻng" hơn.
Thứ hai, kết quả của DeepSeek gợi ý rằng hoàn toàn có thể tiến hành công việc mà không cần đến các con chip hàng đầu của Nvidia. Các thiết bị được vận chuyển trong xe bọc thép và giao dịch trên thị trường chợ đen có thể đột nhiên bị xem như thứ "đáng có" hơn là "phải có."
Việc xây dựng các trung tâm dữ liệu trị giá 500 tỷ USD để phục vụ cho một số lượng lớn các con chip đó cũng không còn hợp lý nữa.
Nếu tất cả những điều này là đúng, Đạo luật CHIPS – được thiết kế để làm chậm Trung Quốc trong cuộc đua AI – có thể trở thành một trong những cú phản đòn tồi tệ nhất trong lịch sử. (Tôi đã cố cảnh báo một số người trong chính quyền Biden về khả năng này vào mùa hè năm 2023; thay vì lắng nghe, họ gần đây lại đẩy mạnh hơn nữa, trong một trong những sắc lệnh hành pháp cuối cùng của Biden.)
Lo ngại rõ ràng nhất là Đạo luật CHIPS sẽ khuyến khích Trung Quốc tự sản xuất chip. Những người trong Nhà Trắng thực sự đã dự đoán điều đó, và Trung Quốc thực tế đã đầu tư hàng tỷ USD để đạt được mục tiêu này. Tuy nhiên, nhiều người ở Washington dường như coi các biện pháp kiểm soát xuất khẩu như một chiến thuật trì hoãn khẩn cấp, có lẽ hy vọng rằng điều này sẽ mua thêm cho Hoa Kỳ vài năm quan trọng và bằng cách nào đó đảm bảo một lợi thế lâu dài.
Tôi chưa bao giờ tin vào lập luận này vì tôi nghĩ rằng đạt được GPT-5 trước có thể giúp tạo ra những văn bản mẫu tốt hơn, nhưng không phải là thiên tài quân sự. Đạt được điều đó trước sẽ không quan trọng trong dài hạn, giống như việc một công ty Hoa Kỳ đạt được AI tạo sinh cấp GPT-4 cũng không tạo ra khác biệt lớn; như chúng ta đã thấy trong tuần này, lợi thế là rất ngắn ngủi.
Tuy nhiên, chính quyền Biden, có lẽ bị cuốn vào sự cường điệu, dường như sẵn sàng đánh cược rất nhiều chỉ để đổi lấy một lợi thế ngắn hạn, ngay cả khi điều đó làm căng thẳng mối quan hệ với Bắc Kinh hoặc thúc đẩy sự đổi mới trong tương lai của Trung Quốc về sản xuất chip silicon. (Việc Trump ủng hộ sáng kiến Stargate cũng dường như phù hợp với cách suy nghĩ "thần kỳ" tương tự về LLMs, dựa trên hy vọng đạt được sự thống trị mà có lẽ sẽ không bao giờ đến.)
Thay vào đó, như chúng ta đã thấy trong vài tuần gần đây, lợi thế ban đầu của Thung lũng Silicon trong lĩnh vực LLM đã nhanh chóng biến mất, bất chấp các biện pháp kiểm soát xuất khẩu.
Nhưng không phải (như một số người trong chúng ta đã nghĩ) vì Trung Quốc nhanh chóng phát triển các phiên bản tương đương H100 (một công việc lớn kéo dài nhiều năm và vẫn chưa hoàn thành), mà vì họ tìm ra cách để vượt qua sự phụ thuộc vào chúng.
Chúng ta vô tình đã nâng tầm kỹ thuật của họ. Trong bài viết trên Financial Times, Angela Zhang lập luận rằng, "Những thành tựu của Trung Quốc về hiệu quả không phải là ngẫu nhiên. Chúng là phản ứng trực tiếp đối với các biện pháp hạn chế xuất khẩu ngày càng gia tăng do Mỹ và các đồng minh áp đặt. Bằng cách hạn chế quyền tiếp cận của Trung Quốc với các con chip AI tiên tiến, Mỹ đã vô tình thúc đẩy sự đổi mới của họ."
Và có lẽ, chúng ta đã vô tình làm tổn hại công ty silicon lớn nhất của mình, Nvidia. Đổi lại, chúng ta nhận được rất ít, ngoại trừ một đợt tăng giá cổ phiếu ngắn hạn của Nvidia (đã phất lên trong một thời gian khi quá nhiều người đặt cược sai rằng câu trả lời cho AI nằm ở các con chip cao cấp của Nvidia).
Dĩ nhiên, như Miles Brundage đã chỉ ra trong một cuộc phỏng vấn đầu tuần này khi bảo vệ các biện pháp kiểm soát xuất khẩu, cuộc chơi chưa hẳn đã kết thúc, và việc sở hữu một lượng lớn H100s hoặc Blackwell Chips có thể vẫn sẽ rất quan trọng. Quan điểm của ông, được thể hiện trong trích dẫn dưới đây, là hợp lý, và tôi khuyến nghị đọc toàn bộ cuộc phỏng vấn của Brundage – một lập luận xuất sắc bảo vệ các biện pháp kiểm soát xuất khẩu – để có sự cân bằng so với quan điểm của tôi. Tuy nhiên, tôi nghĩ rằng ông đã đánh giá thấp các tiến bộ về phần mềm và đánh giá quá cao tầm quan trọng của số lượng phần cứng; tôi khuyến khích bạn tự đưa ra đánh giá của mình.
Theo lời ông:
"Chắc chắn có rất nhiều điều bạn có thể làm để tối ưu hóa hiệu quả của các con chip, và DeepSeek buộc phải khám phá một số kỹ thuật đó nhanh hơn so với các công ty Mỹ. Nhưng điều đó không có nghĩa là họ sẽ không có lợi nếu sở hữu nhiều hơn. Điều đó cũng không có nghĩa là họ có thể ngay lập tức nhảy từ o1 lên o3 hoặc o5 như OpenAI, vì OpenAI sở hữu một hạm đội chip lớn hơn rất nhiều."
Tôi đồng ý với Brundage rằng nguồn cung chip vẫn sẽ quan trọng, nhưng đồng thời cũng rõ ràng rằng cuộc chơi đã thay đổi.
§
Có lẽ những người hưởng lợi lớn nhất sẽ là người tiêu dùng; trong chừng mực LLMs hữu ích (dù vẫn còn những vấn đề về độ tin cậy), giá của chúng sắp giảm mạnh.
Nhưng mặt khác, rẻ hơn không hẳn đã tốt hơn. Nếu cuộc đua phát triển LLMs tiếp tục không được quản lý tại Mỹ, và các LLM vẫn thiếu kết nối với thực tế, các chu kỳ phát triển vội vã và sự cạnh tranh toàn cầu khốc liệt có thể làm gia tăng các rủi ro như thông tin sai lệch, kết quả thiên lệch, vi phạm quyền riêng tư, và việc lạm dụng bởi các tác nhân độc hại. Cả thế giới có thể thất bại – và thất bại nhanh hơn.
Trung Quốc bắt kịp nhanh như vậy vì nhiều lý do. Một lý do đáng để Quốc hội điều tra là quyết định của Meta mở mã nguồn LLMs của họ. (Câu hỏi mà Quốc hội cần đặt ra là: Quyết định đó có vai trò then chốt như thế nào trong việc Trung Quốc bắt kịp? Liệu chúng ta có giữ được vị trí dẫn đầu nếu họ không làm điều đó? Được biết, DeepSeek bắt đầu công việc với LLMs bằng cách huấn luyện lại mô hình Llama của Meta.)
Việc đặt quá nhiều kỳ vọng vào Altman, như Nhà Trắng đã làm tuần trước và những người khác đã làm trước đây, cũng có thể sẽ được nhìn nhận như một sai lầm khi nhìn lại. Nhiều câu hỏi đã được đặt ra về uy tín của ông; các nhân vật nổi bật như Sutskever, Murati, và Amodei đã rời đi, và Altman không đưa ra được tầm nhìn kỹ thuật rõ ràng. Altman có thể là một bậc thầy bán hàng, nhưng Musk đúng khi nói rằng Mỹ không nên phụ thuộc quá nhiều vào ông và không nên trao cho ông một sự công nhận cao như vậy dựa trên cơ sở quá ít.
Trong một tweet sắc bén và lan truyền nhanh, nhà báo Ryan Grim ngày hôm qua đã nêu bật nhiều suy nghĩ của tôi ở đây, khi nói về việc chính phủ Mỹ (ngoại trừ Lina Khan) liên tục mắc sai lầm bằng cách chiều chuộng các công ty lớn và làm quá ít để thúc đẩy đổi mới độc lập:
Trừ khi có điều gì đó thay đổi, chúng ta có thể sẽ chứng kiến nhiều năm mà cả hai quốc gia đều không đạt được vị trí dẫn đầu rõ ràng, dù có hay không khoản đầu tư 500 tỷ USD vào cơ sở hạ tầng.
Cá nhân tôi đặt cược rằng, nếu mọi thứ giữ nguyên, trong vòng 3 năm tới chúng ta sẽ thấy 3 điều:
§
Hy vọng duy nhất để Mỹ giành lại vị trí dẫn đầu rõ ràng là một cơ quan chính phủ, một công ty Mỹ, hoặc một phòng thí nghiệm học thuật nghĩ vượt ra khỏi khuôn khổ LLM. Các bước đi liên quan đến LLM hiện đã được hiểu quá rõ để bất kỳ ai có thể đạt được lợi thế quyết định ở đó. Hơn nữa, như tôi đã lập luận trong nhiều năm, LLM quá mù mờ, quá cồng kềnh, và quá khó để gỡ lỗi và xác minh. Câu trả lời nằm ở nơi khác; đặt cược tương lai của chúng ta vào ý tưởng duy nhất đó là điều thiếu khôn ngoan.
Cuộc đua đến AGI sẽ không được quyết định bởi quốc gia nào sở hữu nhiều chip nhất mà bởi quốc gia nào thúc đẩy được sự đổi mới thực sự tốt nhất. Điều đó có thể là Mỹ, Trung Quốc, hoặc có lẽ một quốc gia khác ít bị gò bó trong tư duy "chính thống LLM" và sẵn sàng đặt cược lớn vào các ý tưởng mới.
Bài viết này ban đầu xuất hiện trên "Marcus on AI," bản tin Substack của Gary Marcus, trước khi giá cổ phiếu Nvidia giảm trong ngày hôm nay.
Các ý kiến được trình bày trong các bài bình luận trên Fortune.com hoàn toàn là quan điểm của tác giả và không nhất thiết phản ánh quan điểm và niềm tin của Fortune.