- DeepSeek, startup AI tại Hàng Châu (Trung quốc) do Liang Wenfeng sáng lập, đã vượt qua ChatGPT để trở thành ứng dụng miễn phí đứng đầu trên App Store của Apple tại Mỹ vào ngày 27/1/2025
- Công ty tuyên bố chỉ mất 5,6 triệu USD và 2 tháng để phát triển mô hình AI, so với chi phí khoảng 100 triệu USD của OpenAI cho GPT-4
- DeepSeek sử dụng 2.000 chip Nvidia chuyên dụng, thấp hơn nhiều so với 16.000 chip cần thiết để huấn luyện các mô hình hàng đầu của Mỹ
- Thành công của DeepSeek đã gây ra đợt bán tháo lớn nhất lịch sử thị trường chứng khoán, làm giảm hàng tỷ USD giá trị vốn hóa của các công ty công nghệ Mỹ như Microsoft, Nvidia và Broadcom
- Các công ty công nghệ lớn của Mỹ như Microsoft, Meta, Amazon và Alphabet dự kiến chi tới 300 tỷ USD cho các dự án AI trong năm 2025
- Donald Trump đã công bố dự án Stargate trị giá 500 tỷ USD để đầu tư vào cơ sở hạ tầng AI thông qua liên minh giữa OpenAI, Oracle và SoftBank
- Sam Altman, CEO của OpenAI, thừa nhận DeepSeek là "một mô hình ấn tượng" và cam kết sẽ đẩy nhanh việc phát hành các mô hình tốt hơn
- Các chuyên gia cảnh báo cuộc đua AI giữa các quốc gia có thể gây nguy hiểm, khi ngay cả các CEO cũng thừa nhận người chiến thắng có thể vô tình gây ra nguy cơ tuyệt chủng cho loài người
📌 Startup DeepSeek của Trung quốc đã làm rung chuyển ngành AI toàn cầu khi chỉ dùng 5,6 triệu USD và 2.000 chip Nvidia để tạo ra mô hình cạnh tranh với ChatGPT, buộc Mỹ phải đầu tư 500 tỷ USD vào dự án Stargate nhằm duy trì vị thế dẫn đầu trong cuộc đua AI.
https://www.newsweek.com/2025/02/14/how-deepseek-has-blown-open-ai-race-between-us-china-2024138.html
Ngày 1 tháng 2, 2025 - 5:00 sáng EST
Startup Trung Quốc DeepSeek đã gây chấn động thế giới trí tuệ nhân tạo và tạo ra cơn đau đầu cho Hoa Kỳ.
Trợ lý AI của DeepSeek đã vượt qua đối thủ phương Tây ChatGPT vào ngày 27 tháng 1 để trở thành ứng dụng miễn phí được xếp hạng cao nhất trên App Store của Apple tại Mỹ, giáng một đòn trị giá hàng nghìn tỷ USD vào các công ty công nghệ Mỹ trên thị trường chứng khoán.
Đối thủ của OpenAI đã gửi một thông điệp đáng lo ngại đến cả Washington và Thung lũng Silicon, cho thấy Trung Quốc đang thu hẹp khoảng cách với Mỹ trong một lĩnh vực công nghệ quan trọng. Newsweek đã liên hệ với DeepSeek, OpenAI và Cục Công nghiệp và An ninh của Mỹ qua email để yêu cầu bình luận.
DeepSeek, một công ty ít được biết đến tại Hàng Châu, Trung Quốc, là đứa con tinh thần của Lương Văn Phong, một cựu quản lý quỹ phòng hộ đã chuyển sang phát triển AI vào năm 2023. Lương nói với Asia Tech Review: "Đây là về việc dân chủ hóa đổi mới."
Mô hình chủ lực của nền tảng này, DeepSeek-R1, đã gây ra khoản lỗ lớn nhất trong lịch sử thị trường chứng khoán trong một ngày, làm bốc hơi hàng tỷ USD khỏi giá trị vốn hóa của các gã khổng lồ công nghệ Mỹ như Microsoft – cổ đông thiểu số của OpenAI – cùng các nhà sản xuất chip Nvidia và Broadcom vào tháng trước. Đợt bán tháo dữ dội này bắt nguồn từ lo ngại rằng DeepSeek, và do đó là Trung Quốc, đã bắt kịp các công ty Mỹ đi đầu trong lĩnh vực AI tạo sinh – với chi phí chỉ bằng một phần nhỏ.
DeepSeek tuyên bố đã huấn luyện các mô hình của mình trong 2 tháng với chi phí 5,6 triệu USD và sử dụng ít chip hơn so với các mô hình AI thông thường. Trong khi đó, OpenAI có trụ sở tại Mỹ được cho là đã chi khoảng 100 triệu USD để phát triển GPT-4. Gary Marcus, nhà khoa học nhận thức và tác giả cuốn Rebooting.AI, nói với Newsweek: "Chưa ai đặt chân lên mặt trăng, và cũng chưa thể sớm đạt được điều đó, nhưng Trung Quốc về cơ bản đã bắt kịp Mỹ trong các kỹ thuật AI tạo sinh vốn còn nhiều thiếu sót và mang tính trào lưu."
Dù tuyên bố về ngân sách của DeepSeek bị một số người trong giới AI nghi ngờ – những người cho rằng công ty này chỉ sử dụng công nghệ hiện có và mã nguồn mở – nhưng cũng có nhiều ý kiến trái chiều.
Nabil Jawdat Sarhan, phó giáo sư ngành Kỹ thuật Điện & Máy tính tại Đại học Bang Wayne và giám đốc Phòng thí nghiệm Nghiên cứu Hệ thống Máy tính & Học sâu của Wayne State, nói với Newsweek: "Tôi không có lý do gì để nghi ngờ tính xác thực của thông tin này. Trung Quốc đã đầu tư mạnh vào việc nuôi dưỡng nhân tài trong lĩnh vực trí tuệ nhân tạo, khoa học máy tính, kỹ thuật máy tính và nhiều lĩnh vực khác.
"Là một nhà nghiên cứu về AI, tôi kinh ngạc trước khối lượng khổng lồ các công trình nghiên cứu của Trung Quốc được công bố trên các tạp chí và hội nghị hàng đầu trong lĩnh vực này. Hơn nữa, các công ty Trung Quốc đã thành công trong việc tạo ra những sản phẩm cạnh tranh với chi phí thấp hơn đáng kể so với Mỹ. Khoảng cách công nghệ giữa Mỹ và Trung Quốc đã thu hẹp đáng kể trong những năm qua, và Trung Quốc bắt đầu có lợi thế trong một số lĩnh vực."
Kristian Hammond, giáo sư khoa học máy tính tại Đại học Northwestern và giám đốc Trung tâm Nâng cao An toàn Trí tuệ Nhân tạo, nói với Newsweek: "Nếu những gì họ nói là sự thật và hệ thống có thể được xây dựng cũng như vận hành trên phần cứng rẻ hơn nhiều, DeepSeek sẽ có tác động đáng kể.
"Nvidia hiện nay có giá trị cao như vậy vì mọi người nghĩ rằng không thể xây dựng AI nếu không có họ. Nhưng DeepSeek cho thấy rằng điều đó là khả thi. Tương tự, OpenAI đã 'lập luận' rằng chúng ta không thể hỗ trợ phần mềm của họ tại địa phương, nhưng DeepSeek một lần nữa chứng minh điều ngược lại.
"Và thực tế rằng DeepSeek có thể được xây dựng với chi phí thấp hơn, ít tính toán hơn, ít thời gian hơn và có thể chạy trên các máy rẻ hơn cho thấy rằng khi mọi người chạy đua theo hướng lớn hơn và mạnh hơn, thì đã bỏ lỡ cơ hội để xây dựng những mô hình thông minh hơn và nhỏ hơn. Nếu họ công khai kỹ thuật của mình, điều đó sẽ tạo ra sự đột phá vì tất cả sẽ đổ xô vào hướng đi nhỏ gọn."
Các hạn chế của cựu Tổng thống Joe Biden đối với phát triển AI ở nước ngoài có thể đã thúc đẩy Trung Quốc đổi mới. Để duy trì vị thế dẫn đầu trong ngành AI, Đạo luật CHIPS năm 2022 của Biden đã thúc đẩy sản xuất chất bán dẫn tại Mỹ, đồng thời hạn chế các công ty chip đầu tư vào Trung Quốc và Nga – những đối thủ cạnh tranh lớn nhất trong ngành.
Sau đó, ông đã cấp 6,6 tỷ USD cho Tập đoàn Sản xuất Chất bán dẫn Đài Loan (TSMC) để xây dựng các nhà máy chip tiên tiến ở Arizona, nhằm giảm nguy cơ gián đoạn chuỗi cung ứng trong trường hợp xảy ra xung đột liên quan đến Đài Loan. Tuy nhiên, DeepSeek đã tích trữ 10.000 chip H100 của Nvidia và sử dụng số chip này để tiếp tục công việc, dù các biện pháp kiểm soát xuất khẩu vẫn là một thách thức, theo Lương Văn Phong.
Alexandra Mousavizadeh, người sáng lập Global AI Index và CEO của Evident, nói với Newsweek rằng các chính sách của Biden có thể đã buộc Trung Quốc phải đổi mới với nguồn lực hạn chế hơn. "Nhìn vào DeepSeek, [các quy định của Biden] dường như không có nhiều tác động lớn... Tôi nghĩ trước tiên, rõ ràng là chúng ta đang thấy rằng chúng không thực sự hiệu quả trong việc ngăn chặn chip lọt vào thị trường Trung Quốc."
Ngay cả khi Mỹ siết chặt hơn nữa, "gần như không thể hoàn toàn ngăn Trung Quốc tiếp cận các chip cao cấp," cô nói. "Mặt khác, ngay cả khi Mỹ thành công trong việc hạn chế, thì cũng đang đẩy Trung Quốc phát triển các loại chip khá tinh vi."
Điều này cho thấy cách DeepSeek có thể ra mắt chỉ với 2.000 chip Nvidia chuyên dụng, so với 16.000 chip hoặc hơn mà các mô hình hàng đầu của Mỹ yêu cầu để huấn luyện; các công ty Trung Quốc đã tận dụng tối đa nguồn lực có sẵn.
"Điều Trung Quốc cần làm là phát triển các con chip đủ tốt," Mousavizadeh nói thêm. "Chúng không cần phải là loại tiên tiến nhất để đạt đến mức độ cạnh tranh cao."
Thành công của DeepSeek tại Mỹ được cho là nhờ vào khả năng tiếp cận, tính hiệu quả về chi phí và hiệu năng. DeepSeek tự mô tả là "cạnh tranh với mô hình o1 của OpenAI" trong lập luận và giải toán. CEO OpenAI Sam Altman gọi DeepSeek là "một mô hình ấn tượng, đặc biệt là xét về những gì họ có thể đạt được với mức giá đó."
Ông viết trên X: "Chúng tôi chắc chắn sẽ tung ra những mô hình tốt hơn nhiều, và cũng thật sự hứng khởi khi có một đối thủ mới! Chúng tôi sẽ chuẩn bị một số bản phát hành. Nhưng quan trọng nhất, chúng tôi hào hứng tiếp tục thực hiện lộ trình nghiên cứu của mình và tin rằng sức mạnh tính toán quan trọng hơn bao giờ hết để hoàn thành sứ mệnh của chúng tôi."
Stuart Russell, giáo sư danh dự ngành khoa học máy tính và là người giữ ghế Smith-Zadeh về kỹ thuật tại Đại học California, Berkeley, nói với Newsweek rằng "có lẽ còn quá sớm để khẳng định" liệu DeepSeek có ngang tầm với các hệ thống mới nhất của các công ty Mỹ hay không.
"Hiệu năng của chatbot là một chủ đề phức tạp," ông nói. "Nếu các tuyên bố là chính xác, đây sẽ là một ví dụ khác về việc các nhà phát triển Trung Quốc có thể tái tạo các hệ thống của Mỹ trong vòng vài tháng sau khi ra mắt. Cấu trúc tổng thể của cách hoạt động của mô hình o1 của OpenAI đã được biết đến từ khá lâu—thậm chí trước khi nó được phát hành—vì vậy không quá ngạc nhiên khi nó có thể được tái tạo ở mức độ nào đó."
Russell cho biết các con số về chi phí huấn luyện và số lượng chip sử dụng là điều bất ngờ lớn nhất và "đã gây ra xáo trộn trên thị trường, vì các công ty Mỹ như Microsoft, Meta và OpenAI đang đầu tư hàng tỷ USD vào chip và trung tâm dữ liệu, dựa trên giả định rằng chúng là cần thiết để huấn luyện và vận hành các hệ thống mới này. Nếu giả định đó sai và mọi thứ có thể được thực hiện rẻ hơn nhiều, thì những khoản đầu tư đó phần lớn là lãng phí, và nhu cầu trong tương lai đối với chip của Nvidia nói riêng sẽ thấp hơn đáng kể so với dự đoán," ông nói.
Người phát ngôn của Nvidia nói với Newsweek: "DeepSeek là một bước tiến xuất sắc trong AI và là một ví dụ hoàn hảo về khả năng mở rộng trong giai đoạn thử nghiệm. Công trình của DeepSeek minh họa cách các mô hình mới có thể được tạo ra bằng kỹ thuật đó, tận dụng các mô hình và tài nguyên tính toán có sẵn, đồng thời tuân thủ hoàn toàn các quy định kiểm soát xuất khẩu. Việc suy luận yêu cầu số lượng lớn GPU của Nvidia và hệ thống mạng hiệu năng cao. Chúng ta hiện có ba định luật mở rộng: tiền huấn luyện và hậu huấn luyện vẫn tiếp tục, cùng với mở rộng trong giai đoạn thử nghiệm mới."
Các công ty công nghệ lớn có trụ sở tại Mỹ như Microsoft, Meta, Amazon và Alphabet dự kiến sẽ chi tới 300 tỷ USD cho các dự án AI trong năm nay. Vào ngày 21 tháng 1, Donald Trump công bố Stargate—một khoản đầu tư 500 tỷ USD vào cơ sở hạ tầng AI tại Mỹ, được thực hiện thông qua quan hệ đối tác mới giữa OpenAI, Oracle và SoftBank. Tổng thống Mỹ phát biểu: "Đây là một lá phiếu tín nhiệm mạnh mẽ đối với tiềm năng của nước Mỹ. Điều này sẽ đảm bảo tương lai của công nghệ AI và giữ nó ở trong nước."
Tuy nhiên, thành công của DeepSeek có thể làm suy yếu một trụ cột quan trọng trong chính sách đối ngoại—hạn chế việc bán chip AI do Mỹ thiết kế cho Trung Quốc. Mousavizadeh đã phác thảo các lựa chọn của Trump: "Mỹ có thể tiếp tục cố gắng kiểm soát quyền tiếp cận chip và đóng các cánh cửa lại. Trong khi làm điều đó, đồng thời tăng cường đầu tư vào hạ tầng dữ liệu, hỗ trợ sự phát triển AI tại Mỹ và dẫn đầu cuộc đua," bà nói.
"Hoặc mở cửa hoàn toàn và nói rằng: 'Mọi người có quyền tiếp cận mọi thứ là điều tốt nhất cho tất cả, vì chính sự hợp tác giữa châu Âu, Mỹ và Trung Quốc trong quá khứ đã giúp chúng ta đạt được trình độ hiện tại.' Do đó, việc đóng cửa có thể làm chậm quá trình phát triển AI toàn cầu. Theo tôi hiểu, Trump chắc chắn sẽ nghiêng về lựa chọn đầu tiên.
"Ông ấy đang cố gắng cắt đứt quyền tiếp cận chip của Trung Quốc và đẩy mạnh phát triển AI tại Mỹ, điều đã được thể hiện qua dự án Stargate. AI đang là ưu tiên hàng đầu trong Nhà Trắng của Trump."
Dù ai thắng trong cuộc đua AI, Russell vẫn đưa ra lời cảnh báo cho ngành công nghệ. Ông cho rằng cuộc chạy đua xây dựng các trung tâm dữ liệu lớn hơn "đã bắt đầu giống với cuộc chạy đua giữa Mỹ và Liên Xô trong những năm 1960 để chế tạo và thử nghiệm các quả bom ngày càng lớn hơn: họ đã chế tạo được bom 50 megaton trước khi nhận ra rằng tất cả đều vô nghĩa, nhưng trong quá trình đó, họ đã lãng phí hàng tỷ USD và thải ra đủ lượng phóng xạ vào khí quyển để giết chết 100.000 người."
"Cuộc 'chạy đua AI' giữa các công ty và giữa các quốc gia có phần tương tự, nhưng tệ hơn: ngay cả các CEO đang tham gia cuộc đua này cũng đã thừa nhận rằng bất kỳ ai chiến thắng đều có khả năng cao dẫn đến sự tuyệt chủng của loài người, vì chúng ta không biết cách kiểm soát những hệ thống thông minh hơn chính mình."
Nói cách khác, Russell cho rằng đây là "một cuộc chạy đua đến rìa vực thẳm."