- DeepSeek, startup AI Trung Quốc, đã tạo bước đột phá với mô hình suy luận AI vượt trội và tiết kiệm chi phí hơn so với các đối thủ Mỹ
- Sự kiện này khiến cổ phiếu công nghệ và năng lượng Mỹ mất 1.000 tỷ USD giá trị vốn hóa trong một ngày
- DeepSeek được thành lập năm 2023, do Liang Wenfeng - người điều hành một quỹ đầu tư lớn của Trung Quốc sáng lập, hoạt động như phòng nghiên cứu hơn là doanh nghiệp thương mại
- Công ty tuyển dụng các nhà nghiên cứu trẻ được đào tạo tại Trung Quốc, tập trung vào năng lực thay vì bằng cấp
- DeepSeek sử dụng các mô hình AI nguồn mở như Meta's Llama, khác với mô hình độc quyền của OpenAI và Google
- Công ty tập trung vào ngôn ngữ thay vì multimodal, với niềm tin rằng AI có thể đạt trình độ như con người thông qua mô hình ngôn ngữ
- DeepSeek trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên Apple App Store của Mỹ
- Vốn đầu tư mạo hiểm tại Trung Quốc giảm 37% xuống còn 40,2 tỷ USD trong năm qua, trong khi tăng mạnh tại Mỹ
- OpenAI cáo buộc DeepSeek vi phạm quyền sở hữu trí tuệ, mặc dù chính OpenAI cũng đang đối mặt với các cáo buộc tương tự
📌 DeepSeek đã phá vỡ định kiến về sự đổi mới công nghệ giữa Trung Quốc và Mỹ. Startup này chứng minh khả năng tạo ra mô hình AI hiệu quả với chi phí thấp, khiến thị trường công nghệ Mỹ mất 1.000 tỷ USD vốn hóa trong một ngày và mở ra kỷ nguyên cạnh tranh AI toàn cầu mới.
https://www.ft.com/content/d72e0750-6a8b-4ef4-b9e1-6d35fd2a69b8
#FT
Bước đột phá của start-up này làm lung lay những định kiến lỗi thời về 2 quốc gia
Sự hân hoan đầy tự hào tràn ngập internet Trung Quốc trong tuần này. Nếu chiến thắng của Google DeepMind trước kỳ thủ cờ vây mạnh nhất Trung Quốc vào năm 2017 là minh chứng cho trí tuệ nhân tạo (AI) vượt trội của phương Tây, thì việc DeepSeek ra mắt một mô hình AI lập luận hàng đầu thế giới trong tháng này đã được tán dương như một thành công vang dội tại Trung Quốc.
Mô hình AI thông minh hơn và rẻ hơn của DeepSeek được một lãnh đạo công nghệ Trung Quốc gọi là “thành tựu khoa học và công nghệ định hình vận mệnh quốc gia”. Một người khác ví von start-up này như một thành viên chủ chốt trong “Biệt đội Avengers Công nghệ Mô hình Lớn Trung Quốc”, với sứ mệnh đối trọng lại sự thống trị AI của Mỹ.
Niềm vui của Trung Quốc lại mang đến nỗi đau cho các ông lớn công nghệ Mỹ khi nhà đầu tư bắt đầu đặt câu hỏi liệu bước đột phá của DeepSeek có làm lung lay tính hợp lý của các khoản đầu tư khổng lồ vào hạ tầng AI hay không. Kết quả là, chỉ trong ngày thứ Hai, cổ phiếu công nghệ và năng lượng Mỹ đã bốc hơi 1.000 tỷ USD giá trị vốn hóa thị trường, dù sau đó có phục hồi phần nào vào cuối tuần.
Từ lâu, Trung Quốc bị gán với hình ảnh một nền kinh tế sản xuất thâm dụng vốn, được nhà nước trợ cấp, chuyên sản xuất phần cứng giá rẻ như điện thoại thông minh, tấm pin mặt trời hay xe điện. Nhưng thực tế, Trung Quốc đã vươn lên thành cường quốc phần mềm toàn cầu từ lâu, vượt xa phương Tây trong lĩnh vực thương mại điện tử và dịch vụ tài chính số, đồng thời đầu tư mạnh vào AI.
Sự trỗi dậy của DeepSeek đã thách thức nhiều định kiến lỗi thời về đổi mới công nghệ ở Trung Quốc, dù công ty này không hẳn là một đại diện tiêu biểu. Thành công của DeepSeek bác bỏ nhận định cũ kỹ rằng “Mỹ đổi mới, Trung Quốc sao chép, còn châu Âu quản lý”.
Ở nhiều khía cạnh, DeepSeek mang dáng dấp của một start-up Thung lũng Silicon kiểu “tự thân vận động”, dù không ra đời từ một gara. Được thành lập vào năm 2023, công ty này có tham vọng tương tự như OpenAI và Google DeepMind trong việc đạt tới trí tuệ nhân tạo tổng quát (AGI) – AI đạt đến cấp độ tư duy như con người. Tuy nhiên, thay vì huy động vốn bên ngoài, DeepSeek được hậu thuẫn bởi Liang Wenfeng, người sáng lập một trong những quỹ đầu cơ hàng đầu Trung Quốc.
Trong một cuộc phỏng vấn được đăng lại trên bản tin China Talk, Liang cho biết DeepSeek hoạt động theo mô hình phòng thí nghiệm nghiên cứu hơn là một doanh nghiệp thương mại. Khi tuyển dụng, công ty ưu tiên năng lực hơn bằng cấp, chủ yếu tuyển các nhà nghiên cứu trẻ được đào tạo tại Trung Quốc.
Liang chia sẻ rằng nhóm nghiên cứu của ông được tạo điều kiện để khám phá và mắc sai lầm, vì “đổi mới thường nảy sinh một cách tự nhiên – nó không phải thứ có thể lên kế hoạch hay giảng dạy”.
Không giống như OpenAI hay Google, DeepSeek dựa vào các mô hình AI mã nguồn mở như Llama của Meta, thay vì phát triển các mô hình độc quyền. Công ty cũng tập trung hoàn toàn vào ngôn ngữ trong hành trình hướng tới AGI, thay vì mở rộng sang đa phương thức (multimodal) như hình ảnh, âm thanh hay video.
Liang lý giải:
“Những gì bạn nghĩ là ‘tư duy’ thực chất có thể chỉ là cách bộ não dệt nên ngôn ngữ. Điều này gợi ý rằng AGI có thể xuất hiện từ các mô hình ngôn ngữ”.
Nhờ cách tiếp cận chuyên sâu này, DeepSeek đã tạo ra một mô hình lập luận đột phá với chi phí thấp, mà không cần đến sức mạnh tính toán khổng lồ như các đối thủ Mỹ.
Giống như với các ứng dụng công nghệ Trung Quốc khác, chính trị gia Mỹ đã nhanh chóng bày tỏ lo ngại về bảo mật và quyền riêng tư liên quan đến DeepSeek. OpenAI thậm chí còn cáo buộc công ty Trung Quốc vi phạm quyền sở hữu trí tuệ – một động thái có phần mỉa mai khi OpenAI cũng đang đối mặt với các vụ kiện vi phạm bản quyền.
Dù các tập đoàn công nghệ Mỹ tỏ ra lo lắng một cách kín đáo, nhiều nhà phát triển lại hào hứng đón nhận cơ hội mà công nghệ của DeepSeek mang lại. Nhờ khả năng lập luận vượt trội với chi phí thấp, mô hình này có thể được ứng dụng rộng rãi trong nhiều lĩnh vực.
Thứ Hai vừa qua, DeepSeek đã trở thành ứng dụng miễn phí được tải nhiều nhất trên Apple App Store tại Mỹ.
Trớ trêu thay, chính Mỹ có thể là bên hưởng lợi nhiều hơn từ bước đột phá của DeepSeek. Những năm gần đây, Trung Quốc siết chặt kiểm soát khu vực tư nhân, khiến số lượng start-up mới thành lập giảm mạnh kể từ năm 2018. Theo PitchBook, vốn đầu tư mạo hiểm vào Trung Quốc đã giảm 37% xuống còn 40,2 tỷ USD vào năm ngoái, trong khi con số này lại tăng mạnh tại Mỹ.
DeepSeek đã giáng một đòn mạnh vào lòng kiêu hãnh của các tập đoàn công nghệ Mỹ, đẩy mạnh cạnh tranh toàn cầu và thúc đẩy việc ứng dụng AI nhanh hơn.
Tạm thời, có vẻ như Trung Quốc đang đổi mới, còn Mỹ bắt chước. Nhưng liệu đây chỉ là một hiện tượng nhất thời, hay khởi đầu của một xu hướng dài hạn?
With DeepSeek, China innovates and the US imitates
The start-up’s breakthrough confounds outworn prejudices about the two countries
Triumphalist glee lit up the Chinese internet this week. Just as Google DeepMind’s victory over China’s strongest Go player in 2017 showcased western brilliance in artificial intelligence, so DeepSeek’s release of a world-beating AI reasoning model has this month been celebrated as a stunning success in China.
DeepSeek’s smarter and cheaper AI model was a “scientific and technological achievement that shapes our national destiny”, said one Chinese tech executive. The start-up had become a key player in the “Chinese Large-Model Technology Avengers Team” that would counter US AI dominance, said another.
China’s delight, however, spelled pain for several giant US technology companies as investors questioned whether DeepSeek’s breakthrough undermined the case for their colossal spending on AI infrastructure. US tech and energy stocks lost $1tn of their market value on Monday, although they regained some ground later in the week.
The stereotypical image of China abroad may still be that of a state-subsidised, capital-intensive manufacturing economy that excels at churning out impressive low-cost hardware, such as smartphones, solar panels and electric vehicles. But, in truth, China long ago emerged as a global software superpower, outstripping the west in ecommerce and digital financial services, and it has invested massively in AI, too.
DeepSeek’s emergence confounds many of the outworn prejudices about Chinese innovation, although it is far from a typical Chinese company. It certainly invalidates the old saw that while the US innovates, China imitates and Europe regulates. In several ways, DeepSeek resembles a bootstrapped Silicon Valley start-up, even if it was not founded in a garage. Launched in 2023, the company has the same high-flown ambition as OpenAI and Google DeepMind to attain human-level AI, or artificial general intelligence (AGI). But its founder Liang Wenfeng runs one of China’s leading hedge funds, meaning the company has not had to raise external financing.
In an interview republished in the China Talk newsletter, Liang explained that DeepSeek operated more as a research lab than a commercial enterprise. When recruiting, it prioritised capabilities over credentials, hiring young Chinese-educated researchers. Liang said these people were given the space to explore and the freedom to make mistakes. “Innovation often arises naturally — it’s not something that can be deliberately planned or taught,” he said.
DeepSeek relies on open-source AI models, such as Meta’s Llama, in contrast to the proprietary models favoured by OpenAI and Google. It also focuses narrowly on language in its quest to reach AGI rather than attempting to go multimodal and incorporating images, audio and video. “What you think of as ‘thinking’ might actually be your brain weaving language. This suggests that humanlike AGI could potentially emerge from language models,” he said.
DeepSeek’s focused approach has enabled it to develop a compelling reasoning model without the need for extraordinary computing power and seemingly at a fraction of the cost of its US competitors. As with other Chinese apps, US politicians have been quick to raise security and privacy concerns about DeepSeek. And OpenAI has even accused the Chinese company of possible breaches of intellectual property rights. Given the cases against OpenAI for infringing others’ copyright, though, that might strike some as rich.
While some big US tech companies responded to DeepSeek’s model with disguised alarm, many developers were quick to pounce on the opportunities the technology might generate. The capabilities and cheapness of DeepSeek’s reasoning model may allow them to deploy it for an ever-expanding number of uses. On Monday, DeepSeek was the most downloaded free app on the US Apple App Store.
Ironically, that may yet enable the US to benefit more from DeepSeek’s breakthrough than China. Over the past few years, China has been throttling its own private sector as the state has exerted tighter control. The number of start-ups launched in China has plummeted since 2018. According to PitchBook, venture capital funding in China fell 37 per cent to $40.2bn last year while rising strongly in the US.
DeepSeek has punctured the hubris of the US tech oligarchs. It has intensified global competition and will accelerate the adoption of AI tools. Temporarily this could be a case of China innovating and the US imitating. But is it just a spectacular blip or the start of a long-term trend?