Mô hình AI o3 của OpenAI: Thay đổi toàn diện kinh tế học phần mềm với chi phí "khủng"

  • OpenAI đã ra mắt mô hình AI mới mang tên o3, được đánh giá là một bước tiến lớn trong khả năng tư duy, vượt qua thách thức ARC với điểm số 91,5%, cao hơn bất kỳ mô hình nào trước đó.
  • Điểm khác biệt của o3 là phương pháp "test-time compute," yêu cầu tăng thời gian xử lý dữ liệu để cải thiện chất lượng kết quả, dẫn đến chi phí mỗi lần truy vấn tăng cao. Một câu hỏi phức tạp có thể tiêu tốn đến 3.000 USD.
  • Chi phí vận hành o3 đã phá vỡ nguyên tắc chi phí thấp của ngành phần mềm, khi các dịch vụ truyền thống như công cụ tìm kiếm chỉ tiêu tốn phần nhỏ tài nguyên.
  • Mô hình o3 được xem là bước chuyển lớn trong kinh tế học AI, khi quy mô xử lý không chỉ tập trung vào giai đoạn huấn luyện mà còn trong giai đoạn truy vấn. Điều này làm tăng áp lực từ các nhà cung cấp chip như Nvidia và các nhà cung cấp dịch vụ đám mây như Amazon, Microsoft, Google.
  • OpenAI dự kiến cung cấp o3 với mức phí cao, lên đến 2.000 USD/tháng, nhằm bù đắp chi phí vận hành khổng lồ. Đây là sự thay đổi đáng kể so với các mô hình trước đây thường miễn phí hoặc có chi phí thấp hơn.
  • Các đối thủ cạnh tranh cũng không đứng yên. Google đã ra mắt mô hình Gemini 2.0 Flash, trong khi các mô hình nguồn mở đang được kỳ vọng sẽ gia tăng sức ép cạnh tranh. Các công ty như Anthropic và xAI cũng được định giá cao, lần lượt là 60 tỷ USD và 45 tỷ USD.
  • Việc sử dụng o3 không chỉ tập trung vào người tiêu dùng cá nhân mà còn hướng đến doanh nghiệp với các dịch vụ tùy chỉnh theo nhu cầu, hứa hẹn tăng năng suất làm việc nhưng đòi hỏi chi phí đầu tư lớn.
  • Khác với các mô hình AI trước đây, o3 và các mô hình tương tự có thể dẫn đến thị trường cạnh tranh đa cực thay vì độc quyền.

📌 Mô hình AI o3 của OpenAI đánh dấu bước đột phá về khả năng tư duy nhưng đi kèm chi phí vận hành cao. Thị trường AI chuyển từ miễn phí sang trả phí cao, đồng thời đối mặt áp lực từ cạnh tranh và chi phí nguồn lực. Đây là thay đổi lớn trong kinh tế học phần mềm hiện đại.

http://www.economist.com/business/2025/01/20/openais-latest-model-will-change-the-economics-of-software

OpenAI ra mắt mô hình mới sẽ thay đổi kinh tế học của phần mềm  
Càng suy luận nhiều, càng tốn sức mạnh máy tính hơn  

20 tháng 1 năm 2025 | SAN FRANCISCO  
Chia sẻ  

Khi OpenAI công bố một mô hình trí tuệ nhân tạo (AI) tạo sinh mới, gọi là o3, vài ngày trước Giáng sinh, thông báo này đã tạo ra cả sự phấn khích lẫn hoài nghi. Phấn khích từ những người kỳ vọng khả năng suy luận của mô hình này sẽ là một bước tiến lớn hướng tới trí thông minh siêu việt hơn con người (một số người cho rằng điều này còn quan trọng hơn sự ra mắt ChatGPT của OpenAI vào năm 2022). Hoài nghi vì OpenAI không công khai mô hình này cho công chúng và có mọi động cơ để phóng đại vai trò tiên phong của công ty trong lĩnh vực AI nhằm lấy lòng Donald Trump, tổng thống sắp nhậm chức.  

Tuy nhiên, kể từ đó, một điểm đồng thuận đã xuất hiện. Mô hình này, cũng như tiền thân của nó là o1 (o2 bị bỏ qua vì đó là tên của một mạng di động ở châu Âu), tạo ra kết quả tốt hơn khi thực hiện nhiều “suy nghĩ” hơn để phản hồi một yêu cầu. Nhiều suy nghĩ hơn đồng nghĩa với việc sử dụng nhiều sức mạnh tính toán hơn—và chi phí cao hơn cho mỗi yêu cầu. Kết quả là một thay đổi lớn đang diễn ra trong kinh tế học của nền kinh tế số, vốn được xây dựng dựa trên việc cung cấp các dịch vụ giá rẻ cho một số lượng lớn người dùng với chi phí cận biên thấp, nhờ vào việc phân phối miễn phí qua internet. Mỗi lần các mô hình trở nên đắt đỏ hơn để thực hiện yêu cầu, kỷ nguyên chi phí cận biên bằng không ngày càng xa hơn.  

Nhà đầu tư định giá OpenAI như một công ty công nghệ được yêu thích: công ty được định giá 157 tỷ USD dựa trên một vòng huy động vốn gần đây. Các nhà đầu tư hy vọng rằng, nhờ sự thành công của các sản phẩm như ChatGPT, công ty này sẽ trở thành gã khổng lồ công nghệ trị giá 1 nghìn tỷ USD tiếp theo. Nhưng chi phí cao của các mô hình tiên tiến, cùng với áp lực từ các nhà cung cấp, nhà phân phối và đối thủ cạnh tranh, cho thấy việc tạo ra mô hình có thể không mang lại quyền lực kiểu độc quyền như các gã khổng lồ công nghệ đã từng có. “Một điều rất quan trọng để hiểu về tương lai: kinh tế học của AI sắp thay đổi hoàn toàn,” François Chollet, một nhà nghiên cứu AI kỳ cựu, viết trên X, một mạng xã hội, vào ngày o3 được công bố.  

Biểu đồ: The Economist  

François Chollet đã giúp tạo ra sự phấn khích về o3. Vào tháng 6, ông đã khởi động một giải thưởng trị giá 1 triệu USD cho các mô hình có thể vượt qua thử thách mà ông đã tạo ra 5 năm trước, gọi là “Abstraction and Reasoning Corpus” hay ARC. Đây là một tập hợp các câu đố suy luận trực quan trông đơn giản (xem hình minh họa) được thiết kế để “dễ đối với con người nhưng bất khả thi đối với AI hiện đại”. (Sự dễ dàng ở đây là tương đối—trong một nghiên cứu vào tháng 9, con người được tuyển chọn trực tuyến đạt điểm từ 60-70% trong bài kiểm tra này). Giải thưởng này không chỉ mang tính thách thức đơn thuần. François Chollet nói rằng vượt qua bài kiểm tra ARC là một bước “cực kỳ quan trọng” hướng tới việc xây dựng trí tuệ nhân tạo tổng quát, nghĩa là các cỗ máy vượt qua con người ở nhiều nhiệm vụ.  

Sáu tháng sau, OpenAI đã xuất sắc vượt qua bài kiểm tra này. Mô hình o3 của công ty đạt điểm đột phá 91,5%. Thành công của nó trong thử thách cho thấy một bước thay đổi trong khả năng của AI thích nghi với các nhiệm vụ mới, François Chollet nhận xét. Mô hình mới không chỉ tốt hơn; nó còn khác biệt. Giống như o1, o3 sử dụng phương pháp “test-time compute” (tính toán thời gian kiểm tra), tạo ra kết quả tốt hơn khi dành nhiều thời gian hơn cho suy luận (khi một mô hình AI đã được đào tạo trả lời các yêu cầu). Thay vì chỉ đơn giản đưa ra câu trả lời càng nhanh càng tốt, o3 được thiết kế để—thực chất—suy nghĩ kỹ hơn về câu hỏi.  

Đó là lúc chi phí cao hơn xuất hiện. François Chollet đặt giới hạn 10.000 USD cho số tiền mà các thí sinh có thể chi tiêu vào sức mạnh tính toán để trả lời 400 câu hỏi trong thử thách của ông. Khi OpenAI giới thiệu một mô hình dưới giới hạn này, công ty đã chi 6.677 USD (khoảng 17 USD mỗi câu hỏi) để đạt điểm 82,8%. Điểm 91,5% của o3 đạt được nhờ việc vượt qua ngân sách. Công ty không tiết lộ số tiền đã chi, nhưng cho biết rằng phiên bản đắt tiền của quá trình này sử dụng lượng “compute” gấp 172 lần so với phương pháp rẻ hơn—tương đương khoảng 3.000 USD để giải một yêu cầu mà con người chỉ mất vài giây.  

Cần lưu ý rằng các mô hình AI trước đây đã thách thức chuẩn mực chi phí cận biên thấp của ngành công nghiệp phần mềm, bởi vì việc trả lời các yêu cầu đòi hỏi nhiều sức mạnh xử lý hơn đáng kể so với việc sử dụng các công cụ tương đương như công cụ tìm kiếm. Nhưng chi phí xây dựng các mô hình ngôn ngữ lớn và vận hành chúng đủ nhỏ về mặt tuyệt đối để OpenAI vẫn có thể cung cấp truy cập miễn phí.  

Với các mô hình mới nhất, điều đó không còn đúng nữa. OpenAI giới hạn phiên bản “pro” của mô hình o1 chỉ dành cho những người dùng ở gói đăng ký 200 USD mỗi tháng (và bị lỗ, theo Sam Altman, giám đốc điều hành của công ty, bởi vì khách hàng tiêu tốn nhiều hơn dự kiến của công ty trên mỗi yêu cầu). Pierre Ferragu của New Street Research, một công ty phân tích, ước tính rằng OpenAI có thể tính phí tới 2.000 USD mỗi tháng để truy cập đầy đủ vào o3.  

Sức mạnh của các mô hình như vậy dựa trên việc đưa một phiên bản của “luật mở rộng quy mô” trong ngành này đến gần hơn với người dùng cuối. Cho đến nay, tiến bộ trong AI phụ thuộc vào việc huấn luyện lớn hơn và tốt hơn, với nhiều dữ liệu hơn và sức mạnh tính toán lớn hơn tạo ra trí thông minh vượt trội hơn. Nhưng một khi mô hình được huấn luyện, rất khó để sử dụng tốt sức mạnh xử lý bổ sung. Như thành công của o3 trong thử thách ARC cho thấy, điều đó không còn đúng nữa. Luật mở rộng quy mô dường như đã chuyển từ việc huấn luyện mô hình sang suy luận.  

Những phát triển như vậy thay đổi kinh tế học mà các nhà sản xuất mô hình như OpenAI phải đối mặt. Sự phụ thuộc của các mô hình mới vào sức mạnh xử lý lớn hơn làm tăng quyền lực của các nhà cung cấp như Nvidia, nhà sản xuất chip AI chuyên dụng. Điều này cũng mang lại lợi ích cho các nhà phân phối mô hình AI, đặc biệt là các nhà cung cấp dịch vụ đám mây như Amazon, Microsoft và Alphabet (công ty mẹ của Google). Và điều này có thể giúp biện minh cho khối tài sản mà các gã khổng lồ công nghệ đã đầu tư vào các trung tâm dữ liệu, bởi vì suy luận nhiều hơn sẽ cần sức mạnh tính toán nhiều hơn. OpenAI sẽ bị chèn ép từ cả hai phía.  

Còn có yếu tố cạnh tranh. Google đã phát hành mô hình suy luận riêng của mình, gọi là Gemini 2.0 Flash, và các công ty công nghệ khác có lẽ cũng sẽ làm vậy. Các mô hình mã nguồn mở được kỳ vọng sẽ xuất hiện. Khách hàng sẽ có thể sử dụng nhiều mô hình từ các nhà cung cấp khác nhau. Và mặc dù các mô hình AI tạo sinh có thể cải thiện một chút thông qua tương tác với khách hàng, chúng thiếu các hiệu ứng mạng thực sự (trong đó dịch vụ sẽ cải thiện đáng kể khi có nhiều người dùng hơn), không giống như các sản phẩm Google và Facebook đã làm trong kỷ nguyên trước.  

Chi phí cận biên cao có nghĩa là các nhà sản xuất mô hình sẽ phải tạo ra giá trị đáng kể để tính giá cao. Hy vọng, theo Lan Guan của Accenture, một công ty tư vấn, là các mô hình như o3 sẽ hỗ trợ các tác nhân AI mà cá nhân và doanh nghiệp có thể sử dụng để tăng năng suất. Ngay cả một mức giá cao cho việc sử dụng một mô hình suy luận cũng có thể xứng đáng so với chi phí thuê một tiến sĩ toán học thực thụ, chẳng hạn. Nhưng điều đó phụ thuộc vào mức độ hữu ích của các mô hình.  

Các trường hợp sử dụng khác nhau cũng có thể dẫn đến sự phân mảnh hơn. Jeremy Schneider của McKinsey, một công ty tư vấn, cho rằng việc cung cấp các dịch vụ AI cho khách hàng doanh nghiệp sẽ đòi hỏi các mô hình được chuyên biệt hóa cho nhu cầu của từng doanh nghiệp, thay vì các mô hình đa dụng như ChatGPT.  

Thay vì bị thống trị bởi một công ty, một số người kỳ vọng việc tạo mô hình sẽ giống như một thị trường độc quyền tập đoàn truyền thống hơn, với rào cản gia nhập cao nhưng không có sự thống trị tuyệt đối—hoặc lợi nhuận độc quyền. Hiện tại, OpenAI đang dẫn đầu, nhưng một trong những đối thủ chính của công ty, Anthropic, được cho là đang huy động vốn ở mức định giá 60 tỷ USD, và xAI, công ty thuộc sở hữu phần lớn của Elon Musk, được định giá 45 tỷ USD. Điều này cho thấy kỳ vọng cao dành cho các công ty này. Với o3, OpenAI đã chứng minh lợi thế kỹ thuật của mình, nhưng mô hình kinh doanh vẫn chưa được kiểm chứng. ■  

OpenAI’s latest model will change the economics of software

The more reasoning it does, the more computer power it uses

 
|SAN FRANCISCO
When OpenAI announced a new generative artificial-intelligence (AI) model, called o3, a few days before Christmas, it aroused both excitement and scepticism. Excitement from those who expected its reasoning capabilities to be a big step towards superhuman intelligence (some reckoned it would be a bigger deal than OpenAI’s launch of ChatGPT in 2022). Scepticism because OpenAI did not release it to the public and had every incentive to overplay the firm’s pioneering role in AI to curry favour with Donald Trump, the incoming president.
Yet since then one point of consensus has emerged. The model, as well as its predecessor, o1 (o2 was skipped because that is the name of a European mobile network), produces better results the more “thinking” it does in response to a prompt. More thinking means more computing power—and a higher cost per query. As a result a big change is afoot in the economics of the digital economy, which was built on providing cheap services to large numbers of people at low marginal cost, thanks to free distribution on the internet. Every time models become more expensive to query, the zero-marginal cost era is left further behind.
Investors value OpenAI like a tech darling: it is worth $157bn, going by a recent fundraising. They hope that thanks to the success of products like ChatGPT, it will become the next $1trn tech giant. But the higher costs of state-of-the-art models, as well as other pressures from suppliers, distributors and competitors, suggests model-making may not confer the sort of monopoly-like powers enjoyed by the tech giants. “One very important thing to understand about the future: the economics of AI are about to change completely,” said François Chollet, a veteran AI researcher, on X, a social-media site, the day o3 was made public.
Chart: The Economist
Mr Chollet has helped drum up excitement about o3. In June he launched a $1m prize for models that could run a gauntlet he had created five years earlier called the “Abstraction and Reasoning Corpus”, or ARC. It is a plethora of simple-looking visual-reasoning puzzles (see illustration) intended to be “easy for humans and impossible for modern AI”. (Easy being relative—in a study in September, humans recruited online scored 60-70% on the test.) The prize wasn’t just challenging for its own sake. Mr Chollet said beating an ARC task was a “critical” step towards building artificial general intelligence, meaning machines beating humans at many tasks.
Six months later OpenAI aced the test. Its o3 model achieved a breakthrough score of 91.5%. Its success in the challenge showed a step-change in AI’s ability to adapt to novel tasks, Mr Chollet said. The new model is not just better; it is different. Like o1, it uses a “test-time compute” approach, which produces better results the more time that is spent on inference (when a trained ai model answers queries). Rather than simply producing an answer as quickly as it can spit it out, o3 is built to—in effect—think harder about the question.
That is where the higher costs come in. Mr Chollet set a limit of $10,000 on the amount that contestants can spend on computing power to answer the 400 questions in his challenge. When OpenAI put forward a model under the limit, it spent $6,677 (about $17 per question) to score 82.8%. The score of 91.5%, achieved by o3, came from blowing the budget. The company didn’t reveal the amount spent, but said that the expensive version of the process used 172 times the amount of “compute” as the cheaper approach—suggesting around $3,000 to solve a single query that takes humans seconds.
To be sure, past AI models already challenged the low-marginal-cost norm of the software industry, because answering queries required substantially more processing power than using equivalent tools like a search engine. But the costs of building large language models and running them were small enough in absolute terms that OpenAI could still give away access for free.
With the latest models that is no longer the case. OpenAI restricts the “pro” version of the o1 model to users on its $200-a-month subscription tier (and loses money, according to Sam Altman, its boss, because customers are spending more on queries than the company had budgeted for). Pierre Ferragu of New Street Research, a firm of analysts, reckons that OpenAI may charge as much as $2,000 a month for full access to o3.
The power of such models relies on them bringing a version of the sector’s “scaling laws” closer to the end user. Until now, progress in AI had relied on bigger and better training runs, with more data and more computer power creating more intelligence. But once a model was trained, it was hard to use extra processing power well. As o3’s success on the ARC challenge shows, that is no longer the case. Scaling laws appear to have moved from training models to inference.
Such developments change the economics facing model-makers, such as OpenAI. The new models’ dependence on more processing power strengthens their suppliers, such as Nvidia, a maker of specialist AI chips. It also benefits the distributors of ai models, notably the cloud-service providers Amazon, Microsoft and Alphabet (Google’s parent company). And it may help justify the fortunes that these tech giants have invested in data centres because more inference will need more computing power. OpenAI will be squeezed from both sides.
Then there is competition. Google has released its own reasoning model, called Gemini 2.0 Flash, and other tech firms probably will too. Open-source models are expected to follow. Customers will be able to draw on multiple models from different providers. And although generative-AI models may improve a little through their interactions with customers, they lack true network effects (where the service gets a lot better the more users it has), unlike the products Google and Facebook made in the past era.
High marginal costs mean the model-builders will have to generate meaningful value in order to charge premium prices. The hope, says Lan Guan of Accenture, a consultancy, is that models like o3 will support AI agents that individuals and companies will use to increase their productivity. Even a high price for use of a reasoning model may be worth it compared with the cost of hiring, say, a fully fledged maths PhD. But that depends on how useful the models are.
Different use cases may also lead to more fragmentation. Jeremy Schneider of McKinsey, a consultancy, says providing AI services to corporate customers will require models that are specialised for the needs of each enterprise, rather than general-purpose ones such as ChatGPT.
Instead of being dominated by one firm, some expect model-making to be more like a traditional oligopoly, with high barriers to entry but no stranglehold—or monopoly profits. For now, OpenAI is the leader, but one of its main rivals, Anthropic, is reportedly raising money at a $60bn valuation, and xAI, majority-owned by Elon Musk, is worth $45bn. That suggests there are high hopes for them, too. With o3 OpenAI has demonstrated its technical edge, but its business model remains untested. ■
 

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo