Приложения и сервисы генеративного ИИ дорожают из-за роста затрат на инфраструктуру. Новые графические процессоры и ускорители могут облегчить спрос на инференс, но конечный потребитель экономии не заметит.
Волна сокращений продолжается: m* уволит 10% сотрудников, Cloudflare — около 1100 человек. Крупные компании вроде OpenAI и Anthropic пока защищены, а Microsoft, m* и AWS отстают в разработке моделей. Разработчики отказываются от фиксированных тарифов, переходят на оплату по факту потребления. Это неприятный сюрприз для работодателей, надеявшихся на дешёвую замену сотрудников.
Более дешёвые токены оптимизируют экономику, но новое оборудование выйдет не раньше конца года или следующего. OpenAI GPT-5.5 подорожала вдвое, Google Gemini 3.5 Flash — в 3–6 раз. Рост цен усугубляется тем, что ИИ-агенты потребляют больше токенов, чем чат-боты.
Появились практические применения: Claude Code, Codex, GitHub Copilot. Но ЦОДы не рассчитаны на инференс. Nvidia поглотила Groq за $20 млрд, AMD, AWS, Intel и Google готовят свои ускорители, стремясь снизить стоимость токена.

0 комментариев