На этой неделе в Кремниевой долине осознают, что создание усовершенствованной модели искусственного интеллекта может уже не быть такой уж специализированной задачей, как считалось ранее.
Пробуждающим сигналом стал DeepSeek, китайский стартап, созданный год назад, чья бесплатная модель искусственного интеллекта с открытым исходным кодом R1 более или менее соответствует передовым моделям американских технологических гигантов. При этом она была создана за малую часть стоимости, по-видимому, с использованием менее продвинутых чипов и требует гораздо меньше мощности центра обработки данных для своей работы.
До сих пор общепринятой мудростью в технологическом мире США было то, что американские технологические гиганты могли бы оставаться впереди, тратя миллиарды долларов, накапливая передовые чипы и строя огромные центры обработки данных (несмотря на экологические издержки). По сути, поскольку они входят в число самых богатых компаний в мире, они считали, что они могли бы направить на решение проблемы больше ресурсов, чем кто-либо другой, и выйти победителем.
Теперь все это поставлено под сомнение. А технологические гиганты сталкиваются с непростыми вопросами со стороны Уолл-стрит.
Имя искусственного интеллекта, возможно, больше не побеждает в игре с самыми дорогими и все более мощными моделями.
«Парадигма меняется», — сказал Зак Касс, консультант по ИИ и бывший руководитель отдела вывода решений OpenAI на рынок.
«Так сложно владеть научным прорывом», например, усовершенствованием модели ИИ, сказал Касс, и не дать конкурентам догнать вас. Вместо этого технологические компании теперь могут оказаться в ситуации, когда им приходится конкурировать за снижение затрат и создание более полезных приложений для потребителей и корпоративных клиентов — а также за потребление меньшего количества энергии и природных ресурсов в этом процессе.
Реакция Кремниевой долины
По крайней мере один американский технологический лидер уже пообещал отреагировать на DeepSeek, ускорив выпуск более мощных моделей.
Генеральный директор OpenAI Сэм Альтман назвал модель DeepSeek R1 «впечатляющей» в посте X в понедельник, добавив, что «мы выпустим несколько релизов» новых моделей в ответ. Директор по продуктам OpenAI Кевин Вейл также сказал, что грядущая модель o3 компании, запуск которой запланирован на ближайшие недели, «станет еще одним важным шагом вперед».
«Это сверхконкурентная отрасль, не так ли? И это показывает, что она конкурентоспособна в глобальном масштабе, а не только в пределах США», — сказал Вейл во время телефонного разговора с журналистами о новом предложении OpenAI ChatGPT для государственных учреждений в ответ на вопрос CNN. «Мы стремимся двигаться здесь очень быстро. Мы хотим оставаться впереди».
Но аналитики также ожидают, что крупные технологические компании сократят свои планы расходов на центры обработки данных и, возможно, пересмотрят размер платы, которую они взимают с потребителей. DeepSeek доказала, что можно предоставлять технологию по более низкой цене, хотя некоторые отраслевые эксперты подняли брови от заявлений стартапа о расходах чуть менее 6 миллионов долларов на создание своей модели.
Крупнейший инвестор OpenAI, Microsoft, расследует, обучала ли DeepSeek свою модель на украденных данных OpenAI, сообщает Bloomberg. Даже если компания достигла своей революции эффективности с помощью некоторых должностных преступлений, достижения DeepSeek разожгли огонь под индустрией искусственного интеллекта Кремниевой долины.
«Все эти другие передовые лаборатории моделей — OpenAI, Anthropic, Google — будут строить гораздо более эффективные модели на основе того, что они узнают из DeepSeek», — сказал Джил Лурия, руководитель технологических исследований в инвестиционной компании DA Davidson. «И вы сможете использовать их за часть той цены, которую вы можете себе позволить сейчас, потому что запуск этих моделей будет стоить лишь часть той стоимости».
Конечно, отрасль почти наверняка в конечном итоге переключит свое внимание на «эффективность» — работая над добавлением возможностей ИИ, используя заданный объем вычислительной мощности, а не добавляя больше серверов для улучшения технологии. Существует лишь определенное количество компьютеров, которые вы можете построить, и лишь определенное количество электроэнергии, доступной для их обслуживания. И инструмент ИИ может стать лишь настолько эффективным, скажем, для написания электронных писем или планирования поездок, прежде чем делать его немного более мощным уже не имеет смысла.
Но DeepSeek, похоже, ускорил этот процесс. А в Кремниевой долине сокращение расходов на центры обработки данных может оказаться сложной задачей.
Буквально на прошлой неделе OpenAI, Oracle и SoftBank посетили Белый дом, чтобы объявить о создании новой компании и инвестициях в размере 500 миллионов долларов в инфраструктуру искусственного интеллекта в США; генеральный директор Microsoft Сундар Пичаи подтвердил, что он «хорошо справляется» с запланированными инвестициями своей компании в размере 80 миллиардов долларов в разработку и инфраструктуру искусственного интеллекта в этом году; а генеральный директор Meta Марк Цукерберг заявил, что расходы его компании на ИИ могут достичь 65 миллиардов долларов в этом году.
«Это безумное строительство центра обработки данных ИИ, о котором мы говорили последние пару лет? Им больше не нужно этого делать. Они могут построить гораздо меньше, потому что могут предоставлять гораздо больше услуг по гораздо более низкой цене», — сказал Лурия. Он добавил, что инвесторы, скорее всего, будут ожидать услышать об этих планах в отчетах о доходах американских технологических компаний в течение следующих двух недель.
Конечно, если технологические гиганты сократят расходы на центры обработки данных для обучения моделей ИИ — и, следовательно, будут взимать с клиентов меньшую плату — их инструменты будут использоваться чаще, увеличивая нагрузку на центры обработки данных в плане вывода (или людей, задающих вопросы), написали аналитики Bloomberg Intelligence во вторник. Поэтому пока еще неизвестно, насколько драматичным может быть это сокращение расходов на центры обработки данных.
Преимущества DeepSeek
Некоторые руководители технологических компаний говорят, что рассматривают DeepSeek как подтверждение, а не как угрозу.
Сторонники открытого исходного кода ИИ, где базовая архитектура модели доступна всем, а не платная, утверждают, что китайская модель является доказательством того, что американские компании должны делиться своими инновациями, а не скрывать их. Таким образом, вся отрасль в США могла бы развиваться быстрее и оставаться технологическим стандартом во всем мире.
«У США уже есть лучшие закрытые модели в мире. Чтобы оставаться конкурентоспособными, мы также должны поддерживать развитие активной экосистемы с открытым исходным кодом», — написал бывший генеральный директор Google Эрик Шмидт в своей статье в Washington Post во вторник.
Компания Meta, продвигающая ИИ с открытым исходным кодом с помощью своей модели Llama, также заявила, что такие модели «способствуют существенному сдвигу в отрасли, и это позволит всем быстрее воспользоваться преимуществами ИИ».
И даже если DeepSeek заставит в краткосрочной перспективе переосмыслить бизнес-модель, которую Кремниевая долина разработала для ИИ, люди, которые верят, что эта технология изменит мир, должны радоваться такому прогрессу, сказал Касс.
«Мы, я полагаю, справедливо напуганы, потому что думали, что у нас глобальное превосходство ИИ, когда на самом деле нам следует праздновать», — сказал Касс. «Потому что это еще одно доказательство того, что революция ИИ демократизирует технологию и она будет справедливо распределена».