В прошлом месяце DeepSeek перевернул мир технологий с ног на голову — и на то были веские причины, по словам экспертов в области искусственного интеллекта, которые говорят, что мы, скорее всего, наблюдаем лишь начало влияния китайского технологического стартапа на сферу ИИ.
DeepSeek попала в заголовки новостей в конце января со своей моделью R1 AI, которая, по словам компании, может примерно соответствовать производительности модели o1 от Open AI при значительно меньших затратах. Акции технологических компаний упали, когда DeepSeek ненадолго потеснил ChatGPT и стал лучшим приложением в App Store от Apple.
Это достижение заставило американских технологических гигантов усомниться в позиции Америки в гонке ИИ против Китая – и в миллиардах долларов, стоящих за этими усилиями. Хотя вице-президент Дж. Д. Вэнс не упомянул DeepSeek или Китай по имени в своих выступлениях на Саммите действий в области искусственного интеллекта в Париже во вторник, он, безусловно, подчеркнул, насколько важным приоритетом для Соединенных Штатов является лидерство в этом секторе.
«Соединенные Штаты Америки являются лидером в области ИИ, и наша администрация планирует сохранить это положение», — сказал он, хотя и добавил, что «Америка хочет сотрудничать» с другими странами.
Но дело не только в эффективности и мощности DeepSeek. То, как DeepSeek R1 может рассуждать и «думать» над ответами, чтобы предоставлять качественные результаты, а также решение компании сделать ключевые части своей технологии общедоступными, также будет продвигать эту область вперед, говорят эксперты.
Хотя ИИ уже давно используется в технологических продуктах, за последние два года он достиг точки кипения благодаря росту ChatGPT и других генеративных ИИ-сервисов, которые изменили то, как люди работают, общаются и находят информацию. Он сделал любимцами Уолл-стрит такие компании, как производитель чипов Nvidia и перевернули траекторию гигантов Кремниевой долины. Поэтому любая разработка, которая может помочь построить более эффективные и производительные модели, обязательно будет под пристальным вниманием.
«Это определенно не шумиха», — сказал Орен Этциони, бывший генеральный директор Института искусственного интеллекта Аллена. «Но, кроме того, это очень быстро меняющийся мир».
Момент TikTok от ИИ
Лидеры технологий быстро отреагировали на рост DeepSeek. Генеральный директор Google DeepMind Демис Хассабис назвал шумиху вокруг DeepSeek «преувеличенной», но также сказал, что его модель «вероятно, лучшая работа, которую я видел из Китая», сообщает CNBC.
Генеральный директор Microsoft Сатья Наделла заявил в квартальном отчете компании В январе на конференции по финансовым результатам было отмечено, что у DeepSeek есть «реальные инновации», а генеральный директор Apple Тим Кук заявил на конференции по финансовым результатам производителя iPhone, что «инновации, повышающие эффективность, — это хорошо».
Но внимание было не только позитивным. Исследователь полупроводников SemiAnalysis поставил под сомнение заявления DeepSeek о том, что обучение обошлось всего в 5,6 млн долларов. OpenAI сообщила The Financial Times, что нашла доказательства того, что DeepSeek использовала модели американской компании для обучения своего конкурента.
«Мы знаем и изучаем признаки того, что DeepSeek мог неправильно преобразовать наши модели, и поделимся информацией, как только узнаем больше», — заявил представитель OpenAI в комментарии CNN. С DeepSeek не удалось немедленно связаться для получения комментария.
А пара американских законодателей уже призвала запретить приложение на правительственных устройствах после того, как исследователи безопасности указали на его потенциальные связи с китайским правительством, как сообщили Associated Press и ABC News. Аналогичные опасения были высказаны в отношении популярного приложения для социальных сетей TikTok, которое должно быть продано американскому владельцу или рискует быть запрещенным в США.
«DeepSeek — это TikTok (больших языковых моделей)», — сказал Этциони.
Глубокое впечатление от DeepSeek на мир технологий
Технологические гиганты уже задумываются о том, как технология DeepSeek может повлиять на их продукты и услуги.
«DeepSeek по сути предоставил нам рецепт в виде технического отчета, но они не дали нам дополнительных недостающих частей», — сказал Льюис Танстолл, старший научный сотрудник Hugging Face, платформы искусственного интеллекта, предлагающей инструменты для разработчиков.
Танстолл возглавляет работу Hugging Face по полному открытию исходного кода модели R1 DeepSeek; хотя DeepSeek предоставила исследовательскую работу и параметры модели, она не раскрыла код или данные обучения.
Наделла сказал на конференции Microsoft, посвященной доходам, что ПК с Windows Copilot+ или ПК, созданные в соответствии с определенной спецификацией для поддержки моделей ИИ, смогут локально запускать модели ИИ, полученные из DeepSeek R1. Производитель мобильных чипов Qualcomm заявил во вторник, что модели, полученные из DeepSeek R1, будут работать на смартфонах и ПК на базе его чипов в течение недели.
Исследователи, ученые и разработчики в области искусственного интеллекта все еще изучают значение DeepSeek для развития искусственного интеллекта.
Модель DeepSeek — не единственная модель с открытым исходным кодом и не первая, способная рассуждать над ответами перед тем, как дать ответ; прошлогодняя модель OpenAI o1 тоже умеет это делать.
То, что делает DeepSeek значимым, — это то, как он может рассуждать и учиться на других моделях, а также тот факт, что сообщество ИИ может видеть, что происходит за кулисами. Те, кто использует модель R1 в приложении DeepSeek, также могут видеть ее «мыслительный» процесс, когда она отвечает на вопросы.
«Вы можете видеть, как вращаются колеса внутри машины», — сказал Дурга Маллади, старший вице-президент и генеральный менеджер по технологическому планированию и периферийным решениям компании Qualcomm, в интервью CNN.
Танстолл считает, что в не столь отдаленном будущем мы можем увидеть волну новых моделей, которые смогут рассуждать как DeepSeek. Это может быть критически важно, поскольку технологические гиганты стремятся создать агентов ИИ, которых Кремниевая долина в целом считает следующим этапом эволюции чат-бота и того, как потребители будут взаимодействовать с устройствами, хотя этот сдвиг еще не произошел.
Grok 3, следующая версия чат-бота на платформе социальных сетей X, будет обладать «очень мощными возможностями рассуждения», заявил ее владелец Илон Маск в четверг в видеообращении во время Всемирного саммита правительств.
На данный момент сообщество ИИ продолжит экспериментировать с тем, что может предложить DeepSeek. То есть, пока не произойдет следующий прорыв.
«Я определенно предсказываю, что в течение следующих 12 месяцев его вытеснит что-то другое», — сказал Этциони. «Но это вполне реальный прогресс».