Главные разработки в сфере ИИ за 2024 год: Apple, OpenAI и Nvidia

Что произошло в сфере ИИ за 2024 год

Мир в этом году получил точное представление о том, на что способен искусственный интеллект на самом деле, пишет The Verge. Каждая технологическая компания — от разработчиков «умных» домов до производителей носимых устройств и смартфонов — успела представить собственное ИИ-решение. Например, Samsung первым выпустил в продажу линейку смартфонов со встроенным искусственным интеллектом Galaxy AI, задав тренд в индустрии (и заодно увеличив операционную прибыль во втором квартале на 1458% год к году).

В 2024 году крупнейшие компании из списка Fortune Global 500 друг за другом ввели специальную должность директора или «главного специалиста» по искусственному интеллекту. Такого сотрудника наняли, например, американский инвестбанк Morgan Stanley (111-е место в Fortune Global) и фармацевтическая компания Eli Lilly (455-е место). Еще в конце весны 2024-го консалтинговая компания McKinsey провозгласила: уровень внедрения ИИ в мире резко поднялся — до 72% (с 55% в 2023 году). Бизнес в основном использует генеративный искусственный интеллект, то есть инструменты для создания текстов, видео и изображений на основе запросов. Чаще всего к ним обращаются компании, которые работают в маркетинге и продажах (34%), на втором месте — разработчики продуктов и услуг (23%), на третьем — ИТ-компании (17%). Большинство участников опроса McKinsey уверены, что в ближайшие 3 года инвестиции в ИИ внутри компаний будут только расти. К слову, по данным Crunchbase, только за первую половину 2024 года в ИИ-стартапы по всему миру вложили более $35,5 млрд.

Визионеры не устают делать амбициозные прогнозы. Так, в сентябре глава OpenAI Сэм Альтман опубликовал эссе The Intelligence Age, в котором заявил, что «в течение нескольких тысяч дней» у человечества появится суперинтеллект — сверхразумный ИИ, который по своим способностям превзойдет человека.

У каждого из нас появится личная команда ИИ из виртуальных экспертов в разных областях, которые будут работать вместе, чтобы создать практически все, что мы можем себе представить. У наших детей будут виртуальные наставники, которые предоставят персонализированные уроки по любому предмету, на любом языке и в любом темпе. Можно представить аналогичные инструменты для улучшения здравоохранения, создания любого ПО, которое только можно вообразить, и многого другого.
Сэм Альтман
генеральный директор OpenAI

Активное использование ИИ по всему миру привело и к ряду законодательных инициатив: в августе в ЕС в силу вступил AI Act — первый закон об искусственном интеллекте, который классифицирует все разработки по уровню риска (от «низкого» до «неприемлемого»). А в США, по данным Forbes, на рассмотрении находятся «почти три десятка дел», связанных с ИИ и нарушением авторских прав. Тем не менее крупные игроки продолжают привлекать инвестиции и предлагать новые продукты. «Московские новости» рассказывают о главных разработках и итогах 2024 года в индустрии.

Nvidia

В 2024 году американский технологический гигант Nvidia вложился в продвижение DGX Cloud. Это облачный сервис, который предоставляет доступ к инфраструктуре и ПО, необходимым для обучения ИИ. Forbes пишет, что компания «утроила расходы» на облачные сервисы, сделав их «одним из главных стратегических приоритетов». Среди партнеров у Nvidia по этому направлению — крупнейшие облачные провайдеры Amazon Web Services, Google Cloud Platform, Microsoft Azure и Oracle Cloud Infrastructure.

Кроме того, по состоянию на август 2024-го Nvidia контролирует около 80% рынка чипов на базе искусственного интеллекта. Это одна из причин, почему Минюст США ведет антимонопольное расследование в отношении компании. Американские регуляторы предполагают, что Nvidia предоставляет льготы и скидки тем клиентам, которые отказываются от сотрудничества с другими производителями, и «затрудняет переход покупателей к другим поставщикам чипов и ИИ-решений». Тем временем Amazon, Google и Microsoft разрабатывают собственные чипы, чтобы уменьшить зависимость от Nvidia.

OpenAI

В начале 2024-го одним из главных ИИ-трендов года называли развитие моделей text-to-video, которые позволяют генерировать видео по текстовому запросу. Компания OpenAI пошла по этому пути и уже в феврале представила нейросеть Sora, которая может создавать реалистичные ролики продолжительностью до минуты. Тогда ей могли воспользоваться только «избранные» художники, дизайнеры и режиссеры: разработчики запросили и получили обратную связь, которая помогла усовершенствовать нейросеть. В открытый доступ новую версию инструмента (Sora Turbo) выпустили только в декабре: пользователи подписок ChatGPT Plus и ChatGPT Pro могут генерировать видео в высоком качестве длительностью до 20 секунд.

В сентябре OpenAI показала o1 — новую ИИ-модель для чат-бота ChatGPT. В компании заявили, что эта версия способна «рассуждать, как человек». Сейчас подписчикам ChatGPT Pro ($200 в месяц) уже доступна более мощная версия нейросети — GPT-o1 Pro, которую предлагают использовать для программирования и решения сложных математических задач.

Meta*

Компания Марка Цукерберга тоже не смогла обойти стороной тренд на генерацию видео. Правда, конкурента Sora — семейство Movie Gen — в Meta* выпустили только в октябре. Нейросеть может создавать ролики максимальной продолжительностью 16 секунд (частота — до 24 кадров в секунду). При этом ИИ способен генерировать фоновое аудио и синхронизировать его с происходящим на видео. Например, Movie Gen поможет наложить звуки джунглей или шум квадроцикла.

Meta* развивает конкурента ChatGPT — ИИ-модель с открытым исходным кодом Llama. В сентябре ее обновили до версии 3.2: Llama стала мультимодальной, то есть теперь модель способна обрабатывать как текст, так и изображения, а также анализировать графики и диаграммы. Главное преимущество продукта от Meta* — доступность ряда базовых функций без подключения к интернету.

The Verge отмечает, что компания в этом году также доработала свои «умные» очки Ray-Ban Meta* и может «выиграть гонку» носимых устройств, которые функционируют на базе ИИ. Так, гаджет определяет объекты вокруг пользователей, рассказывает о достопримечательностях, пишет посты для соцсетей и при необходимости обеспечивает звонок по видеосвязи. Но TechCrunch напоминает о рисках: издание выяснило, что любое изображение, которым делится владелец Ray-Ban, может быть использовано для обучения ИИ.

Google

Корпорация под конец года провела большую презентацию, где показала сразу несколько новинок. Среди них — модель Gemini 2.0, которая, по словам разработчиков Google, в 2 раза быстрее предыдущей версии. Также нейросеть может генерировать изображения и аудио на нескольких языках.

В арсенале корпорации теперь есть и набор виртуальных помощников и агентов. Прорывом в индустрии называют Project Mariner — прототип ИИ-помощника, который выполняет действия в браузере Chrome за человека: перемещает курсор на экране, кликает на ссылки и заполняет формы. Project Mariner можно будет поручить разные задачи — например, создать корзину покупок в магазине на основе заданного списка. При этом у помощника нет возможности самостоятельно принимать файлы cookie и подписывать соглашения об использовании персональных данных от имени пользователей.

Кстати, на конференции по итогам третьего квартала 2024 года глава Google Сундар Пичаи рассказал, что более 25% нового кода в Google уже пишет ИИ. Тогда же корпорация опубликовала квартальный отчет: чистая прибыль Alphabet увеличилась на 34% год к году — до $26,3 млрд. И это связано с «ускоренным ростом» спроса на ИИ-продукты, пишет Business Insider.

Microsoft

Корпорация сделала ставку на партнерство с крупными игроками. Вместе с OpenAI они к 2028 году собираются построить дата-центр Stargate. Там установят суперкомпьютер «с миллионами специализированных серверных чипов» — для поддержки ИИ-продуктов от OpenAI. Стоимость проекта оценивается в $100 млрд. А расширенное сотрудничество с Nvidia, о котором компании объявили в марте 2024-го, предполагает интеграцию генеративного ИИ от Nvidia в сервисы Microsoft (Microsoft Azure, Microsoft Fabric, Microsoft 365 и другие).

В корпорации работают и над собственными инструментами. Так, в начале октября Microsoft представила обновленную версию нейросети Copilot — с голосовым интерфейсом и анализом данных в Excel с помощью Python.

Apple

Владельцы устройств Apple провели год в ожидании Apple Intelligence — первой ИИ-технологии от компании. Доступ к разработке пользователи получили в октябре (правда, частичный и в режиме бета-тестирования). Владельцы iPhone, iPad и Mac смогли опробовать новые инструменты для письма: Apple Intelligence помогает исправить ошибки в тексте или сделать конспект. Среди прочего появились и подборки уведомлений — ИИ «достает» из пушей важные детали и собирает краткое резюме.

С выходом обновления iOS 18.2 пользователям открыли еще несколько функций на базе Apple Intelligence. Главное — интеграция с ChatGPT: пользователь может поставить Siri сложную задачу (генерация текста или решение математического примера), а голосовой помощник перенаправит запрос чат-боту. Ответ появится на экране устройства в интерфейсе Siri. Также среди нововведений — приложение Image Playground, которое генерирует изображения в разных стилях.

Фото обложки: Midjourney

*Компания Meta признана в России экстремистской.

ИИтоги года: как искусственный интеллект «вырос» за 366 дней