Gemma 2, Gemini 1.5 Flash и Pro, мощный ИИ-генератор изображений: Какие ИИ-продукты нам показали на ивенте Google I/O 2024?

15 мая, 2024  12:03

В рамках ежегодной конференции для разработчиков Google I/O 2024 компания Google анонсировала множество интересных продуктов и обновлений — от инициатив в области ИИ и машинного обучения до новых процессоров TPU.

Редакция NEWS.am Tech собрала для вас все самое интересное из ИИ-продуктов, представленных Google.

Обновления Gemini

Одна из интереснейших новинок — модель искусственного интеллекта Gemma 2 с открытым исходным кодом, включающая 27 млрд параметров. Ее запуск ожидается в июне этого года.

27 млрд параметров — заметный прогресс после версий Gemma 2B и Gemma 7B, выпущенных ранее в этом году, с 2 млрд и 7 млрд параметров соответственно. По словам вице-президента Google Labs Джоша Вудворда (Josh Woodward), Gemma 2 предложит лучшую в отрасли производительность в компактных размерах благодаря оптимизации для работы на графических процессорах Nvidia следующего поколения или одном хосте Google Cloud TPU в сервисе Vertex AI.

Линейка моделей искусственного интеллекта Gemini также пополнилась новой моделью Gemini 1.5 Flash, ориентированной на задачи, требующих высокой скорости: модель может обрабатывать данные практически молниеносно, без задержек. Нейросеть может с высокой скоростью обрабатывать текст, изображения и видео, и она подходит для приложений, требующих мгновенных ответов в режиме реального времени. Ее можно использовать, например, для общения с пользователями или клиентами, или для мгновенной генерации простых изображений.

А для задач, не требующих очень быстрых ответов, лучше подойдет улучшенная модель Gemini 1.5 Pro, которая может анализировать большие объемы текста, делать обобщения и переводы. Как сообщает издание The Verge, обе модели используют контекстное окно в 1 миллион токенов, что позволяет учитывать больше информации при генерации ответов. Для сравнения, контекстное окно GPT-4 составляет 128 000 токенов.

Imagen 3 и другие ИИ-инструменты

Еще один интересный анонс — новая версия генеративной нейросети семейства Imagen. Новый Imagen 3, который называют самым продвинутым генератором изображений от Google, более точно понимает текстовые запросы, генерирует более детализированные изображения, реже ошибается и, по словам главы исследовательского ИИ-подразделения Google Deep Mind Демиса Хассабиса (Demis Hassabis), создает меньше «отвлекающих артефактов».

Для предотвращения использования Imagen 3 для создания дипфейков, в процессе генерации изображений задействуется технология SynthID — на медиафайлы наносятся невидимые криптографические водяные знаки.

Еще одно интересное новшество — ИИ-модель Veo, с помощью которой можно создавать видеоклипы в разрешении 1080p длительностью около минуты на основе текстового описания. Есть возможность использовать различные визуальные и кинематографические стили и редактировать сгенерированные кадры.

Интеграция Gemini в сервисы Google

Google планирует добавить больше ИИ-возможностей в свою поисковую систему. В частности, для некоторых результатов поиска будут создаваться полностью сгенерированные ИИ обзоры. А функция Ask This Video позволит пользователям с помощью Gemini искать конкретную информацию внутри видео на YouTube.

Gemini также будет интегрирован в Gmail, и с ее помощью пользователи смогут искать, обобщать и составлять черновики писем. ИИ, как ожидается, сможет выполнять и более сложные задачи, такие как обработка возврата товара в интернет-магазине.

В Android 15 появится функция Gemini Live, позволяющая пользователям вести полноценные голосовые беседы с ИИ-помощником, который сможет видеть и реагировать на окружение пользователя через камеру смартфона.

Gemini Nano, самая компактная модель ИИ от Google, будет встроена прямо в десктопный клиент Chrome, начиная с версии 126. Это позволит разработчикам использовать ИИ-модель на устройстве для создания собственных функций.

В Google Maps разработчики смогут использовать возможности Gemini для создания ИИ-описаний мест и областей на основе данных от сообщества Google Maps.


 
 
 
 
  • Архив