Google выпустила Gemma 4 — ускорение до 3 раз

Логотип Google Gemma 4, иллюстрация работы ИИ на мобильных устройствах и компьютерах, графика ускорения производительности.

Google представила Gemma 4 — новое поколение открытых моделей, созданных на основе передовых технологий Gemini AI. Gemma 4 оптимизирована для работы непосредственно на вашем устройстве.

Компания Google открыла доступ к Gemma 4 по лицензии Apache 2.0. Это упрощает работу для разработчиков. Модели универсальны: они работают на обычных видеокартах, поддерживаются мобильные процессоры и интегрирована поддержка чипов TPU от Google.

Как gemma 4 ускоряет работу

Главное новшество Gemma 4Multi-Token Prediction (MTP). Эта технология устраняет «узкое место» при генерации текста. Раньше модель генерировала только один символ за раз.

MTP использует легкую модель-«черновик», которая предсказывает сразу несколько следующих символов. Затем основная модель Gemma проверяет их. Если предсказание верно, модель подтверждает весь блок данных разом, генерируя несколько символов за одно действие. Модели-«черновики» используют общие с основной моделью данные контекста, что значительно экономит время.

Результаты ускорения

Тесты показывают значительный рост скорости: ускорение достигает 3 раз в зависимости от устройства. На телефонах Pixel модель E2B работает в 2.8 раза быстрее, а E4B — в 3.1 раза. На чипах Apple M4 большая модель Gemma 4 ускоряется в 2.5 раза.

Польза для бизнеса и пользователей

MTP решает проблемы с производительностью и снижает задержку, что особенно актуально для больших моделей. Теперь они лучше работают на обычном оборудовании. Для телефонов это означает лучшую энергоэффективность: заряд батареи расходуется экономнее.

Качество ответов при этом сохраняется. Основная модель гарантирует точность. Локальная работа AI повышает конфиденциальность, так как вам не нужно отправлять данные в облако.

Простая интеграция

Интегрировать MTP в проекты на базе Gemma 4 не составит труда. Модели-«черновики» доступны бесплатно и могут быть интегрированы в популярные системы, такие как MLX, VLLM, SGLang и Ollama.

Ранее по теме
Google запустил Gemini Enterprise Agent Platform для контроля ИИ-агентов

Больше новостей в нашем Телеграм. Подпишись!

Ссылка на источник тык.

Read more

Meta* разрабатывает умный кулон с ИИ и сервис Wearables for Work для бизнеса, расширяя линейку носимых устройств.

Meta выпустит ИИ-кулон для записи разговоров

Meta активно развивает свою стратегию в области ИИ-оборудования. Компания планирует создать умный кулон с искусственным интеллектом. Первые тесты этого носимого устройства начнутся в следующем году. Это стало возможным благодаря покупке стартапа Limitless в конце 2025 года. Кулон будет крепиться к одежде или носиться как ожерелье. Его главная задача – записывать разговоры

Логотипы иконки AI-браузеров: Perplexity Comet, Dia, Neon, Atlas, Brave, DuckDuckGo, Vivaldi, SigmaOS. Обзор инновационных браузеров.

Битва AI-браузеров: как новые инструменты автоматизируют рутину

Perplexity’s Comet Comet — это браузер с поддержкой AI от Perplexity. Он функционирует как поисковый движок на базе чат-бота и способен автоматизировать рутинные задачи, такие как суммирование писем, просмотр веб-страниц и назначение встреч в календаре. Comet доступен по платной подписке «Max», стоимость которой составляет 200 долларов в месяц. Браузер автоматизирует

Изображение: фейковый AI-блогер с логотипами нейросетей, олицетворяющий мошенничество в соцсетях и продажу товаров.

Мошенники используют ИИ-блогеров для выманивания денег

Мошенники создают виртуальных блогеров с помощью нейросетей. Эти персонажи «жалуются» на жизнь, чтобы втереться в доверие и продать бесполезный товар. Как работают эти мошенники Схема проста: в день создаются сотни поддельных профилей. Например, аккаунт "Aliyahsbuckles" собрал 40 тысяч подписчиков и миллионы просмотров, переупаковывая чужой контент для продажи дешевых

Онлайн-сервис Past Maps, наложение старых карт на современные данные, использование AI для OCR и автоматизации, модель подписки, исторические исследования.

ИИ сократил время техподдержки Past Maps в 6 раз

Past Maps — это онлайн-сервис, который накладывает старые карты на современные географические данные. Он полезен для историков, генеалогов, исследователей и специалистов, например, нефтяников, изучающих старые скважины. Рост популярности и новая модель дохода За три года число пользователей Past Maps выросло с 20 000 до 300 000 в месяц. Сервис перешел от

Хочешь больше информации про автоматизацию и AI?

В ТГ-канале «Дети нейросети» рассказываю про автоматизацию бизнеса.

Автоматизироваться
Дети Нейросети © 2026