Новые модели Granite R2 поддерживают 200+ языков

ИИ модели Granite Embedding R2: многоязычные, эффективные, с поддержкой 200+ языков, контекст 32K токенов, Matryoshka. Для бизнеса и разработчиков.

Новые модели Granite Embedding Multilingual R2 решают важную задачу: обеспечивают поддержку множества языков при разумном размере. Эти модели готовы для бизнеса и показывают высокую эффективность. Они поддерживают более 200 языков, а также контекстное окно в 32 768 токенов. Это в 64 раза превышает показатель версии R1.

Особенности моделей

Существует два варианта моделей. granite-embedding-311m-multilingual-r2 — это полная модель со 311 миллионами параметров, которая создает векторы размером 768. Она поддерживает Matryoshka dimension truncation и лучше всего справляется со сложными задачами. granite-embedding-97m-multilingual-r2 — компактная модель с 97 миллионами параметров, выдающая векторы размером 384. Эта модель показывает лучшее качество поиска среди моделей своего размера.

Производительность и архитектура

Показатели производительности заметно улучшились. Модель 97M получила 60.3 балла в тесте MTEB, опережая конкурентов с 300+ млн параметров. Модель 311M набрала 65.2 балла, что на 14.5 балла больше, чем у предшественника R1. На GPU NVIDIA H100 модель 97M обрабатывает более 2500 документов в секунду, а модель 311M — около 1800. Увеличенное окно в 32K токенов значительно улучшило результаты в тестах LongEmbed: прирост составил +31.3 для 97M и +34.0 для 311M.

Модели Granite Embedding R2 используют архитектуру ModernBERT с Flash Attention 2.0. Эффективность обеспечивают оптимизированные словари: 262 000 токенов для модели 311M и 180 000 для 97M. Модель 311M поддерживает Matryoshka embeddings, что позволяет сократить размерность векторов (например, до 128) при минимальной потере качества — сохраняется 97% производительности.

Практическое применение

Модели подходят для множества задач. С их помощью можно работать с данными на 200+ языках. Инструмент полезен для RAG и работы международных команд разработчиков. Модели обучены на данных IBM и соответствуют корпоративным стандартам, исключая данные с некоммерческими лицензиями. Matryoshka в модели 311M экономит ресурсы: расходы на хранение и поиск сокращаются в 3–6 раз.

Интеграция проста: они работают с библиотеками `sentence-transformers` и `LangChain`. Модели поставляются с весами ONNX и OpenVINO, совместимы с vLLM и llama.cpp/Ollama (GGUF). Часто достаточно просто сменить имя модели, чтобы добавить многоязычную поддержку без переписывания скриптов.

Как выбрать модель

Выбирайте granite-embedding-311m-multilingual-r2 для максимальной точности в сложных кросс-язычных задачах, если инфраструктура позволяет или требуется гибкость Matryoshka.

Рассмотрите granite-embedding-97m-multilingual-r2 для продакшена, если важны низкая задержка и высокая скорость. Рекомендуется как замена узкоспециализированным моделям. Она мгновенно добавляет поддержку 200+ языков и требует меньше ресурсов.

Ранее по теме
TML-Interaction-Small — ИИ с откликом 0.4 секунды

Больше новостей в нашем Телеграм. Подпишись!

Ссылка на источник тык.

Read more

Изображение: фейковый AI-блогер с логотипами нейросетей, олицетворяющий мошенничество в соцсетях и продажу товаров.

Мошенники используют ИИ-блогеров для выманивания денег

Мошенники создают виртуальных блогеров с помощью нейросетей. Эти персонажи «жалуются» на жизнь, чтобы втереться в доверие и продать бесполезный товар. Как работают эти мошенники Схема проста: в день создаются сотни поддельных профилей. Например, аккаунт "Aliyahsbuckles" собрал 40 тысяч подписчиков и миллионы просмотров, переупаковывая чужой контент для продажи дешевых

Онлайн-сервис Past Maps, наложение старых карт на современные данные, использование AI для OCR и автоматизации, модель подписки, исторические исследования.

ИИ сократил время техподдержки Past Maps в 6 раз

Past Maps — это онлайн-сервис, который накладывает старые карты на современные географические данные. Он полезен для историков, генеалогов, исследователей и специалистов, например, нефтяников, изучающих старые скважины. Рост популярности и новая модель дохода За три года число пользователей Past Maps выросло с 20 000 до 300 000 в месяц. Сервис перешел от

Разработчик работает за компьютером, на экране код и символы ИИ. Графики показывают снижение продуктивности и рост техдолга из-за ИИ.

ИИ-помощники снизили производительность разработчиков и увеличили долги

Зависимость от ИИ-помощников стала нормой: многие разработчики уже не готовы писать код без поддержки нейросетей. Это меняет стандартные рабочие процессы в IT. Исследования 2025 года показали: ожидания от ИИ часто разбиваются о реальность. Вместо обещанного ускорения задачи стали занимать больше времени из-за отладки, настройки и ожидания ответов нейросетей. К февралю

Логотип OpenAI и схема Frontier Governance Framework (FGF) для безопасной разработки ИИ.

OpenAI представила готовый стандарт безопасности ИИ-разработок

OpenAI представляет Frontier Governance Framework (FGF) — готовую инструкцию по безопасной разработке ИИ. Этот фреймворк помогает избежать серьезных рисков при масштабировании. FGF соответствует требованиям регуляторов, таким как EU General-Purpose AI Code of Practice и California’s Transparency in Frontier AI Act (TFAIA). Используйте этот документ как шаблон для своих систем: он

Хочешь больше информации про автоматизацию и AI?

В ТГ-канале «Дети нейросети» рассказываю про автоматизацию бизнеса.

Автоматизироваться
Дети Нейросети © 2026