Новости ИИ

Новые модели Granite R2 поддерживают 200+ языков

Нейроредакция

14 мая 2026 — 2 min read

Новые модели Granite Embedding Multilingual R2 решают важную задачу: обеспечивают поддержку множества языков при разумном размере. Эти модели готовы для бизнеса и показывают высокую эффективность. Они поддерживают более 200 языков, а также контекстное окно в 32 768 токенов. Это в 64 раза превышает показатель версии R1.

Особенности моделей

Существует два варианта моделей. granite-embedding-311m-multilingual-r2 — это полная модель со 311 миллионами параметров, которая создает векторы размером 768. Она поддерживает Matryoshka dimension truncation и лучше всего справляется со сложными задачами. granite-embedding-97m-multilingual-r2 — компактная модель с 97 миллионами параметров, выдающая векторы размером 384. Эта модель показывает лучшее качество поиска среди моделей своего размера.

Производительность и архитектура

Показатели производительности заметно улучшились. Модель 97M получила 60.3 балла в тесте MTEB, опережая конкурентов с 300+ млн параметров. Модель 311M набрала 65.2 балла, что на 14.5 балла больше, чем у предшественника R1. На GPU NVIDIA H100 модель 97M обрабатывает более 2500 документов в секунду, а модель 311M — около 1800. Увеличенное окно в 32K токенов значительно улучшило результаты в тестах LongEmbed: прирост составил +31.3 для 97M и +34.0 для 311M.

Модели Granite Embedding R2 используют архитектуру ModernBERT с Flash Attention 2.0. Эффективность обеспечивают оптимизированные словари: 262 000 токенов для модели 311M и 180 000 для 97M. Модель 311M поддерживает Matryoshka embeddings, что позволяет сократить размерность векторов (например, до 128) при минимальной потере качества — сохраняется 97% производительности.

Практическое применение

Модели подходят для множества задач. С их помощью можно работать с данными на 200+ языках. Инструмент полезен для RAG и работы международных команд разработчиков. Модели обучены на данных IBM и соответствуют корпоративным стандартам, исключая данные с некоммерческими лицензиями. Matryoshka в модели 311M экономит ресурсы: расходы на хранение и поиск сокращаются в 3–6 раз.

Интеграция проста: они работают с библиотеками `sentence-transformers` и `LangChain`. Модели поставляются с весами ONNX и OpenVINO, совместимы с vLLM и llama.cpp/Ollama (GGUF). Часто достаточно просто сменить имя модели, чтобы добавить многоязычную поддержку без переписывания скриптов.

Как выбрать модель

Выбирайте granite-embedding-311m-multilingual-r2 для максимальной точности в сложных кросс-язычных задачах, если инфраструктура позволяет или требуется гибкость Matryoshka.

Рассмотрите granite-embedding-97m-multilingual-r2 для продакшена, если важны низкая задержка и высокая скорость. Рекомендуется как замена узкоспециализированным моделям. Она мгновенно добавляет поддержку 200+ языков и требует меньше ресурсов.

Ранее по теме
TML-Interaction-Small — ИИ с откликом 0.4 секунды

Больше новостей в нашем Телеграм. Подпишись!

Ссылка на источник тык.

Логотип Google Gemini 3.5 Pro на фоне графика акций Alphabet и символов искусственного интеллекта

Хаос в Google задержал Gemini 3.5 Pro

Внутренние проблемы и технические сбои Google затянул с выпуском Gemini 3.5 Pro из-за организационного хаоса. Четыре подразделения — DeepMind, Cloud, Android и Search — дублировали задачи друг друга, одновременно создавая инструменты для кодинга. Это привело к медленному принятию решений и неоправданному расходу ресурсов. Технические сложности также замедлили процесс: обновленные данные для

Логотипы Apple и OpenAI на фоне концепта AI-устройства и микросхем

Apple пригрозила 40 экс-сотрудникам в OpenAI

Apple против openai: битва за «железо» Apple и OpenAI конкурируют в сфере разработки AI-устройств, что создает ощутимую напряженность между компаниями. Apple заявляет, что это лишь начало. В центре внимания оказались бывшие сотрудники, в частности экс-дизайнер Apple, который теперь руководит аппаратным направлением в OpenAI. Компания действует решительно: юристы разослали предупреждения 40

Интерфейс Siri AI на экране Apple Watch в WatchOS 27 Public Beta

Siri AI в WatchOS 27 заменила ссылки ответами

Siri AI в WatchOS 27 public beta полностью меняет логику работы с Apple Watch. Теперь устройство не перенаправляет пользователя на сайты, а дает конкретный ответ в режиме живого диалога. Как настроить Обновите iPhone до iOS 27 Public Beta, после чего установите WatchOS 27 Public Beta через приложение Watch. В настройках

Инфографика моделей OpenAI GPT-5.6: Sol, Terra и Luna с указанием стоимости и назначения

OpenAI выпустила GPT-5.6 — три модели под бюджет

OpenAI выпустила GPT-5.6. Теперь вместо одной модели работает «меню» из трех вариантов. Вы выбираете модель под конкретную задачу и бюджет — это вопрос финансового планирования, а не только техники. Иерархия моделей и цены Sol — флагман для сложнейших задач ($5 за вход и $30 за выход). Terra — сбалансированный вариант ($2.50