С помощью новых нейросетей белгородцы смогут генерировать тексты на русском и ещё 60 языках

Каждая модель содержит 13 миллиардов параметров и способна создавать тексты на русском или других языках.

Для пользователей стали доступны новые нейросети по генерации текста для русского и ещё 60 языков. Их открыла команда Сбера. Нейросетевая модель генерации текста для русского языка ruGPT-3.5 13B — её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей компании, способную генерировать тексты на 61 языке. Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.

Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями банка архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2 048 токенов. Она обучена на текстовом корпусе размером около 1 терабайта, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.

Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 миллиардов параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 гигабайтах текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Игорь Резанов

Читайте также

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter.

Похожие новости

Всероссийская Сбербанкиада в Казани соберёт около 2,5 тысячи человек

Всероссийская Сбербанкиада в Казани соберёт около 2,5 тысячи человек

Сотрудники Центрально-Чернозёмного банка Сбера спасли от мошенников почти 13 миллионов рублей своих клиентов

Сотрудники Центрально-Чернозёмного банка Сбера спасли от мошенников почти 13 миллионов рублей своих клиентов

Власти Курской области встретились с представителями Сбера

Власти Курской области встретились с представителями Сбера

Сбер организует автопробег протяжённостью более 3,5 тысячи километров

Сбер организует автопробег протяжённостью более 3,5 тысячи километров

Сбер повышает ставки по депозитам и ипотеке

Сбер повышает ставки по депозитам и ипотеке

Белгородский студенческий стартап стал лучшим на демодне молодёжных акселераторов Сбера

Белгородский студенческий стартап стал лучшим на демодне молодёжных акселераторов Сбера

Белгородец потратил более 300 тысяч бонусов СберСпасибо на оплату путешествия

Белгородец потратил более 300 тысяч бонусов СберСпасибо на оплату путешествия

Жители Черноземья получили страховые выплаты на 1,2 миллиарда рублей

Жители Черноземья получили страховые выплаты на 1,2 миллиарда рублей

Сбер рассказал, сколько образовательных кредитов с господдержкой взяли белгородцы

Сбер рассказал, сколько образовательных кредитов с господдержкой взяли белгородцы

Глава Сбербанка на «Уроке Цифры» рассказал школьникам о перспективах искусственного интеллекта

Глава Сбербанка на «Уроке Цифры» рассказал школьникам о перспективах искусственного интеллекта

Белгородская, Орловская и Липецкая области — в числе лучших по ESG-индексу

Белгородская, Орловская и Липецкая области — в числе лучших по ESG-индексу

Исследование: Каждому десятому начинающему предпринимателю Черноземья больше 56 лет

Исследование: Каждому десятому начинающему предпринимателю Черноземья больше 56 лет

Три главных мифа об ипотеке: дорого, долго и невыгодно? [объясняет Сбер]

Три главных мифа об ипотеке: дорого, долго и невыгодно? [объясняет Сбер]

Белгородская область и СберУниверситет договорились о цифровой трансформации госуправления

Белгородская область и СберУниверситет договорились о цифровой трансформации госуправления