С помощью новых нейросетей белгородцы смогут генерировать тексты на русском и ещё 60 языках

Каждая модель содержит 13 миллиардов параметров и способна создавать тексты на русском или других языках.

Для пользователей стали доступны новые нейросети по генерации текста для русского и ещё 60 языков. Их открыла команда Сбера. Нейросетевая модель генерации текста для русского языка ruGPT-3.5 13B — её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей компании, способную генерировать тексты на 61 языке. Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.

Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями банка архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2 048 токенов. Она обучена на текстовом корпусе размером около 1 терабайта, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.

Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 миллиардов параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 гигабайтах текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Игорь Резанов

Читайте также

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter.

Похожие новости

Всероссийская Сбербанкиада в Казани соберёт около 2,5 тысячи человек

Всероссийская Сбербанкиада в Казани соберёт около 2,5 тысячи человек

Сотрудники Центрально-Чернозёмного банка Сбера спасли от мошенников почти 13 миллионов рублей своих клиентов

Сотрудники Центрально-Чернозёмного банка Сбера спасли от мошенников почти 13 миллионов рублей своих клиентов

Власти Курской области встретились с представителями Сбера

Власти Курской области встретились с представителями Сбера

С начала года белгородцы совершили более 75 тысяч транзакций по сервисам SberPay

С начала года белгородцы совершили более 75 тысяч транзакций по сервисам SberPay

Сбер организует автопробег протяжённостью более 3,5 тысячи километров

Сбер организует автопробег протяжённостью более 3,5 тысячи километров

Сбер провёл конференцию для белгородских HR-директоров

Сбер провёл конференцию для белгородских HR-директоров

Сбер повышает ставки по депозитам и ипотеке

Сбер повышает ставки по депозитам и ипотеке

Белгородский студенческий стартап стал лучшим на демодне молодёжных акселераторов Сбера

Белгородский студенческий стартап стал лучшим на демодне молодёжных акселераторов Сбера

Сбер: почти на треть выросли траты россиян на путешествия по стране

Сбер: почти на треть выросли траты россиян на путешествия по стране

Белгородец потратил более 300 тысяч бонусов СберСпасибо на оплату путешествия

Белгородец потратил более 300 тысяч бонусов СберСпасибо на оплату путешествия

Первый зампред Сбера Кирилл Царёв: ипотеку по госпрограммам фактически убыточная для банков

Первый зампред Сбера Кирилл Царёв: ипотеку по госпрограммам фактически убыточная для банков

Нейросеть Сбера GigaChat сдала экзамен на врача

Нейросеть Сбера GigaChat сдала экзамен на врача

Жители Черноземья получили страховые выплаты на 1,2 миллиарда рублей

Жители Черноземья получили страховые выплаты на 1,2 миллиарда рублей

Белгородцы получили страховые выплаты на 212 миллионов рублей

Белгородцы получили страховые выплаты на 212 миллионов рублей