С помощью новых нейросетей белгородцы смогут генерировать тексты на русском и ещё 60 языках

Каждая модель содержит 13 миллиардов параметров и способна создавать тексты на русском или других языках.

Для пользователей стали доступны новые нейросети по генерации текста для русского и ещё 60 языков. Их открыла команда Сбера. Нейросетевая модель генерации текста для русского языка ruGPT-3.5 13B — её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей компании, способную генерировать тексты на 61 языке. Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.

Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями банка архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2 048 токенов. Она обучена на текстовом корпусе размером около 1 терабайта, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.

Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 миллиардов параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 гигабайтах текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Игорь Резанов

Читайте также

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter.

Похожие новости

Всероссийская Сбербанкиада в Казани соберёт около 2,5 тысячи человек

Всероссийская Сбербанкиада в Казани соберёт около 2,5 тысячи человек

Сотрудники Центрально-Чернозёмного банка Сбера спасли от мошенников почти 13 миллионов рублей своих клиентов

Сотрудники Центрально-Чернозёмного банка Сбера спасли от мошенников почти 13 миллионов рублей своих клиентов

В Сбере рассказали, что над сценарием фильма «Чебурашка» работали 1,5 года

В Сбере рассказали, что над сценарием фильма «Чебурашка» работали 1,5 года

Сбер выдал первую в Белгородской области ипотеку для IT-специалистов

Сбер выдал первую в Белгородской области ипотеку для IT-специалистов

Сбер начал выдавать ипотеку на строительство дома под залог земли

Сбер начал выдавать ипотеку на строительство дома под залог земли

Белгородцы чаще других жителей Черноземья берут ипотеку по госпрограммам

Белгородцы чаще других жителей Черноземья берут ипотеку по госпрограммам

Журналисты и блогеры поучаствовали в первом в России пробеге на электрокарах

Журналисты и блогеры поучаствовали в первом в России пробеге на электрокарах

В 2023 году Сбер открыл более 20 офисов нового формата в Черноземье

В 2023 году Сбер открыл более 20 офисов нового формата в Черноземье

Белгородская молодёжь может побороться за 14 миллионов рублей в конкурсе по ИИ

Белгородская молодёжь может побороться за 14 миллионов рублей в конкурсе по ИИ

Белгородцы — в лидерах по количеству взятой «Семейной ипотеки» среди Черноземья

Белгородцы — в лидерах по количеству взятой «Семейной ипотеки» среди Черноземья

Сбер предупредил о новой схеме телефонных мошенников

Сбер предупредил о новой схеме телефонных мошенников

Сбер провёл в Белгороде День детской цифровой безопасности

Сбер провёл в Белгороде День детской цифровой безопасности

В Липецке открыли новый кампус «Школы 21»

В Липецке открыли новый кампус «Школы 21»

Сбер и ФНС планируют улучшить взаимодействие с гражданами при помощи ИИ

Сбер и ФНС планируют улучшить взаимодействие с гражданами при помощи ИИ