С помощью новых нейросетей белгородцы смогут генерировать тексты на русском и ещё 60 языках

Каждая модель содержит 13 миллиардов параметров и способна создавать тексты на русском или других языках.

Для пользователей стали доступны новые нейросети по генерации текста для русского и ещё 60 языков. Их открыла команда Сбера. Нейросетевая модель генерации текста для русского языка ruGPT-3.5 13B — её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей компании, способную генерировать тексты на 61 языке. Обе модели доступны на платформе HuggingFace, и их могут использовать все разработчики, модели опубликованы под открытой лицензией MIT.

Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями банка архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2 048 токенов. Она обучена на текстовом корпусе размером около 1 терабайта, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов.

Также в открытом доступе опубликована многоязычная модель mGPT 13B. Версия mGPT 13B содержит 13 миллиардов параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 гигабайтах текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Игорь Резанов

Читайте также

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter.

Похожие новости

Всероссийская Сбербанкиада в Казани соберёт около 2,5 тысячи человек

Всероссийская Сбербанкиада в Казани соберёт около 2,5 тысячи человек

Сотрудники Центрально-Чернозёмного банка Сбера спасли от мошенников почти 13 миллионов рублей своих клиентов

Сотрудники Центрально-Чернозёмного банка Сбера спасли от мошенников почти 13 миллионов рублей своих клиентов

В Воронеже провели межрегиональный турнир по хоккею с шайбой среди команд Черноземья

В Воронеже провели межрегиональный турнир по хоккею с шайбой среди команд Черноземья

В 60 городах России проведут юбилейный «Зелёный марафон»

В 60 городах России проведут юбилейный «Зелёный марафон»

Сбер: Для обеспечения экономики длинными деньгами нужно развивать рынок капитала

Сбер: Для обеспечения экономики длинными деньгами нужно развивать рынок капитала

Учёные создали базу изображений минералов с их описаниями для обучения ИИ

Учёные создали базу изображений минералов с их описаниями для обучения ИИ

Медийщикам показали, как в Орле делают керамическую плитку

Медийщикам показали, как в Орле делают керамическую плитку

Сбер назвал средний размер чаевых в Черноземье

Сбер назвал средний размер чаевых в Черноземье

Страховые компании Сбера возместят убытки пострадавших от разрушения подъезда в Белгороде

Страховые компании Сбера возместят убытки пострадавших от разрушения подъезда в Белгороде

Более 10 тысяч белгородцев подали заявки на обучение в «Школе-21»

Более 10 тысяч белгородцев подали заявки на обучение в «Школе-21»

Сотрудники белгородского отделения Сбера собрали более 900 килограмм макулатуры в акции «БумБаттл»

Сотрудники белгородского отделения Сбера собрали более 900 килограмм макулатуры в акции «БумБаттл»

Сбербанк: средний срок просрочки по кредиту в России за полгода снизился с 19 до 18 дней

Сбербанк: средний срок просрочки по кредиту в России за полгода снизился с 19 до 18 дней

Белгородских школьников приглашают поучаствовать в международной ИТ-олимпиаде

Белгородских школьников приглашают поучаствовать в международной ИТ-олимпиаде

Исследование «Домклик»: доля льготной ипотеки в России в мае составила 85,5 процента

Исследование «Домклик»: доля льготной ипотеки в России в мае составила 85,5 процента