Breaking! Nvidia выпустили открытую LLM Nemotron 4 340B! – П | АйТиБорода

Breaking! Nvidia выпустили открытую LLM Nemotron 4 340B!

– По классике есть три варианта: Base, Instruct и Reward модель
– Дышит в спину GPT-4, а кое-где и обгоняет
– Обучена на 9Т токенов
– Приготовьтесь: Instruct модель обучена на данных, 98% которых были синтетическими
– 50+ языков, 40+ языков программирования
– Лицензия Apache 2.0 (разрешает коммерческое использование)
– Reward модель сейчас #1 на RewardBench

Еще одна особенность модели – она совсем не прожорливая, ей нужны всего-то две A100 и 1.3TB памяти. Nemotron предназначена в первую очередь для генерации синтетических данных для обучения LLM.

Плюсом ко всему, Nvidia выкатила еще и новый датасет человеческих предпочтений (для reward моделей) HelpSteer2. Ну просто песня

Все модели и датасет | тех.репорт

АйТиБорода

🧏‍♂️ 22.61K
Тэхналогіі

Гиковский контент про айтишку, технологии и науку. Без цензуры и лишнего пафоса. Слава Україні. Жыве Беларусь....

Далучайцеся
▲ Галасаваць (1)

Breaking! Nvidia выпустили открытую LLM Nemotron 4 340B! – П | АйТиБорода

Login