Nvidia представила открытую LLM модель Nemotron-4 340B

Сравнение Nemotron-4 340B с GPT-4-1106

На данный момент самая крупная, после DeepSeek-V2 236B, открытая LLM модель размером 340B. По тестам сравнения человеком как выигрывает у GPT-4-1106 (вышла в ноябре 2023), так и проигрывает, но чаще составляет паритет.

Обучалась на 50+ естественных языках и 40+ языках программирования. Архитектура модели построена на Grouped-Query Attention (GQA) и Rotary Position Embeddings (RoPE). Но длина контекста всего 4096 токенов.

Модель представлена в виде: Nemotron-4-340B-Base, Nemotron-4-340B-Instruct и Nemotron-4-340B-Reward.

Base — предназначена для генерации синтетических данных.
Insctuct — предназначена для чата и выполнения инструкций
Reward — base модель с дополнительным линейным слоем для обучения используя новый подход reward.

Модель распространяется под лицензией NVIDIA Open Model License Agreement, разрешающая коммерческое использование.

Сама модель может и в стихи, так как обучалась и на русском языке:

Онлайн демо: https://chat.lmsys.org/ (там выбрать Direct Chat)

Веса модели: https://huggingface.co/nvidia/Nemotron-4-340B-Instruct

safetensors: https://huggingface.co/failspy/Nemotron-4-340B-Instruct-SafeTensors

Больше подробностей в пресс-релизе.

Самая большая загадка — сможет ли 1 битное квантование gguf позволить запустить её локально, и что даст эта модель для сообщества llm.

Источник: habr.com

80-ваттная зарядка есть, а зарядник не положили: в Европе представлен смартфон Vivo V40

Пн Июн 17 , 2024

Из плюсов — 6,78-дюймовый AMOLED-дисплей 1,5K, камера ZEISS и аккумулятор на 5500 мАч Компания Vivo представила в Европе новый смартфон V40. По характеристикам он похож на модель Vivo S19, доступную в Китае, и тоже поддерживает быструю проводную зарядку мощностью 80 Вт. Только в отличие от китайского варианта у Vivo V40 […]

80-ваттная зарядка есть, а зарядник не положили: в Европе представлен смартфон Vivo V40

Разбираем важные нюансы подбора литиевых ХИТ для разработчиков

Новые характеристики антенных рефлекторов для спутников

АО «НИИЭТ» получил измерительные системы с возможностью тестирования большинства изделий собственной производимой продукции

«Росэлектроника» разработала устройство «три в одном» для криптозащиты сетей спецсвязи

В МФТИ создали сверхлегкую батарею для космического корабля

Студенты НГТУ НЭТИ создали инновационный ЧПУ станок для производства печатных плат

Продукция Hongfa для различных применений в Компэл

«Росэлектроника» разработала самый миниатюрный компьютер на базе Эльбруса

Конференция «Контрактная разработка электроники 2024»

«Росэлектроника» запатентовала уникальный клей для электроники

Apple отложила запуск ИИ-функций iOS 18 в ЕС из-за проблем с местным законодательством

Стартовали продажи портативной антенны Starlink Mini Dish со встроенным Wi-Fi-роутером за $599

Релиз открытого менеджера буфера обмена с функциями редактирования и создания скриптов CopyQ 9.0

Названо единственное условие вступления армии КНДР в СВО

Боец ВС РФ объяснил «успехи» ВСУ под Харьковом

В 1Password появились коды для восстановления доступа к учётной записи

В Британии рассказали об отдалении Вучича от Путина

БПЛА «международной коалиции» ударил по грузовику в Сирии

Неисправный брандмауэр вызвал сбой в системе 911 в Массачусетсе

В продажу вышли российские наушники Radiotehnika TD01С