Добавить новость

Суд отправил экс-главу Рязанской области Любимова в СИЗО по делу о взятке

Колумбия впервые экстрадировала своего гражданина в РФ

Главную новогоднюю елку России отправили в Кремль из подмосковного Можайска

В Москве задержали мошенника, сдававшего в аренду чужие квартиры



World News in Kazakh


Новости сегодня

Новости от TheMoneytizer

KAZ-LLM представлена Главе государства. В разработке участвовали Beeline Казахстан и QazCode

В Астане представили первую национальную языковую модель KAZ-LLM, разработанную для устранения языкового разрыва с помощью искусственного интеллекта. Модель была презентована Президенту Казахстана Касым-Жомарту Токаеву, став важным шагом в развитии отечественных технологий. Ее разработкой занимался Институт умных систем и искусственного интеллекта (ISSAI NU) совместно с Beeline Казахстан, QazCode и Astana Hub при координации МЦРИАП РК.
В последние годы в области генеративного искусственного интеллекта, особенно в сфере больших языковых моделей (LLM), наблюдается значительный прогресс. Модели, такие как GPT-4, LLaMA и Gemini, установили новые стандарты, продемонстрировав впечатляющие уровни сложности и функционала. Однако подобные достижения в основном охватывают языки с высоким уровнем доступности, такие как английский, китайский, японский и русский. Недостаток ресурсов для других языков создает языковой разрыв в ИИ, что влияет на качество пользовательского опыта, усиливает предвзятость и способствует цифровому неравенству.
11 декабря в Астане Президенту Казахстана Касым-Жомарту Токаеву была представлена национальная языковая модель KAZ-LLM. Модель была разработана под руководством Института умных систем и искусственного интеллекта (ISSAI NU) в партнерстве с Beeline Казахстан и его ИТ-компанией QazCode, а также Astana Hub. Проект координируется Министерством цифрового развития, инноваций и аэрокосмической промышленности РК (МЦРИАП РК). Модель имеет стратегическое значение для всей страны, поскольку решает проблему языкового разрыва с помощью ИИ.
Как разрабатывалась модель KAZ-LLM?
Нейронная сеть основана на 150 миллиардах токенах, тщательно собранных из общедоступных источников на четырех языках: казахском, русском, английском и турецком. Это позволяет модели демонстрировать высокую точность и универсальность, обеспечивая улучшенное качество обработки текстов на различных языках и способствуя улучшению перевода. Токенами называют минимальные единицы текста, такие как слова, их части или даже отдельные символы, которые ИИ использует для анализа и понимания информации.
Интерфейс и функциональность модели были разработаны с учетом самых передовых мировых стандартов, что подтверждает высокую технологическую зрелость и широкий потенциал модели. Для оценки ее производительности использовались комплексные бенчмарки с вопросно-ответными парами, охватывающие разнообразные области знаний. Пакет бенчмарков включал в себя следующие тесты:

ARC (AI2 Reasoning Challenge) — проверка научного мышления через вопросы с множественным выбором.
GSM8K — оценка способности решать задачи по математике для начальной школы.
HellaSwag — тестирование логики продолжения предложений.
MMLU (Massive Multitask Language Understanding) — проверка знаний по 57 различным предметам.
Winogrande — оценка здравого смысла в двусмысленных предложениях.
DROP — тестирование навыков понимания прочитанного и логического мышления.

Партнерство Beeline и QazCode ускорило разработку
Ключевыми партнерами в ее создании стали Beeline Казахстан и его ИТ-компания QazCode, объединив усилия и опыт в создании языковых моделей, таких как Kaz-RoBERTA, а также в разработке ИИ-решений для малых языковых групп в сотрудничестве с зарубежными партнерами. Поддержка в виде предоставленных серверов с вычислительными мощностями 8 DGX H100 значительно ускорила процесс обучения и расширила возможности модели. Для сравнения: обычному компьютеру понадобится несколько дней, чтобы проанализировать архив из 1 миллиона фотографий. В то время как 8 серверов DGX H100, использующихся для обучения ISSAI KAZ-LLM, справятся с этой задачей всего за несколько секунд.
На базе этих серверов разработчики обучили две версии модели — с 8 миллиардами и 70 миллиардами параметров, к процессу присоединились дата-сайентисты QazCode.
Алексей Шаравар, CEO QazCode. Фото: Beeline

"Наша команда активно участвовала в разработке и обучении модели KAZ-LLM. При создании LLM разработчики и партнеры использовали современные технологии машинного обучения, такие как PyTorch и Torchtune, а также учитывали опыт предыдущих проектов по адаптации open source архитектур LLM для казахского языка. В ходе обучения, которое продолжалось 50 дней непрерывных вычислений, модель улучшила способность понимать контекст и обеспечивать высокое качество взаимодействия с пользователями. Тестирование показало, что модель успешно решает технические задачи, учитывая культурные и языковые особенности казахского языка",- поделился СЕО QazCode Алексей Шаравар.

О результатах и перспективах KAZ-LLM
Исследователи отмечают, что проект - это важная веха на пути Казахстана на мировой арене искусственного интеллекта.

"Эта модель отражает стремление Казахстана к инновациям, самостоятельности и росту своей технологической экосистемы. Наша команда подготовила две версии ISSAI KAZ-LLM с 8 миллиардами и 70 миллиардами параметров, построенные на архитектуре Meta Llama и оптимизированные для высокопроизводительных систем и сред с ограниченными ресурсами. Модели выпущены по лицензии CC-BY-NC, которые доступны для некоммерческого использования на сайте Hugging Face, способствуя глобальному академическому и исследовательскому сотрудничеству. Таким образом, разработчики смогут скачать и запустить нашу модель как на сложных серверах, так и на ноутбуках", - рассказал директор ISSAI, профессор NU Хусейн Атакан Варол.

Ожидается, что ISSAI Kaz-LLM откроет новые возможности для создания стартапов и инновационных проектов на базе ИИ. В дальнейшем планируется разработка моделей следующего поколения, которые будут интегрировать языковые и визуальные данные, что позволит значительно расширить возможности ИИ. Также рассматривается добавление поддержки модели других тюркских языков, что позволит укрепить связи между тюркоязычными сообществами.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Новые власти Сирии будут судить журналистов, якобы причастных к пропаганде Асада

Температура в Москве: на следующей неделе ожидается до минус 15 градусов

Облачность и снег ожидаются в Москве 14 декабря

Анастасия Ивлеева оштрафована за дискредитацию российской армии

Музыкальные новости

Купить качественный частотный преобразователь в России

В столице прошло феерическое техношоу «Танки против монстр-траков»

Военная служба по контракту в подразделениях Росгвардии

Россия близка к соглашению с новыми властями Сирии о сохранении двух своих военных баз, — Bloomberg

Новости России

На Бали российский турист выжил после падения с высоты 25 метров

Охваченная огнем многоэтажка во Фрязине попала на видео

Россети намерены вложить более 3 млрд руб. в электросети Дагестана в 2025 г.

Очевидцы сообщили о пожаре в многоквартирном доме во Фрязино

Экология в России и мире

В дни школьных каникул балет «Щелкунчик» пройдет в «Колизей - арене»

Кабинет Артиста в Яндекс. Кабинет Артиста в Яндекс Музыке. 

Концерт «Времена года» Антонио Вивальди прозвучит в Эрмитаже

5 способов, как сделать освещение умным

Спорт в России и мире

Миллиардер дал совет Елене Рыбакиной

Президент Федерации тенниса Италии сравнил Янника Синнера с Винус Уильямс

Блинкова обыграла Росе и вышла во второй круг турнира WTA в Лиможе

Видео дня: Мария Шарапова учит сына русскому алфавиту

Moscow.media

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный

Россияне осваивают внутренний туризм: турпотоки в некоторые регионы выросли на 57%

Портативный ТСД корпоративного класса Saotron RT-T70

BelkaCar и МТС Premium увеличили кэшбэк на поездки в приложении каршеринга











Топ новостей на этот час

Rss.plus






Новые власти Сирии будут судить журналистов, якобы причастных к пропаганде Асада

Визовый режим с Россией. Ташкент решил выслужиться перед Вашингтоном

Появилось видео аварии с фурой на Новорижском шоссе

Источник 360.ru: плита придавила мужчину на стройке в Печатниках