Добавить новость

На пути к лезгинскому онлайн-переводчику

В последние годы интернет переживает подлинную революцию, связанную с развитием нейросетей и искусственного интеллекта на их базе. Эти перемены не обошли стороной и такую сферу интернета, как лингвистические технологии. Все современные онлайн-переводчики работают на базе обучающихся нейросетей, для которых каждый новый перевод - это пища для дальнейшего улучшения качества. Конечно же, наилучшее качество перевода достигается для больших европейских языков - английского, русского, испанского, немецкого и других с их огромными перекрестными массивами данных. Специалисты говорят, что совсем скоро переводы между этими языками будут вполне адекватны тем, которые делал бы человек. Но с каждым годом технические возможности и доступность нейросетевых технологий растут - и теперь очередь дошла до относительно небольших языков. Учитывая важность цифровизации в современных условиях, вопрос создания онлайн-переводчиков для языков народов России взяло под свою опеку Федеральное агентство по делам национальностей в сотрудничестве с компанией «Яндекс». На данный момент в Яндекс-переводчике, помимо русского, присутствуют еще 8 языков России: башкирский, марийский луговой, марийский горный, осетинский, татарский, удмуртский, чувашский, якутский. В течение трех лет в крупнейшем российском онлайн-переводчике должны появиться еще порядка 20 новых языков. Соответствующая работа в данный момент ведется в целом ряде регионов. Республика Дагестан в языковом вопросе, как известно, стоит особняком. Это регион с самым большим языковым разнообразием в России, и создание онлайн-переводчиков для каждого из них - долгий процесс. Тем не менее, при объединении усилий федерального центра, регионов, научных центров, общественных организаций и языковых активистов данная задача вполне реализуема. Напомним, что в мае этого года в Москве в офисе компании «Яндекс» прошла стратегическая сессия «Информационные технологии и языки народов России» , организованная Домом народов России при поддержке ФАДН России. Среди прочих, в ней принимали участие и представители ФЛНКА. Одним из итогов обсуждений стала предварительная договоренность о том, что в 2025 году, если будут пройдены все промежуточные этапы, ФЛНКА сможет способствовать включению лезгинского языка в Яндекс-переводчик. Основной задачей, которую необходимо реализовать для преодоления своеобразного «порога вхождения» в Яндекс-переводчик - создать корпус из 100 тысяч параллельных переводов предложений с русского на лезгинский. Это минимальное значение - чем больше будет переводов, тем лучше будет конечный продукт. При этом сами эти предложения важно взять из специального русско-английского корпуса размером в 1 миллион предложений, разработанного «Яндексом». Все эти данные обрабатываются искусственным интеллектом, который сам с помощью сложных математических моделей определяет внутренние закономерности языка и учится переводить. Даже сами разработчики подобных IT-продуктов признаются, что для них все это тоже порой выглядит как своеобразная магия. Примечательно, что в данный момент активно развивается открытый проект по созданию онлайн-переводчика, который создала и ведет группа молодых лезгинских энтузиастов - специалистов в сфере IT, в частности, искусственного интеллекта. Эта команда называет себя просто - Lezghian Community (Лезгинское сообщество). Данный проект создан уже на совершенно иной платформе под названием Huggingface. Команда проекта уже загрузила в свою базу данных для обучения искусственного интеллекта большие массивы текстов, включая все статьи из лезгинской Википедии, имеющуюся в открытом доступе литературу на лезгинском языке и даже перевод Библии. Принцип здесь тот же самый - необходимо создать достаточно большое число (чем больше, тем лучше) качественных параллельных переводов предложений. Потом все эти предложения загрузят в нейросеть - и можно пользоваться переводчиком! Основной инструмент пополнения базы данных переводов - специально разработанный для этой цели телеграм-бот , который позволяет в интерактивном режиме участвовать в проекте любому пользователю мессенджера телеграм. При активации бота он высылает пользователю случайное предложение на русском языке. Достаточно ввести в ответном сообщении перевод и отправить его. Желательно делать это регулярно, и поэтому модераторы создали специальное ежедневное напоминание для переводчиков. Как подчеркнул в беседе с ФЛНКА один из инициаторов и моторов проекта Саид Азизов (да, это именно тот вундеркинд из Каспийска, который в 17 лет победил в Международном конкурсе по искусственному интеллекту), главные принципы деятельности Lezghian Community - исключительно некоммерческий характер и полная открытость на всех этапах. Тем не менее, как уверяют авторы проекта, это совершенно не значит, что в итоге в переводчике будут хаотичные переводы низкого качества. Обязательным этапом станет специальная модерация и проверка всего корпуса профессионалами. И в решении задачи привлечения профессионалов - знатоков языка - свою поддержку окажет ФЛНКА. Кроме того, самых активных и профессиональных переводчиков ждут вознаграждения. Отметим, что буквально спустя несколько дней после объявления о начале работы бота для создания онлайн-переводов база предложений уже насчитывает несколько тысяч - то ли еще будет! Уже сейчас, даже на базе имеющегося небольшого количества переводов, функционирует открытый прототип переводчика – каждый может убедиться в этом, перейдя по ссылке . Учитывая, что для создания переводчика на любой из упомянутых платформ необходимо решить примерно одну и ту же задачу, представляется наилучшим решением консолидировать усилия всех заинтересованных сторон для формирования максимально большого и качественного корпуса параллельных текстовых переводов. Этот же корпус может быть использован в дальнейшем для включения лезгинского языка еще и в «Гугл-переводчик», самый большой и известный среди подобных сервисов. А уж у кого в итоге перевод окажется лучше - определят пользователи. Таким образом, нет сомнений, что уже в обозримом будущем благодаря общим усилиям и новым технологиям удастся создать лезгинский онлайн-переводчик - один из важных и долгожданных инструментов для сохранения, популяризации и развития родного языка.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Москве, в Московской области и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Москве

Ria.city

Крещенские морозы 2025 удивят: Синоптики рассказали, какой сюрприз готовит погода в Москве

Здание на улице Врубеля в Москве охватил пожар на площади 300 квадратных метров

Очередная годовщина подвига 9-й роты в Афганистане. Как реальность отличается от кино и о чём Бондарчук-младший забыл в этой истории?

Tencent: Путин превратит Россию в сверхдержаву, если объединит ее с Белоруссией

Музыкальные новости

Московский «Спартак» разгромил СКА со счетом 5:0 в матче на «СКА-Арене»

Путин приехал в храме Георгия Победоносца на Поклонной горе в Москве

Сергей Собянин. Главное за день

Собянин поздравил москвичей с Рождеством и пожелал здоровья и благополучия

Новости Москвы

Расчет ЗРК под Горловкой чудом спасся после удара ракеты НАТО рядом с машиной

Tencent: Путин превратит Россию в сверхдержаву, если объединит ее с Белоруссией

Кто получит наследство модельера Вячеслава Зайцева

Здание на улице Врубеля в Москве охватил пожар на площади 300 квадратных метров

Экология в Москве

Кулинарное путешествие по Байкалу 

RAF: От обычного парня в популярного блогера-миллионника.

Что такое любовь к себе и чем она отличается от эгоизма

Что такое чак-чак и как приготовить его в домашних условиях

Спорт в Москве

Самсонова одержала победу в первом круге турнира WTA в Аделаиде

Соболенко — о смерти Кольцова: «Поняла, что мне не нужен психолог, я справлюсь сама»

Шнайдер вышла во второй круг турнира WTA в Аделаиде, обыграв Синякову

Директор Australian Open назвал главную конкурентку Арины Соболенко в Мельбурне

Москва на Moscow.media

Массовое заражение сальмонеллезом в пермской "Хлебнице" вылилось в уголовное дело

Hongqi опубликовала патентные изображения нового кабриолета

У новых Lexus GX на солнце плавятся детали машин

Nvidia представила семейство настольных видеокарт GeForce RTX 50, флагман оценён в $1999











Топ новостей на этот час в Москве и Московской области

Rss.plus






Tencent: Путин превратит Россию в сверхдержаву, если объединит ее с Белоруссией

Киноклуб Музея Победы приглашает на кинопоказы в январе

Кино прокатилось по билетам // Рост цен обеспечил увеличение сборов в новогодние праздники

Пожар в московском мормонском центре: горит здание на улице Врубеля