Добавить новость


Новости сегодня

Новости от TheMoneytizer

Ученые НИУ ВШЭ выяснили, как нейросети распознают и объясняют каламбуры

Международная группа исследователей, включающая высококвалифицированных специалистов факультета компьютерных наук Национального исследовательского университета "Высшая школа экономики" (НИУ ВШЭ), разработала уникальный корпус данных под названием KoWit-24. Этот корпус, состоящий из 2700 новостных заголовков, содержащих лингвистические каламбуры, предназначен для оценки способности искусственного интеллекта распознавать, интерпретировать и анализировать подобные языковые феномены.

В рамках эксперимента были протестированы пять различных языковых моделей, в том числе GPT-4o и GigaChat, на предмет их способности обрабатывать каламбуры. Результаты показали, что даже наиболее передовые системы демонстрируют значительные ошибки в анализе данных лингвистических конструкций. Модели демонстрируют улучшенную способность к выявлению заголовков, содержащих каламбуры, однако их интерпретации часто оказываются недостаточно точными и не полностью раскрывают семантические связи и контекстуальные нюансы.

Доцент факультета компьютерных наук НИУ ВШЭ Павел Браславский подчеркнул, что корпус KoWit-24 обеспечивает решение двух ключевых проблем, характерных для предыдущих наборов данных. Во-первых, он предоставляет контекстуальную информацию для каждого заголовка, что существенно улучшает качество анализа. Во-вторых, корпус имеет многоуровневую разметку, что делает его комплексным инструментом для тестирования и оценки возможностей искусственного интеллекта в области обработки естественного языка.

Лингвистические каламбуры широко используются в российских новостных заголовках как средство привлечения внимания и передачи иронии. Примером может служить заголовок «Особо бумажные персоны», который обыгрывает выражение «особо важные персоны», создавая тем самым юмористический и иронический подтекст.

Новый корпус охватывает новостные заголовки за период с 2021 по 2023 годы и включает метаданные о типе каламбура, ключевых словах и отсылках, что обеспечивает более глубокий и всесторонний анализ. Результаты данного исследования были представлены на престижной международной конференции по обработке естественного языка RANLP (Recent Advances in Natural Language Processing). Корпус опубликован в открытом доступе, что позволяет другим научным группам использовать его для обучения, тестирования и совершенствования языковых моделей.

Читайте на сайте


Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. Абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city
Музыкальные новости
Новости России
Экология в России и мире
Спорт в России и мире
Moscow.media










Топ новостей на этот час

Rss.plus