Добавить новость

Каких витаминов и минералов не хватает россиянам, выяснили специалисты ВСК

В Подмосковье штрафы за незаконный сброс стройотходов достигли почти 8 млн руб

В России прокомментировали приглашение Путина в Бахрейн

За сайты-двойники осуждены представители «билетной мафии»



News in English


Новости сегодня

Новости от TheMoneytizer

Cross-lingual hate speech detection using domain-specific word embeddings

by Ayme Arango Monnar, Jorge Perez Rojas, Barbara Polete Labra

THIS ARTICLE USES WORDS OR LANGUAGE THAT IS CONSIDERED PROFANE, VULGAR, OR OFFENSIVE BY SOME READERS. Hate speech detection in online social networks is a multidimensional problem, dependent on language and cultural factors. Most supervised learning resources for this task, such as labeled datasets and Natural Language Processing (NLP) tools, have been specifically tailored for English. However, a large portion of web users around the world speak different languages, creating an important need for efficient multilingual hate speech detection approaches. In particular, such approaches should be able to leverage the limited cross-lingual resources currently existing in their learning process. The cross-lingual transfer in this task has been difficult to achieve successfully. Therefore, we propose a simple yet effective method to approach this problem. To our knowledge, ours is the first attempt to create a multilingual embedding model specific to this problem. We validate the effectiveness of our approach by performing an extensive comparative evaluation against several well-known general-purpose language models that, unlike ours, have been trained on massive amounts of data. We focus on a zero-shot cross-lingual evaluation scenario in which we classify hate speech in one language without having access to any labeled data. Despite its simplicity, our embeddings outperform more complex models for most experimental settings we tested. In addition, we provide further evidence of the effectiveness of our approach through an ad hoc qualitative exploratory analysis, which captures how hate speech is displayed in different languages. This analysis allows us to find new cross-lingual relations between words in the hate-speech domain. Overall, our findings indicate common patterns in how hate speech is expressed across languages and that our proposed model can capture such relationships significantly.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Типичный сценарий: У мира будет всего 20 минут в случае начала ядерной катастрофы

В Москве завершился первый розыгрыш баллов в рамках программы «Миллион призов»

Взаимная торговля Москвы и стран ШОС выросла почти на 12 процентов

Авиарейсы из Екатеринбурга в Казань и Нижний Новгород задержаны к вылету

Музыкальные новости

Выборы губернаторов и депутатов стартовали в России

ГЛОНАСС намерен взять автоданные под защиту

Бакальчук заявил о приостановке строительства складов Wildberries в России и СНГ

Певица Алла Рид выступила на вечере в честь юбилея комедии "В джазе только девушки»

Новости России

Видеокамеры зафиксировали случаи незаконного сброса мусора в Одинцове

Авиарейсы из Екатеринбурга в Казань и Нижний Новгород задержаны к вылету

Юрий Шитиков: «Выборы — это ключевой момент, определяющий наше будущее и важность заботы о следующих поколениях»

Маск назвал интересными слова Путина о поддержке Харрис на выборах

Экология в России и мире

Врач-стоматолог Наталья Тышкевич: как вовремя распознать пародонтоз

От высокого холестерина спасут яблоки? Врач объяснила, можно ли заменять статины на продукты и пищевые добавки

Работники СЛД «Магдагачи» филиала «Забайкальский» компании «ЛокоТех-Сервис» организовали экологический десант

Стильный кроссовер за хит от «Авторадио»

Спорт в России и мире

Первая ракетка мира Синнер впервые вышел в финал Открытого чемпионата США

Даниил Медведев не смог пробиться в полуфинал Открытого чемпионата США по теннису

«Он открыто кричал на нее». Появились подробности расставания Рыбакиной с тренером

ATP и WTA могут завершить коммерческое слияние в первой половине 2025 года (Front Office Sports)

Moscow.media

Заместитель управляющего ОСФР по г. Москве и Московской области Алексей Путин об индексации работающим пенсионерам

МОШЕННИЧЕСТВО «ПОД ПРИКРЫТИЕМ»?

ТСД промышленного класса Saotron RT-Т510

Портативный ТСД корпоративного класса Saotron RT-T70











Топ новостей на этот час

Rss.plus






В Москве завершился первый розыгрыш баллов в рамках программы «Миллион призов»

Астана отдала свою таможню под наблюдение США. Зачем?

Взаимная торговля Москвы и стран ШОС выросла почти на 12 процентов

Завод по производству колбасных изделий появится в Мытищах