Как справиться с принципиальной непрозрачностью работы модели

26.07.2024 12:42

Для пользователя ML-модель обычно выглядит как классический «черный ящик». И она принимает решения, значимые для бизнеса организации, таким образом, что специалисты не понимают, почему именно был сделан тот или иной вывод. Это свойство является, по сути, платой за то, что алгоритм машинного обучения умеет находить нелинейные закономерности в данных. Бум глубоких нейронных сетей, который мы переживаем сегодня, связан с принципиально новыми возможностями моделирования ситуации: вместо простой линейной регрессии, реализовать которую можно даже с помощью Excel, стало возможно использовать сложные алгоритмы, анализировать веса признаков и настраивать нейросеть на оптимальный прогноз.

В поисках лучших архитектурных решений для моделей классических алгоритмов индустрия стала использовать метод градиентного бустинга. Теоретически он предполагает использование целого набора простых моделей, постепенно исправляющих ошибки предшественников для получения конечной сильной нейросети. На практическом уровне подразумевается комбинирование слабых алгоритмов с помощью перерасчета входных данных: каждая последующая модель (она обычно имеет вид дерева решений) конструируется таким образом, чтобы придавать больший вес тем наблюдениям, которые ранее были предсказаны с ошибкой. Метод градиентного бустинга получил широкое распространение в среде датасайентистов, появились соответствующие готовые библиотеки на Python. Однако сами модели стали еще более непрозрачными, а задача получить объяснительные функции – еще более актуальной. Ее решает https://slsoft.ru/products/polymatica/advanced-analytics/?ut... . Посмотрим далее, какие основные элементы формируют эту дополнительную ценность.

Интерпретация признаков модели

В решении Polymatica ML используется метод SHAP (SHapley Additive exPlanations), базирующийся на математической теории игр. В его основе – так называемый вектор Шепли, который отражает все возможные комбинации и варианты данных. Метод позволяет разбить прогноз на части, выявить значение каждого признака и, проанализировав все элементы вектора, понять, какие факторы модели играют самую важную роль при выборе варианта решения.

Платформа Polymatica ML обеспечивает в качестве результирующих данных не только собственно результат работы модели, но и коэффициенты, характеризующие важность вклада разных признаков в достижение этого результата. Анализ признаков дает возможность скорректировать результат модели в лучшую сторону, осознанно влияя на характеристики отдельных значимых свойств.

Тонкий анализ модели

Polymatica ML умеет работать с некоторыми внутренними параметрами каждой модели и оценивать, какое влияние они способны оказывать на конечный вывод. Основной метод такого анализа – автоматизированный эксперимент, то есть перебор различных вариантов показателей с последующим анализом итоговых метрик. На платформе Polymatica ML для этих целей реализован визуальный конструктор логики автоподбора параметров. Можно также воспользоваться готовым скриптом, встроенным в платформенное ПО, или решениями, реализующими различные известные математические методы интерпретации модели машинного обучения:

· Partial Dependence Plots (PDP, графики частичной зависимости, PD-графики) – визуализируют корреляции между целью и выбранными признаками после того, как модель обучена. Используется Python-библиотека PDPbox.

· LIME (Local Interpretable Model-agnostic Explanations) – использует механизм локальной интерпретации моделей вместо попыток интерпретировать всю модель целиком.

Также можно интерпретировать не само предсказание результата, а, скажем, разницу между двумя предсказаниями или текущим и усредненным. Тогда фактически речь идет о попытке объяснить, каким образом изменение некоторых входных признаков влияет на изменение результирующего предсказания.

В математическом смысле методы LIME и SHAP несколько похожи – оба работают с моделью как с «черным ящиком»: изменяют данные на входе модели и анализируют изменение вывода. Опыт работы с крупными компаниями-заказчиками показывает, что все они используют в своей работе те или иные методы интерпретации признаков моделей, а автоматизированный вариант применения этих методов, реализованный в виде функционала аналитической платформы Polymatica ML, дает возможность любым другим учреждениям воспользоваться опытом лидеров.

Вместо датасайентиста или вместе с ним?

Методы улучшения объяснительной функции модели доказали свою практическую полезность. Но данная математика относится к продвинутому уровню data science, а значит, только весьма крупные организации могут позволить себе подобные штатные единицы. Функциональность решения Polymatica ML дает возможность организовать «под ключ» весь поток нужных алгоритмов: от их развертывания в виде ИТ-сервисов до интерпретации результатов с адаптацией к конкретным бизнес-пользователям. Правда, платформа Polymatica ML – это не замена специалиста по обработке данных, а отличный инструмент для радикального повышения результативности его работы. Для аналитика работа с функционалом платформы проще, чем создание составных формул в Excel. По нашим оценкам, специалисту достаточно пары дней для обучающего погружения в основы машинного обучения, после чего он сможет воспроизвести на платформе все те продвинутые математические методы анализа сложных моделей, о которых шла речь ранее.

Новости от наших партнёров в Вашем городе

Ria.city

123ru.net

Ненахов оценил результаты «Локомотива» в первом круге РПЛ

Теперь у мигрантов своя полиция? В России начали работу представительства МВД Киргизии

Вернуть контроль над эмоциями: пять лайфхаков, как быстро успокоиться

Концерт в рамках проекта «Настоящее будущего» пройдет в Балашихе

Музыкальные новости

Bigpot.news

Экс-президент США признал ошибку, которая продолжается до сих пор: МОК превратился в цирк

В России вновь пройдет культурно-благотворительный фестиваль детского творчества «Добрая волна»

Николай Цискаридзе на марафоне Знание.Первые: «Если человек развивается, он живет»

Глава ТПП РФ Сергей Катырин: бизнес предлагает донастроить налоговое законодательство

Новости России

29ru.net

Марианна Абравитова рассказала, почему плакать полезно

Ефимов: В ТиНАО с января возведено шесть инженерных объектов

«Energy»: Vlade Kay презентовал новую песню о любви

В Гагаринском районе идет капремонт домов на ул. Косыгина и Ленинском проспекте

Экология в России и мире

Life24.pro

Кажетта Ахметжанова рассказала, сбываются ли сны с четверга на пятницу

Дмитрий Несоленый возглавил депо «Унеча» компании «ЛокоТех-Сервис»

Богданов борется за сердце Glukozы, а Хрусталев ищет кольцо Нефертити

Джиган, Artik & Asti и NILETTO спели о худи, а Дина Саева стала новым артистом: в Москве прошел BRUNCH Rocket Group

Спорт в России и мире

News.tennis

Российская теннисистка Анастасия Потапова сообщила о разводе

Стала известна позиция Елены Рыбакиной в мировом рейтинге после старта на Итоговом турнире WTA

Касаткина сыграет на Итоговом турнире WTA после снятия Пегулы

Даниил Медведев станет самым возрастным участником Итогового турнира — 2024

Moscow.media

News24.pro

Велосипедист застрял в лобовом стекле авто после ДТП в Подмосковье

На модернизацию системы теплоснабжения Подмосковья направят 60 млрд рублей

Эксперты: мир ждут «качели» после победы Трампа на выборах президента США

Дом по программе реновации появится на Шушенской улице

Читайте на 123ru.net

Новини України

Происшествия

Интернет

Документальные новости

Частные объявления в Вашем городе, в Вашем регионе и в России

Новости от наших партнёров в Вашем городе

Ненахов оценил результаты «Локомотива» в первом круге РПЛ

Теперь у мигрантов своя полиция? В России начали работу представительства МВД Киргизии

Вернуть контроль над эмоциями: пять лайфхаков, как быстро успокоиться

Концерт в рамках проекта «Настоящее будущего» пройдет в Балашихе

Экс-президент США признал ошибку, которая продолжается до сих пор: МОК превратился в цирк

В России вновь пройдет культурно-благотворительный фестиваль детского творчества «Добрая волна»

Николай Цискаридзе на марафоне Знание.Первые: «Если человек развивается, он живет»

Глава ТПП РФ Сергей Катырин: бизнес предлагает донастроить налоговое законодательство

Марианна Абравитова рассказала, почему плакать полезно

Ефимов: В ТиНАО с января возведено шесть инженерных объектов

«Energy»: Vlade Kay презентовал новую песню о любви

В Гагаринском районе идет капремонт домов на ул. Косыгина и Ленинском проспекте

Кажетта Ахметжанова рассказала, сбываются ли сны с четверга на пятницу

Дмитрий Несоленый возглавил депо «Унеча» компании «ЛокоТех-Сервис»

Богданов борется за сердце Glukozы, а Хрусталев ищет кольцо Нефертити

Джиган, Artik & Asti и NILETTO спели о худи, а Дина Саева стала новым артистом: в Москве прошел BRUNCH Rocket Group

Российская теннисистка Анастасия Потапова сообщила о разводе

Стала известна позиция Елены Рыбакиной в мировом рейтинге после старта на Итоговом турнире WTA

Касаткина сыграет на Итоговом турнире WTA после снятия Пегулы

Даниил Медведев станет самым возрастным участником Итогового турнира — 2024

Где-то на болотах....

*Meta незаконно использовала финансовые данные пользователей в рекламе

Уважаемые коллеги! Дорогие друзья! Братство спасателей поздравляет вас с важным государственным праздником – Днем народного единства!

В Санкт-Петербурге завершился Международный фестиваль робототехники «РобоФинист 2024»

Топ новостей на этот час

«Energy»: Vlade Kay презентовал новую песню о любви

Концерт в рамках проекта «Настоящее будущего» пройдет в Балашихе

Мытищинский депутат приобрел подарки для особенных детей

Автомобили стали реже оставлять под запрещающими знаками у Внуково