Специалисты из лаборатории исследований искусственного интеллекта T‑Bank AI Research (входит в экосистему компаний "Интеррос" Владимира Потанина) вместе со студентами МИСИС и МФТИ заявили о разработке самого точного в мире метода распознавания неизвестных объектов на фотографии посредством ИИ. Открытие SDDE уже признано мировым научным сообществом в рамках недавней Международной конференции по обработке изображений в Абу-Даби.
Свой метод авторы назвали SDDE (Saliency-Diversified Deep Ensembles). Разработчики полагают, что их решение будет крайне востребовано в сферах, требующих высокой точности анализа - в том числе, сфере беспилотных транспортных средств и медицинской диагностики, где, порой, жизненно важно различать неопознанные элементы и графические артефакты. В предлагаемом нейросетью решении риск ошибки при обработке и анализе изображений сократился более чем на 20%, что существенно снижает потребность перепроверки и коррекции неверных решений человеком.
С целью увеличения эффективности распознавания объектов учёные применяют методы машинного обучения. В частности, метод «глубокие ансамбли», который объединяет несколько нейронных сетей для решения задачи. Это похоже на сбор мнений разных экспертов для получения лучшего решения.
«Предыдущие разработки в области компьютерного зрения сталкивались с проблемой однородности ансамблей, то есть они были слишком похожи друг на друга, что снижало качество и разнообразие их оценок, — поясняют в Т-Банке. — Ученые из лаборатории T-Bank AI Research нашли решение этой проблемы с помощью нового метода SDDE, который использует карты внимания, фокусирующиеся на разных аспектах данных. Это уменьшает схожесть моделей и повышает их общую точность, благодаря чему идентификация объектов становится более надежной и диверсифицированной».
Также исследователи из T-Bank AI Research научили модель при работе с изображениями учитывать не только те наборы данных, которые использовались при ее обучении, но и незнакомую ей информацию. Такой подход существенно улучшил работу модели в сфере распознавания до сих пор неизвестных ей объектов и точности их идентификации.
"Представленный метод основан на ансамблировании моделей, где несколько моделей совместно работают над предсказаниями. Авторы заметили, что при традиционном обучении модели склонны фокусироваться на одних и тех же признаках внутри изображений, что ограничивает эффективность ансамбля, рассуждает он. Чтобы преодолеть это ограничение, исследователи разработали технику обучения, которая поощряет каждую модель в ансамбле обращать внимание на разные части изображения при прогнозировании. Разнообразив фокус каждой модели, ансамбль становится лучше в распознавании тех входных данных, с которыми он ранее не сталкивался», — разъясняет научный сотрудник группы «ИИ в промышленности» Института AIRI Максим Голядкин.
Для оценки эффективности метода учёные T-Bank AI Research провели испытания на популярных базах данных: CIFAR10, CIFAR100 и ImageNet-1K. Метод SDDE продемонстрировал наилучшие результаты по сравнению со схожими алгоритмами, такими как Negative Correlation Learning и Adaptive Diversity Promoting.