Лаборатория DeepMind использовала ИИ AlphaZero для решения фундаментальной математической задачи в информатике и побила рекорд, установленный более 50 лет назад. Об этом пишет Technology Review.
Речь идет об умножении матриц. Это важнейший тип вычислений, лежащий в основе различных приложений, от отображения изображений на экране до моделирования сложных физических процессов.
Несмотря на широкое распространение метода, он все еще недостаточно изучен. Матрица — это сетка чисел, которая может представлять собой что угодно. Базовая техника перемножений двух таких объектов преподается в средней школе.
Однако все усложняется при попытке найти более быстрый метод решения задачи. По словам ученых, вариантов перемножения двух матриц может быть больше, чем атомов во Вселенной.
«Количество возможных действий почти бесконечно», — сказал инженер DeepMind Томас Хьюберт.
Подход исследователей заключается в превращении задания в своего рода настольную игру под названием TensorGame. Доска представляет собой задачу на умножение, а каждый ход направлен на ее решение. Таким образом, серия предпринятых действий к конечной цели представляет собой алгоритм.
Затем ученые обучили играть в эту игру новую версию AlphaZero, названную AlphaTensor. Аналогично шахматам или го, искусственный интеллект изучал лучшие серии шагов при умножении матриц. За победу с минимальным количеством ходов AlphaTensor получал вознаграждение.
«Мы превратили это в игру — наш любимый вид фреймворка», — сказал Хьюберт.
Главный результат исследователей состоит в ускорении решения данной задачи. Например, базовый школьный метод умножения матриц четыре на четыре состоит из 64 шагов. Самый быстрый способ решения задачи в 1969 году открыл немецкий математик Фолькер Штрассен: он состоит из 49 ходов. AlphaTensor справился за 47 шагов.
По словам исследователей, система DeepMind превосходит лучшие существующие алгоритмы для более чем 70 различных размеров матриц. Их впечатлило количество различных правильных алгоритмов, которые нашел AlphaTensor для каждой задачи.
«Удивительно, что существует по меньшей мере 14 000 способов умножения матриц четыре на четыре», — говорит Хусейн Фаузи, научный сотрудник DeepMind.
После поиска самых быстрых алгоритмов в теории команда использовала AlphaTensor для поиска алгоритмов на графических процессорах Nvidia V100 и Google TPU. Согласно результатам тестирования, программа нашла верные решения на 10-20% быстрее, чем при помощи стандартных методов на аналогичных чипах.
По словам исследователей, это также имеет фундаментальное значение для самого машинного обучения. Ускорение вычисления может оказать большое влияние на тысячи повседневных компьютерных задач, сократив расходы и сэкономив энергию.
В будущем DeepMind планирует использовать AlphaTensor для поиска других типов алгоритмов.
Напомним, в июле ИИ-лаборатория заявила, что системе AlphaFold предсказала структуры более 200 млн белков. Это почти все известные науке соединения, обнаруженные в растениях, бактериях и животных.
В мае DeepMind представила визуальную языковую модель с 80 млрд параметров.
Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!