Решение “ бесплодных плато ” – ключ к квантовому машинному обучению

«Работа решает ключевую проблему использования для квантового машинного обучения. Мы строго доказали условия, при которых определенные архитектуры вариационных квантовых алгоритмов будут или не будут иметь бесплодные плато по мере их увеличения », – сказал Марко Сересо, ведущий автор статьи, опубликованной в Nature Communications сегодня командой Лос-Аламосской национальной лаборатории.

Сересо – научный сотрудник, занимающийся исследованиями квантовой теории информации в Лос-Аламосе. «С нашими теоремами вы можете гарантировать, что архитектура будет масштабируема для квантовых компьютеров с большим количеством кубитов."
«Обычно подход заключался в том, чтобы запустить оптимизацию и посмотреть, работает ли она, и это приводило к усталости исследователей в этой области», – сказал Патрик Коулз, соавтор исследования. Установление математических теорем и вывод первых принципов исключает догадки при разработке алгоритмов.

Команда из Лос-Аламоса использовала общий гибридный подход для вариационных квантовых алгоритмов, обучая и оптимизируя параметры на классическом компьютере и оценивая функцию стоимости алгоритма или меру успеха алгоритма на квантовом компьютере.
По словам соавтора Лукаша Чинчо, алгоритмы машинного обучения переводят задачу оптимизации – скажем, поиск кратчайшего маршрута для коммивояжера через несколько городов – в функцию затрат.

Это математическое описание функции, которая будет минимизирована. Функция достигает минимального значения только в том случае, если вы решите задачу.
Большинство квантовых вариационных алгоритмов инициируют свой поиск случайным образом и оценивают функцию стоимости глобально для каждого кубита, что часто приводит к бесплодному плато.

«Мы смогли доказать, что если вы выберете функцию стоимости, которая смотрит локально на каждый отдельный кубит, то мы гарантируем, что масштабирование не приведет к невероятно крутой кривой зависимости времени от размера системы и, следовательно, ее можно обучить», Коулз сказал.
Квантовый вариационный алгоритм создает среду решения проблем, где пики представляют собой точки с высокой энергией системы или проблемы, а впадины – значения с низкой энергией. Ответ кроется в самой глубокой долине. Это основное состояние, представленное функцией минимальной стоимости.

Чтобы найти решение, алгоритм тренируется по ландшафту, тем самым перемещаясь к нижней точке.
«Люди предлагали квантовые нейронные сети и тестировали их, выполняя мелкомасштабное моделирование 10 (или меньше) нескольких кубитов», – сказал Серецо. «Проблема в том, что вы не увидите бесплодного плато с небольшим количеством кубитов, но когда вы попытаетесь увеличить количество кубитов, оно окажется. Затем алгоритм необходимо переработать для более крупного квантового компьютера."

Бесплодное плато – это проблема обучаемости, которая возникает в алгоритмах оптимизации машинного обучения, когда пространство для решения проблем становится плоским во время выполнения алгоритма. В этой ситуации алгоритм не может найти нисходящий уклон в том, что кажется безликим ландшафтом, и нет четкого пути к минимуму энергии. Не обладая ландшафтными особенностями, машинное обучение не может научиться находить решение.
«Если у вас бесплодное плато, вся надежда на квантовое ускорение или квантовое преимущество потеряна», – сказал Сересо.

Прорыв команды Лос-Аламоса делает важный шаг к квантовому преимуществу, когда квантовый компьютер выполняет задачу, которая на классическом компьютере занимала бы бесконечно много времени. Достижение квантового преимущества в краткосрочной перспективе зависит от масштабирования вариационных квантовых алгоритмов.

У этих алгоритмов есть потенциал для решения практических задач, когда станут доступны квантовые компьютеры на 100 кубитов или более – надеюсь, в ближайшее время. Квантовые компьютеры в настоящее время имеют максимум 65 кубитов.

Кубит – это основная единица информации в квантовом компьютере, как и биты в классическом цифровом компьютере.
«Самая горячая тема в шумных квантовых компьютерах промежуточного масштаба – это вариационные квантовые алгоритмы или квантовое машинное обучение и квантовые нейронные сети», – сказал Коулз. «Они были предложены для приложений, от решения структуры молекулы в химии до моделирования динамики атомов и молекул и расчета чисел на множители."