ученые доказали теорию избыточности параметров в квантовых нейронных сетях

Ученые из Лос-Аламосской национальной лаборатории подтвердили теорию перепараметризации в квантовых нейронных сетях – технике, которая повышает эффективность квантового машинного обучения для сложных задач.

Квантовое машинное обучение – это новая область искусственного интеллекта, которая использует преимущества квантовых компьютеров для обработки больших объемов информации и решения задач, которые недоступны для классических компьютеров. Квантовые нейронные сети – это один из способов построения квантовых машинных моделей, которые имитируют работу мозга с помощью квантовых схем.

Однако квантовое машинное обучение сталкивается с проблемой оптимизации параметров квантовых нейронных сетей. Параметры – это настраиваемые элементы модели, которые определяют ее поведение и результат. Если параметров слишком мало, модель не может адаптироваться к данным и решить задачу. Если параметров слишком много, модель может запутаться в локальных минимумах функции потерь – меры ошибки модели – и не достичь лучшего решения.

Перепараметризация – техника, которая решает эту проблему, добавляя больше параметров, чем необходимо для задачи. Это позволяет модели избежать локальных минимумов и найти глобальный минимум функции потерь. Перепараметризация хорошо изучена в классическом машинном обучении, но ее эффекты на квантовые нейронные сети были неясны до сих пор.

В новой статье, опубликованной в журнале Nature Computational Science, команда из Лос-Аламоса представила теоретическое доказательство перепараметризации в квантовых нейронных сетях. Они показали, как можно предсказать критическое число параметров, при котором модель переходит от недопараметризации к оверпараметризации. Ученые также продемонстрировали преимущества оверпараметризации на примере задачи классификации различных фаз материи в квантовых системах.

“Мы верим, что наши результаты будут полезны для изучения свойств квантовых данных, таких как классификация различных фаз материи в исследовании квантовых материалов, что очень сложно на классических компьютерах”, – сказал Диего Гарсия-Мартин, постдок в Лос-Аламосской национальной лаборатории и соавтор статьи. Он работал над исследованием в рамках Летней школы по квантовым вычислениям в Лос-Аламосе в 2021 году как аспирант Автономного университета Мадрида.

Чтобы проиллюстрировать выводы команды из Лос-Аламоса, Марко Сересо, старший научный сотрудник и специалист по квантовой теории в лаборатории, описал мысленный эксперимент, в котором турист, ищущий самую высокую гору в темном ландшафте, представляет процесс обучения. Путешественник может шагать только в определенных направлениях и оценивает свой прогресс, измеряя высоту с помощью ограниченной системы GPS.

В этой аналогии количество параметров в модели соответствует направлениям, доступным для движения путешественника, сказал Сересо. “Один параметр позволяет двигаться вперед и назад, два параметра позволяют перемещаться вбок и так далее”, – сказал он. Ландшафт данных, вероятно, будет иметь более трех измерений, в отличие от нашего гипотетического мира путешественников.

При слишком малом количестве параметров ходок не может тщательно исследовать и может принять небольшой холм за самую высокую гору или застрять на равнине, где любой шаг кажется бесполезным. Однако по мере увеличения количества параметров ходок может двигаться в большем количестве направлений в более высоких измерениях. То, что изначально казалось местным холмом, могло оказаться возвышенной долиной между пиками. С дополнительными параметрами путешественник избегает попадания в ловушку и находит истинную вершину или решение проблемы.

Public Release.