Статья в журнале Applied Physics Reviews, опубликованная AIP Publishing, предлагает новый подход к выполнению вычислений, требуемых нейронной сетью, с использованием света вместо электричества. В этом подходе ядро фотонного тензора выполняет параллельное умножение матриц, повышая скорость и эффективность текущих парадигм глубокого обучения.
В машинном обучении нейронные сети обучаются выполнять неконтролируемое решение и классификацию невидимых данных. После обучения нейронной сети на данных она может производить вывод для распознавания и классификации объектов и шаблонов и поиска подписи в данных.
Фотонный TPU хранит и обрабатывает данные параллельно, используя электрооптическое межсоединение, которое позволяет эффективно читать и записывать оптическую память, а фотонный TPU взаимодействовать с другими архитектурами.
«Мы обнаружили, что интегрированные фотонные платформы, которые объединяют эффективную оптическую память, могут выполнять те же операции, что и блок тензорной обработки, но они потребляют небольшую часть энергии и имеют более высокую пропускную способность и, при своевременном обучении, могут использоваться для выполнения логического вывода со скоростью света ", – сказал Марио Мискульо, один из авторов.
Большинство нейронных сетей распутывают несколько слоев взаимосвязанных нейронов, стремясь имитировать человеческий мозг. Эффективный способ представления этих сетей – составная функция, которая умножает матрицы и векторы вместе. Это представление позволяет выполнять параллельные операции с помощью архитектур, специализирующихся на векторизованных операциях, таких как умножение матриц.
Однако чем интеллектуальнее задача и чем выше желаемая точность прогноза, тем сложнее становится сеть.
Такие сети требуют больших объемов данных для вычислений и большей мощности для обработки этих данных.
Современные цифровые процессоры, подходящие для глубокого обучения, такие как блоки обработки графики или блоки тензорной обработки, ограничены в выполнении более сложных операций с большей точностью из-за необходимой для этого мощности и медленной передачи электронных данных между процессором и памятью.
Исследователи показали, что производительность их ТПУ может быть на 2-3 порядка выше, чем у электрического ТПУ. Фотоны также могут быть идеальным выбором для вычислительных сетей с распределенными узлами и механизмов, выполняющих интеллектуальные задачи с высокой пропускной способностью на границе сетей, таких как 5G.
На границах сети сигналы данных могут уже существовать в виде фотонов от камер наблюдения, оптических датчиков и других источников.
«Специализированные процессоры Photonic могут сэкономить огромное количество энергии, улучшить время отклика и уменьшить трафик центра обработки данных», – сказал Мискульо.
Для конечного пользователя это означает, что данные обрабатываются намного быстрее, потому что большая часть данных предварительно обрабатывается, а это означает, что только часть данных должна быть отправлена в облако или центр обработки данных.
