Ученые опровергают теорию восприятия 60-летней давности: результаты могут иметь значение для понимания человеческого зрения и диагностики аномалий зрения

Команда под руководством Джона Цотсоса, профессора кафедры электротехники и информатики инженерной школы Лассонда, обнаружила, что человеческий мозг не выбирает интересные части изображения для обработки, как это было в очень влиятельной теории Дональда Бродбента 1958 года. предложил.
Для психолога Бродбента интересные части изображения – это те, которые имеют отношение к тому, почему вы вообще смотрите на сцену, или представляют собой новые предметы, которые сразу же привлекают наше внимание. Теория раннего отбора Бродбента, которая имеет современный аналог в Теории карты значимости Кристофа Коха и Шимона Ульмана, опубликованной в 1985 году, утверждает, что эти интересные области обрабатываются мозгом по одной за раз в порядке их значимости, что является числовой балл того, насколько интересен регион. В настоящее время существуют сотни алгоритмов определения значимости, основанных на работах Коха и Ульмана, для выполнения такого ранжирования.

Однако команда Цоцоса обнаружила, что заметность вообще не нужна для простой задачи быстрого решения, что изображено на изображении. Более того, ни один из текущих алгоритмов искусственного интеллекта (ИИ) для этой задачи не приближается к возможностям человека, что очень хорошо.

С другой стороны, вычисление заметности действительно играет основную роль в определении того, куда люди двигают глазами, и именно движение глаз выбирает части сцены для обработки следующей.
«Наше исследование смотрит на это для видения и проверяет ведущие алгоритмы, которые вычисляют меру заметности, и задает вопрос:« работают ли эти алгоритмы на том же уровне, что и люди на этих изображениях? »? Например, если задача состоит в том, чтобы определить, есть ли в сцене кошка, правильно ли алгоритм значимости выбирает кошку?

Исследование показало, что эти алгоритмы далеко не так хороши, как люди ", – сказал Цоцос.
Для дальнейшего тестирования существующих алгоритмов команда провела дополнительные эксперименты с 17 испытуемыми в возрасте от 25 до 34 лет.

В одном из повторных экспериментов участникам показали 2000 цветных изображений. Испытуемые не были знакомы с изображениями и просматривали каждое изображение с животными и без них только один раз. Затем изображения обрабатывались таким образом, чтобы только самые центральные части сетчатки с самым высоким разрешением могли видеть то, что было на изображении, и ничего не видеть на периферии. Участников попросили смотреть в центр каждой фотографии в течение 20 секунд, прежде чем она исчезнет.

Участники смогли правильно определить, присутствовало ли животное на картинке или нет.
Цоцос говорит, что это открытие имеет важные последствия для нашего понимания человеческого зрения и обработки человеческого зрения, особенно для диагностики патологий зрения, таких как аспекты аутизма.
«Когда вы хотите диагностировать проблемы со зрением, вы основываете на нем то, как должна работать здоровая система обработки изображений.

То, что мы сделали с этим исследованием, добавило кусочка головоломки к тому, как работает “ здоровая ” система, которая затем изменила бы то, как вы сравниваете аномалию, чтобы иметь возможность диагностировать ее."
Цоцос добавляет, что этот кусок головоломки также может быть полезен при создании новых моделей и улучшении существующих для автономного вождения или приложений безопасности.