Сверточные нейронные сети (CNN) – это форма биологического глубокого обучения в области искусственного интеллекта. Взаимодействие тысяч нейронов имитирует то, как наш мозг учится распознавать изображения. «Эти CNN успешны, но мы не до конца понимаем, как они работают», – говорит Эстефания Талавера Мартинес, преподаватель и исследователь Института математики, информатики и искусственного интеллекта Бернулли при Университете Гронингена в Нидерландах.
Еда
Она сама использовала CNN для анализа изображений, сделанных носимыми камерами при изучении человеческого поведения.
Среди прочего, Талавера Мартинес изучала наше взаимодействие с едой, поэтому она хотела, чтобы система распознавала различные условия, в которых люди сталкиваются с едой. «Я заметил, что система допустила ошибки при классификации некоторых изображений, и мне нужно было знать, почему это произошло.’
Используя тепловые карты, она проанализировала, какие части изображений использовались CNN для определения обстановки. «Это привело к гипотезе о том, что система не учитывала достаточно деталей», – объясняет она.
Например, если система ИИ научилась использовать кружки для идентификации кухни, она будет неправильно классифицировать жилые комнаты, офисы и другие места, где используются кружки. Решение, разработанное Талаверой Мартинес и ее коллегами Дэвидом Моралесом (Андалузский научно-исследовательский институт данных и вычислительного интеллекта, Университет Гранады) и Беатрис Ремесейро (факультет компьютерных наук, Университет Овьедо), оба в Испании, призвано отвлечь внимание людей. система от своих основных целей.
Размытый
Они обучили CNN, используя стандартный набор изображений самолетов или автомобилей, и определили с помощью тепловых карт, какие части изображений использовались для классификации.
Затем эти части были размыты в наборе изображений, который затем использовался для второго раунда обучения. ‘Это заставляет систему искать идентификаторы в другом месте. И, используя эту дополнительную информацию, она становится более детализированной в своей классификации.’
Подход хорошо работал со стандартными наборами изображений, а также с изображениями, которые Талавера Мартинес собирала сама с носимых камер. «Наш тренировочный режим дает нам результаты, аналогичные другим подходам, но намного проще и требует меньше вычислительного времени.«Предыдущие попытки улучшить детальную классификацию включали объединение различных наборов CNN.
Подход, разработанный Талаверой Мартинес и ее коллегами, намного проще. Это исследование дало нам лучшее представление о том, как эти CNN учатся, и помогло нам улучшить программу обучения.’
