В документе, который появится на конференции Общества обработки нейронной информации на следующей неделе, исследователи Массачусетского технологического института представляют новую систему, которая объединяет эти два способа обработки информации, чтобы люди и компьютеры могли сотрудничать для принятия более эффективных решений.
Система учится делать суждения, обрабатывая данные, но выделяет то, что узнает, в простые примеры. В экспериментах люди, использующие эту систему, более чем на 20 процентов лучше справлялись с задачами классификации, чем те, кто использовал аналогичную систему, основанную на существующих алгоритмах.
«В этой работе мы изучали, можем ли мы усовершенствовать технику машинного обучения, чтобы она поддерживала людей в принятии решений, ориентированных на признание», – говорит Джули Шах, доцент кафедры аэронавтики и космонавтики Массачусетского технологического института, и ее соавторы. автор новой статьи. "Это тот тип людей, которые принимают решения, когда принимают тактические решения – например, в пожарных командах или полевых операциях. Когда им предлагают новый сценарий, они не ищут то, что делают машины. Они пытаются сопоставить свой текущий сценарий с примерами из своего предыдущего опыта, а затем думают: «Хорошо, это сработало в предыдущем сценарии», и адаптируют его к новому сценарию."
В частности, Шах и ее коллеги – ее студент Бин Ким, докторская диссертация которой легла в основу новой статьи, и Синтия Рудин, доцент кафедры статистики в Слоунской школе менеджмента Массачусетского технологического института – пытались усилить вид машинное обучение, известное как "неконтролируемое."
В управляемом машинном обучении компьютер получает множество обучающих данных, помеченных людьми, и пытается найти корреляции – скажем, те визуальные особенности, которые наиболее часто встречаются в изображениях с пометкой «автомобиль»."С другой стороны, при неконтролируемом машинном обучении компьютер просто ищет общие черты в неструктурированных данных. Результатом является набор кластеров данных, члены которого каким-то образом связаны, но может быть неочевидно, как.
Уравновешивание
Наиболее распространенным примером машинного обучения без учителя является так называемое тематическое моделирование, при котором система объединяет документы в кластеры в соответствии с их наиболее характерными словами.
Поскольку данные не помечены, система не может фактически определить темы документов. Но человек, просматривающий его результаты, может сделать вывод, что, например, документы, обозначенные словами "юриспруденция" и "апелляционная инстанция", являются юридическими документами, а документы, обозначенные словами "тональность" и "гармония", – это документы по теории музыки.
Исследователи Массачусетского технологического института внесли два основных изменения в алгоритм, обычно используемый в обучении без учителя.
Во-первых, кластеризация была основана не только на общих характеристиках элементов данных, но и на их сходстве с некоторым репрезентативным примером, который исследователи назвали «прототипом»."
Во-вторых, вместо простого ранжирования общих функций по важности, как это делает алгоритм тематического моделирования, новый алгоритм пытается отсеять список функций до репрезентативного набора, который исследователи назвали «подпространством»."С этой целью алгоритм налагает штраф на подпространства, которые становятся слишком большими. Поэтому, когда он создает свои кластеры данных, он должен сбалансировать три иногда конкурирующие цели: сходство с прототипом, размер подпространства и четкие границы между кластерами.
«Чтобы описать хорошее подпространство, нужно выбрать хороший прототип», – объясняет Ким. "В то же время вы должны выбрать правильное подпространство, чтобы прототип имел смысл.
Итак, вы делаете все это одновременно."
Первым шагом исследователей было протестировать свой новый алгоритм на нескольких классических задачах машинного обучения, чтобы убедиться, что добавленные ограничения не повлияли на его производительность.
Они обнаружили, что в большинстве задач он работал так же хорошо, как и его предшественник, а в некоторых случаях он действительно работал лучше. Шах считает, что это может быть связано с тем, что ограничение прототипа не позволяет алгоритму собирать списки функций, содержащие внутренние противоречия.
Предположим, например, что алгоритм неконтролируемого обучения пытается охарактеризовать избирателей в группе населения. Множество избирателей может быть зарегистрировано как демократы, но большинство республиканцев могло проголосовать на последних предварительных выборах.
Тогда традиционный алгоритм может описать типичного избирателя как зарегистрированного демократа, голосовавшего на последних республиканских праймериз. Ограничение прототипа делает такой результат очень маловероятным, поскольку ни один избиратель не будет соответствовать его характеристике.
Дорожный тест
Затем исследователи провели ряд экспериментов, чтобы определить, действительно ли машинное обучение на основе прототипов может улучшить процесс принятия решений человеком. Ким выбрала набор рецептов из онлайн-базы данных, в которой им уже были присвоены категории, такие как перец чили, паста и пирожные, и переработала их только в списки ингредиентов. Затем она передала списки как в обычный алгоритм тематического моделирования, так и в новый алгоритм с ограничениями на прототип.
Для каждой категории новый алгоритм нашел репрезентативный пример, в то время как традиционный алгоритм создал список часто встречающихся ингредиентов.
Двадцать четыре субъекта получили по 16 новых списков ингредиентов. Некоторые списки были сгенерированы новым алгоритмом, а некоторые – обычным алгоритмом, и назначение было случайным.
Со списками, созданными с помощью нового алгоритма, испытуемые добивались успеха в 86% случаев, в то время как со списками, созданными с помощью обычного алгоритма, они добивались успеха в 71% случаев.
«Я думаю, что это отличная идея, которая соответствующим образом моделирует машинное обучение и интерфейс с пользователями», – говорит Ашутош Саксена, доцент кафедры информатики Корнельского университета.
Саксена возглавляет исследовательский проект под названием Robo Brain, который использует машинное обучение, чтобы прочесать Интернет и смоделировать тип здравых ассоциаций, которые понадобятся роботу для навигации в своей среде.
"В Robo Brain алгоритм машинного обучения пытается чему-то научиться, и, возможно, он не в состоянии делать что-то должным образом, поэтому он должен показать пользователям, чему он научился, чтобы получить обратную связь, чтобы улучшить свое обучение. , "Саксена говорит. "Нам было бы очень интересно использовать такую технику, чтобы показать пользователям результаты проекта Robo Brain."