Специалисты по компьютерным технологиям в Техасском университете штата Остин опубликовали исследование в области научной робототехники, которые демонстрируется система искусственного интеллекта (ИИ) наделенную способностью распознавать «общую картину» окружающего мира.
Недавний прогресс в проецировании изображений с точки зрения компьютерного зрения, был связан с углубленным изучением ИИ, который был получен путем создания алгоритмов, направленных на достижение конкретной цели. Но этот метод оказался медлительным и сложным в осуществлении поставленных целей, поэтому профессор Кристен Грауман провела совместное исследование, вместе с доктором философии Сантоши Рамакришнан, и кандидатом философии Динеш Джаяраман, для проецирования нового движка ИИ, который сможет заменить устаревшую модель системы компьютерного зрения.
Исследователи составили собственный алгоритм в UT Austin’s Texas Advanced Computing Center and Department of Computer Science, прибегнув к поведенческой психологи, которая в свою очередь основана на системе вознаграждения. Например, в случае тестирования программы в автономном режиме, исследователи смоделировали управление транспортного средства, в котором алгоритм получает вознаграждение за остановку на красном светофоре, или штраф за нарушение правил.
Но в данном эксперименте, Грауман и коллеги пытались избежать неопределенности ИИ в отношении скрытых частей окружающей среды. Новый алгоритм был построен на короткой серии взглядов, которые совмещались в единую, общую картину. Принимая во внимание, что текущий алгоритм достаточно прямолинеен, команда исследователей дополнила его дополнительными задачами.
Присвоив дополнительному алгоритму имя Друг, команда инициировала новые тесты, основанные на альтернативных выборах, в которых Друг должен представлять ИИ эффективные варианты для решения задач. Например, если покупатель начал поиски одежды в незнакомом магазине, но обнаружил на витринах лишь кастрюли и сковородки, разумно предположить, что в его ближнем окружении находятся еще несколько предметов домашнего обихода, поэтому логичным будет устремить взгляд в другом направлении и исключить потерю времени на сканировании однотипных предметов.
Новый алгоритм предназначен для общего пользования и подходит для широкого круга задач, так как возможность быстро масштабировать окружающую среду используя несколько коротких взглядов, может пригодиться для поиска и спасения при ограниченном времени. В дальнейшем времени, исследовательская группа планирует портировать свою работу на мобильные устройства.