В данной работе описывается прототип гибридной системы, основанной на искусственных нейронных сетях (ИНС) для решений проблем классификации и распознавания нормализованных лиц. Для решения задачи препроцессирования изображений и извлечения конкретных геометрических черт лица использовался Метод Собственных Пакселов (вариация Метода Главных Компонент). Для классификации образов использовались нейросети по одну многослойному персептрону на каждый фильтр. Метод Собственных Пакселов, был усовершенствован на стадии классификации на классификации образов только одной природы(имеющих один и тот же фильтр). Моделирование системы проводилось на Штуттгардском Симуляторе Нейронных Сетей (SNNS) в интерфейсе JAVASNNS 2001. Для интерпретации комбинированных результатов, полученных на нейросетях, был разработан анализатор Судья . Описывается стратегия принятия наилучшего решения при распознавания лиц в спорных случаях( с низкой степенью уверенности ). Представлены результаты нескольких экспериментов при моделировании системы на 2-х базах данных Ollivetti (ORL) и HongIkFace2001 University .
Данная система разрабатывалась как простейшая модель принятия точных решений для распознавания больших распределенных баз данных изображений (человеческих лиц) при некотором ограничении по времени.
В данной работе затронута только проблема классификации и распознавания нормализованных лиц, задача поиска движений на сцене, отделения человека от сцены, нахождения лица и выявления отдельных черт лица пока не рассматривается. В данной работе мы сравнили и обнаружили эффективность нового метода эйген-пакселов по сравнению с методом эйген-лиц . Мы усовершенствовали предложенную модель, предложив идею классификации сравнимых образов , т.е. образов характеризующих разные предметы, но имеющих одну и ту же природу ( эйген-фильтр ). Одновременно с внедрением идеи сравнимых образов нам удалось распараллелить архитектуру системы на независимые компоненты и как результат понизить время обучения системы в целом, помимо этого мы добились представления баз данных образов в более компактной распределенной форме.
В данной работе был исследован метод главных компонент, был обнаружен тот факт, что при распознавании образов методом эйген-паксел точное решение мы можем принимать на основе информации, полученной на первых четырех фильтрах, остальные фильтры позволяли получать добавочную информацию и контролировать процесс принятия правильного решения.
Природа данной системы более подходит для обработки больших баз данных, когда эффективность и точность главенствует над скоростью принятия решения (типичная задача - поиск похожих лиц по фотороботу).
Источник: тезисы докладов третьей научно-практической конференции "Современные проблемы фотограмметрии и дистанционного зондирования". (г. Москва 11-12 апреля 2002г.).