Теория распознавания образов

Теория распознава́ния о́браза — раздел информатики и смежных дисциплин, развивающий основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков. Такие задачи решаются довольно часто, например, при переходе или проезде улицы по сигналам светофора. Распознавание цвета загоревшейся лампы светофора и знание правил дорожного движения позволяет принять правильное решение о том, можно или нельзя переходить улицу.

Автоматическое распознавание лиц специальной программой

Необходимость в таком распознавании возникает в самых разных областях — от военного дела и систем безопасности до оцифровки аналоговых сигналов.

Проблема распознавания образа приобрела выдающееся значение в условиях информационных перегрузок, когда человек не справляется с линейно-последовательным пониманием поступающих к нему сообщений, в результате чего его мозг переключается на режим одновременности восприятия и мышления, которому свойственно такое распознавание .

Неслучайно, таким образом, проблема распознавания образа оказалась в поле междисциплинарных исследований — в том числе в связи с работой по созданию искусственного интеллекта, а создание технических систем распознавания образа привлекает к себе всё большее внимание.

Направления в распознавании образов

Можно выделить два основных направления[1]:

Изучение способностей к распознаванию, которыми обладают живые существа, объяснение и моделирование их;
Развитие теории и методов построения устройств, предназначенных для решения отдельных задач в прикладных целях.

Формальная постановка задачи

Распознавание образов — это отнесение исходных данных к определённому классу с помощью выделения существенных признаков, характеризующих эти данные, из общей массы данных.

При постановке задач распознавания стараются пользоваться математическим языком, стремясь — в отличие от теории искусственных нейронных сетей[2], где основой является получение результата путём эксперимента, — заменить эксперимент логическими рассуждениями и математическими доказательствами[3].

Классическая постановка задачи распознавания образов[4]: Дано множество объектов. Относительно них необходимо провести классификацию. Множество представлено подмножествами, которые называются классами. Заданы: информация о классах, описание всего множества и описание информации об объекте, принадлежность которого к определённому классу неизвестна. Требуется по имеющейся информации о классах и описании объекта установить — к какому классу относится этот объект.

Наиболее часто в задачах распознавания образов рассматриваются монохромные изображения, что дает возможность рассматривать изображение как функцию на плоскости. Если рассмотреть точечное множество на плоскости $T$ , где функция $f(x,y)$ выражает в каждой точке изображения его характеристику — яркость, прозрачность, оптическую плотность, то такая функция есть формальная запись изображения.

Множество же всех возможных функций $f(x,y)$ на плоскости $T$ есть модель множества всех изображений $X$ . Вводя понятие сходства между образами можно поставить задачу распознавания. Конкретный вид такой постановки сильно зависит от последующих этапов при распознавании в соответствии с тем или иным подходом.

Некоторые методы распознавания графических образов

Для оптического распознавания образов можно применить метод перебора вида объекта под различными углами, масштабами, смещениями и т. д. Для букв нужно перебирать шрифт, свойства шрифта и т. д.

Второй подход — найти контур объекта и исследовать его свойства (связность, наличие углов и т. д.)

Ещё один подход — использовать искусственные нейронные сети. Этот метод требует либо большого количества примеров задачи распознавания (с правильными ответами), либо специальной структуры нейронной сети, учитывающей специфику данной задачи.

Персептрон как метод распознавания образов

Фрэнк Розенблатт, вводя понятие о модели мозга, задача которой состоит в том, чтобы показать, как в некоторой физической системе, структура и функциональные свойства которой известны, могут возникать психологические явления, описал простейшие эксперименты по различению. Данные эксперименты целиком относятся к методам распознавания образов, но отличаются тем, что алгоритм решения не детерминированный.

Простейший эксперимент, на основе которого можно получить психологически значимую информацию о некоторой системе, сводится к тому, что модели предъявляются два различных стимула и требуется, чтобы она реагировала на них различным образом. Целью такого эксперимента может быть исследование возможности их спонтанного различения системой при отсутствии вмешательства со стороны экспериментатора, или, наоборот, изучение принудительного различения, при котором экспериментатор стремится обучить систему проводить требуемую классификацию.

В опыте с обучением персептрону обычно предъявляется некоторая последовательность образов, в которую входят представители каждого из классов, подлежащих различению. В соответствии с некоторым правилом модификации памяти правильный выбор реакции подкрепляется. Затем персептрону предъявляется контрольный стимул и определяется вероятность получения правильной реакции для стимулов данного класса. В зависимости от того, совпадает или не совпадает выбранный контрольный стимул с одним из образов, которые использовались в обучающей последовательности, получают различные результаты:

Если контрольный стимул не совпадает ни с одним из обучающих стимулов, то эксперимент связан не только с чистым различением, но включает в себя и элементы обобщения.
Если контрольный стимул возбуждает некоторый набор сенсорных элементов, совершенно отличных от тех элементов, которые активизировались при воздействии ранее предъявленных стимулов того же класса, то эксперимент является исследованием чистого обобщения.

Персептроны не обладают способностью к чистому обобщению, но они вполне удовлетворительно функционируют в экспериментах по различению, особенно если контрольный стимул достаточно близко совпадает с одним из образов, относительно которых персептрон уже накопил определённый опыт.

Примеры задач распознавания образов

Оптическое распознавание символов
Распознавание штрих-кодов
Распознавание автомобильных номеров
Распознавание лиц
Распознавание речи
Распознавание изображений
Распознавание локальных участков земной коры, в которых находятся месторождения полезных ископаемых
Классификация документов

См. также

Примечания

Ту Дж., Гонсалес Р. Принципы распознавания образов, М. 1978
Маткасым Н. Н. Распознавание образов с помощью нейронных сетей // Технологии Microsoft в теории и практике программирования : сборник трудов XIII Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых, г.Томск, 22-23 марта 2016 г.. — С. 23—25.
Файн В. С. Опознавание изображений, М., 1970
Журавлёв Ю. И. Об алгебраическом подходе к решению задач распознавания и классификации // Проблемы кибернетики. — М.: Наука, 1978, вып. 33. — С. 5-68.

Литература

Аркадьев А. Г., Браверман Э. М. Обучение машины распознаванию образов. — М.: Наука, 1964
Барабаш Ю. Л., Варский Б. В., Зиновьев В. Т. Вопросы статистической теории распознавания. — М.: Советское радио, 1967. — 399 с.
Бонгард М. М. Проблема узнавания.— М.: Физматгиз, 1967.
Аркадьев А. Г., Браверман Э. М. Обучение машины классификации объектов. — М.: Наука, 1971.
Горелик А. Л., Скрипкин В. А. Методы распознавания. — 4-е изд. — М.: Высшая школа, 1984, 2004. — 262 с.
Вапник В. Н., Червоненкис А. Я. Теория распознавания образов. — М.: Наука, 1974. — 416 с.
Васильев В. И. Распознающие системы. Справочник. — 2-е изд. — К.: Наукова думка, 1983. — 424 с.
Распознавание. Математические методы. Программная система. Практические применения. / Ю.И. Журавлёв, В. В. Рязанов, О.В. Сенько. М.: ФАЗИС, 2006. 147 с. ISBN 5-7036-0108-8.
Л. Шапиро, Дж. Стокман. Компьютерное зрение = Computer Vision. — М.: Бином. Лаборатория знаний, 2006. — 752 с. — ISBN 5-947-74384-1.
Фомин Я. А. Распознавание образов: теория и применения. — 2-е изд. — М.: ФАЗИС, 2012. — 429 с. — ISBN 978-5-7036-0130-4.
Фомин Я. А., Тарловский Г. Р. Статистическая теория распознавания образов. — М.: Радио и связь, 1986. — 624 с.
Форсайт Дэвид А., Понс Джин. Компьютерное зрение. Современный подход = Computer Vision: A Modern Approach. — М.: Вильямс, 2004. — 928 с. — ISBN 0-13-085198-1.
Чэн Ш.-К. Принципы проектирования систем визуальной информации. — М.: Мир, 1994. — 408 с.
Лбов Г. С. Методы обработки разнотипных экспериментальных данных. — Новосибирск: Наука, 1981. — 157 с.

Ссылки

Юрий Лифшиц. Курс «Современные задачи теоретической информатики» — лекции по статистическим методам распознавания образов, распознаванию лиц, классификации текстов
Journal of Pattern Recognition Research Архивная копия от 8 сентября 2008 на Wayback Machine (Журнал исследования распознавания образов)

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[1] Ту Дж., Гонсалес Р. Принципы распознавания образов, М. 1978

[2] Маткасым Н. Н. Распознавание образов с помощью нейронных сетей // Технологии Microsoft в теории и практике программирования : сборник трудов XIII Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых, г.Томск, 22-23 марта 2016 г.. — С. 23—25.

[3] Файн В. С. Опознавание изображений, М., 1970

[4] Журавлёв Ю. И. Об алгебраическом подходе к решению задач распознавания и классификации // Проблемы кибернетики. — М.: Наука, 1978, вып. 33. — С. 5-68.

Словари и энциклопедии	Большая каталанская Большая норвежская Большая российская Britannica (онлайн)
В библиографических каталогах	GND: 4040936-3 LCCN: sh85098789 NDL: 00569072

Искусственный интеллект
История	История искусственного интеллекта Зима искусственного интеллекта Дартмутский семинар
Философия	Тест Тьюринга Китайская комната Сильный и слабый искусственные интеллекты Дружественный искусственный интеллект Этика искусственного интеллекта Проблема контроля
Направления	Агентный подход Адаптивное управление Инженерия знаний Модель жизнеспособной системы Машинное обучение Нейронная сеть Нечёткая логика Обработка естественного языка Распознавание образов Роевой интеллект Символический ИИ Эволюционные алгоритмы Экспертная система
Применение	Голосовое управление Задача классификации Классификация документов Кластеризация документов Кластерный анализ Локальный поиск Машинный перевод Оптическое распознавание символов Распознавание речи Распознавание рукописного ввода Игровой ИИ
Исследователи	Чарлз Бэббидж Владимир Вапник Джозеф Вейценбаум Норберт Винер Виктор Глушков Владимир Городецкий Ян ЛеКун Алексей Ляпунов Джон Маккарти Марвин Мински Аллен Ньюэлл Сеймур Пейперт Джуда Перл Гермоген Поспелов Дмитрий Поспелов Фрэнк Розенблатт Герберт Александер Саймон Алан Тьюринг Патрик Уинстон Виктор Финн Сергей Фомин Демис Хассабис Джеффри Хинтон Ноам Хомский Клод Шеннон Эндрю Ын Элиезер Юдковский