Распознавание изображений на основе вероятностной нейронной сети с проверкой однородности
Савченко А.В.

Аннотация:
Предложено использование вероятностной нейронной сети с проверкой однородности в задаче распознавания изображений. Показано, что это решение является оптимальным в байесовском смысле, если задача рассматривается в терминах статистической проверки однородности выборок признаков входного и эталонных изображений. Рассматривается проблема недостаточной вычислительной эффективности оптимального алгоритма при наличии многих альтернативных классов и большой размерности признакового пространства. Исследуется возможность её преодоления для случая дискретных признаков путём синтеза нового критерия, основанного на сопоставлении гистограмм признаков входного и эталонных изображений. Показано, что частным случаем такого критерия является правило ближайшего соседа с популярными мерами близости хи-квадрат и Йенсена–Шеннона. Приведены результаты экспериментального исследования в задаче идентификации личности по фотографии лица для популярных баз данных AT&T и JAFFE. Продемонстрировано, что предложенный подход существенно превосходит по качеству традиционное решение, основанное на сведении распознавания к задаче статистической классификации.

Ключевые слова :
автоматическое распознавание изображений, распознавание лиц, вероятностная нейронная сеть, проверка однородности выборок, правило ближайшего соседа.

Литература:

  1. Forsyth, D.A. Computer Vision: A Modern Approach / D.A. Forsyth, J. Ponce. – New Jersey: Prentice Hall (2-nd Edition), 2011. – 792 p.
  2. Lowe, D. Distinctive image features from scale-invariant keypoints / D. Lowe // International Journal of Computer Vision. – 2004. – Vol. 60, N.2. – P. 91-110. – ISSN 0920-5691.
  3. Dalal, N. Histograms of Oriented Gradients for Human Detection. Proceedings / N. Dalal, B. Triggs // International Conference on Computer Vision & Pattern Recognition. – 2005. – P. 886-893.
  4. Zuo, W. Robust Recognition of Noisy and Partially Occluded Faces Using Iteratively Reweighted Fitting of Eigenfaces / W. Zuo, K. Wang, D. Zhang // Conference on Advances in Multimedia Information Processing, Lecture Notes in Computer Science. – 2006. – Vol. 4261. – P. 844-851.
  5. Савченко, А.В. Выбор параметров алгоритма распознавания изображений на основе коллектива решающих правил и принципа максимума апостериорной вероятности / А.В. Савченко // Компьютерная оптика. – 2012. – Т.36, №1. – С.117-124.
  6. Savchenko, A.V. Directed enumeration method in image recognition / A.V. Savchenko // Pattern Recognition. – 2012. – Vol. 45, N.8. – P. 2952-2961. – ISSN 0031-3203.
  7. Fukunaga, K. Introduction to Statistical Pattern Recognition / K. Fukunaga. – 2nd ed. – New York: Academic Press, Inc, 1991. – 591 p.
  8. Webb, A.R. Statistical Pattern Recognition / A.R. Webb. – New York: Wiley (2nd Edition), 2002. – 534 p.
  9. Савченко, А.В. Теоретико-вероятностная модель полутонового изображения для задачи распознавания образов без учителя на основе метода направленного перебора / А.В. Савченко // Компьютерная оптика. – 2011. – Т.35, №3. – С.385-394. – ISSN 0134-2452.
  10. Specht, D.F. Probabilistic neural networks / D.F. Specht // Neural Networks. – 1990. – Vol. 3. – P. 109–118. – ISSN 0893-6080.
  11. Savchenko, A.V. Adaptive Video Image Recognition System Using a Committee Machine / A.V. Savchenko // Optical Memory and Neural Networks (Information Optics). – 2012. – Vol. 21, N.4. – P. 219–226. – ISSN 1060-992X.
  12. Savchenko, A.V. Statistical Recognition of a Set of Patterns Using Novel Probability Neural Network / A.V. Savchenko // International Workshop on Artificial Neural Networks and Pattern Recognition, Lecture Notes in Computer Science. – 2012. – Vol. 7477. – P. 93-103.
  13. Боровков, А.А. Математическая статистика: дополнительные главы / А.А. Боровков – М.: Наука, 1984. – 144 с.
  14. Савченко, В.В. Принцип минимального информационного рассогласования в задаче распознавания дискретных объектов / В.В. Савченко, А.В. Савченко // Известия вузов России. Радиоэлектроника. – 2005. –Вып.3. – С.10-18. – ISSN 1993-8985.
  15. Face Processing: Advanced Modeling and Methods / edited by W. Zhao, R. Chellappa. – Elsevier: Academic Press, 2005. – 768 p.
  16. Savchenko, A.V. Face Recognition in Real-Time Applications: Comparison of Directed Enumeration Method and K-d Trees / A.V. Savchenko // International Conference on Business Informatics Research, Lecture Notes in Business Information Processing. – 2012. – Vol. 128. – P. 187-199/
  17. AT&T faces dataset, http://www.cl.cam.ac.uk/research/dtg/ attarchive/facedatabase.html (October 21, 2012).
  18. JAFFE dataset, http://www.kasrl.org/jaffe.html (October 21, 2012)
  19. Tan, X. Face recognition from a single image per person: A survey / X. Tan, S. Chen, Z.H. Zhou, F. Zhang // Pattern Recognition. – 2006. – Vol. 39, N 9. – P. 1725-1745. – ISSN 0031-3203
  20. Theodoridis, S. Pattern Recognition / S. Theodoridis, C. Koutroumbas. – Elsevier Inc. (4th Edition), 2009. – 840 p.
  21. Yoo, G.-H. Content-based image retrieval using shifted histogram / G.-H. Yoo, B.K. Kim, K.S. You // International Conference on Computer Science, Lecture Notes in Computer Science. – 2007. – Vol. 4489. – P. 894–897.
  22. Лисицын, С.О. Распознавание дорожных знаков с помощью метода опорных векторов и гистограмм ориентированных градиентов / С.О. Лисицын, О.А Байда// Компьютерная оптика. – 2012. – Т. 36, № 2. – С.289-295. – ISSN 0134-2452.
  23. Савченко, А.В. Градиент яркости в задаче распознавания полутоновых изображений на основе статистического подхода / А.В. Савченко // Вестник компьютерных и информационных технологий. – 2012. – № 1. – C. 12-16. – ISSN 1810-7206.
  24. Kullback, S. Information Theory and Statistics / S. Kullback. – Dover Pub, 1997. – 399 p.
  25. Martins, A.F.T. Nonextensive entropic kernels / A.F.T. Martins, M.A.T. Figueiredo, P.M.Q. Aguiar, N.A. Smith, E.P. Xing // International Conference on Machine Learning. – 2008. – P. 640-647.
  26. Ahonen, T. Face recognition with local binary patterns / T. Ahonen, A. Hadid, M. Pietikainen // European Conference on Computer Vision. – 2005. – P. 469–481
  27. Zhang, D. Content-Based Shape Retrieval Using Different Shape Descriptors: A Comparative Study / D. Zhang, G. Lu // IEEE International Conference on Multimedia and Expo. – 2001. – P. 289-293.

© 2009, IPSI RAS
Institution of Russian Academy of Sciences, Image Processing Systems Institute of RAS, Russia, 443001, Samara, Molodogvardeyskaya Street 151; E-mail: ko@smr.ru; Phones: +7 (846) 332-56-22, Fax: +7 (846) 332-56-20