Метод максимально правдоподобных рассогласований в задаче распознавания изображений на основе глубоких нейронных сетей
Савченко А.В.

Национальный исследовательский университет «Высшая школа экономики», Нижний Новгород, Россия

Аннотация:
Исследована задача распознавания изображений в условиях малых выборок наблюдений на основе метода ближайшего соседа, в котором сопоставляются векторы признаков высокой размерности, выделенные с помощью глубокой свёрточной нейронной сети. Предложен новый алгоритм распознавания на основе метода максимального правдоподобия (совместной плотности вероятности) рассогласований между входным и всеми эталонными изображениями. Для оценки правдоподобия используется известное асимптотически нормальное распределение рассогласования Йенсена–Шеннона между векторами значений признаков изображений, что согласовывается с известными экспериментальными оценками закона распределения мер близости между векторами высокой размерности. В рамках экспериментального исследования для базы данных фотографий лиц Labeled Faces in the Wild и набора видеоданных YouTube Faces показано, что предлагаемый алгоритм позволяет на 1–5 % повысить точность распознавания изображений и видеопоследовательностей по сравнению с традиционными методами классификации.

Ключевые слова:
статистическое распознавание образов, обработка изображений, глубокие свёрточные нейронные сети, метод максимально правдоподобного перебора, распознавание лиц.

Цитирование:
Савченко, А.В. Метод максимально правдоподобных рассогласований в задаче распознавания изображений на основе глубоких нейронных сетей / А.В. Савченко // Компьютерная оптика. – 2017. – Т. 41, № 3. – С. 422-430. – DOI: 10.18287/2412-6179-2017-41-3-422-430.

Литература:

  1. LeCun, Y. Deep learning / Y. LeCun, Y. Bengio, G. Hinton // Nature. – 2015. – Vol. 521(7553). – P. 436-444. – DOI: 10.1038/nature14539.
  2. Prince, S.J. Computer vision: models, learning, and inference / S.J. Prince. – New York: Cambridge University Press, 2012. – 598 p. – ISBN: 978-1-107-01179-3.
  3. Goodfellow, I. Deep learning (Adaptive computation and machine learning series) / I. Goodfellow, Y. Bengio, A. Courville. – Cambridge, London: MIT Press, 2016. – 800 p. – ISBN: 978-0-262-03561-3.
  4. Savchenko, A.V. Search techniques in intelligent classifica­tion systems / A.V. Savchenko. – Switzerland: Springer In–ternational Publishing, 2016. – 83 p. – ISBN 978-3-319-30513-4.
  5. Zhao, Y. Face recognition from a single registered image for conference socializing / Y. Zhao, Y. Liu, S. Zhong, K.A. Hua // Expert Systems with Applications. – 2015. – Vol. 42(3). – P. 973-979. – DOI: 10.1016/j.eswa.2014.08.016.
  6. Raudys, S.J. Small sample size effects in statistical pattern recognition: Recommendations for practitioners / S.J. Radys, A.K. Jain // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 1991. – Vol. 13, Issue 3. – P. 252-264. – DOI: 10.1109/34.75512.
  7. Мокеев, В.В. О решении проблемы выборки малого размера при использовании линейного дискриминантного анализа в задачах распознавания лиц / В.В. Мокеев, С.В. Томилов // Бизнес-информатика.– 2013. – №1(23). – С. 37-43.
  8. Фурсов, В.А. Построение опорных подпространств в задачах распознавания фрактальных изображений / В.А. Фурсов, Е.Ю. Минаев // Информационные технологии и нанотехнологии (ИТНТ-2016). – 2016. – С. 530-537.
  9. Фурсов, В.А. Адаптивная идентификация по малому числу наблюдений / В.А. Фурсов // Приложение к журналу «Информационные технологии». – 2013. – № 9.– С. 1-32.
  10. Лапко, А.В. Непараметрические модели распознавания образов в условиях малых выборок / А.В. Лапко, С.В. Чен­цов, В.А. Лапко // Автометрия. – 1999.– № 6.– С. 105-113.
  11. Савченко, В.В. Решение проблемы малых выборок на основе информационной теории восприятия речи / В.В. Савченко // Известия высших учебных заведений России. Радиоэлектроника. – 2008.– Вып. 5.– С. 33-44.
  12. Tan, X. Face recognition from a single image per person: a survey / X. Tan, S. Chen, Z.H. Zhou, F. Zhang // Pattern Recognition.– 2006.– Vol. 39, Issue 9.– P. 1725-1745. – DOI: 10.1016/j.patcog.2006.03.013.
  13. Bertinetto, L. Learning feed-forward one-shot learners / L. Bertinetto, J.F. Henriques, J. Valmadre, P. Torr, A. Ve­daldi // Advances in Neural Information Processing Systems 29: Annual Conference on Neural Information Processing Systems 2016. – 2016. – P. 523-531.
  14. Parkhi, O.M. Deep face recognition / O.M. Parkhi, A. Ve­daldi, A. Zisserman // Proceedings of the British Machine Vision. – 2015. – P. 6-17.
  15. Liu, J. Targeting ultimate accuracy: Face recognition via deep embedding / J. Liu, Y. Deng, C. Huang // arXiv preprint arXiv:1506.07310. – 2015.
  16. Szegedy, C. Going deeper with convolutions / C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, A. Rabinovich // Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). – 2015. – P. 1-9. – DOI: 10.1109/CVPR.2015.7298594.
  17. Russakovsky, O. Imagenet large scale visual recognition challenge / O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein, A.C. Berg, F.-F. Li // International Journal of Computer Vision. – 2015. – Vol. 115(3). – P. 211-252. – DOI: 10.1007/s11263-015-0816-y.
  18. Taigman, Y. DeepFace: Closing the gap to human-level performance in face verification / Y. Taigman, M. Yang, M. Ranzato, L. Wolf // Proceedings of the IEEE Internatio­nal Conference on Computer Vision and Pattern Recog­nition (CVPR). – 2014. – P. 1701-1708. – DOI: 10.1109/CVPR.2014.220.
  19. Savchenko, A.V. Maximum-likelihood approximate nearest neighbor method in real-time image recognition / A.V. Sav­chenko // Pattern Recognition. – 2017. – Vol. 61. – P. 459-469. – DOI: 10.1016/j.patcog.2016.08.015.
  20. Савченко, А.В. Метод максимально правдоподобного перебора в задаче классификации кусочно-однородных объектов / А.В. Савченко // Автоматика и телемеханика.– 2016.– № 3.– С. 99-108. – ISSN 0005-2310.
  21. Savchenko, A.V. Statistical testing of segment homogeneity in classification of piecewise-regular objects / A.V. Sav­chenko, N.S. Belova // International Journal of Applied Mathematics and Computer Science. – 2015. – Vol. 25(4). – P. 915-925. – DOI: 10.1515/amcs-2015-0065.
  22. Dalal, N. Histograms of oriented gradients for human detection / N. Dalal, B. Triggs // Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). – 2005. – P. 886-893. – DOI: 10.1109/CVPR.2005.177.
  23. Lowe, D. Distinctive image features from scale-invariant keypoints / D. Lowe // International Journal of Computer Vision. – 2004. – Vol. 60(2). – P. 91-110. – DOI: 10.1023/B:VISI.0000029664.99615.94.
  24. Ahonen, T. Face recognition with local binary patterns / T. Ahonen, A. Hadid, M. Pietikainen // Proceedings of the European Conference on Computer Vision (ECCV 2004). – 2004. – P. 469-481. – DOI: 10.1007/978-3-540-24670-1_36.
  25. Савченко, А.В. Распознавание изображений на основе вероятностной нейронной сети с проверкой однородности / А.В. Савченко // Компьютерная оптика.– 2013. – Т. 37, № 2.– С. 254-262.
  26. Kullback, S. Information theory and statistics / S. Kullback. – Mineola, New York: Dover Publications, Inc., 1997. – 408 p. – ISBN: 978-0-486-69684-7.
  27. Burghouts, G.J. The distribution family of similarity distances / G.J. Burghouts, A.W.M. Smeulders, J.-M. Geuse­broek // Proceedings of the 20th International Conference on Neural Information Processing Systems (NIPS’07). – 2007. – P. 201-208.
  28. Best-Rowden, L. Unconstrained face recognition: identifying a person of interest from a media collection / L. Best-Rowden, H. Han, C. Otto, B.F. Klare, A.K. Jain // IEEE Transactions on Information Forensics and Security. – 2014. – Vol. 9(12). – P. 2144-2157. – DOI: 10.1109/TIFS.2014.2359577.
  29. Wolf, L. Face recognition in unconstrained videos with mat­ched background similarity / L. Wolf, T. Hassner, I. Maoz // Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition (CVPR). – 2011. – P. 529-534. – DOI: 10.1109/CVPR.2011.5995566.
  30. Jia, Y. Caffe: Convolutional architecture for fast feature embedding / Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick, T. Darrell // Proceedings of the 22nd ACM International Conference on Multimedia (MM’14). – 2014. – P. 675-678. – DOI: 10.1145/2647868.2654889.
  31. Wu, X. A lightened CNN for deep face representation / X. Wu, R. He, Z. Sun // arXiv preprint arXiv:1511.02683v1. – 2015.
  32. Yi, D. Learning Face Representation from Scratch / D. Yi, Z. Lei, S. Liao, S.Z. Li // arXiv preprint arXiv:1411.7923. – 2014.
  33. Система распознавания лиц на видео [Электронный ресурс]. – URL: https://github.com/HSE-asavchenko/HSE_Face­Rec/tree/master/src/caffe_models (дата обращения 01.04.2017).
  34. Learned-Miller, E. Labeled faces in the wild: A survey / E. Learned-Miller, G.B. Huang, A. RoyChowdhury, H. Li, G. Hua // In book: Advances in Face Detection and Facial Image Analysis / Ed. by M. Kawulok, M.E. Celebi, B. Smolka. – Springer International Publishing Switzerland, 2016. – P. 189-248. – DOI: 10.1007/978-3-319-25958-1_8.
  35. Wang, H. Video-based face recognition: a survey / H. Wang, Y. Wang, Y. Cao // World Academy of Science. Engineering and Technologies. – 2009. – Vol. 60. – P. 293-302.

© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846) 242-41-24 (ответственный секретарь), +7 (846) 332-56-22 (технический редактор), факс: +7 (846) 332-56-20