Поиск объектов на изображениях с использованием структурного дескриптора на основе графов
Захаров А.А., Баринов А.Е., Жизняков А.Л., Титов В.С.

Муромский институт (филиал) ФГБОУ ВО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых», Муром, Россия,

ФГБОУ ВО «Юго-Западный государственный университет», Курск, Россия

Аннотация:
В работе рассматривается разработка структурного дескриптора для поиска объектов на изображениях. Дескриптор построен на основе графа, вершинами которого являются центры масс сегментов особенностей. Для вложения графа в векторное пространство используется преобразование Юнга–Хаусхолдера. Предложенный способ вложения графа в векторное пространство базируется на методах дифференциальной геометрии. Для описания связи между точками используются составные кривые. Граф изображения описывается матрицей параметров кривизны. С помощью метрики Хаусдорфа вычисляется матрица расстояний для графов объекта-кандидата и объекта-эталона. Для представления результатов используется метод многомерного шкалирования. Для исследования разработанного подхода были использованы изображения тестовых объектов и изображения лиц людей. При обнаружении головы человека на изображениях сравнение разработанного дескриптора осуществлялось с методом Виолы–Джонса. Достоинством разработанного подхода является инвариантность к повороту изображения на плоскости при поиске объектов. Также дескриптор позволяет обнаруживать объекты с углом поворота в пространстве до 50 градусов. Использование центров масс сегментов особенностей в качестве вершин графа значительно повышает устойчивость подхода при изменении ракурса съемки по сравнению с подходом, в котором вершинами графа являются особые точки изображения.

Ключевые слова:
анализ изображений, поиск объектов, структурный дескриптор, вложение графов, компьютерное зрение.

Цитирование:
Захаров, А.А. Поиск объектов на изображениях с использованием структурного дескриптора на основе графов / А.А. Захаров, А.Е. Баринов, А.Л. Жизняков, В.С. Титов // Компьютерная оптика. – 2018. – Т. 42, № 2. – С. 283-290. – DOI: 10.18287/2412-6179-2018-42-2-283-290.

Литература:

  1. Krig, S. Computer vision metrics: Survey, taxonomy, and analysis / S. Krig. – Berkeley, CA: Apress Media, 2014. – 498 p. – ISBN: 978-1-4302-5929-9.
  2. Jain, M. A survey on CBIR on the basis of different feature descriptor / M. Jain, D. Singh // British Journal of Mathematics & Computer Science. – 2016. – Vol. 14, Issue 6. – P. 1-13. – DOI: 10.9734/BJMCS/2016/24000.
  3. Ojala, T. A comparative study of texture measures with classification based on feature distributions / T. Ojala, M. Pietikäinen, D. Hardwood // Pattern Recognition. – 1996. – Vol. 29, Issue 1. – P. 51-59. – DOI: 10.1016/0031-3203(95)00067-4.
  4. Calonder, M. BRIEF-binary robust independent elementary features / M. Calonder, V. Lepetit, C. Strecha, P. Fua // European Conference on Computer Vision. – 2010. – Part IV. – P. 778-792. – DOI: 10.1007/978-3-642-15561-1_56.
  5. Rublee, E. ORB: An efficient alternative to SIFT or SURF / E. Rublee, V. Rabaud, K. Konolige, G. Bradski // IEEE International Conference on Computer Vision (ICCV). – 2011. – P. 2564-2571. – DOI: 10.1109/ICCV.2011.6126544.
  6. Leutenegger, S. BRISK: Binary Robust invariant scalable keypoints / S. Leutenegger, M. Chli, R. Siegwart // IEEE International Conference on Computer Vision (ICCV’11). – 2011. – P. 2548-2555. – DOI: 10.1109/ICCV.2011.6126542.
  7. Lowe, D.G. Distinctive image features from scale-invariant keypoints / D.G. Lowe // International Journal of Computer Vision. – 2004. – Vol. 60, Issue 2. – P. 91-110. – DOI: 10.1023/B:VISI.0000029664.99615.94.
  8. Bay, H. SURF: Speeded up robust features / H. Bay, A. Ess, T. Tuytelaars, L. Van Gool // Computer Vision and Image Understanding. – 2008. – Vol. 110, Issue 3. – P. 346-359. – DOI: 10.1016/j.cviu.2007.09.014.
  9. Tola, E. DAISY: An efficient dense descriptor applied to wide-baseline stereo / E. Tola, V. Lepetit, P. Fua // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2010. – Vol. 32, Issue 5. – P. 815-830. – DOI: 10.1109/TPAMI.2009.77.
  10. Dalal, N. Histograms of oriented gradients for human detection / N. Dalal, B. Triggs // IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 2005). – 2005. – Vol. 1. – P. 886-893. – DOI: 10.1109/CVPR.2005.177.
  11. Scharstein, D. A taxonomy and evaluation of dense two-frame stereo correspondence algorithms / D. Scharstein, R. Szeliski // International Journal of Computer Vision. – 2002. – Vol. 47, Issue 1-3. – P. 7-42. – DOI: 10.1023/A:1014573219977.
  12. Jun, B. Robust face detection using local gradient patterns and evidence accumulation / B. Jun, D. Kim // Pattern Recognition. – 2012. – Vol. 45, Issue 9. – P. 3304-3316. – DOI: 10.1016/j.patcog.2012.02.031.
  13. Freeman, H. On the encoding of arbitrary geometric configurations / H. Freeman // IRE Transactions on Electronic Computers. – 1961. – Vol. EC-10, Issue 2. – P. 260-268. – DOI: 10.1109/TEC.1961.5219197.
  14. Gonzalez, R. Digital image processing / R. Gonzalez, R. Woods. – 3rd ed. – Upper Saddle River, NJ: Prentice-Hall, 2007. – 976 p. – ISBN: 978-0-13-168728-8.
  15. Bracewell, R. The Fourier transform and its applications / R. Bracewell. – 3rd ed. – New York: McGraw-Hill Science, 1999. – 640 p. – ISBN: 978-0-07-303938-1.
  16. Fei-Fei, L. Recognizing and learning object categories / L. Fei-Fei, R. Fergus, A. Torralba // Conference on Computer Vision and Pattern Recognition. – 2007.
  17. Matas, J. Robust widebaseline stereo  from  maximally stable extremal regions / J. Matas, O. Chum, M. Urban, T. Pajdla // British Machine Vision Conference. – 2002. – P. 384-393.
  18. Belongie, S. Shape matching and object recognition using shape contexts / S. Belongie, J. Malik, J. Puzicha // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2002. – Vol. 24, Issue 4. – P. 509-522. – DOI: 10.1109/34.993558.
  19. Ломов, Н.А. Площадь дискового покрытия – дескриптор формы изображения / Н.А. Ломов, Л.М. Местецкий // Компьютерная оптика. – 2016. – Т. 40, № 4. – С. 516-525. – DOI: 10.18287/2412-6179-2016-40-4-516-525.
  20. Сидякин, С.В. Морфологические дескрипторы формы бинарных изображений на основе эллиптических структурирующих элементов / С.В. Сидякин, Ю.В. Визильтер // Компьютерная оптика. – 2014. – Т. 38, № 3. – С. 511-520. – DOI: 10.18287/0134-2452-2014-38-3-511-520.
  21. Bauckhage, C. Bounding box splitting for robust shape classification / C. Bauckhage, J.K. Tsotsos // IEEE International Conference on Image Processing (ICIP 2005). – 2005. – P. 478-481. – DOI: 10.1109/ICIP.2005.1530096.
  22. Sonka, M. Image processing, analysis and machine vision / M. Sonka, V. Hlavac, R. Boyle. – London: Chapman and Hall, 1993. – 872 p. – ISBN: 978-0-412-45570-4.
  23. Abbasi, S. Enhancing CSS-based shape retrieval for objects with shallow concavities / S. Abbasi, F. Mokhtarian, J. Kittler // Image and Vision Computing. – 2000. – Vol. 18, Issue 3. – P. 199-211. – DOI: 10.1016/S0262-8856(99)00019-0.
  24. Siddiqi, K. A shock grammar for recognition / K. Siddiqi, B. Kimia // Proceedings of the 1996 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR '96). – 1996. – P. 507-513. – DOI: 10.1109/CVPR.1996.517119.
  25. Zakharov, A.A. Finding correspondences between images using descriptors and graphs / A.A. Zakharov, A.Yu. Tu­zhilkin, A.L. Zhiznyakov // Procedia Engineering. – 2015. – Vol. 129. – P. 391-396. – DOI: 10.1016/j.proeng.2015.12.131.
  26. Barinov, A.E. Clustering using a random walk on graph for head pose estimation / A.E. Barinov, A.A. Zakharov // 2015 International Conference on Mechanical Engineering, Automation and Control Systems (MEACS). – 2015. – DOI: 10.1109/MEACS.2015.7414876.
  27. Баринов, А.Е. Алгоритм спектральной кластеризации с ограничениями для выделения лица человека на изображениях / А.Е. Баринов, А.А. Захаров, А.Л. Жиз­няков // Динамика систем, механизмов и машин. – 2016. – Т. 2, № 1. – С. 222-228.
  28. Zakharov, A.A. Recognition of human pose from images based on graph spectra / A.A. Zakharov, A.E. Barinov, A.L. Zhyznyakov // The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. – 2015. – Vol. XL-5/W6. – P. 9-12. – DOI: 10.5194/isprsarchives-XL-5-W6-9-2015.
  29. Chung, F.R.K. Spectral graph theory / F.R.K. Chung. – Provides, Rhode Island: AMS, 1997. – 207 p. – ISBN: 0-8218-0315-8.
  30. ElGhawalby, H. Measuring graph similarity using spectral geometry / H. ElGhawalby, E.R. Hancock. – In book: Image Analysis and Recognition. ICIAR 2008 / ed. by A. Campilho, M. Kamel. – Berlin, Heidelberg: Springer, 2008. – P. 517-526. – DOI: 10.1007/978-3-540-69812-8_51.
  31. Borg, I. Modern multidimensional scalling: Theory and applications / I. Borg, P. Groenen. – 2nd ed. – New York, NY: Springer-Verlag, 2005. – 614 p. – P. 207-212. – ISBN: 0-387-25150-2.
  32. Viola, P. Rapid Object detection using a boosted cascade of simple features / P. Viola, M. Jones // Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 2001). – 2001. – P. 511-518. – DOI: 10.1109/CVPR.2001.990517.

© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846) 242-41-24 (ответственный секретарь), +7 (846) 332-56-22 (технический редактор), факс: +7 (846) 332-56-20