Разработка алгоритма семантической сегментации аэрофотоснимков реального времени
Блохинов Ю.Б., Горбачев В.А., Ракутин Ю.О., Никитин А.Д.

 

Государственный научно-исследовательский институт авиационных систем, Государственный научный центр Российской Федерации (ГНЦ ФГУП «ГосНИИАС»), Москва, Россия

Аннотация:
Статья посвящена разработке эффективного алгоритма семантической сегментации изображений для работы в реальном времени, обладающего наилучшей точностью в своем классе. На основе сравнительного анализа методов предварительной сегментации, методов вычисления признаков по сегментам изображения, а также различных алгоритмов машинного обучения выявлены наиболее эффективные из них как по точности, так и по быстродействию. По результатам исследования построен модульный алгоритм семантической сегментации со временем выполнения, близким к реальному. Обучение и тестирование проводились на коллекции ISPRS «Vaihingen» аэрофотоснимков видимого и инфракрасного диапазонов, к которым прилагается пиксельная карта высот изображенной местности. Предложен оригинальный способ получения нормализованной матрицы высот по исходной цифровой модели рельефа.

Ключевые слова:
анализ изображений, распознавание образов, детектирование, классификация, аэрофотоснимки, матрица высот, суперпиксели, набор признаков, семантическая сегментация, машинное обучение, условные случайные поля.

Цитирование:
Блохинов, Ю.Б. Разработка алгоритма семантической сегментации аэрофотоснимков реального времени / Ю.Б. Блохинов, В.А. Горбачев, Ю.О. Ракутин, А.Д. Никитин // Компьютерная оптика. – 2018. – Т. 42, № 1. – С. 141-148. – DOI: 10.18287/2412-6179-2018-42-1-141-148.

Литература:

  1. Горбачев, В.А. Плотная реконструкция рельефа местности на основе модифицированного алгоритма полуглобального стереоотождествления / В.А. Горбачев // Известия РАН. Теория и системы управления. – 2014. – № 2. – С. 68-79. – DOI: 10.7868/S0002338814020103.
  2. Веркеенко, М.С. Построение плотных моделей поверхности земли на основе метода полуглобального отождествления для случая множественного перекрытия снимков / М.С. Веркеенко, В.А. Горбачев // Известия РАН. Теория и системы управления. – 2017. – № 6. – С. 100-111. – DOI: 10.7868/S0002338817060087.
  3. Long, J. Fully convolutional networks for semantic segmentation / J. Long, E. Shelhamer, T. Darrell // IEEE Conference on Computer Vision and Pattern Recognition. – 2015. – P. 3431-3440. – DOI: 10.1109/CVPR.2015.7298965.
  4. 2D Semantic labeling contest. – URL: http://www2.isprs.org/commissions/comm3/wg4/semantic-labeling.html (дата обращения 8.09.2017).
  5. Achanta, R. SLIC superpixels compared to state-of-the-art superpixel methods / R. Achanta, A. Shaji, K. Smith, A. Lucchi, P. Fua, S. Susstrunk // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2012. – Vol. 34, Issue 11. – P. 2274-2281. – DOI: 10.1109/TPAMI.2012.120.
  6. Malik, J. Contour and texture analysis for image segmentation / J. Malik, S. Belongie, T. Leung, J. Shi // International Journal of Computer Vision. – 2001. – Vol. 43(1). – P. 7-27. – DOI: 10.1023/A:1011174803800.
  7. Ojala, T. Comparative study of texture measures with classification based on feature distributions / T. Ojala, M. Pietikäinen, D.A. Harwood // Pattern Recognition. – 1996. Vol. 29, Issue 1. – P. 51-59. – DOI: 10.1016/0031-3203(95)00067-4.
  8. Papageorgiou, C.P. A general framework for object detection / C.P. Papageorgiou, M. Oren, T. Poggio // Proceedings of International Conference on Computer Vision. – 1998. – P. 555-562. – DOI: 10.1109/ICCV.1998.710772.
  9. Машинное обучение (курс лекций, К.В. Воронцов). – URL: http://www.machinelearning.ru/wiki/index.php? title=Машиное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 (дата обращения 8.09.2017).
  10. Finley, T. Training structural SVMs when exact inference is intractable / T. Finley, T. Joachims // Proceedings of the 25th International Conference on Machine Learning (ICML '08). – 2008. – P. 304-311. – DOI: 10.1145/1390156.1390195.
  11. Kolmogorov, V. Minimizing non-submodular functions with graph cuts – A review / V. Kolmogorov, C. Rother // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2007. – Vol. 29(7). – P. 1274-1279. – DOI: 10.1109/TPAMI.2007.1031.
  12. Müller, A.C. PyStruct Structured prediction in Python / A.C. Müller, S. Behnke // Journal of Machine Learning Research. – 2014. – Vol. 15, Issue 1. – P. 2055-2060.
  13. Cramer, M. The DGPF – Test on digital aerial camera evaluation overview and test design / M. Cramer // Photogrammetrie – Fernerkundung – Geoinformation. – 2010. – Vol. 2. – P. 73-82. – DOI: 10.1127/1432-8364/2010/0041.
  14. Evaluierung digitaler photogrammetrischer luftbildkamerasysteme. – URL: http://www.ifp.uni-stuttgart.de/dgpf/DKEP-Allg.html (дата обращения 8.09.2017).

© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846) 242-41-24 (ответственный секретарь), +7 (846) 332-56-22 (технический редактор), факс: +7 (846) 332-56-20