Синтез обучающих выборок для классификации дорожных знаков с помощью нейросетей
Шахуро В.И., Конушин А.С.

 

НИУ Высшая школа экономики, Москва, Россия,
МГУ имени М.В. Ломоносова, Москва, Россия

Аннотация:
В работе исследуется применимость порождающих конкурирующих нейронных сетей для синтеза обучающих выборок на примере задачи классификации дорожных знаков. Рассматриваются порождающие нейронные сети, обучаемые с помощью метрики Васерштейна. В качестве базового метода для сравнения используется метод генерации синтетических изображений дорожных знаков по иконке. Проводится экспериментальное сравнение нейросетевых классификаторов, обученных на реальных данных, двух видах синтетических данных, а также смеси реальных и синтетических данных. Эксперименты показывают, что современные порождающие нейронные сети позволяют создавать реалистичные обучающие выборки для классификации автодорожных знаков, которые превосходят по качеству методы генерации знаков по иконкам, но немного уступают по качеству реальным данным.

Ключевые слова:
классификация дорожных знаков, синтетические обучающие выборки, порождающие нейронные сети.

Цитирование:
Шахуро, В.И. Синтез обучающих выборок для классификации дорожных знаков с помощью нейросетей / В.И. Шахуро, А.С. Конушин // Компьютерная оптика. – 2018. – Т. 42, № 1. – С. 105-112. – DOI: 10.18287/2412-6179-2018-42-1-105-112.

Литература:

  1. Russakovsky, O. ImageNet large scale visual recognition challenge / O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein, A. Berg, L. Fei-Fei // International Journal of Computer Vision. – 2015. – Vol. 115, Issue 3. – P. 211-252. – DOI: 10.1007/s11263-015-0816-y.
  2. Lin, T. Microsoft COCO: Common objects in context / T. Lin, M. Maire, S. Belongie, J. Hays, P. Perona, D. Ramanan, P. Doll'ar, L. Zitnick. – In book: Computer Vision – ECCV 2014 / ed. by D. Fleet, T. Pajdla, B. Schiele, T. Tuytelaars. – Switzerland: Springer International Publishing; 2014. – P. 740-755. – ISBN: 978-3-319-10592-5.
  3. Cordts, M. The cityscapes dataset for semantic urban scene understanding / M. Cordts, M. Omran, S. Ramos, T. Rehfeld, M. Enzweiler, R. Benenson, U. Franke, S. Roth, B. Schiele // Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. – 2016. – P. 3213-3223. – DOI: 10.1109/CVPR.2016.350.
  4. Shotton, J. Real-time human pose recognition in parts from single depth images / J. Shotton, T. Sharp, A. Kipman, A. Fitzgibbon, M. Finocchio, A. Blake, M. Cook, R. Moore // Communications of the ACM. – 2013. – Vol. 56, Issue 1. – P. 116-124. – DOI: 10.1145/2398356.2398381.
  5. Richter, S.R. Playing for data: Ground truth from computer games / S.R. Richter, V. Vineet, S. Roth, V. Koltun. – In book: Computer Vision – ECCV 2016 / ed by B. Leibe, J. Matas, N. Sebe, M. Welling. – Cham, Switzerland: Springer, 2016. – P. 102-118. – DOI: 10.1007/978-3-319-46475-6_7.
  6. Moiseyev, B. Evaluation of traffic sign recognition methods trained on synthetically generated data / B. Moiseyev, A. Konev, A. Chigorin, A. Konushin // Proceedings of the 15th International Conference on Advanced Concepts for Intelligent Vision Systems. – 2013. – P. 576-583. – DOI: 10.1007/978-3-319-02895-8_52.
  7. Chigorin, A. A system for large-scale automatic traffic sign recognition and mapping / A. Chigorin, A. Konushin // CMRT13 – City Models, Roads and Traffic 2013. ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences. – 2013. – Vol. II-3/W3. – P. 13-17. – DOI: 10.5194/isprsannals-II-3-W3-13-2013.
  8. Fischer, P. Flownet: Learning optical flow with convolutional networks / P. Fischer, A. Dosovitskiy, E. Ilg, P. Haus­ser, C. Hazirbas, V. Golkov, P. van der Smagt, D. Cremers, T. Brox // arXiv preprint arXiv:1504.06852. – 2015.
  9. Goodfellow, I. Generative adversarial nets / I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, A. Courville, Y. Bengio // Proceedings of the 27th International Conference on Neural Information Processing Systems. – 2014. – Vol. 2. – P. 2672-2680.
  10. Radford, A. Unsupervised representation learning with deep convolutional generative adversarial networks [Electronical Resource] / A. Radford, L. Metz, S. Chintala // arXiv preprint arXiv:1511.06434. – 2015. – URL: https://arxiv.org/abs/1511.06434. (date request 24.11.2017).
  11. Denton, E.L. Deep generative image models using a Laplacian pyramid of adversarial networks / E.L. Denton, S. Chintala, A. Szlam, R. Fergus // Proceedings of the 28th International Conference on Neural Information Processing Systems (NIPS). – 2015. – Vol. 1. – P. 1486-1494.
  12. Mirza, M. Conditional generative adversarial nets [Electronical Resource] / M. Mirza, S. Osindero // arXiv preprint arXiv:1411.1784. – 2014. – URL: https://arxiv.org/abs/1411.1784 (date request 24.11.2017).
  13. Zheng, Z. Unlabeled samples generated by GAN improve the person re-identification baseline in vitro [Electronical Resource] / Z. Zheng, L. Zheng, Y. Yang // arXiv preprint arXiv:1701.07717. – 2017. – URL: https://arxiv.org/abs/1701.07717 (date request 24.11.2017).
  14. Arjovsky, M. Wasserstein gan [Electronical Resource] / M. Arjovsky, S. Chintala, L. Bottou // arXiv preprint arXiv:1701.07875. – 2017. – URL: https://arxiv.org/abs/1701.07875 (date request 24.11.2017).
  15. Stallkamp, J. Man vs. computer: Benchmarking machine learning algorithms for traffic sign recognition / J. Stallkamp, M. Schlipsing, J. Salmen, C. Igel // Neural networks. – 2012. – Vol. 32. – P. 323-332. – DOI: 10.1016/j.neunet.2012.02.016.
  16. Шахуро, В.И. Российская база изображений автодорожных знаков / В.И. Шахуро, А.С. Конушин // Компьютерная оптика. – 2016. – Т. 40, № 2. – С. 294-300. – DOI: 10.18287/2412-6179-2016-40-2-294-300.
  17. Лисицын, С.О. Распознавание дорожных знаков с помощью метода опорных векторов и гистограмм ориентированных градиентов / С.О. Лисицын, О.А. Байда // Компьютерная оптика. – 2012. – Т. 36, № 2. – С. 289-295.
  18. Ciresan, D. Multi-column deep neural network for traffic sign classification / D. Ciresan, U. Meier, J. Masci, J. Schmid­huber // Neural Networks. – 2012. – Vol. 32. – P. 333-338. – DOI: 10.1016/j.neunet.2012.02.023.

© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846) 242-41-24 (ответственный секретарь), +7 (846) 332-56-22 (технический редактор), факс: +7 (846) 332-56-20