Чернядьев Иван Валерьевич инженер-исследователь ФГБНУ "Институт проблем искусственного интеллекта",
бакалавр физико-технического факультета ФГБОУ ВО "ДонГУ".
Область научных интересов: компьютерное зрение, машинное обучение, нейронные сети.
Ермоленко Татьяна Владимировна научный сотрудник отдела системного анализа и интеллектуальных интерфейсов
ФГБНУ "Институт проблем искусственного интеллекта",
кандидат технических наук, доцент.
Область научных интересов: машинное обучение, обработка естественного языка, распознавание образов, интеллектуальный анализ данных.
УДК 004.932.4 DOI 10.24412/2413-7383-2025-4-39-254-265 Язык: Русский Аннотация: В статье рассматривается актуальная проблема улучшения качества изображений с использованием методов глубокого обучения, с акцентом на super-resolution, шумоподавление и
устранение артефактов. Анализируются ключевые архитектуры на основе Transformer и сверточных нейронных сетей, их преимущества и недостатки, такие как высокая ресурсоемкость и
узкая специализация. Предлагаются улучшения в виде рандомизированной аугментации
данных для синтеза обучающей выборки и замены стандартной свертки на быструю свертку
Фурье для захвата глобального контекста. Целью работы является повышение качества
восстановления изображений без высоких вычислительных затрат.
Ключевые слова:
super-resolution, нейронные сети, компьютерное зрение,
глубокое обучение, обработка изображений.
Список литературы: 1. Сай С.В. Способ оценки четкости фотореалистичных изображений с высоким разрешением // Компьютерная оптика. 2022. Т. 46, № 1. С. 121-129. ISSN 2412-6179. DOI: 10.18287/2412-6179-CO-899.
2. Коновалов, В.Ф. Единый нейросетевой метод повышения разрешения для разнородных цифровых изображений дистанционного зондирования Земли / В.Ф. Коновалов, В.В. Мясников, В.В. Сергеев // Компьютерная оптика. 2024. Т. 48, № 6. С. 944-955. DOI: I0.18287/2412-6179-C0-I610.
3. Singh P., Ganotra D. Brain MRT image super resolution using discrete cosine transform and convolutional neural network. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2023, vol. 23, no. 4, pp. 734-742. doi: 10.17586/2226-1494-2023-23-4-734-742.
4. Сай С.В., Кудяшов А.А. Оценка качества изображений природного ландшафта с повышенным разрешением на основе GAN // Вестник ТОГУ. 2024. № 1 (72). С. 45-52. УДК 004.896.
5. Шелковникова, Т.Е. Применение генеративно-состязательных нейросетей для формирования баз данных в сканирующей туннельной микроскопии / Т.Е. Шелковникова, С.Ф. Егоров, П.В. Гуляев // Компьютерная оптика. 2023. Т. 47, № 2. С. 314-322. DOI: 10.18287/2412-6179-CO-1144.
6. Yang F., Yang H., Fu J., Lu H., Guo B. Learning Texture Transformer Network for Image SuperResolution. 2020. P. 5790-5799. DOI: 10.1109/CVPR42600.2020.00583.
7. Liu, Z. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows [Text] / Z. Liu, Y. Lin, Y. Cao, H. Hu, Y. Wei, Z. Zhang, S. Lin, B. Guo // arxiv preprint. 2021. arxiv:2103.14030.
8. Liang, J. SwinIR: Image Restoration Using Swin Transformer / J. Liang, J. Cao, G. Sun, K. Zhang, L. Van Gool, R. Timofte // arxiv preprint. 2021. arxiv:2108.10257.
9. Бережнов, Н.И. Совершенствование механизмов внимания для архитектуры трансформер в задачах повышения качества изображений / Н.И. Бережнов, А.А. Сирота // Компьютерная оптика. 2024. Т. 48, № 5. С. 726-733. DOI: 10.18287/2412-6179-CO-1393.
10. Ермоленко Т. В., Самородский И. Е. Анализ эффективности архитектур глубоких нейросетей для классификации // Журнал «Проблемы искусственного интеллекта». 2022. № 1(24). С. 54-64. ISSN 2413-7383.
11. Денисов А.К., Быковский С.В., Кустарев П.В. Метод увеличения разрешения изображения с использованием референсных изображений на основе диффузионной модели // Научнотехнический вестник информационных технологий, механики и оптики. 2025. Т. 25, № 2. С. 321-327. doi: 10.17586/2226-1494-2025-25-2-321-327.
12. Yoo, J.S., Kim, M., & Kim, S.J. (2020). Rethinking Data Augmentation for Image Super-Resolution. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), June 13-19, 2020, Seattle, WA, USA, pp. 10735-10744. DOI: 10.1109/CVPR42600.2020.01075.
13. Чаганова О.Б., Григорьев А.С., Николаев Д.П., Николаев И.П. Прикладные аспекты современных методов неослепительного восстановления изображений [Текст] // Компьютерная оптика. – 2024. Т. 48, № 4. С. 562–572. ISSN 2412-6179. DOI: 10.18287/2412-6179-CO-1409.
14. Zhang X., Wu X. Dual-layer Image Compression via Adaptive Downsampling and Spatially Varying Upconversion. 2023. P. 1-10. DOI: arXiv:2302.06096.
15. Котенко, И. В. Метод противодействия состязательным атакам на системы классификации изображений [Текст] / И. В. Котенко, И. Б. Саенко, О. С. Лаута, Н. А. Васильев, В. Е. Садовников // Вопросы кибербезопасности. 2025. № 2(66). С. 114-123. ISSN 2311-3456. DOI: 10.21681/2311-3456-2025-2-114-123.
16. Пикалёв Я.С., Ермоленко Т.В. О нейронных архитектурах извлечения признаков для задачи распознавания объектов на устройствах с ограниченной вычислительной мощностью // Журнал «Проблемы искусственного интеллекта». 2023. № 3. С. 44-54. ISSN 2413-7383. DOI 10.34757/2413-7383.2023.30.3.004.
17. Чернядьев, И. В. Системный анализ программного обеспечения концептуальной нейросетевой модели системы классификации эмоций на изображениях / И. В. Чернядьев В. В. Бондарчук // Евразийский Союз Ученых. Серия: технические и физико-математические науки. 2024. № 08(123). С. 6-15. ISSN 2413-9335. DOI: 10.31618/ESU.2413-9335.
18. Rao, Y. Global Filter Networks for Image Classification / Y. Rao, W. Zhao, Z. Zhu, J. Lu, J. Zhou // arxiv preprint. 2021. arxiv:2107.00645.
19. Quattrini, F. Volumetric Fast Fourier Convolution for Detecting Ink on the Carbonized Herculaneum Papyri [Text] / F. Quattrini, V. Pippi, S. Cascianelli, R. Cucchiara // arxiv preprint. 2023. arxiv:2308.05070.
20. Gu, L. Fast Fourier Convolution Based Remote Sensor Image Object Detection for Earth Observation [Text] / L. Gu, R. Qiao, X. Chen // arxiv preprint. 2022. arxiv:2209.00551.
21. Miao W., Shen J., Xu Q., Hamalainen T., Xu Y., Cong F. SpikingYOLOX: Improved YOLOX Object Detection with Fast Fourier Convolution and Spiking Neural Networks / W. Miao, J. Shen, Q. Xu, T. Hamalainen, Y. Xu, F. Cong. 2025. Vol. 39, iss. 2. P. 1465-1473. DOI: 10.1609/aaai.v39i2.321
.
Выпуск: 4(39)'2025
Раздел: Системный анализ, управление и обработка информации, статистика
Как цитировать: