РУС ENG

ОБНАРУЖЕНИЕ КЛЮЧЕВЫХ ОБЪЕКТОВ И ПЕРЕКРЁСТНАЯ ГЕОЛОКАЛИЗАЦИЯ: АНАЛИЗ НАБОРОВ ДАННЫХ И МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ

О журнале

Новости
Цели и сфера
Основатель и издатель
Редакционная коллегия
Условия лицензирования
Конфиденциальность
Отношение к плагиату
Публикационная этика
Политика архивирования
Подписка


Для авторов

Инструкции для авторов
Процесс рецензирования
Авторские права
Договор о передаче прав
Редакционные сборы


Архив

Все выпуски
Поиск


Контакты

Контакты


Пикалёв Ярослав Сергеевич
кандидат техн. наук, старший научный сотрудник лаборатории интеллектуальных систем и анализа данных, Федерального государственного бюджетного научного учреждения «Институт проблем искусственного интеллекта».
283048, г. Донецк, ул. Отважных, д. 19, кв. 85, телефон: +7949 4287388, эл. почта i@pikaliov.ru.
Область научных интересов: цифровая обработка сигналов, анализ данных, распознавание образов, обработка естественного языка, компьютерное зрение, машинное обучение, нейронные сети.

УДК 004.932.72
DOI 10.24412/2413-7383-2024-4-25-37
Язык: Русский
Аннотация: Данная работа посвящена проблеме создания системы для задачи перекрёстной геолокализации на основе нейросетевого подхода. Это направление актуально в связи с тем, что эти системы помогают БПЛА ориентироваться в сложных условиях, идентифицируя объекты, препятствия и маршруты, что позволяет снизить зависимость от операторов. К тому же, используя системы распознавания, БПЛА могут осуществлять сбор и анализ данных. В ходе данной работы был проведен анализ существующих наборов данных, применимых к задаче перекрестной геолокации, а также были выявлены общие положения и требования к используемым наборам данных. Среди всех наборов были выделены следующие: Objects 365, LVIS, VisDrone, DOTA, iSAID и GeoText. Выделены следующие основные проблемы рассматриваемой задачи: 1) предварительная обработка изображений; 2) извлечение признаков; 3) целесообразность предварительного обуче-ния базовой модели; 4) учет семантических характеристик объектов и другие.
Ключевые слова: нейронные сети, наборы данных, перекрёстная геолокализация, компьютерное зрение, распознавание объектов, аугментация данных, автономные системы.

Список литературы:
1. Ронжин, А.Л., Ле, В.Н., & Шувалов, Н.С. (2024). Оптимизация технологической карты допустимых системотехнических решений задачи видеоаналитики аквакультуры. *Вестник Южно-Уральского университета. Серия «Математика. Механика. Физика»*, × 2 ×(16), 50-58. ISSN 2075-809Х. DOI: 10.14529/mmph240205
2. Ронжин, А. Л. (2024). Интеллектуализация и роботизация научного оборудования для междисциплинарных исследований. *Проблемы искусственного интеллекта*, × 1 ×(28), 4-10. ISSN 2413-7383. *(DOI отсутствует)*
3. Durgam, A., et al. (2024). Cross-view geo-localization: a survey. *arXiv preprint arXiv:2406.09722*.
4. Zhang, X., et al. (2020). Understanding image retrieval re-ranking: A graph neural network perspective. *arXiv preprint arXiv:2012.07620*.
5. Lin, J., et al. (2022). Joint representation learning and keypoint detection for cross-view geo-localization. *IEEE Transactions on Image Processing*, × 31 ×, 3780-3792.
6. Али, Б., Садеков, Р.Н., & Цодокова, В.В. (2022). Алгоритмы навигации беспилотных летательных аппаратов с использованием систем технического зрения. *Гироскопия и навигация*, × 30 ×(4), 87-105. ISSN 0869-7035. DOI: 10.17285/0869-7035.00105
7. Пикалёв, Я.С. (2022). Разработка системы нормализации текстовых корпусов. *Проблемы искусственного интеллекта*, × 2 ×(25), 64-78. ISSN 2413-7383
8. Хакимов, Р. С., Нижникова, О. Л., & Близно, М. В. (2024). К вопросу о разработке системы аннотирования данных для задач компьютерного зрения. *Проблемы искусственного интеллекта*, × 3 ×(34), 70–79. ISSN 2413-7383. DOI: 10.24412/2413-7383-2024-3-70-79
9. Gupta, A., Dollar, P., & Girshick, R. (2019). LVIS: A dataset for large vocabulary instance segmentation. In *Proceedings of the IEEE/CVF conference on computer vision and pattern recognition* (pp. 5356-5364).
10. Shao, S., et al. (2019). Objects365: A large-scale, high-quality dataset for object detection. In *Proceedings of the IEEE/CVF international conference on computer vision* (pp. 8430-8439).
11. Zamir, S.W., et al. (2019). iSAID: A large-scale dataset for instance segmentation in aerial images. In *Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops* (pp. 28-37).
12. Cao, Y., et al. (2021). VisDrone-DET2021: The vision meets drone object detection challenge results. In *Proceedings of the IEEE/CVF International conference on computer vision* (pp. 2847-2854).
13. Xia, G. S., et al. (2018). DOTA: A large-scale dataset for object detection in aerial images. In *Proceedings of the IEEE conference on computer vision and pattern recognition* (pp. 3974-3983).
14. Chu, M., et al. (2025). Towards natural language-guided drones: GeoText-1652 benchmark with spatial relation matching. In *European Conference on Computer Vision* (pp. 213-231). Springer, Cham.
15. Ермоленко, Т.В. (2019). Классификация ошибок в тексте на основе глубокого обучения. *Проблемы искусственного интеллекта*, × 3 ×(14), 47-57. ISSN 2413-7383
16. Зуев, В. М. (2024). Сравнение обнаружения объектов средствами искусственного интеллекта в сравнении с классическими методами. *Проблемы искусственного интеллекта*, × 3 ×(34), 4-10. ISSN 2413-7383. DOI: 10.24412/2413-7383-2024-3-30-35.
17. Пикалёв, Я. С., & Ермоленко, Т. В. (2023). О нейронных архитектурах извлечения признаков для задачи распознавания объектов на устройствах с ограниченной вычислительной мощностью. *Проблемы искусственного интеллекта*, × 3 ×(30), 44-54. ISSN 2413-7383. DOI: 10.34757/2413-7383.2023.30.3.004
18. Павленко, Б. В., & Бондаренко, В. И. (2024). Интеллектуально-алгоритмический метод калибровки прицелов. *Проблемы искусственного интеллекта*, × 3 ×(34), 55–63. ISSN 2413-7383. DOI: 10.24412/2413-7383-2024-3-55-63
19. Кришнан, Ш. Р., & Амудха, П. (2024). Улучшение обнаружения аномалий на видео с помощью усовершенствованной технологии UNET и техники каскадного скользящего окна. *Информатика и автоматизация*, × 6 ×(23), 1899-1930. ISSN 2713-3192. DOI: 10.15622/ia.23.6.12
20. Сойфер, В. А., Фурсов, В. А., & Харитонов, С. И. (2024). Калмановская фильтрация одного класса изображений динамических объектов. *Информатика и автоматизация*, × 4 ×(23), 953-968. ISSN 2713-3192. DOI: 10.15622/ia.23.4.1

Выпуск: 4(35)'2024
Раздел: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И МАШИННОЕ ОБУЧЕНИЕ
Как цитировать: Пикалёв Я. С. ОБНАРУЖЕНИЕ КЛЮЧЕВЫХ ОБЪЕКТОВ И ПЕРЕКРЁСТНАЯ ГЕОЛОКАЛИЗАЦИЯ: АНАЛИЗ НАБОРОВ ДАННЫХ И МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ* [Текст] / Я. С. Пикалёв // Проблемы искусственного интеллекта. - 2024. № 4 (35). - С. 25-37ОБНАРУЖЕНИЕ КЛЮЧЕВЫХ ОБЪЕКТОВ И ПЕРЕКРЁСТНАЯ ГЕОЛОКАЛИЗАЦИЯ: АНАЛИЗ НАБОРОВ ДАННЫХ И МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ. - http://paijournal.guiaidn.ru/ru/2024/3(34)-3.html