Шелепов Владислав Юрьевич доктор физико-математических наук, профессор, заведующий кафедрой систем искусственного интеллекта Института информатики и искусственного интеллекта Донецкого национального технического университета.
283048, г. Донецк, ул. Артёма, 118-б.
Область научных интересов: распознавание речевых образов, системы искусственного интеллекта.
Ниценко Артём Владимирович профессиональный программист.
283048, г. Донецк, ул. Артёма, 118-б.
Область научных интересов: распознавание речи.
УДК 004.89:004.93 DOI 10.24412/2413-7383-2024-4-16-24 Язык: Русский Аннотация:
В статье предложен способ автоматического снятия омонимии именительного и винительного падежа существительных с использованием информации о семантических связях слов, извлеченной из большого корпуса текстов. Данные о семантических связях представлены в виде онтологии, состоящей из множества семантических триплетов или троек «субъект-предикат-объект». Результаты реализованы в экспериментальном программном обеспечении для снятия омонимии. Ключевые слова: обработка естественного языка, снятие омонимии, онтология, граф знаний, семантическая тройка.
Список литературы: 1. Зеленков, Ю.Г., Сегалович, И.В., & Титов, В.А. (2005). Вероятностная модель снятия морфологической омонимии на основе нормализующих подстановок и позиций соседних слов. In *Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара Диалог’2005* (pp. 188-197).
2. Сокирко, А.В., & Толдова, С.Ю. (2005). Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический анализатор именных групп). In *Интернет-математика 2005: автоматическая обработка веб-данных* (pp. 80-94). М.
3. Лакомкин, Е.Д., Пузыревский, И.В., & Рыжова, Д.А. (2013). *Анализ статистических алгоритмов снятия морфологической омонимии в русском языке*. Retrieved from http://aistconf.org/stuff/aist2013/submissions/aist2013_submission_33.pdf (дата обращения 20.12.2021).
4. Schmid, H. (2013). Probabilistic part-ofispeech tagging using decision trees. In *New methods in language processing* (pp. 154-164).
5. Sharoff, S., Kopotev, M., Erjavec, T., Feldman, A., & Divjak, D. (2008). Designing and evaluating a Russian tagset. In *Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC 2008)* (Vol. 26, pp. 279-285).
6. Muzychka, S.A., Romanenko, A.A., & Piontkovskaja, I.I. (2014). Conditional Random Field for morphological disambiguation in Russian. In *Компьютерная лингвистика и интеллектуальные технологии* (pp. 455-465).
7. Антонова, А., & Соловьев, А. (2013). Использование метода условных случайных полей для обработки текстов на русском языке. In *Компьютерная лингвистика и интеллектуальные технологии* (pp. 27–44).
8. Sorokin, A., et al. (2017). MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian. In *Proceedings of the International Conference Dialogue 2017* (Vol. 1, pp. 297-313).
9. Lyashevskaya, O.N., et al. (2020). GRAMEVAL 2020 shared task: Russian full morphology and universal dependencies parsing. In *Proceedings of the International Conference Dialogue 2020* (Vol. 1, pp. 553-569).
10. Chiche, A., & Yitagesu, B. (2022). Part of speech tagging: a systematic review of deep learning and machine learning aPproaches. *Journal of Big Data*, *9*(1), 1-25.
11. Смирнов, И.В. (2023). *Интеллектуальный анализ текстов на основе методов разноуровневой обработки естественного языка*. М.: ФИЦ ИУ РАН.
12. Anastasyev, D. G., Andrianov, A. I., & Indenbom, E. M. (2017). Part-of-speech tagging with rich language description. In *Компьютерная лингвистика и интеллектуальные технологии : По материалам ежегодной Международной конференции "Диалог", Москва, 31 мая – 03 2017 года* (Vol. Выпуск 16 (23), Том 1, pp. 2-13). Москва: Российский государственный гуманитарный университет.
13. Национальный корпус русского языка. (n.d.). Retrieved from https://ruscorpora.ru/ (дата обращения: 20.11.2024).
14. Копотев, М.В., & Янда, Л.А. (2006). Национальный корпус русского языка. *Вопросы языкознания*, (5), 149–155.
15. Жевнерович, Е.Э. (2018). Корпус текстов в научном исследовании. In *Материалы II Международной научно-практической конференции «Лингвистика, лингводидактика, лингвокультурология: актуальные вопросы и перспективы развития»* (pp.25-32). Минск.
16. Ниценко, А. В., & Шелепов, В. Ю. (2023). Использование данных Национального корпуса русского языка для снятия омонимии винительного и родительного падежа внутри парадигмы существительных. In *Искусственный интеллект: теоретические аспекты, практическое применение: материалы Донецкого международного научного круглого стола* (pp. 137–141). Донецк: ФГБНУ «ИПИИ».
17. Ляшевская, О. Н., & Шаров, С. А. (2009). *Частотный словарь современного русского языка (на материалах Национального корпуса русского языка)*. М.: Азбуковник.
Выпуск: 4(35)'2024
Раздел: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И МАШИННОЕ ОБУЧЕНИЕ
Как цитировать:
Ниценко А. В., Шелепов В. Ю. ОБ ИСПОЛЬЗОВАНИИ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ СНЯТИЯ ОМОНИМИИ ИМЕНИТЕЛЬНОГО И ВИНИТЕЛЬНОГО ПАДЕЖА (КАК ЭЛЕМЕНТА СОЗДАНИЯ ОНТОЛОГИИ) [Текст]
/ А. В. Ниценко В. Ю. Шелепов
// Проблемы искусственного интеллекта. - 2024. № 4 (34). - С. 16-24. - http://paijournal.guiaidn.ru/ru/2024/4(35)-2.html