Кузьменко Андрей Владимирович (аспирант,
Национальный исследовательский ядерный университет «МИФИ»
)
Киреев Василий Сергеевич (кандидат технических наук, доцент,
Национальный исследовательский ядерный университет «МИФИ»
)
|
По оценкам, около 80% корпоративных данных являются неструктурированными, что затрудняет их обработку и анализ традиционными методами. Извлечение отношений между сущностями из этих данных в форме реляционных троек позволяет преобразовать неструктурированную информацию в структурированную форму, облегчая доступ, анализ и использование знаний. В работе рассматриваются современные подходы извлечения реляционных троек из текстов на естественном языке, основанные на технологии преобразования последовательностей. Авторами выделены и структурированы существующие решения в набор групп методов: классические методы преобразования последовательностей, методы преобразования последовательностей в множество и prompt-методы. Проводится сравнительный анализ преимуществ и недостатков этих методов. Предлагается методология построения вспомогательной системы извлечения реляционных троек.
Ключевые слова:реляционная тройка, нейронная сеть, обработка естественного языка, seq-to-seq, set-to-seq, большие языковые модели.
|
|
|
Читать полный текст статьи …
|
Ссылка для цитирования: Кузьменко А. В., Киреев В. С. ПРИМЕНЕНИЕ ГЕНЕРАТИВНЫХ ПОДХОДОВ В СЕМАНТИЧЕСКОМ АНАЛИЗЕ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2025. -№02/2. -С. 117-122 DOI 10.37882/2223-2966.2025.02-2.23 |
|
|