Журнал «Современная Наука»

Russian (CIS)English (United Kingdom)
МОСКВА +7(495)-142-86-81

АКТИВНОЕ ОБУЧЕНИЕ ДЛЯ КЛАССИФИКАЦИИ НАМЕРЕНИЙ В КОНТЕКСТНОМ ОБУЧЕНИИ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ

Дранга Даниил Игоревич  (Национальный исследовательский технологический университет МИСиС, Москва, Российская Федерация)

В современной обработке естественного языка большие языковые модели продемонстрировали высокую эффективность в различных задачах, включая классификацию намерений пользователя в диалоговых системах. Однако выбор оптимального набора примеров для контекстного обучения остается вызовом, особенно при ограниченном бюджете на разметку данных. В данной работе предлагается адаптированный алгоритм активного обучения для эффективного подбора примеров в контекстном обучении больших языковых моделей для задачи классификации намерений. Предложенный метод учитывает неопределенность модели и обеспечивает разнообразие выбранных примеров, способствуя улучшению точности классификации. Экспериментальные исследования показали, что разработанный подход превосходит альтернативные методы, обеспечивая более высокое качество классификации как для закрытых моделей (например, GPT-4), так и для открытых моделей, демонстрирующих хорошие результаты на русском языке (например, Gemma 2 27b).

Ключевые слова:активное обучение, контекстное обучение, большие языковые модели, классификация намерений, few-shot обучение, оценка неопределенности

 

Читать полный текст статьи …



Ссылка для цитирования:
Дранга Д. И. АКТИВНОЕ ОБУЧЕНИЕ ДЛЯ КЛАССИФИКАЦИИ НАМЕРЕНИЙ В КОНТЕКСТНОМ ОБУЧЕНИИ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2025. -№02/2. -С. 92-97 DOI 10.37882/2223-2966.2025.02-2.12
ПРАВОВАЯ ИНФОРМАЦИЯ:
Перепечатка материалов допускается только в некоммерческих целях со ссылкой на оригинал публикации. Охраняется законами РФ. Любые нарушения закона преследуются в судебном порядке.
© ООО "Научные технологии"