Джуров  Александр Андреевич   (Аспирант, 
Донского государственного технического университета
)
                
            
            
    
        
            
            
                
                    
                        |   | 
                        
                         В данной статье рассматривается использование библиотеки sklearn и базы данных WordNet для классификации текста. Показан принцип работы стемминга, а также пример реализации его в python. Расписаны шаги Pipeline для построения модели и обработки данных. Были рассмотрены различные подходы к предобработке текста, включая токенизацию, удаление стоп-слов и лемматизацию. Использование базы данных WordNet позволило провести семантический анализ текста и улучшить качество классификации текста. Результаты экспериментов показали, что комбинирование методов sklearn и базы данных WordNet являются эффективным подходом к классификации текста. Показана демонстрация работы разработанного модуля с выводами результатов и общая схема работы модуля с описанием его работы. 
                        Ключевые слова:sklearn, WordNet, Stemmer, классификация текста, Python, Pipeline 
                         | 
                     
                
             
             | 
        
        
            |   | 
        
        
            | 
             Читать полный текст статьи …  
             | 
        
        
             
             
            
                
                    
                         Ссылка для цитирования: Джуров  А. А. ПОИСК ДЕСТРУКТИВНОГО КОНТЕНТА В ТЕКСТЕ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2024. -№03/2. -С. 46-50 DOI 10.37882/2223-2966.2024.3-2.07 | 
                         | 
                     
                
             
             |