Files / Новые технологии

Анализ настроений в социальных сетях: на примере

Эмпирическое исследование классификации 10 000 твитов на позитивные и негативные с использованием моделей глубокого обучения на основе сверточных и рекуррентных нейронных сетей.

Detail

Published

23/12/2025

Список ключевых заголовков разделов

  1. Введение
  2. Связанные исследования
  3. Анализ настроений
  4. Векторные представления слов (Word Embeddings)
  5. Глубокое обучение
  6. Типы алгоритмов и технологий глубокого обучения
  7. Рекуррентные нейронные сети
  8. Методы и метрики оценки
  9. Методология исследования
  10. Результаты экспериментов
  11. Заключение

Краткое описание документа

На фоне растущего влияния социальных сетей анализ общественных настроений стал ключевой опорой в таких областях, как оценка рыночного реагирования компаний, прогнозирование политических выборов и предсказание макроэкономических явлений. Twitter, как всемирно известная платформа микроблогов и социальных сетей, насчитывает более 200 миллионов зарегистрированных пользователей и 100 миллионов активных пользователей, ежедневно генерируя около 250 миллионов твитов. Его огромные объемы неструктурированных данных предоставляют богатую выборку для анализа настроений, но также создают технические проблемы. Данное исследование фокусируется на проблеме анализа настроений на платформе Twitter, с основной целью построения эффективной модели для точной классификации твитов на позитивные и негативные.

Исследование начинается с обзора ключевых концепций и областей применения анализа настроений, определяя классификационные аспекты субъективности и анализа настроений (SSA), включая фреймворки классификации на уровне документа, предложения и аспекта. Также проводится систематический обзор соответствующих исследований в данной области, охватывающий алгоритмы машинного обучения, технологии семантического анализа и интеграцию словарей настроений, что закладывает теоретическую основу для последующего построения модели.

На техническом уровне исследование использует методологию глубокого обучения, создавая гибридную модель, объединяющую сверточные нейронные сети (CNN) и рекуррентные нейронные сети (RNN), с особым вниманием к внедрению сетей долгой краткосрочной памяти (LSTM) для решения проблемы долгосрочных зависимостей в традиционных RNN. Процесс обработки данных следует строгой стандартизированной процедуре, включая ключевые этапы: получение и предварительная обработка набора данных (удаление стоп-слов, знаков препинания, специальных символов и т.д.), представление текста (преобразование текста в векторы на основе технологии векторных представлений слов), разделение набора данных (80% обучающая выборка и 20% тестовая выборка) и другие, что обеспечивает качество данных и эффективность обучения модели.

Для обучения и валидации модели исследование использует набор данных из 1.6 миллиона твитов с сайта kaggle.com (включая 800,000 позитивных и 800,000 негативных твитов). Производительность оценивается с помощью множества метрик: точности (accuracy), прецизионности (precision), полноты (recall) и F1-меры. Результаты экспериментов показывают, что построенная модель достигла успешности в 93.91% при распознавании настроений в твитах, где применение слоя векторных представлений слов, оптимизация параметров блоков LSTM и использование алгоритма оптимизации Adam сыграли ключевую роль в повышении точности классификации.

Данное исследование подтверждает эффективность моделей глубокого обучения в анализе настроений на основе неструктурированных данных социальных сетей. Модель с высокой точностью может обеспечить поддержку принятия решений в практических сценариях, таких как политический маркетинг, и одновременно заложить техническую основу для последующего создания интегрированной системы анализа настроений в реальном времени. Процесс обработки данных, архитектура модели и опыт выбора гиперпараметров, полученные в ходе исследования, также предоставляют воспроизводимый эмпирический ориентир для аналогичных исследований анализа настроений в социальных сетях.