4.99MBZIP
В данной статье в качестве объекта исследования взяты микроблоги студенческих городков, объединены характеристики микроблогов и реализована система обнаружения горячих тем в микроблогах студенческих городков на основе изучения технологий, связанных с горячими темами. Система состоит в основном из модулей сбора данных, предварительной обработки данных микроблогов, кластерного анализа K-means и других модулей. Система оказывает большую помощь сотрудникам, занимающимся изучением общественного мнения в кампусе, в своевременном обнаружении горячих тем.
Основные реализации данной работы заключаются в следующем:
(1) Используйте технологию Python crawler для одновременного получения страниц микроблогов и используйте соответствующие библиотеки Python для быстрого извлечения текстового содержимого микроблогов.
(2) Наблюдайте разницу между характеристиками микроблогов кампуса и традиционных текстов и выполняйте операции по предварительной обработке данных в соответствии с характеристиками коротких текстов микроблогов кампуса.
(3) Учитывая высокую размерность модели векторного пространства и разреженность представления текста микроблога, разреженность векторов признаков VSM решается с помощью улучшенного алгоритма TF-IDF для эффективного сокращения размерности и выбора признаков.
(4) Направленный на решение проблемы локального оптимального решения традиционного алгоритма K-means, выбор начального центра кластера в алгоритме Kmeans улучшен, и точность кластеризации K-means повышена.
(5) В соответствии с особенностями микроблогов в кампусе, алгоритм расчета тепла улучшен, чтобы повысить точность получения горячих тем.
(6) Система обнаружения горячих тем может управляться через визуальный интерфейс, что облегчает менеджерам по общественному мнению получение информации о горячих темах из интерфейса.
Заявление о ресурсах (покупка считается согласием с этим заявлением): 1. любая операция в веб-платформе считается прочитал и согласился с нижней части сайта регистрационное соглашение и отказ от ответственности, этот сайт ресурсы были ультра-низкая цена, и не предоставляет техническую поддержку 2. некоторые пользователи сети поделиться сетевой адрес диска может быть недействительным, таких как возникновение сбоев, пожалуйста, отправьте письмо в службу поддержки код711cn#qq.com (замените # на @) будет составлен, чтобы отправить 3. этот сайт предоставляет все загружаемые ресурсы (программное обеспечение и т.д.) сайт, чтобы гарантировать, что никаких негативных изменений; но этот сайт не может гарантировать точность, безопасность и целостность ресурсов, пользователь загружает по своему усмотрению, мы общаемся, чтобы узнать для целей не все исходный код не 100% безошибочно или нет ошибок; вы должны иметь определенную основу, чтобы быть в состоянии читать и понимать код, чтобы быть в состоянии изменить отладку! код и устранять ошибки. В то же время, пользователи данного сайта должны понимать, что Source Code Convenience Store не владеет никакими правами на программное обеспечение, предоставленное для скачивания, авторские права принадлежат законному владельцу ресурса. 4. все ресурсы на этом сайте только для обучения и исследовательских целей, пожалуйста, должны быть удалены в течение 24 часов после загрузки ресурсов, не используйте в коммерческих целях, в противном случае юридические споры, возникающие с сайта и издателя залога ответственности сайта и не будет нести! 5. в связи с воспроизводимым характером ресурсов, приобретенные ресурсы не подлежат возврату, баланс пополнения также не подлежит возврату