Zusammenfassung
Seit dem Entstehen des Web 2.0 gehören Blogs zum Kern der neuen Medienlandschaft. Insbesondere der Mikro-Blogging-Dienst Twitter stellt eine der schnellst wachsenden Informationsquellen unserer Zeit dar. Über 200 Millionen regelmäßige Nutzer schreiben täglich mehr als 340 Millionen Nachrichten.
Twitter-Nutzer haben die Möglichkeit über mit # annotierten Worten (sog. Hashtags) Nachrichten explizit zu verschlagworten. Diese Schlagworte sind nicht immer eindeutig und können für mehrere Themen verwendet werden. Den Überblick über mögliche Verbindungen zwischen Hashtags und deren Themen zu behalten, fällt schwer. Der hier vorgestellte Ansatz erfasst mittels Data-Mining-Methoden Zusammenhänge zwischen Hashtags und visualisiert diese. Dadurch soll der Nutzer unterstützt werden, einen Überblick über besprochene Themen und deren Hashtags zu bekommen.
References
Huang J, Thornton KM, Efthimiadis EN (2010) Conversational tagging in twitter. In: Proceedings of the 21st ACM conference on Hypertext and hypermedia. HT ’10, New York, NY, USA, ACM, 173–178
Infosthetics (2012) Hashtagify: Exploring the connections between twitter hashtags. http://infosthetics.com/archives/2011/05/hashtagify_exploring_the_connections_between_twitter_hashtags.html, Stand 31. Juli 2012
Bennett S (2012) Visually explore twitter hashtags and their relationships with hashtagify, http://www.mediabistro.com/alltwitter/, Stand 20. Juli 2012
Davidov D, Tsur O, Rappoport A (2010) Enhanced sentiment learning using twitter hashtags and smileys. In: Proceedings of the 23rd International Conference on Computational Linguistics: Posters. COLING ’10, Stroudsburg, PA, USA, Association for Computational Linguistics, 241–249
Hossmann T, Schatzmann D, Carta P, Legendre F (2012) Twitter in disaster mode: smart probing for opportunistic peers. In: Proceedings of the third ACM international workshop on Mobile Opportunistic Networks. MobiOpp ’12, New York, NY, USA, ACM, 93–94
Tsur O, Rappoport A (2012) What’s in a hashtag?: Content based prediction of the spread of ideas in microblogging communities. In: Proceedings of the fifth ACM international conference on Web search and data mining. WSDM ’12, New York, NY, USA, ACM, 643–652
Sadamitsu K, Mishina T, Yamamoto M (2007) Topic-based language models using dirichlet mixtures. Syst Comput Japan 38(12):76–85
Bishop CM (2007) Pattern Recognition and Machine Learning (Information Science and Statistics). 1st ed, 2006, corr. 2nd printing edn, Springer
Rodgers JL, Nicewunder AW (1988) Thirteen ways to look at the correlation coefficient. The American Statistician 42(1):59–66
Lord F, Novick M (1968) Statistical Theories of Mental Test Scores. Addison-Wesley series in behavioral science, Addison-Wesley Pub. Co.
Nakatani S (2012) Language detection library for java. code.google.com/p/language-detection/, Stand 19. Juli 2012
Usbeck R (2012) Analyse von mikro-blog-daten. Master-Arbeit
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Usbeck, R. Analyse von Mikro-Blogging-Daten. Informatik Spektrum 38, 400–405 (2015). https://doi.org/10.1007/s00287-014-0768-6
Published:
Issue Date:
DOI: https://doi.org/10.1007/s00287-014-0768-6