Fragen aus der Forschungspraxis

Soziale Medien – Ein neues Forschungsfeld für die Psychologie Social Media – A New Area for Psychological Research Was wird erklärt? Auf der Kommunikationsplattform „Twitter“ wird seit November 2014 unter dem Schlagwort „#NotJustSad“ eine Diskussion geführt, bei der an einer Depression erkrankte Menschen von ihren Erfahrungen mit der Erkrankung berichten. Der folgende Beitrag zeigt, welche statistischen Methoden zur Analyse dieser internetbasierten Kommunikation zur Verfügung stehen.

Soziale Medien als Grundlage wissenschaftlicher Untersuchungen !

Mit der Etablierung des sog. Web 2.0, d. h. des interaktiven Internets, sind in den letzten Jahren eine Reihe von Plattformen entstanden, die als „Social Media“ bezeichnet werden. Zu den wohl bekanntesten dieser „sozialen Medien“ gehören „Facebook“, „Google+“ und „Twitter“. Vor allem Twitter hat sich in den letzten Jahren als Plattform erwiesen, die – aufgrund der diskutierten Themen – auch für die Erforschung des Umgangs mit psychischen Erkrankungen relevant sein könnte. Ein gutes Beispiel für ein aus psychologischer Perspektive relevantes Thema ist die seit November 2014 bei Twitter unter dem Schlagwort „#NotJustSad“ geführte Diskussion, bei der an einer Depression erkrankte bzw. von depressiven Symptomen betroffene Menschen von ihren Erfahrungen mit der Erkrankung berichten und davon erzählen, wie ihre Mitmenschen darauf reagieren. Bei Twitter handelt es sich um eine Kommunikationsplattform, auf der sich telegrammartige Kurznachrichten (Tweets) verbreiten lassen. Diese Kurznachrichten dürfen bis zu 140 Zeichen umfassen und sind thematisch mit sog. Hashtags markiert. Anhand dieser mit einem Doppelkreuz (engl. hash) eingeleiteten Zeichenkette (z. B. #DGPPN) kann gezielt nach Kurznachrichten verschiedener Themengebiete gesucht werden. Aktuell (3. Quartal 2014) wird Twitter weltweit von etwa 232 Millionen Menschen genutzt (http:// de.statista.com).

Eine von Twitter zur Verfügung gestellte Programmierschnittstelle (API) erlaubt es, mithilfe externer Anwendungen auf diese Kurznachrichten zuzugreifen. Im wissenschaftlichen Kontext hat sich dafür das Statistikprogramm GNU R [1] bewährt. Mithilfe dieser Open-Source-Anwendung lässt sich ein Datensatz erstellen, der mit einem entsprechenden Hashtag markierte Tweets sowie weitere zugehörige Informationen enthält (z. B. Name des Benutzers, Datum und Uhrzeit).

Vor und Nachteile sozial generierter Daten !

Während wissenschaftliche Datenerhebungen, die z. B. im Rahmen einer Patienten- oder Bevölkerungsbefragung, zumeist sehr teuer und zeitaufwendig sind und darüber hinaus oft nur relativ kleine Datensätze hervorbringen, lassen sich „sozial“, also von Menschen generierte Daten ohne größeren finanziellen und zeitlichen Aufwand sammeln. Außerdem umfassen die so erstellten Datensätze in der Regel wesentlich mehr Fälle als das bei gezielten Datenerhebungen der Fall ist. Da soziale Daten von jedermann erzeugt werden können, der einen Internetanschluss hat, haben diese Daten darüber hinaus auch eine größere Reichweite als bspw. im Rahmen einer Befragung erhobene Daten. Die enorme Größe und Reichweite vieler sozial generierter Datensätze ist jedoch nicht automatisch ein Garant für die Repräsentativität der Daten. Vielmehr wird die Repräsentativität durch einen Selektionsbias – die Nutzer sozialer Medien sind mehrheitlich jung, leben in Städten und gehören der Mittelschicht an – eingeschränkt. Ein weiterer Nachteil besteht in deren geringer „Dichte“ dieses Datentyps. Unter „Dichte“ versteht man in diesem Zusammenhang den Grad der Brauchbarkeit der Daten für die Beantwortung der Forschungsfragen [2].

Analysemethoden !

Für die Auswertung sozialer Daten, bei denen es sich größtenteils um Texte handelt, wurden in den letzten Jahren eine Reihe von quantitativen Verfahren entwickelt,

die unter den Namen „Data Mining“, „Text Mining“ bzw. „Social Media Mining“ firmieren. Sich traditionell mit der Analyse von Texten befassende qualitative Forschungsmethoden kommen aufgrund der großen Datenmengen schon allein aus forschungspraktischen Gründen nur ergänzend infrage. Am Anfang einer statistischen Textanalyse steht in der Regel die Auszählung von Worthäufigkeiten. Die am häufigsten verwendeten Wörter können einen ersten Hinweis darauf geben, welche Themen und Problemfelder sich in dem untersuchten Text wiederfinden. Diese frequentialistischen Wortanalysen lassen sich nicht nur im Quer-, sondern auch im Längsschnitt durchführen. So lässt sich z. B. ermitteln, ob sich im Zeitverlauf neue thematische Schwerpunkte entwickelt haben. Da sich die Bedeutung eines Wortes oft nur in dem Kontext erschließt, in dem es verwendet wird, ist die Auszählung von Worthäufigkeiten für tiefer gehende Analysen in der Regel nicht geeignet. Die Kontextworte eines Begriffs lassen sich durch die Extrahierung von sog. N-Grammen ermitteln, wobei das „N“ für die Anzahl der Wörter steht, die im zu untersuchenden Text entweder direkt vor oder hinter dem entsprechenden Begriff stehen. So wird z. B. bei einem Bigramm jeweils ein Kontextwort des untersuchten Begriffs ermittelt. Eine Auszählung der N-Gramme kann Aufschluss darüber geben, in welchen Bedeutungszusammenhängen ein bestimmter Begriff am häufigsten gebraucht wird und ob bzw. wie sich diese Bedeutungszusammenhänge im Zeitverlauf ändern. Da Twitter-Nutzer weder ihr Alter noch ihr Geschlecht angeben müssen, ist die Analyse diesbezüglicher Gruppenunterschiede nicht oder nur eingeschränkt möglich. Eine weitere statistische Methode, mit deren Hilfe sich Texte quantitativ analysieren lassen, ist die Clusteranalyse. Auf Grundlage dieser Analysemethode lässt sich die Nähe bzw. Entfernung von bestimmten, z. B. im Text am häufigsten verwendeten Begriffen ermitteln. Dabei werden Worte, die innerhalb eines Texts eine bestimmte Nähe zueinander aufweisen, in verschiedene Cluster gruppiert. Clustermethoden, die in diesem Zusammenhang häufig verwendet werden, sind die Hierarchische Agglomerative Clusterana-

Köhler N. Soziale Medien – … Psychother Psych Med 2015; 65: 84–85 · DOI http://dx.doi.org/10.1055/s-0034-1387545

Heruntergeladen von: University of Florida. Urheberrechtlich geschützt.

84

Fragen aus der Forschungspraxis

Fazit für die Praxis Quantitative Textanalysen erfreuen sich seit einigen Jahren vor allem in der Linguistik und der Literaturwissenschaft wachsender Beliebtheit. Sie können jedoch auch für die Erforschung psychologischer Fragestellungen nutzbar gemacht werden [3]. Am Beispiel der Kommunikationsplattform „Twitter“ wurde gezeigt, mit welchen statistischen Methoden sich im Internet verfügbare „soziale“ Daten analysieren lassen.

beeinflusst den Polarity-Score des Gesamttextes. Darüber hinaus lassen sich Sentimentanalysen auch mithilfe sog. „Naive Bayes classifier“ und auf Grundlage der Item-Response-Theorie durchführen [2].

Dr. Norbert Köhler, Abteilung für Medizinische Psychologie und Medizinische Soziologie, Universitätsklinikum Leipzig, Philipp-Rosenthal-Straße 55, 04103 Leipzig, E-Mail: norbert. [email protected]

Literatur 1 R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: The R Foundation for Statistical Computing; 2014 2 Danneman N, Heimann R. Social media mining with R. Deploy cutting-edge sentiment analysis techniques to real-world social media data. Birmingham, UK: Packt Publishing; 2014 3 Bik HM, Goldstein MC. An Introduction to Social Media for Scientists. PLoS Biol 2013; 11: e1001535

Köhler N. Soziale Medien – … Psychother Psych Med 2015; 65: 84–85 · DOI http://dx.doi.org/10.1055/s-0034-1387545

Heruntergeladen von: University of Florida. Urheberrechtlich geschützt.

lyse (HAC) sowie die Clusterzentrenanalyse (k-means Clustering). Ein weiteres, bisher zumeist in der Meinungsforschung eingesetztes Verfahren ist die Sentimentanalyse. Mit dieser Methode lassen sich in Texten niedergelegte Einstellungen, Einschätzungen und Gefühle analysieren. Sentimentanalysen werden in der Regel wörterbuchbasiert („lexicon-based“) durchgeführt. Ein solches „Wörterbuch“ enthält eine Liste von „negativen“ und „positiven“ Worten, denen ein sog. Polarity-Score zugeordnet ist. Dabei wird jedem „negativen“ Wort (z. B. „schlecht“, „unangenehm“ etc.) abhängig von seiner Stärke ein negativer und jedem „positiven“ Wort (z. B. „gut“, „ausgezeichnet“ etc.) ein positiver Score zugeordnet. Bei der Analyse wird der untersuchte Text Wort für Wort mit dem Wörterbuch abgeglichen. Jedes Wort des Textes, das im Wörterbuch enthalten ist,

85

[Social media - a new area for psychological research].

[Social media - a new area for psychological research]. - PDF Download Free
85KB Sizes 0 Downloads 12 Views