Tackelberz

Tackelberz header image 1

Sahne Links

30. Juni 2010 · Keine Kommentare

Der Netzbewohner kennt das vielleicht. Nach einiger Zeit ist die Sammlung von Lesezeichen ein undurchdringbares Wirrwarr und man bedient sich nur der einigen Wenigen vom Anfang. Deshalb sollte man hin und wieder mal aufräumen. Und wie das so beim Ausmisten ist, das findet man doch immer wieder Sachen, die man nicht wegschmeissen möchte. In diesem Sinne: Einige meiner Lieblings-links aus dem letzten halben Jahr:

Eternal Moonwalk
Wenn ich an Michael Jackson denke, dass ist das wie so eine kleine Depression am Tage. Irgendwie ist alles nach 1986 komisch mit ihm verlaufen. Und das Schlimme daran ist, ich denke, er ist selbst am wenigsten schuld. Zum Link – kam nach seinem Tod raus und ist finde ich eine wunderschöne Sache.

E-Book Suchmaschine
Unglaublich was da geht! Und alles sofort verfügbar. Also, sollte man zu einem Thema was nicht finden. Dort müsste was sein.

Durch das zerstörte Haiti fahren
Im Rahmen der großen Hilfsaktionen für das durch Erdbeben zerstörte Haiti wurde diese Applikation ins Netz gestellt. Ich finde es unglaublich wie das funktionieren soll und das stellt, meiner Meinung nach, eine neue Dimension des “Fernsehens” dar.

We feel fine
Das habe ich, wie so vieles über Spreeblick erfahren. Hier kann man sich anschauen, wie Leute ihre Emotionen in der Blogosphäre ausdrücken. Man kann die Emotionen dann auch in verschieden Kategorien einteilen: Tageszeit, Geschlecht, Wetter usw.

Deutschland – England WM 2010
Aus aktuellem Anlass und sehr lustig.

→ Keine KommentareTags: Allgemein

Das war die GOR 10

30. Mai 2010 · Keine Kommentare


Dieses Foto wurde auf der GOR 10 gemacht und zeigt mich beim wilden Vortragen. Obwohl ich durch die GOR-Party noch ziemlich beeinträchtig war, hat es den Meisten wohl gefallen.
Ich möchte an dieser Stelle meinen Respekt für diese gelungene Konferenz an die Leitung der GOR 10 aussprechen. Nicht zuletzt die kompromisslose Party hat diese Konferenz zu einem wirklich freudigen Ereignis gemacht.
Für Interessierte gibt es es links nebenan (<-) die Folien vom Vortrag bei Slideshare zum runter laden.

→ Keine KommentareTags: Konferenzen

Quellen der deutschsprachigen A-List-Blogs

18. April 2010 · 3 Kommentare

Jan Schmidt hat letztens auf seinem Blog einen Aufsatz veröffentlicht, in dem er mit Hilfe des “Leitmedien”-Tools von rivva feststellen wollte, welche Online-Medien eigentlich den Stoff für Diskussionen in der deutschsprachigen Blogosphäre liefern. Als Erkenntnis stellt er dann gegen Ende fest, dass Blogs die Aufmerksamkeit für journalistische Inhalte vergrößern, weil der überwiegende Teil der diskutierten Inhalte aus “etablierten-publizistischen” Angeboten stammt.
Für mich persönlich war dieses Ergebnis interessant und auch bekräftigend, weil ich gerade diese Tage meine Präsentation für die GOR vorbereitet habe und dort eben aus anderer Perspektive auf ein ähnliches Ergebnis gekommen bin.
Der Ausgangspunkt meines Vortrags ist die Frage, ob deutschsprachige A-List-Blogs eher den Agenda-Setting Prozess der Mainstream Medien verstärken oder eher abschwächen? Es gibt in der Literatur Hinweise für beides. Einmal wird behauptet, dass A-List-Blogs sich im Grunde auf die Kommentierung von Mainstream Medien Inhalten konzentrieren – wie es “Watchblogs” logischerweise auch tun – und somit die Wirkung der Mainstream Medien Agenda verstärken. Andererseits gibt es aber auch Befunde, die dafür sprechen, dass A-List-Blogs eine alternative Agenda anbieten, indem sie sich Themen widmen, die nicht aus Mainstream Medien Quellen stammen, sondern aus “kleinen” Blogs, Videoplattformen, Tweets usw. In diesem Kontext ist oftmals von einer “Focal Points”-Funktion der A-List-Blogs zu lesen, da sie die relevanten Informationen in der Blogosphäre (oder im User Generated Content allgemein) verdichten.
Um dies zu überprüfen habe ich in meinem Datensatz für einen bestimmten Zeitraum (4 Wochen im August und September 2008) alle Posts der A-List-Blogs extrahiert. (A-List-Blogs habe ich pragmatisch definiert: Sifry benennt im State of the Blogosphere-Bericht von 2006 eine “High Autority Group der Blogs” und das sind jene, die über 500 Links haben. Ich habe dann für den genannten Zeitraum in die deutschen Bloggercharts geschaut und jene Blogs mit über 500 Links als A-List-Blogs definiert. (Auch dazu).) Diese wurden dann im Rahmen des Seminars mittels Inhaltsanalyse untersucht.
Um herauszufinden, welche Blogs Inhalte wiedergeben, die aus Mainstream Medien Quellen stammen, wurde jeder Link daraufhin untersucht, ob er auf eine Mainstream Quelle verweist oder nicht. Ebenso wurde der Verweis auf offline Mainstream Medien kodiert.
Das Ergebnis sieht so aus:

Es ist zu sehen, dass der Anteil der Posts, die Informationen aus Mainstream Medien Quellen diffundieren, weitaus geringer ist (ca. 25%) als der Anteil jener Posts, die entweder alternative Quellen (Blogs, Videoplattformen, Wikis…) oder gar keine Quellen haben.
Dies ist eigentlich überraschend, da man auf Grund dieses Ergebnisses davon ausgehen müsste, dass eher eine Abschwächung der Mainstream Medien Agenda stattfindet als eine Verstärkung.
Betrachtet man die einzelnen Blogs genauer, ist festzustellen, dass gerade der bildblog, stefan-niggemeier, netzpolitik und indiskretion ehrensache relativ viel im Verhältnis zu ihrer Gesamtanzahl an Posts über Dinge berichten, die auf Mainstream Medien Quellen basieren. Beim Bildblog ist das einleuchtend. Das nächste Schaubild verdeutlicht aber gut, dass spezielle Themen Mainstream Medien Informationen “mit sich bringen”, oder besser gesagt bei solchen Themen Mainstream Medien Quellen einfach unumgänglich sind.

Das Thema Media, das sich wohl meistens als Medienkritik darstellt, ist in dem bildblog, stefan-niggemeier und indiskretion ehrensache die Triebfeder für die Verwendung von Mainstream Medien Quellen. Bei dem Blog netzpolitik ist es das Thema Politik. Bei dem Thema Politik ist davon auszugehen, dass politische Neuigkeiten sich in den meisten Fällen als erstes in etablierten Medien finden lassen. Somit bleibt politischen Blogs gar nichts anderes übrig als sich häufig auf Mainstream Medien Quellen beziehen zu müssen.
Nun aber zurück zum Agenda Setting Konzept. Meiner Meinung nach ist es nicht möglich, Agenda Setting Prozesse zu überprüfen, ohne sich die Wirkung bei den Rezipienten anzuschauen. Ich habe, um diesen Anspruch gerecht zu werden, nach den Links im Datensatz auf die inhaltsanalysierten Posts gesucht. Vergleicht man die Anzahl an Links zu den Posts mit Mainstream Medien Quellen mit der Anzahl an Links zu denen ohne Mainstream Medien Quellen, dann fällt auf, dass tendenziell öfter auf die ersteren verlinkt wird (statistisch signifikanter T-Wert auf 5%-Niveau). Somit wären wir wieder bei dem Aufsatz von Jan Schmidt. Auch dieses Ergebnis zeigt, dass Themen aus Mainstream Medien Quellen eher in der Blogosphäre diskutiert werden als Themen aus alternativen Quellen.
Woran das liegt?
Bei der Inhaltsanalyse hatten wir ebenso Nachrichtenfaktoren kodiert, und es zeigte sich, dass die Posts mit Mainstream Medien Quellen tendenziell eine größere Anzahl aber auch eine größere Intensität von Nachrichtenfaktoren aufweisen können. Schon Galtung und Ruge (1965) haben Nachrichtenfaktoren als generelle Verarbeitungsmechanismen verstanden. Spätestens Eilders (1997) konnte beweisen, dass Nachrichtenfaktoren als Relevanzindikatoren auch bei der Rezeption funktionieren. Bestimmen Nachrichtenfaktoren also auch das Linkverhalten? Es scheint so.
Genaueres dazu bei dem Vortrag

Literatur:

Eilders, C. (1997). Nachrichtenfaktoren und Rezeption. Eine empirische Analyse zur Auswahl und Verarbeitung
politischer Information. Opladen, Westdeutscher Verlag.

Galtung, J. and M. H. Ruge (1965). “The Structure of Foreign News: The Presentation of the Congo, Cuba and Cyprus Crises in Four Norwegian Newspapers.” Journal of Peace Research 2: 64-90.

→ 3 KommentareTags: Blogosphäre

Datensätze für “Modelle und Methoden der Datenanalyse”

31. März 2010 · Keine Kommentare

Datensätze in .sav-Format…

Ubungsdatensatz
Ubungsdatensatz2
Ubungsdatensatz3
Ubungsdatensatz4

→ Keine KommentareTags: Lehre

Konferenz: General Online Research 10

3. März 2010 · 2 Kommentare

Im Frühjahr gibt es für Menschen, die sich mit dem Phänomen Blogs beschäftigen drei interessante Konferenzen, auf denen man sich mit anderen Menschen über dieses und auch andere Themen austauschen kann. Da gibt es in Berlin die re:publica, das Treffen von Leuten die finden, dass sie irgendwas Interressantes über das Web 2.0 zu sagen haben (ist auch meistens interessant). Dann gibt es die Jahrestagung der DGPuk – diese Jahr in Ilmenau. Und die General Online Research (GOR) Tagung, die dieses Jahr in Pforzheim stattfindet. Ja, richtig Pforzheim! Jene Stadt von der ich als Kind mal dachte es wäre die Hauptstadt Deutschlands (hat meine Mutter jedenfalls behauptet). Da Pforzheim von Heilbronn gerade mal eine Stunde entfernt ist und ich mal nicht stundenlang mit dem Zug fahren wollte um auf eine Interessante Konferenz zu gehen, habe ich mich eben in diesem Jahr auf die GOR konzentriert und dort ein Paper eingereicht, welches auch den Review-Prozess überstanden hat. Also geht´s dieses Frühjahr nicht nach Berlin oder sonst wohin, nein, ich bleibe im Ländle und fahre nach Pforzheim.
Weil man auf der GOR-Seite nicht ganz so einfach im Programm zu den Themen und den dazugehörigen Abstracts der Präsentierenden findet, habe ich mal meinen unten angehängt:

Am 28.05. um 15.30 Uhr:
German Language A-List-Blogs: Reinforcement of the Mainstream Media Agenda or Challenge to it?

Relevance & Research Question
In the blogosphere there is a vast majority of “small blogs” with just a few links and only some blogs with numerous links – called A-List-Blogs. Of importance is what role the A-List-Blogs play in the agenda-setting process. By many scholars the A-List-Blogs are referred as a reinforcement of the mainstream media agenda because they tend to rely primarily on established media outlets for their information. On the contrary, colleagues state that A-List-
Blogs are focal points for the blogosphere. This means that the A-List-Blogs emphasize the remarkable information in the blogosphere by linking to posts of small blogs. Hence A-List-
Blogs are challenging the dominance of mainstream media by linking to alternative news providers. This paper therefore investigates whether A-List-Blogs reinforce the mainstream
media agenda or whether they challenge it. On evaluating the role of the A-List-Blogs it is necessary to look at the audience – the small blogs. If they do not react to the posts of the A-List-Blogs, the diffusion of issues, regardless of belonging to the mainstream media or alternative agenda – is meaningless. So we ask:
Do small blogs respond more often to mainstream media or alternative issues?

Methods & Data
To answer the first question, a content analysis of eleven German language A-List-Blogs was carried out during a period of four weeks, in August and September 2008. To prove the second question a hyperlink analysis was used, to measure the reactions of the small blogs. The empirical investigations were based on data of blog posts, which were made available by the ICWSM09 in California.

Results
German language A-List-Blogs adopt fewer issues from the mainstream media compared to those of alternative news providers; however, the reaction of the small blogs is significantly larger on the mainstream issues.

Added Value
The results show that it is important to look for the reactions of the audience to decide which role the A-List-Blogs play. The hyperlink analysis shows that they function as an enforcement
of the mainstream media agenda. This suggests that the audience is more interested in commenting on mainstream media issues than discussing alternative subjects.

→ 2 KommentareTags: Konferenzen

Quiz 2

26. Januar 2010 · Keine Kommentare

Hier ihre Ergebnisse des 2. Quiz.

Falls Sie Ihre Matrikelnummer auf der Liste nicht finden, dann denken Sie bitte zuerst an die “Suche”-Funktion Ihres PDF-Readers. Falls Sie dann immernoch nicht fündig geworden sind, probieren Sie alle mögliche Zahlendreher aus. Falls es dann auch noch nicht geklappt hat, schreiben Sie mir eine Mail oder posten hier was oder sprechen mich persönlich an.

→ Keine KommentareTags: Lehre

Kookurrenznetze

15. Januar 2010 · Keine Kommentare

Beim letzten Termin des BWL Seminars wurden beim Thema Blog Monitoring semantische Netze als Möglichkeit zur Analyse der Gesprächsinhalte zu einem bestimmten Thema erwähnt. Ich habe zur weiteren Explikation, wie eine solches Netz aussehen kann, mal folgendes Beispiel mit dem PASW Modeler Text Mining erstellt:


Hier habe ich einfach einen Tag aus dem Datensatz herausgegriffen, nämlich den 02. August 2008, und habe alle deutschsprachigen Posts in das Programm geladen (ca. 10000 an diesem Tag). Dann habe ich mir zu dem Begriff “deutsche Blogs” ein Kookurrenznetz herausgeben lassen. Eine Kookurrenzanalyse sucht nach gemeinsam auftretenden Schlüsselbegriffen in einer Dokumentenmenge. Es wird dann gezählt in wie vielen Dokumenten die Begriffe gemeinsam auftreten. Und genau das ist nun oben zu sehen.
Wenn man nun also erfahren möchte wie und was in der Blogosphäre über bestimmte Themen gesprochen wird bekommt man über solch ein Netz einen ersten Anhaltspunkt.

→ Keine KommentareTags: Seminar · Text Mining

Statistik Übungsklausur

13. Januar 2010 · 4 Kommentare

Hier finden Sie die Übungsklausur.

Die Lösungen habe Sie in rot gleich dabei. Ich kann Ihnen aber nicht versprechen, dass alles 100%ig richtig ist. Falls Sie Fragen dazu haben, oder Fehler gefunden haben, dann posten Sie das bitte auf diesem Blog. (Die Kommentarfunktion erscheint wenn Sie die Überschrift anklicken.)

Ebenso kann es sein, dass sich auch Aufgaben aus dem 10.Kapitel in der Übungsklausur finden, die Sie ja nicht lösen können, weil wir es nur bis zum 9. Kapitel schaffen werden.

Ich wünsche viel Erfolg und üben Sie!!! Dann sollte das auch mit der Klausur klappen.

→ 4 KommentareTags: Lehre

Grundlagen des Text Mining… und Stärken und Schwächen des PASW Modelers Text Mining

28. Dezember 2009 · Keine Kommentare

Beim Text Mining (TM) werden aus Textdokumenten Schlüsselbegriffe extrahiert, die eine Aussagekraft bezüglich der Semantik des Textes aufweisen. Für die Extraktion von Schlüsselbegriffen aus Texten werden typischerweise die folgenden Verfahren angewendet (vgl. Heyer et al 2006, 273):

• Linguistische Vorverarbeitung
• statistische und musterbasierte Text-Mining-Verfahren.

Linguistische Vorverarbeitung
Im PASW Modeler Text Mining (im folgenden nur noch Text Miner) sind linguistischen Ressourcen im Lieferumfang als Vorlagen und Bibliotheken und zusammengestellte Ressourcen enthalten. Bibliotheken bestehen aus Wortlisten und weiteren Informationen, die eingesetzt werden, um die Extraktion abzustimmen oder zu spezifizieren. Diese Ressourcen umfassen ein allgemeines Wörterbuch, in dem eine Liste von Grundformen mit einem Code für die Wortart (Part of Speech) enthalten ist (Nomen, Verb, Adjektiv, Partizip, Koordinator, Determinator oder Präposition) (vgl. SPSS 2006, 7). In der linguistischen Vorverarbeitung werden Wortformen durch eine Grundformreduktion in ihre Grundformen überführt, da im Text die Wortformen meist in gebeugter Form auftreten. Ebenso müssen Synonyme angeglichen werden (vgl. Heyer et al 2006, 274).
Der Text Miner beinhaltet umfassende Substitutionswörterbücher (Synonyme und optionale Elemente) sowie Ausschlusswörterbücher, außerdem können Schreibfehler bis zu einem gewissen Grad korrigiert werden (vgl. SPSS 2006, 7). Leider können die zusammengestellten Ressourcen im SPSS Text Miner nicht angezeigt oder bearbeitet werden. Das macht das Programm stückweise zu einer Art „Black Box“.

Statistische Text-Mining-Verfahren
Die Differenzanalyse
Vergleicht man die relativen Häufigkeiten sämtlicher Wortformen eines Textes den man analysieren möchte mit denen in einem großen allgemeinsprachlichen Vergleichskorpus, so werden diejenigen Wortformen, deren relative Häufigkeit im Analysetext signifikant größer ist als im Referenzkorpus, mit hoher Wahrscheinlichkeit Schlüsselbegriffe sein. Dasselbe gilt für Wortformen, die im Analysetext auftreten, nicht aber im Vergleichskorpus (vgl. Heyer et al 2006, 95f). Der Text Miner kann leider keine komplette Differenzanalyse durchführen. Was er leistet ist, dass er einzelne Wörter (Uniterms), die nicht in den zusammengestellten Ressourcen enthalten sind, als Kandidaten für die Extrahierung betrachtet (vgl. SPSS 2006, 7). Die zusammengestellten Ressourcen dienen hier somit als Referenzkorpus.

Musterbasierte Text-Mining-Verfahren
Schlüsselbegriffe eines Textes sind oftmals Fachausdrücke. Die Kenntnis der Fachterminologie eines Faches oder einer Anwendung ist oft der Schlüssel für ein Verständnis des Faches oder der Anwendung selber. Die computergestützte Erkennung der Fachausdrücke eines Faches ist daher eine wichtige Anwendung des Text Mining (vgl. Heyer et al 2006, 272f). Der Begriff „Fachausdrücke“ ist hier ein sehr viel weiterer Begriff, als man annehmen könnte. So werden relevante Einzelwörter wie beispielsweise „Wahl“ oder „Frieden“ sowie Wortzusammensetzungen wie beispielsweise „Präsidentschaftswahl“, „Wahl des Präsidenten“ oder „Friedensverträge“ als Fachausdrücke bezeichnet (vgl. SPSS 2006, 29). Die Fachausdrücke bestimmter Fachgebiete haben meist eine morphologisch und syntaktisch charakteristische Form, welche sich für ihre Identifikation nutzen lässt:
Einerseits sind fast alle Fachausdrücke Nominalphrasen (d.h. sie bestehen entweder aus einem einzelnen Substantiv oder einem Substantiv mit Modifikatoren). Um solche Strukturen zu finden, kann man eine syntaktische Analyse des betroffenen Textes vornehmen und bestimmte Nominalphrasen isolieren. Einfacher noch ist die Suche nach so genannten POS-Mustern (Part-of-Speech-Mustern), d.h. nach Abfolge von Wortformen mit bestimmter Wortart. Mit Abkürzungen NN für Nomen und ADJA für Adjektive erhält man die folgenden nützlichen Muster:
NN
ADJA NN
NN NN…
Dies ist zwar ein theoretisch zu einfacher Ansatz, da z.B. zwei benachbarte Nomina keine Nominal-phrasen bilden müssen (z.B. „Er unterrichtet in Heilbronn Statistik“), liefert aber in der Praxis sehr gute Ergebnisse und lässt sich unter Berücksichtigung der Kookkurrenzbeziehung zwischen zwei Wortformen (linker bzw. rechter Nachbar) effizient implementieren (vgl. Heyer et al 2006, 275).
Der Text Miner ermittelt für die Extraktion Kandidaten, die aus zusammengesetzten Wörtern bestehen (Multiterms), auf der Grundlage von hartkodierten oder dynamischen POS-Mustern. Es sind rund 30 Muster vorhanden und die maximale Mustergröße liegt bei sechs Komponenten (vgl. SPSS 2006, 7). Ähnliche Fachausdrücke werden dann von dem Text Miner unter einem übergeordneten Fachausdruck zusammengefasst, der als Konzept bezeichnet wird (vgl. SPSS 2006, 29).

Beispiel:
Folgend soll ein Beispieltext gezeigt werden und danach die vom Text Miner extrahierten Schlüsselbegriffe (Konzepte). Bei dem Text handelt es sich um einen Blogpost des Blogs „Spreeblick“ veröffentlicht am 1. September 2008 um 22.22 Uhr.

Text:
Man kann sich in Deutschland völlig unbedrängt ein Bild des Konfliktes zwischen Georgien und Russland bilden. Wenn man kenntnisfrei wie ich versucht, etwas zu erfahren, ist der erste Eindruck, dass gerade im Internet die Konfliktlinien fein säuberlich nachgezeichnet und nachgelebt werden. Eher links orientierte Blogger sehen Russland als Opfer einer amerikanischen Intrige, auf konservativer Seite sieht man sich darin bestätigt, dass Russland nur die alte Sowjetunion mit neuem Lack ist. Ich bin bei solchen internationalen Konflikten immer erstaunt, wie viele Experten es gibt in der deutschen (und noch mehr natürlich in der amerikanischen) Blogosphäre. Da haben plötzlich alle Politikwissenschaften studiert, mehrere Jahre sowohl in Moskau als auch in Tiflis gelebt, mit tschetschenischen Hirten Mau-Mau gespielt und aus einem Topf mit flüssiger Weisheit mit großen Löffeln gefuttert. Wie betulich dagegen die alten Medien. Dort darf jeder seine Meinung sagen, demokratische Führer beider Länder duellieren sich aber Bande, amerikanische Griesgrame wetteifern mit russischen Griesgramen um die versteinerste Miene. Und dann heißt es auf einmal: Halt, alles Lüge! Die ARD zensiert (die ARD hatte ein Interview von Thomas Roth mit Putin gerade um die Passagen gekürzt, in denen Putin die russische Position erläutert und den Westen attackiert). Wenn ich jetzt sage, warum ich nicht glaube, dass die ARD zensiert, werden viele lachen: Ich glaube nicht, dass die ARD zensiert, weil es nicht erlaubt ist. Klar, Schleichwerbung ist ja auch nicht erlaubt, aber ich glaube, dass die Begriffe Schleichwerbung und Zensur unterschiedliche Hebel in öffentlich-rechtlichen Journalistenhirnen in Bewegung setzen. Schleichwerbung, so erkläre ich mir das, wird als eine Art Notwehr gegen die Privaten angesehen. Aber Zensur: Das ist dann doch ein anderer Sport. Wer könnte es schöner sagen als Felix Schwenzel, wie stark muss man unter Verfolgungswahn leiden, einen Chaotenhaufen wie die Tagesschau-Redaktion einer durchorchestrierten Informationsverschleierung zu verdächtigen? Wenn man das, was die ARD mit der Kürzung des Putin-Interviews gemacht hat, Zensur nennt, woher nimmt man dann noch Worte für die Ermordung des kremlkritischen Bloggers aus Inguschetien durch russische Polizisten? Der Interviewer Thomas Roth äußert sich im Tagesschau-Blog folgendermaßen: Ich habe zugelassen, dass das Interview durch mehrere russische Sender begleitet wird und nach einer vereinbarten Sperrfrist (20:00 Uhr Ortszeit) nach eigener Entscheidung veröffentlicht werden kann. Die russischen Sender haben das in sehr unterschiedlichen Längen getan (von 5 bis zu rund 40 Minuten). Einige haben nur das aus ihrer Sicht wichtigste veröffentlicht. Verpflichtet waren sie nur zur Quellenangabe: Ein Interview der ARD, Erstes Deutsches Fernsehen. Nur zum Verständnis: Hätte die ARD Interesse daran gehabt, irgendetwas nicht zu veröffentlichen, hätten wir uns gar nicht erst auf solche Bedingungen eingelassen. Also nichts durcheinander bringen! Das ist glaubhaft. Als Blogger muss man sehr genau abwägen, geradezu taktieren, ob man die stärksten Worte wählt in so einem Zusammenhang. Hätte der Spiegelfechter geschrieben: Die ARD hat unsauber gearbeitet und sich in Manipulationsverdacht gebracht, so wäre das korrekter gewesen, aber unter Umständen hätte dann niemand hingehört und Roth hätte sich nicht gerechtfertigt. Auf der anderen Seite stehen die oben angeführten Bedenken. So oder so gebührt Jens Berger Respekt für die aufklärerische Arbeit. Wo man sich aber von Taktik fernhalten sollte, ist in der Frage, für wen man Partei ergreift. Das ist nicht viel anders als bei einer Prügelei, deren Zeuge man wird – man wägt nicht kurz ab, für wen man ist, und prügelt dann mit. Man schlichtet. Und an diesem Schlichtungsprozess kann man sich dann auch als unwissender Blogger beteiligen.

Hier die vom Text Miner extrahierten Schlüsselbegriffe, nach ihrer globalen Häufigkeit geordnet:

ard ; glaube ; zensur ; russland ; worte ; putin : russische sender ; interview ; schleichwerbung ; hebel; prügelei; bedingungen; tagesschau-blog; tschetschenischen hirten; russischen griesgramen; wetteifern; spiegelfechter; demokratische führer; weisheit; unwissender blogger; lack; verfolgungswahn; journalistenhirnen; art notwehr; amerikanischen intrige; deutsches fernsehen; orientierte blogger; ortszeit; meinung; medien; zusammenhang; georgien; moskau; sowjetunion; kürzung des putin-interviews; quellenangabe; politikwissenschaften; felix schwenzel; unbedrängt; eindruck; aufklärerische arbeit; russische polizisten; frage; taktik; fernhalten; sicht; blogosphäre; experten; kenntnisfrei; chaotenhaufen; ermordung des kremlkritischen bloggers; mau-mau; partei; deutschland; begriffe; schleichwerbung; länder; manipulationsverdacht; lüge; russische position; verständnis; interviewer thomas roth; internationalen konflikten; zeuge; inguschetien; jens berger respekt; bild des konfliktes; opfer; konfliktlinien; topf; bande; vereinbarten sperrfrist; verdächtigen; bewegung; interesse; internet; tiflis; durchorchestrierten; blogger; interview von thomas roth; entscheidung; tagesschau-redaktion; schlichtungsprozess, versteinerste miene

Es zeigt sich, dass einige Begriffe in dieser Sammlung weniger relevant erscheinen. Es ist aber wichtig zu verstehen, dass die Extraktion der Schlüsselbegriffe einen iterativen Prozess darstellt (vgl. Heyer et al 2006, 274). Nach der ersten Extraktion müssen die Ergebnisse überprüft werden und die Einstellungen in den lokalen Bibliotheken – diese können vom Nutzer verändert werden – überarbeitet werden. Hier gibt es verschiedene Möglichkeiten der Verfeinerung: nicht erkannte Synonyme, bedeutungslose Konzepte, falsch erkannte Übereinstimmungen, nicht extrahierte Konzepte usw. (vgl. SPSS 2006, 158f).

Literatur:

- Heyer G, Quasthoff U, Wittig T. 2006. Text Mining: Wissensrohstoff Text. Konzepte, Algorithmen, Ergebnisse. Herdecke, Bochum: W3L-Verlag
- SPSS. 2006. Text Mining für Clementine 12.0 – Benutzerhandbuch

→ Keine KommentareTags: Text Mining

Kalender…Dezember

24. Dezember 2009 · Keine Kommentare

Frohe Weihnachten…
…das ist anscheinend ein Weihnachtslied!

→ Keine KommentareTags: Allgemein

Schweigespirale oder Agenda Setting

22. Dezember 2009 · 3 Kommentare

In der Blogosphäre werden “normale” Blogger (oder Bloggerinnen – ich schreibe aus Gründen der Vereinfachung immer in der männlichen Form) in ihrer Themenwahl durch die A-Blogs beeinflusst. Dieser Befund wurde schon von einigen Autoren (vgl.: Schmidt (2006), Hass (2005), Delwich (2005)) so festgehalten. Zwar wurden in den genannten Arbeiten meistens nur Einzelfälle dargestellt, welche belegen sollten, dass ein solcher Einfluss besteht, doch scheint hier wirklich etwas dran zu sein. (Die empirische Überprüfung dieses Phänomens soll an dieser Stelle nicht geschehen – doch daran wird gearbeitet).
Es erscheint ja auch nur logisch – schon seit längerem ist bekannt (vgl.: Schmidt 2006), dass eben diesen A-Blogs in der Blogosphäre eine große Aufmerksamkeit zukommt. Das bedeutet einfach, dass eine Menge Leute, die sich mit Blogs beschäftigen, bei den A-Blogs vorbeischauen und somit natürlich auch Anregungen für ihre eigenen Geschichten holen.
Außer mich damit zu beschäftigen, dieses Phänomen empirisch nachzuweisen, überlege ich mir ebenso, welches theoretische Modell diesen Einfluss erklären oder beschreiben kann. Heute wollte ich mal eine Idee unterbreiten, die ich so noch nirgendwo gelesen habe. Ich bin durch meine Beschäftigung mit Medienwirkungstheorien darauf gestoßen.
Es ist die Theorie der Schweigespirale von Frau Noelle-Neumann, die sich meiner Meinung nach mit ein wenig Uminterpretation zur Erklärung dieses Phänomens anwenden lässt. Nochmals zur Erinnerung sollen hier die zentralen Annahmen der Theorie der Schweigespirale dargestellt werden (nach Schenk (1995):

1. Die Gesellschaft belegt (von der Norm) abweichende Individuen mit Isolation.

2. Individuen haben kontinuierliche Furcht vor Isolation.

3. Diese Isolationsfurcht veranlasst Individuen, das Meinungsklima zu allen Zeiten abzuschätzen (=quasi-statistische Wahrnehmung).

4. Ergebnisse dieses Schätzvorgangs beeinflussen individuelles Verhalten in der Öffentlichkeit, insbesondere die öffentliche Kommunikationsbereitschaft bzw. Redebereitschaft und das Eintreten für die eigenen Ansichten.

5. Die fünfte Annahme verbindet die anderen vier. Zusammengefasst sind sie verantwortlich für die Formierung, Festigung und Veränderung der öffentlichen Meinung.

Frau Noelle-Neumann hat diese Thesen zum größten Teil auf das Fernsehen bezogen und hat somit dem Fernsehen eine tragende Rolle in der Bildung der öffentlichen Meinung zugeschrieben. Die Schweigespirale zeigt sich dadurch, dass jene Ansichten und Meinungen, die vom Fernsehen übertragen werden, sich als “öffentliche Meinung” manifestieren, indem sich kein Mensch mehr traut eine andere Meinung kund zu tun. Und das eben aus den oben genannten Gründen. Da das Fernsehen eine große Aufmerksamkeit in der Gesellschaft hat, wird dem Fernsehen diese Fähigkeit bescheinigt.

Und wer vorher aufgepasst hat, kann hier schon die ersten Anknüpfungspunkte für die Übertragung der Theorie auf die Blogosphäre erkennen. Denn dort kommt den A-Blogs eine vergleichbare Aufmerksamkeit zu. Sie haben sozusagen eine tragende Rolle in der Bildung der öffentlichen Meinung in der Blogosphäre.
Doch muss man weiter differenzieren, um die Theorie der Schweigespirale auf die Blogosphäre zu übertragen. Hier ist es zwar auch so, dass ein Blogger Angst vor Isolation hat – wenn jemand bloggt, dann ist dieses Individuum, meiner Meinung nach, primär an Kommunikation und Beachtung interessiert. Deshalb fürchtet ein Blogger mit seinen Posts alleingelassen zu werden. Er möchte Kommentare, Trackbacks, Links usw. Aber es ist auch ersichtlich, dass die A-Blogs nicht zur Bildung der öffentlichen Meinung beitragen, sondern das Agenda Building der Themenagenda in der Blogosphäre stark beeinflussen. Es ist eben so, dass die Themen der A-Blogger in der Blogosphäre sehr sichtbar sind. Möchte nun ein nicht so bekannter Blogger Aufmerksamkeit auf sich ziehen, dann muss er bei den sichtbaren Themen mitdiskutieren. Er muss sich sozusagen an der Anschlusskommunikation beteiligen. Somit ist natürlich nicht gesagt, dass er der Meinung des A-Bloggers folgen muss – nein, gerade im Gegenteil, eine provokante, kritische Äußerung wird vielleicht sogar größere Resonanz nach sich ziehen -, aber er muss sich der Themen-Agenda der A-Blogger beugen. Wobei wir jetzt bei einer anderen Medienwirkungstheorie gelandet wären – nämlich dem Agenda-Setting-Konzept.

Und aus dieser Sichtweise lässt sich das Phänomen nochmals anders darstellen. Hier muss das Augenmerk auf jenen Zweig der Agenda-Setting-Forschung gelegt werden, welcher sich mit Agenda Setting und Anschlusskommunikation beschäftigt.
Beispielsweise untersuchten Kepplinger und Martin (1986) mit Hilfe des Verfahrens der verdeckten, teilnehmenden Beobachtung, welche Bedeutung der Hinweis auf Themen, die in den Massenmedien behandelt wurden, für die Alltagskommunikation hat. Sie beobachteten Gespräche auf öffentlichen Plätzen, in der Universität, in Gaststätten und auch im privaten Bereich. Sie fanden heraus, dass Medienthemen integrierend wirken. Dies scheint auch logisch, da die Wahrscheinlichkeit, dass ein Medienthema Anschlussmöglichkeiten für viele Teilnehmer eröffnet, groß ist. Kepplinger und Martin (1986) fanden heraus, dass je geringer die Gesprächsintensität war, desto stärker war zu beobachten, dass Themen der Massenmedien herangezogen wurden, um die Diskussion zu beleben. Weiter folgern sie: Die Funktion mag auch darin begründet sein, dass in der Öffentlichkeit seltener über persönliche und unmittelbar relevante Aspekte gesprochen wird und der Vorteil der Massenmedien aus der allgemeinen Bedeutung des Themas resultiert.
Bezüglich des Phänomens der A-Blogger müsste man den A-Blogs für die Blogosphäre eine Agenda-Setting-Funktion zusprechen. Die Anschlusskommunikation der normalen Blogger wäre damit zu begründen, dass die Themen der A-Blogger durch ihre große Sichtbarkeit in der Blogosphäre eine allgemeine Bedeutung erfahren. Und Blogger, die sich an die größere – also nicht persönliche – Öffentlichkeit wenden, eben jene Themen aufgreifen, die integrierend wirken, zu denen eben jeder was zu sagen hat.

Nun ja, resümierend betrachtet erzielen beide Modelle einen ähnlichen Effekt. Doch welches Modell entspricht eher der Realität? Oder sollte man einzelne Teile aus beiden Modellen herausnehmen und kombinieren?

Literatur:

Haas, T. 2005. From “Public Journalism” to the “Public´s Journalism”? Rhetoric an reality in the discourse on weblogs. Journalism Studies 6:387-96

Schmidt, J. 2006. Weblogs. Eine kommunikationssoziologische Studie. Konstanz: UVK Verlagsgesellschaft mbH

Delwiche, A. 2005. Agenda-setting, opinion leadership, and the world of Web logs. In First Monday
Retrieved 15.04.2009, from http://firstmonday.org/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/1300/1220.

Schenk, M. 1995. Soziale Netzwerke und Massenmedien. Tübingen: J.C.B. Mohr (Paul Siebeck)

Kepplinger, H. M. / Martin, V. (1986): Die Funktion der Massenmedien in der Alltagskommunikation. Publizistik 31:118-28

→ 3 KommentareTags: Blogosphäre

Bestes Beispiel…

15. Dezember 2009 · Keine Kommentare

für Focal Points

Für die Codierer:
Bild 2

Und die Adresse: http://www.basicthinking.de/blog/2008/09/24/lieber-blog-opa/

→ Keine KommentareTags: Seminar

Super Beispiel…

15. Dezember 2009 · Keine Kommentare

für Desintermediation.
Für die Codierer:
Weil wir ja beim letzten Treffen gemerkt haben, dass viele von Ihnen Probleme bei der Erkennung haben – mir ist gerade ein schönes Beispiel untergekommen.
Bild 1

Und hier der Link: http://www.googlewatchblog.de/2008/09/23/street-view-heute-mit-party-icon/

→ Keine KommentareTags: Seminar

Quiz 1

2. Dezember 2009 · Keine Kommentare

War ja ganz ordentlich: Ergebnisse Quiz 1

Falls Sie Ihre Matrikelnummer auf der Liste nicht finden, dann denken Sie bitte zuerst an die “Suche”-Funktion Ihres PDF-Readers. Falls Sie dann immernoch nicht fündig geworden sind, probieren Sie alle mögliche Zahlendreher aus. Falls es dann auch noch nicht geklappt hat, schreiben Sie mir eine Mail oder posten hier was oder sprechen mich persönlich an.

→ Keine KommentareTags: Lehre

“grep” Ergebnisse direkt in Datensatz-Format

24. November 2009 · Keine Kommentare

Ich habe ein Problem. Ich schaffe es einfach nicht in R meine Ergebnisse, die ich durch einen “grep” Befehl bekomme, gleich in einen Datensatz transferieren zu können.

Hier ist der Befehl:

for (f in li_main){
hits_main_sep12[[f]]<- grep(f, sep12_desc)
}

li_main” ist eine Ansammlung an URLs, die ich in Blogposts suche (“sep12_desc”).
Das Ergebnis sieht dann so aus:

$`http://www.heise.de/security/news/meldung/115983/from/atom10`
integer(0)

$`http://www.heise.de/security/news/meldung/115990/from/atom10`
integer(0)

$`http://www.heise.de/tr/Ohne-Innovation-geht-nichts–/artikel/115923`
[1] 522

$`http://www.heise.de/tr/Nie-unbeobachtet–/artikel/115929`
integer(0)

$`http://www.heise.de/security/news/meldung/115944/from/atom10`
integer(0)

$`http://www.taz.de/1/zukunft/konsum/artikel/1/aus-lokalpatriotismus-wird-markentreue/`
integer(0)

$`http://www.taz.de/1/sport/artikel/1/wie-phoenix-aus-der-asche/`
integer(0)

$`http://www.taz.de/1/leben/alltag/artikel/1/britische-kneipenkrise/`
[1] 1615

$`http://www.taz.de/1/politik/europa/artikel/1/auf-offener-strasse-erschlagen/`
integer(0)

$`http://www.taz.de/1/zukunft/umwelt/artikel/1/verkehrsminister-tiefensee-mauert/`
integer(0)

Wie man sieht, finde ich dann einige URLs in den Posts andere aber auch nicht. Ich muss bisher immer noch “händisch” rausschauen, wo es einen Treffer gab, und dann selbst den Treffer in eine Tabelle eintragen. Das ist sehr mühsam und deshalb suche ich nach einer Möglichkeit bzw. Funktion in R, die mir diese Arbeit vielleicht abnehmen könnte.

Was ich brauchen würde, wäre einfach ein Datensatz, der in etwa so aussieht:

tabelle

Es ist egal, ob bei “Treffer” dann die Anzahl der Treffer steht, oder die Nummern der Posts. Ich habe natürlich schon die Mailinglisten in R durchgeschaut, aber nichts gefunden, was mir weiterhelfen könnte. An “R help” habe ich noch nicht geschrieben, weil ich es einmal gewagt habe und dann fürchterlich auf die Fresse bekommen habe: “You should first read this and than you should reread this usw.”. Ich weiß ja, dass die Leute, die da mitmachen wenig Zeit haben und auch kein Geld dafür bekommen, aber manchmal denke ich, dass da einige nur zum Dissen von Anfängern mitmachen. Es steht natürlich auch in den Bedingungen für die R-Hilfe, dass man seine Hausaufgaben gemacht haben sollte,… aber das ist ein anderes Thema. Wie gesagt, bin ich da jetzt erstmal vorsichtig geworden und probiere es jetzt mal über diesen Weg.

Also, falls mir jemand weiterhelfen kann, auch wenn es nur eine Richtung ist, bitte unten posten oder auch gerne per e-mail.

→ Keine KommentareTags: R