Die Frage, ob es “der” oder “das” Blog ist, wird hart umkämpft. Befürworter des “das Blog” verweisen auf netzhistorische Hintergründe, und die Duden Definition, welche “das” als Grundlage angibt, “der” als “auch:” zusätzlich erlaubt:

Beführworter des “der” meinen, dass “das Blog” sich “blöde anhört” und beschimpfen die Vertreter des Neutrum gerne als Ewiggestrige, welche sich nicht an die neuen Zeiten anpassen können.

Also habe ich mal den Test gemacht. Dank Firehose Access habe ich für drei Monate nach “der” oder “das” Blog und die relevanten Alternativen gesucht. Dort ergibt sich, aus der rohen Datenflut, das folgende Bild:

“Das Blog” ist also grob gesagt der geläufigere Ansatz. Rohe Daten sagen aber über die Ausrichtung einer Verwendung nicht viel aus. Also mal schnell R raus gekramt. Hier half mir “Text Mining with R” extrem weiter.

Analysis of 2697 records of sign1:"der Blog" n=834 and sign2:"das Blog" n=1863
Reading....
sign1: intval 84 "der Blog" p=0.03534 H0=100
sign2: intval 145 "das Blog" p=0.0404 H0=100

In dieser Analyse wurde die sentiment Signifikanz über die “Influencer Value” (vI) als unidirektional angenommen. Mit statistischer Signifikanz sind Benutzer des “das Blog” einflussreicher und (leider kann ich das nicht abstellen, ich muss das mal auseinanderdröseln) länger auf Twitter aktiv.

Weitere Erfahrungswerte:

Benutzer des “das Blog” sind (p=0.029) gebildeter, haben (p=0.05) bessere Grammatik, und (p=0.032) techisch versiierter. Die Hashtag-Analyse der beiden Datenkörper ergibt:

“Das Blog”:

  • #informatik
  • #wissen
  • #aufschrei
  • #medizin
  • #got

“Der Blog”:

  • #geld
  • #natürlich
  • #wissen
  • #sozial
  • #got
  • #dsds

Als (n>signN/100) relevante Hashtags.

Auf in’s Intenetz

Nachdem das mit Twitter so schön geklappt hat, habe ich Korpus-Sets der bekanntesten Foren und Webseiten erstellt. Durch die R Analyse ergibt sich der folgende Spread:

technology (high) : n=329, n=203, n=112, n=94
serious (high) : n=293, n=102, n=11, n=92

Diskrepanzen in den Totals sind durch Elimination entstanden, bei u.A. dem “Heise Newsticker” konnte keine signifikante Ausrichtung für “serious”, also ernste/themenbezogene Berichterstattung festgestellt werden. Ihn nachträglich als solches zu markieren hätte die Analyse nicht signifikant verändert.

Hier nimmt die Verwendung von “der Blog” also zu, je niedriger die Technologische Sentiment Presence ist. In Technologie habe ich in dieser Analyse den MINT (Mathe, Informatik, Naturwissenwschaften, Technologie) Score angewandt.

Bei “Seriousness”, also wie ernsthaft ein Thema behandelt wird, ist das Ganze schon etwas ausgeglichener. Hier liegt der “Publikationen und Interaktionen” Korpus als Score an, in dem unter anderem der Umgang in Kommentaren auch mit einbezogen wird. In nur 73 Prozent aller Fälle konnte jedoch via Scraping oder RSS auch Kommentartext ausgelesen und klassifiziert werden.

Kurze Zusammenfassung:

“Der Blog” ist neuer, und wird grösstenteils von Usern und Seiten mit geringerer MINT-Ausrichtung verwandt. “Das Blog” ist die gewählte Form für “Oldtimer” und technische/naturwissenschaftliche Publikationen. Über die Big 100, die 100 größten Websiten (nach Traffic) stellt sich das Bild als (n=93, einige waren da etwas wischi-waschi) 84:9 für “das Blog” dar.

 

 

Share This