Analyse der deutschen Blogcharts (I)

In den vergangenen Tagen hat mein studentischer Mitarbeiter Martin Wilbers in mühevoller Kleinarbeit die archivierten Datensätze der Deutschen Blogcharts von 2006 zu einem Datensatz zusammengetragen, den wir in der nächsten Zeit näher auswerten wollen. Die Blogcharts werden von Jens Schröder erstellt, der – teilweise ebenfalls in Handarbeit – die Datenbank von Technorati als Grundlage heranzieht, um die 100 meist verlinkten Blogs der deutschsprachigen Blogosphäre zu ermitteln. Seine Seite ist ein sehr guter Anlaufpunkt, um sich über die populärsten Angebote zu informieren – tolle Arbeit, und klasse, dass er die Daten auch archiviert zur Verfügung stellt!

Nach einer Bereinigung von Doubletten [1] sind insgesamt 188 Blogs im Datensatz enthalten, oder anders ausgedrückt: 188 Blogs haben es 2006 für mindestens eine Woche in die Top 100 geschafft. Etwa ein Viertel, nämlich 45 Blogs (23,9%) waren alle 52 Wochen vertreten, die übrigen Quartilsgrenzen liegen bei 11 Wochen (25 % Prozent aller Blogs waren nur solange vertreten) und 22 Wochen (50 % waren …). Leider liegen uns keine Vergleichszahlen (bspw. für die globalen Top100 von Technorati) vor, um diese Werte besser einschätzen zu können, aber aus dem Bauch heraus würde ich sagen, dass diese Daten für eine gewisse Offenheit der deutschsprachigen Top 100 sprechen – es war im Jahr 2006 noch relativ leicht möglich, in die Blogcharts vorzustoßen.

In einem nächsten Schritt haben wir uns heute die Entwicklung verschiedener Kennziffern im Verlauf des Jahres 2006 angesehen: Die maximal verzeichnete Anzahl an Verlinkungen, also den Linkwert der #1 – das war übrigens immer das Bildblog -; den Wert, der in der jeweiligen Woche für Platz 100 reichte (Minimum); den Mittelwert über alle Verlinkungen sowie den Median (der Wert, der die oberen 50 von den unteren 50 Plätzen trennt). Die folgenden beiden Abbildungen (klick für größere Versionen) zeigen den Verlauf dieser Werte über die 52 Wochen; in der zweiten Grafik ist das Maximum nicht enthalten, um die Skalierung etwas übersichtlicher zu machen. Zusammenfassend:

  • Im Verlauf des Jahres sind alle Werte angestiegen, d.h. es waren mehr Verlinkungen nötig, um in die Top 100 zu kommen (Minimum Woche 1:  108; Minimum Woche 52: 171; + 58%) bzw. in die obere Hälfte einzusteigen (Median Woche 1: 168; Median Woche 52: 260; +54%).
  • Der Maximalwert (also das Bildblog) hat im Verlauf des Jahres stark geschwankt und lag in Woche 52 sogar unter dem Wert von Woche 1 (2196 gegenüber 2329; -6%). In der ersten Grafik wird eine gewisse Wellenbewegung deutlich – ein Absinken bis etwa Woche 20, dann ein Ansteigen bis Woche 42, dann wieder ein Absinken. [2] Dennoch ist über das ganze Jahr gesehen eine Aufwärtsbewegung auch beim Bildblog zu erkennen – grafisch wird das durch die ansteigende Regressionsgerade deutlich, die mit in die obere Abbildung aufgenommen wurde.

Wir haben aber nicht nur die Linkzahlen und die jeweiligen Ränge pro Woche im Datensatz verzeichnet, sondern für jedes Blog auch Angaben über das Geschlecht des/der Blogger sowie die Information, ob es sich um ein Gruppenblog handelt. Zudem werden wir in den nächsten Tagen u.a noch Informationen über die behandelten Themen mit aufnehmen. Durch einen Vergleich mit den Ergebnissen der WIB-Studie können wir überprüfen, inwieweit die Top 100 von der übrigen Blogosphäre abweichen – das dürfte recht interessant werden..

DBC 1

Entwicklung der Linkzahlen mit Maximum

 

DBC 1

Entwicklung der Linkzahlen ohne Maximum

[1] Bei einigen Blogs hat sich die angeführte URL im Verlauf des Jahres 2006 geringfügig verändert, bspw. von “www.nudelblog.de/” zu “www.nudelblog.de”. Die entsprechenden Fälle haben wir zusammengeführt. Zwei Sonderfälle hatten wir durch “Umzüge”:  dasnuf.blogspot.com wechselte auf www.dasnuf.de; hier liegen für einige Wochen jeweils zwei Daten vor, d.h. beide Blogs waren zeitweise in den Blogcharts vertreten. Ausserdem wurde bettgefluester.twoday.net zu waschsalon.twoday.net – hier gibt es keine Überschneidung, aber wir haben beide blogs zunächst mal im Datensatz gelassen.

[2] Hierfür ist auch die Entstehung der verwendeten technorati-Zahlen verantwortlich, denn es werden immer nur Links der vergangenen 180 Tage gezählt. Manche Blogs, die wegen eines bestimmten Beitrags oder Vorgangs gewisse Prominenz erlangen, aber dann nicht “nachlegen”, rutschen so automatisch nach einem halben Jahr wieder aus den Charts (in Analogie zu Musikcharts könnte man von “one-hit-wonder” sprechen..:)).

Dieser Beitrag wurde unter Akademisches, Meta-Blogging veröffentlicht. Setze ein Lesezeichen auf den Permalink.

Die Kommentarfunktion ist geschlossen.