Interpretation von Zugriffsstatistiken
Webserver protokollieren die Zugriffe auf eine Website in einer Server-Transfer-Logdatei
("Access Log-Datei") laufend mit. Mit Hilfe spezieller Statistik-Programme
können diese Dateien aufbereitet und zu mehr oder weniger aussagekräftigen
Statistiken verdichtet werden (vergleiche eine ausführlichere Darstellung
von Symposion.de: Server-Logdateien).
| Diese Zahlen können auch zur Fortentwicklung einer Website ausgewertet
werden ("Website Monitoring") und zur
Erfolgskontrolle
von Aktivitäten zur Seitenoptimierung
für Suchmaschinen. |
| |
| Aber nur 49% der professionellen Webmaster beachten die statistischen
Auswertungen ihrer Webfiles. 42% kontrollieren ihr Ranking in Suchmaschinen
(Quelle: Danny Sullivan: Iconocast
Poll Sheds Light On Search Engine Optimization Issues). |
| |
| Zur Illustration zeigt folgende Abbildung einen Ausschnitt der Zugriffstatistik
für Abseits.de für den Monat Mai 1999, erzeugt durch das Programm
"Http-analyze":

Zur Erläuterung (vergleiche auch die englischsprachige Ergebnis-Interpretation
von http-analyze):
-
Es wurden 134.801 Dateien abgerufen ("Hits").
-
Davon wurden 115.305 Dateien abgesandt, bei 15.167 wurde festgestellt,
daß diese Dateien im Proxy oder Cache des Users identisch bereits
vorhanden gewesen sind und deshalb auf die Übermittlung verzichtet.
Bei 4.329 erfolgte eine andere Reaktion (z.B. eine Weiterleitung zu einer
anderen Datei, eine Fehlermeldung, weil die Datei nicht vorhanden gewesen
ist oder der Zugriff nicht erlaubt wurde, weil z.B. ein Paßwort für
einen geschützten Bereich falsch eingegeben worden ist.
-
Die übersandten Dateien setzten sich aus 46.849 HTML-Seiten zusammen
und 87952 anderen Dateiformaten (z.B. Bilddateien, Audio-Dateien, Textdateien,
Excel-Tabellen, PDF-Dateien usw.)
-
Phyisikalisch wurden gut 1,1 Gigabyte Daten angefordert (1.105.079 KB),
verschickt wurden circa 0,9 Gigabyte. Die Differenz sind die Dateien, die
bereits im Cache oder Proxy des Users identisch vorhanden gewesen sind
und deshalb nicht noch einmal übermittelt worden sind.
-
Es wurden 1.161 verschiedene Seiten im Berichtsmonat angefordert. Dies
bedeutet nicht, daß Abseits.de so viele verschiedene Seiten hat.
User können auch nicht (mehr) vorhandene Dateien abrufen. Sie bekommen
eine Fehlermeldung als Reaktion.
-
Von 12.105 verschiedenen Internetzugänge wurden Dateien abgerufen.
Die Aussagekraft ist, isoliert gesehen, sehr gering. Zum Beispiel hat allein
der Bürgernetzverein 120 verschiedene Zugangsknoten. Nur wenn man
die Entwicklung dieser Zahl über mehrere Perioden hinweg betrachtet,
kann man vage etwas darüber sagen, ob der Nutzerkreis sich ausweitet
oder nicht.
-
Die Zahl der User Sessions betrug 17.890 per 24 Stunden.
Das heißt, wenn ein Nutzer über den selben Internetzugang zweimal
innerhalb 24 Stunden Seiten von Abseits.de abruft, zählt er nur einmal,
wenn 24 Stunden dazwischen liegen, zählt er zweimal. Wenn ein Nutzer
täglich auf Abseits.de surft, zählt er im Mai einunddreißigmal.
-
Es haben im Berichtsmonat 1.798 verschiedene "Agenten"
Dateien angefordert.
-
Von 9.917 Webseiten aus wurde im Berichtsmonat auf Seiten von Abseits.de
zugegriffen, also per Link auf Webseiten anderer Websites oder von Ergebnisseiten
von Suchmaschinen. Wenn man diese Zahl in Verhältnis setzt zur Zahl
der User Sessions, sieht man, daß gut die Hälfte der Zugriffe
so generiert wurden. Die andere Hälfte sind Zugriffe von Robots oder
von Usern, die eine URL von Abseits.de in ihren Browser eingetippt und
dann aufgerufen haben oder eine Bookmark
angeklickt haben. Man kann aus der Entwicklung dieses Anteils vorsichtig
auf die relative Bedeutung von Stamm-Usern schließen.
-
Die weiteren Daten wie die maximalen Hits pro Tag sind vor allem interessant
für jemanden, der die Belastung der Servers (Hard- und Software) kontrollieren
will. Ab bestimmten Belastungen wird es erforderlich, die Ausstattung des
Servers zu verbessern.
|
|
|
|
Website Monitoring
Wie können diese Zahlen ausgewertet werden zur Fortentwicklung einer
Website ("Website Monitoring")?
-
Wie finden Nutzer Deine Website? Nutzer finden eine Website normalerweise
über Suchmaschinen, Kataloge, branchenzugehörige Websites und
sonstige Sites. Statistiken zeigen Dir, mit welchen Suchwörtern und
Suchwort-Kombinationen die Suchmaschinen und Kataloge abgefragt haben und
aus den angezeigten Ergebnissen u.a. eine Deiner Seiten ausgewählt
haben. Ausgehend von diesen Daten, kannst Du ermitteln, welche konkurrierende
Seiten bei diesen Anfragen angezeigt worden sind und vor allem die vor
Deiner Seite positionierten Seiten mit Deiner Seite vergleichen.
|
|
|
Referrer-Statistiken bei Websites mit
Frames
"In a successful attempt to make our lives more difficult, Netscape
and Microsoft coded their browsers to handle the passing of referral
information differently. Specifically, if you click on a link that takes
you to a page that features frames, your Netscape browser will send the
original page as the referer to the frame-set page, as well as the pages
that make up each individual frame. Internet Explorer will send the original
page as the referer to the outer (frame set) page, which in turn sends
the URL of the outer page as the referer to the individual frames." Quelle:
"Troubles
with Tracking" by Bill Winett |
|
|
|
-
Welches sind die am meisten und am wenigsten besuchten Seiten Deiner
Site? Wenn fast auschließlich Deine Homepage besucht wird, sind
entweder Deine darunter liegenden Seiten schlecht positioniert oder auf
der Homepage schlecht angebunden oder Du ziehst mit Deiner Homepage Besucher
an, die sich für die Inhalte Deiner Site nicht interessieren. Wenn
Deine darunter liegenden Seiten auch rege genutzt werden, koenntest Du
- im Rahmen Deiner grundlegenden Website-Konzeption - einerseits die am
meisten besuchten Seiten ausbauen, aufteilen, um Seiten mit ähnlichem
Content ergänzen und andererseits die am wenigsten besuchten Seiten
entfernen, reduzieren, nicht mehr aktualisieren, komprimieren. Wenn Du
Seiten entfernst, solltest Du eine Fehler 404-Seite
einbauen, damit Nutzer, die diese Seite noch in einer Suchmachine oder
anderswo finden, keinen unprofessionellen Eindruck von Deiner Site bekomen.
Du kannst Dir auch überlegen, ob Du Deine Besucher eine Top-Ten-Liste
der meistbesuchten Seiten zeigen willst (vergleiche die Top-Ten-Liste
von Abseits.de).
-
Wie navigieren die User durch Deine Site? Welchen internenen Links
wird kaum gefolgt? Auf welchen Seiten wird die Site häufig - von Dir
unerwünscht - verlassen?
-
An welchen Wochentagen und zu welchen Tageszeiten wird Deine Site mehr
oder weniger häufig benutzt? Nutzer tagsüber greifen mehrheitlich
von ihren Arbeitsplätzen aus zu und verfügen in der Regel müber
schnellere Verbindungen. Ladezeiten spielen dann keine so große Rolle.
Menschen, die abends, nachts und an den Wcohenenden, auf Deine Site surfen,
nutzen eher private Anschlüsse. Diese Interpretation ist bei Sites,
die viele ausländischen, vor allem überseeischen Besucher, haben,
wegen der Zeitverschiebung verzerrt. Doch in der Regel werden die meisten
Besucher aus der Region oder Nation des Betreibers einer Site stammen.
Beispielauswertungen
Links zu Programmanbietern und Vergleichen
Links zu redaktionellen Beiträgen
-
Statistical Applications
via Internet, Universität Freiburg.
-
Webspionage
(Dr. Web).
-
Symposion.de: Server-Logdateien.
Ein Kapitel aus dem Buch "Data Mining und E-Commerce".
-
Tracking
Web Site Traffic. Von Jean Kaiser, Web Design-Guide von About.com.
-
Linking
Web Use with Evaluation Measures, von William M.K. Trochim und Dominic
Cirillo, Cornell University, 1996
-
Eine knappe Einführung, wie Webserver funktionieren, findest Du auf
der Seite http://www.webreference.com/html/tutorial28/5.html.
-
Mehr zu den Details geht es auf der Seite http://www.w3.org/Protocols/rfc2616/rfc2616.html
-
Norternwebs Searchengine Tutorial: Referer
Logs.
-
Analyzing
Your Web Site Traffic, von Dan Grossman.
-
Getting Real
about Usage Statistics by Tim Stehle.
-
Analyzing
Your Traffic to Measure Your Success by Robin Nobles
-
Interpreting WWW Statistics
by Doug Linder.
-
How the web works
von Stephen Turner. Unter Ziffer 4 listet er auf, was man aus Logfile-Auswertungen
- entgegen gängiger Vorurteile - nicht ermitteln kann.
-
Search Engine Glossary.
-
Web
metrics that matter, in: Computerworld vom 15. November 2002. Ein guter
Überblick über ökonomisch sinnvolle Bewertungsmaßstäbe
für Websites, wie z.B. einen Loyalitäts-Index..
Bücher
|
|
|