Die Log­da­tei­en Ihres Web­ser­vers verraten Ihnen allerhand über den Hin­ter­grund und das Verhalten Ihrer Besucher. So können Sie durch eine In­spek­ti­on des Logfiles z. B. in Erfahrung bringen, welchen Browser Ihre User verwenden, wie lange sie sich auf Ihrer Website aufhalten und wie viele Seiten sie dabei aufrufen oder welche Such­ma­schi­nen bzw. Links sie auf Ihre Seite geführt haben. Dank dieser und weiterer In­for­ma­tio­nen ist das Logfile eine erst­klas­si­ge Quelle zur Über­prü­fung der Be­nut­zer­freund­lich­keit und Op­ti­mie­rung Ihres Web­pro­jekts. Da es unmöglich ist, diese um­fang­rei­chen Text­da­tei­en manuell aus­zu­wer­ten, gibt es diverse Logfile-Analyse-Tools – so­ge­nann­te Logfile-Analyzer –, die diese Aufgabe über­neh­men und die Er­geb­nis­se visuell auf­be­rei­tet prä­sen­tie­ren. Ein in­ter­es­san­ter Vertreter dieser Analyzer ist das Open-Source-Tool GoAccess.

Grund­le­gen­des zu GoAccess

Im Juli 2010 ver­öf­fent­lich­te der Ent­wick­ler Gerardo Orellana die erste Version des Logfile-Analyse-Tools GoAccess, das er bis heute auf der Plattform GitHub betreut und wei­ter­ent­wi­ckelt. GoAccess kann als freie Software – zunächst unter der GNU-Lizenz, seit 2016 unter der MIT-Lizenz – kostenlos genutzt und an die eigenen Vor­stel­lun­gen angepasst werden.

Die ele­men­ta­re Idee von GoAccess ist die Analyse und visuelle Dar­stel­lung von Web­sta­tis­ti­ken in Echtzeit. Um dies zu ge­währ­leis­ten, wertet der Logfile-Analyzer die ver­schie­dens­ten Logdatei-Formate von Web­ser­vern und Cloud-Diensten wie Apache, nginx, Amazon S3 oder Cloud­Front aus und stellt die Er­geb­nis­se grafisch an­spre­chend in einem Dashboard dar. Dieses lässt sich in unixoiden Systemen entweder über den Browser oder über die Kom­man­do­zei­le aufrufen. Al­ter­na­tiv können die Sta­tis­ti­ken auch im HTML-, JSON- oder CSV-Format aus­ge­ge­ben werden.

GoAccess stellt nur minimale Sys­tem­an­for­de­run­gen und setzt, da es in der Pro­gram­mier­spra­che C ge­schrie­ben ist, einzig die C-Pro­gramm­bi­blio­thek ncurses voraus. Um das Logfile-Analyse-Tool auf einem Windows-Be­triebs­sys­tem zu nutzen, benötigen Sie die Tool-Sammlung Cygwin, mit deren Hilfe Sie bestimmte Linux-An­wen­dun­gen auch auf einem Microsoft-System zum Laufen bringen.

Diese Features zeichnen das Open-Source-Tool aus

Um GoAccess ein­zu­set­zen, sind keinerlei Kon­fi­gu­ra­tio­nen nötig. Sie wählen einfach die zu ana­ly­sie­ren­de Logdatei aus, starten die Über­prü­fung und lassen sich die In­for­ma­tio­nen bequem in Echtzeit anzeigen. Die ver­schie­de­nen Daten sind dabei in einzelnen Sparten auf­ge­führt, wobei sowohl Werte für einzelne Mess­zeit­räu­me als auch ein Wert für den gesamten Über­prü­fungs­zeit­raum angeführt werden. Stan­dard­mä­ßig sind diese Auf­lis­tun­gen chro­no­lo­gisch sortiert, Sie können die Daten al­ler­dings auch nach der Anzahl der Sei­ten­auf­ru­fe bzw. Besucher, der ver­brauch­ten Band­brei­te oder der Zeit, die zum Laden der Website (insgesamt, durch­schnitt­lich oder maximal) benötigt wurde, sortieren. Einige Werte können Sie auch in Balken- oder Kur­ven­dia­gram­men anzeigen lassen. Zu­sätz­lich zu den aktuellen In­for­ma­tio­nen liefert Ihnen GoAccess unter „Overall Analyzed Requests“ eine Zu­sam­men­fas­sung aller bisher aus­ge­wer­te­ten Log-Daten.

Sowohl das Terminal- als auch das Browser-Dashboard (beide in eng­li­scher Sprache) prä­sen­tie­ren die erwähnten un­ter­schied­li­chen Sparten und Diagramme an­spre­chend und nut­zer­freund­lich, sodass Sie in kürzester Zeit Rück­schlüs­se über Besucher und Website ziehen können. Die folgende Tabelle zeigt die ver­schie­de­nen Bereiche, die der Logfile-Analyzer dabei abdeckt, und fasst die Er­kennt­nis­se zusammen, die aus den Werten gezogen werden können.

Sparte Über­set­zung Ent­schei­den­de Werte Bedeutung für Web­ana­ly­se
Unique visitors per day – including spiders Ein­zig­ar­ti­ge Besucher pro Tag – inklusive Com­pu­ter­pro­gram­me Aufrufe, Besucher, Datum (Data) Unter einem ein­zig­ar­ti­gen Besucher werden alle Aufrufe ver­stan­den, die von derselben IP-Adresse erfolgen. Indem Sie die Be­su­cher­zah­len über einen längeren Zeitraum be­ob­ach­ten, können Sie fest­stel­len, ob Kampagnen oder neue Inhalte von Erfolg gekrönt sind.
Requested Files (URLs) An­ge­for­der­te Dateien bzw. URLs Aufrufe, Band­brei­te, Ladezeit (Avg., Cum., Max. T.S.), URL (Data In dieser Sparte erhalten Sie einen Überblick über die am öftesten an­ge­for­der­ten URLs. So erfahren Sie, welche Seiten Ihres Web­pro­jekts besonders beliebt sind, wieviel Band­brei­te ver­braucht wird und wie stabil die La­de­zei­ten der Seiten sind.
Static Requests Statische Anfragen Aufrufe, Band­brei­te, Ladezeit, Datei (Data) Wie im vorigen Fall geht es um an­ge­frag­te Dateien, al­ler­dings nur um statische Inhalte wie Bilder, Icons oder Layout-Elemente.
Not Found URLs (404s) Nicht gefundene URLs (404-Fehler) Aufrufe, URL (Data) In dieser Sparte auf­ge­lis­te­te URLs haben bei den Besuchern zu einem 404-Fehler geführt. Mithilfe dieser Statistik können Sie Netz­werk­pro­ble­me oder feh­ler­haf­te Ver­lin­kun­gen fest­stel­len und beheben. Letztere werden sowohl von Nutzern als auch von Such­ma­schi­nen negativ bewertet.
Visitor Hostnames and IPs Hostname und IP der Besucher Stadt, Land, Hostname, IP (Data) In dieser Rubrik erhalten Sie In­for­ma­tio­nen über Provider und IP-Adresse Ihrer Besucher. GoAccess liefert sogar Daten zu Her­kunfts­land und -ort. Der Nutzen besteht darin, Usern gezielt per­so­na­li­sier­te Inhalte zu prä­sen­tie­ren. Al­ler­dings wi­der­spre­chen sowohl voll­stän­di­ge IP-Adressen als auch Geo­lo­ka­li­sie­rung dem deutschen Da­ten­schutz. (Setzt außerdem GeoIP von Maxmind voraus.)
Operating Systems Be­triebs­sys­te­me Aufrufe, Besucher, Be­triebs­sys­tem (Data) Nach Häu­fig­keit sortiert sehen Sie in dieser Rubrik, welche Be­triebs­sys­te­me Ihre User nutzen. Mithilfe dieser Daten können Sie z. B. genau fest­stel­len, wie hoch der mobile Traffic ist.
Browsers Browser Aufrufe, Besucher, Browser (Data) In diesem Bereich werden Ihnen die zu­grei­fen­den Client-Typen prä­sen­tiert. In erster Linie sehen Sie die Zahlen der ver­schie­de­nen Browser, aber bei­spiels­wei­se auch, ob und welche Crawler Ihre Website durch­su­chen.
Time Dis­tri­bu­ti­on Zeitliche Ver­tei­lung der Aufrufe Aufrufe, Besucher, Ladezeit, Stunde (Data) Sie erhalten eine stun­den­ge­naue Übersicht über die Zu­griffs­zah­len. So können Sie genau fest­stel­len, wann Ihre User besonders aktiv sind, und dann Werbung oder neue Inhalte punkt­ge­nau schalten bzw. ver­öf­fent­li­chen.
Virtual Hosts Virtuelle Hosts Aufrufe, Band­brei­te, Host (Data) Wenn Sie mehrere virtuelle Hosts (Domains, IP-Adressen) auf Ihrem Webserver betreiben, können Sie mithilfe dieser Statistik her­aus­fil­tern, welcher die Res­sour­cen Ihres Servers am stärksten be­an­sprucht.
Referrers URLs Referrer-URLs Aufrufe, URL (Data) Der Referrer ist die in der Logdatei er­schei­nen­de In­for­ma­ti­on über die URL, über die Ihr Besucher auf Ihre Seite gelangt ist. Sie können mit dieser Statistik ei­ner­seits starke Part­ner­sei­ten her­aus­fil­tern, an­de­rer­seits sogar die ver­wen­de­ten Such­be­grif­fe der User erfahren, wenn diese direkt von einer Such­ma­schi­ne gekommen sind.
Referring Sites Referrer-Websites Aufrufe, Web-Adresse (Data) Im Gegensatz zur vor­he­ri­gen Statistik erhalten Sie hier nicht die URL, sondern die all­ge­mei­ne Web­adres­se der Her­kunfts­sei­te.
Key­phra­ses from Google’s search Bei der Google-Such­ma­schi­ne Aufrufe, Such­be­grif­fe GoAccess bietet zu­sätz­lich zu den Referrer-Sta­tis­ti­ken eine
engine ver­wen­de­te Stich­wor­te (Data) separate Auf­lis­tung der Such­an­fra­gen – zumindest für Google. Das erspart Ihnen die mühsame Arbeit, Referrer-URLs ei­gen­stän­dig aus­zu­wer­ten. Die hier prä­sen­tier­ten Er­geb­nis­se können nütz­li­chen Input für Ihre Keyword-Strategie liefern.
Geo Location Geo­tar­ge­ting Besucher, Herkunft (Data) Unter dem Punkt „Geo Location“ finden Sie eine exakte Zuweisung der IP-Adressen zur geo­gra­fi­schen Position des Nut­zer­sys­tems. Die Angaben bergen dieselbe Da­ten­schutz-Pro­ble­ma­tik wie die Statistik über Hostname und Nutzer-IP. (Setzt außerdem GeoIP von Maxmind voraus.)
HTTP Status Codes HTTP-Status-Codes Aufrufe, Sta­tus­code (Data) Diese Sparte gewährt eine Übersicht über die Antworten Ihres Servers. Sie können den Daten entnehmen, ob Ihr Webserver ord­nungs­ge­mäß funk­tio­niert und alle Inhalte feh­ler­frei abgerufen werden können.

So in­stal­lie­ren und nutzen Sie GoAccess

Um si­cher­zu­ge­hen, dass Sie die neueste Version von GoAccess in­stal­lie­ren, sollten Sie die In­stal­la­ti­ons­da­tei von der of­fi­zi­el­len Website her­un­ter­la­den. Über die Kom­man­do­zei­le gelingen Download und In­stal­la­ti­on fol­gen­der­ma­ßen:

$ wget http://tar.goaccess.io/goaccess-1.0.tar.gz
$ tar -xzvf goaccess-1.0.tar.gz
$ cd goaccess-1.0/
$ ./configure --enable-utf8
$ make
# make install

Vergessen Sie nicht, dass ncurses Vor­aus­set­zung für die Funk­tio­na­li­tät des nginx- und Apache-Log-Analyzers ist und ebenfalls in der neuesten Version auf ihrem System in­stal­liert sein sollte. Falls noch nicht geschehen, können Sie die C-Bi­blio­thek mit dem folgenden Code ein­rich­ten:

$ wget http://ftp.gnu.org/pub/gnu/ncurses/ncurses-5.7.tar.gz
$ tar xzf ncurses-6.0.tar.gz
$ cd ncurses-6.0
$ ./configure --prefix=/opt/ncurses
$ make
# make install
$ ls -la /opt/ncurses

Eine de­tail­lier­te Übersicht über die Kon­fi­gu­ra­ti­ons­mög­lich­kei­ten des Logfile-Analyse-Tools erhalten Sie im eng­lisch­spra­chi­gen Handbuch.

Zum Hauptmenü