Ich sammle sehr gerne Daten (über mich) und tracke verschiedene Bereiche meines Lebens. Bisher nutze ich dafür größtenteils externe Dienste und lade meine persönlichen Daten auf deren Server. Das soll sich ein bisschen ändern.
Viele meiner Datenerfassungen fallen vermutlich unter den großen Oberbegriff „Quantified Self„. Mein primärer Fokus liegt dabei aber gar nicht unbedingt auf dem persönlichen Erkenntnisgewinn und der Selbst-Optimierung. Und ich möchte auch nicht bei meiner Krankenversicherung Bonuspunkte sammeln, indem ich ein AOK-Armband trage.
Ich nutze die Daten v.a. für mich selbst als Tagebuch. Um mich an Sachen zu erinnern. Privat und beruflich.
Welche Sehenswürdigkeiten hab ich im letzten Urlaub besucht?
Welche Bücher und Comics habe ich gelesen?
Welche Artikel fand ich besonders toll?
Wann hab ich noch mal was zum Dschungelcamp getwittert?
Viele der Informationen erfasse ich öffentlich, manche bleiben privat. Ich kann selber ganz gut steuern, was ich preisgebe und was nicht. Meine beiden Jahresrückblicke (2014 und 2015) hier im Blog beruhen zu großen Teilen auf diesen Daten.
Was mich dabei seit längerem stört: Die meisten Daten liegen auf den Servern externer Dienstleister. Die verdienen damit oft Geld (was natürlich Teil des Deals und erst mal nicht verwerflich ist) und wenn der Anbieter morgen zumacht, sind meine Inhalte vielleicht für immer weg.
Ich möchte im Idealfall wieder Herr meiner Daten sein oder zumindest ein aktuelles Backup davon haben. Deshalb versuche ich gerade nach und nach, wo es möglich ist, auf entsprechende Tools umzustellen, die mir genau das bieten. Datenhoheit bedeutet für mich dabei: die Informationen liegen auf meinem lokalen Rechner, einem lokalen NAS oder bei meinem Hoster.
Neu ist dieser Ansatz und dieses Bedürfnis nicht. Konrad Lischka erklärt in einem aktuellen Blogeintrag, warum er eine freie Alternative zu Google-Docs nutzen will, Felix Schwenzel hat sich ausführlich mit dem Indieweb („Your content is yours„) auseinandergesetzt und ich habe auch schon ein paar Blogposts zum, von Felix initiierten, Reclaim-Social-Media-Plugin veröffentlicht.
Dabei wird und kann es natürlich nicht darum gehen, Facebook, Twitter oder Instagram zu ersetzen. Das wäre utopisch. Ich habe aber viele kleinere Nischen identifiziert, wo es durchaus Alternativen zu kommerziellen Anbietern gibt und die trotzdem meine Anforderungen abdecken.
Soviel kann ich vorab schon mal sagen: Die nutzerfreundliche All-Inclusive-Lösung gibt es (noch) nicht. Dafür sind die zu ersetzenden Tools zu unterschiedlich. Gerade in Bereich Indieweb kommt man ohne ein grundsätzliches technisches Verständnis noch sehr schnell an Grenzen. Gleichzeitig findet man aber auch bei vielen Tools eine engagierte, auskunftsfreudige Entwickler-Community, die auch Anfängern gerne weiterhilft. Wer es schafft auf einem eigenen Webserver ein WordPress zu installieren, sollte auch mit den meisten der vorgestellten Anwendungen wenig Probleme haben.
Los geht es mit Runalyze, einer Lauftracking-Alternative zu Runtastic & Co.
@heibie „Beischläferin“ …sagt man das so?
@ivoheckmann jupp.
Ich freue mich auf die Serie und auch die offene Einstellung gegenüber den Diensteanbietern.
Ich selbst tracke auch einige Dinge (für mich persönlich), aber habe auch diverse Einschränkungen in Kauf nehmen müssen. Selbst wenn ein Anbieter nicht schließt, möchte man ja vielleicht auch in Zukunft zu einem anderen Anbieter wechseln. Das sollte meiner Meinung nach problemlos möglich sein.
Abgesehen davon leben wir natürlich in einer Welt, in der Menschen Geld verdienen müssen. Ich finde es nur fair, dass man auch bezahlt (mit Daten, Werbung oder direkt), wenn ein Service gut ist. Aber abgesehen davon gibt es auch viele gute Open-Source-Projekte, die nicht so schlecht sind.
P.S.: Falls es interessiert: Ich bin über den Post von Runalyze auf den Blog aufmerksam geworden.
Im zweiten Teil meiner own your data! Reihe wird Google Analytics durch PIWIK ersetzt.
Um die Nutzerzahlen für mein Blog zu zählen, nutze ich von Anfang an Google Analytics. Analytics ist für Webtracking der Markführer. Das Tool ist kostenlos, mächtig und bietet unzählige Auswertungsmöglichkeiten. Bei meinen bisherigen Arbeitgebern war Google Analytics immer Standard.
Google Analytics hat aber auch ein paar Nachteile. Meine Daten (bzw. die Daten meiner Leser, z.B. ihre IP-Adressen) liegen auf den Servern von Google. Deshalb ist es gar nicht so einfach Google Analytics in Deutschland datenschutzkonform einzusetzen. Außerdem ist Analytics sehr komplex und für ein kleines, privates Blog eigentlich überdimensioniert.
Betreibt man ein WordPress-Blog ist als Alternative die Statistik-Funktion des Jetpack-Plugins recht einfach integrierbar. Hier hat man aber auch wieder das Problem, dass die Daten auf einem fremden (US)-Server liegen.
Und da ich ja wieder Herr meiner Daten werden will, habe ich in den letzten Monaten, parallel zu Google Analytics und Jetpack, die Open-Source-Alternative PIWIK getestet.
PIWIK steht kostenlos zur Verfügung und kann auf dem eigenen Server selbst gehostet werden. Die technischen Voraussetzungen dafür sind PHP/MYSQL. Wer also ein WordPress-Blog selbst hosten kann, kann auch eine eigene PIWIK Instanz betreiben.
Auswertungsmöglichkeiten
PIWIK bietet die üblichen Auswertungsmöglichkeiten. PageViews, Visits, Unique Visits, Referrer, Browser/Betriebssystem/Bildschirmauflösung und sogar eine Echtzeit-Besucheranzeige (hier eine kurzes Erklärvideo zu den Features). Für eine privates Blog alles ausreichend.
Nutzerfreundlichkeit
Auf der Einstiegsseite von PIWIK kann man sich sein individuelles Dashboard mit Widgets zusammenstellen. Im Vergleich zu Google Analytics bietet PIWIK nicht ganz so professionelle Auswertungsmöglichkeiten. Das empfinde ich für den privaten Zweck durchaus als vorteilhaft, da es alles übersichtlicher macht.
Bei der Performance merkt man deutliche Unterschiede zu Google Analytics und Jetpack. PIWIK läuft bei mir auf einem Reseller-Account von all-inkl. Und es lädt einfach alles wesentlich langsamer.
Mit einem zusätzlichen Plugin lässt sich PIWIK über die API relativ gut in das WordPress-Backend integrieren, sodass man dort immer die wichtigsten Werte direkt anschauen kann. Das Plugin fügt auf Wunsch den Tracking-Code auch in den Quellcode ein, wenn man das nicht selbst im Template machen will oder kann.
Datenschutz
PIWIK läuft auf meinem Server, bzw. dem Server meines Hosting-Anbieters all-inkl. Einer deutschen Firma. Auf die Daten habe nur ich Zugriff.
Außerdem anonymisiert PIWIK die IP-Adresse der Nutzer automatisch. Eine der wichtigsten Anforderungen um das Tracking in Deutschland datenschutzkonform einzusetzen. Google Analytics bietet das auch an, allerdings muss man es dort aktiv anstellen (und erst mal in den Optionen finden).
Zusätzlich kann man eine One-Click-Opt-Out-Funktion integrieren und das globale DoNotTrack wird ebenfalls respektiert. Alle Privacy Optionen findet man hier nochmal aufgelistet.
Datenabweichungen
Benutzt man auf einer Webseite mehr als ein Zählverfahren ist es ziemlich wahrscheinlich, dass die Daten voneinander abweichen. Meine bisherigen Erfahrungen waren da bis zu 20% Unterschied bei der Zählung.
Das liegt daran, dass jedes Tool andere Techniken oder Auswertungsmechanismen verwendet. Von daher sind PageViews und Visits eigentlich immer nur aussagekräftig und über Webseiten vergleichbar, wenn sie mit dem gleichen Analysetool ausgewertet wurden.
Ich habe mir für das gesamte Jahr 2016 angeschaut, wie stark die PageViews und (Unique) Visits bei den drei Tools bei meinem Blog abweichen. Im Jetpack Vergleich werden nur die Unique Visits berücksichtigt, weil Jetpack nur diese ausweist.
Die Differenzen sind v.a. zu Google Analytics riesig, teilweise weist Google mehr als doppelt so viel aus. Warum das so ist, ist mir ein bisschen schleierhaft. Der PIWIK und Google-Tracking-Code sind beide an gleicher Stelle am Seitenende eingebunden. Die PIWIK-FAQ bietet ein paar Erklärungsansätze. So erfasst Google-Analytics standardmäßig auch Bots und Crawler, PIWIK filtert diese aber raus. PIWIK scheint von den drei Tools jedenfalls am konservativsten zu zählen und ich würde mal sagen, dass sich hinter den PIWIK Zahlen tatsächlich „echte“ Menschen verbergen, während bei den anderen auch viel automatisierte PageViews dabei sind.
Fazit
Zum professionellen Einsatz würde ich (ein selbst gehostetes) PIWIK nicht unbedingt empfehlen, für kleinere Seiten und Blogs, die ihre Daten nicht auf fremden Servern ablegen wollen, ist es eine gute Alternative. Datenschutzrelevante Einstellungen sind schon von Haus aus vorkonfiguriert. Verzichtet man auf ein bisschen Performance bekommt man zwar konservative aber zuverlässige Zahlen über die Besucher der eigenen Webseite und wie sie auf die Seite gekommen sind. Die Installation bekommt jeder hin, der auch sein WordPress selbst installiert hat.
Mit der Veröffentlichung dieses Posts entferne ich die Tracking Codes der beiden anderen Dienste aus meinem Blog.
Beitrag teilen:
Klick, um über Twitter zu teilen (Wird in neuem Fenster geöffnet)
Klick, um auf Facebook zu teilen (Wird in neuem Fenster geöffnet)
Klick, um auf Pocket zu teilen (Wird in neuem Fenster geöffnet)
Klick, um dies einem Freund per E-Mail zu senden (Wird in neuem Fenster geöffnet)
Klicken zum Ausdrucken (Wird in neuem Fenster geöffnet)
Wem gehören meine Daten und wie sicher sind sie? 2016 habe ich schon mal angefangen mir darüber Gedanken zu machen und im folgenden dann immer mal wieder zu Einzelaspekten gebloggt. Richtig vorangekommen bin ich mit dem Thema aber leider nicht. Aktuell gibt es einige Anlässe da mal wieder tiefer einzusteigen.
Im Januar gab es zwei Ereignisse, die in Deutschland auch über die Internetblase hinaus für Aufmerksamkeit gesorgt haben. Zum einen die umfangreiche Datensammlung über Politiker und Prominente, die ein Zwanzigjähriger zusammengetragen hat, zum anderen die Collection#1 (und später #Collection2-5), ein riesiger Datenbatzen, größtenteils zusammengestellt aus zahlreichen Datenlecks der letzten zehn Jahre. Dann noch die Habeck-Diskussion (was macht Social Media aus mir?), der x-te Facebook-Skandal und bald Werbung im Gruppenchat von WhatsApp. Außerdem ist das Netz noch Schuld an Trump, Brexit, Kinder-Verblödung und Nazis. Digitaler Kulturpessimismus hat Hochkonjunktur und das Internet (oder das, was viele dafür halten) hat schon mal bessere Zeiten gesehen.
Tatsächlich hab ich auch das Gefühl, dass nicht mehr alles so rund läuft im Digitalen und sich manches vielleicht auch überlebt oder die falsche Abzweigung genommen hat.
Kein Grund zu Panik und Kurzschlussreaktionen, aber ein guter Zeitpunkt, um mal wieder durchzuwischen. Digitale Bestandsaufnahme, Ausmisten (Facebook sparkelt vielleicht nicht mehr so richtig joy) und nach Alternativen Ausschau halten. Weil: #digitalgehtbesser. Dabei will ich versuchen konstruktiv und pragmatisch vorzugehen, immer orientiert an ein paar Grundsätzen und Ideen:
Wenig ist kostenlos (wenn es kein Geld kostet, kostet es Deine Daten)
Alles, was irgendwo im Netz (oder auf einer Festplatte) abgelegt wird, kann potentiell öffentlich werden (ja, Manni, auch unsere Snapchat-Konversation!). Man kann aber das Risiko so gering wie möglich halten.
Ich finde das (ursprüngliche) Konzept von Social Media (chronologische Timeline, Blogs, Sharing, RSS, Kommunikation, Austausch) immer noch gut und ziehe (immer noch) viel Positives und Spaß daraus.
Natürlich haben digitale Medien Einfluss auf uns, verändern, wie wir kommunizieren, handeln, denken. Das ist aber grundsätzlich erst mal nicht schlecht oder gut. Es kommt darauf an, wie man damit umgeht, es gestaltet.
Ich mag das Internet (und viele Menschen, die ich dort kennengelernt habe).
Meine Ziele:
Datenhoheit
Datensicherheit
Datenhygiene
Besseres Social Media
In (hoffentlich) regelmäßigen Abständen will ich zu verschiedenen Aspekten der Thematik bloggen. Über meine Gründe, Strategien, Ziele, Erkenntnisse, Erfolge, Misserfolge. Weil hier ja noch drei Personen im Haushalt leben, werde ich dabei bestimmt auch öfter familiäre Aspekte mit berücksichtigen.
Dafür habe ich mir ein paar Themen überlegt, an denen ich mich entlang hangeln will. Das sind erst mal nur Stichpunkte, die mir spontan eingefallen sind. Kann sein, dass aus einigen ein eigener Blogpost wird, aus anderen vielleicht sogar mehrere. Oder auch gar keiner. Das wird sich zeigen beim Machen.
Soziale Netzwerke/Services:
Accounts erfassen/löschen/sortieren
Alternative Dienste recherchieren
Privatsphäreinstellungen
Persönliche Tracking-Daten nur für mich selbst erfassen
Sicherheit:
Passwortsicherheit
Backup-Strategie
Datenleaks
Routinen zur Datensicherheit entwickeln
Games:
Freemium vs. Paid
Soziale Aspekte:
kann man Dienste überhaupt verlassen ohne sich gesellschaftlich zu isolieren?
Bestimmt habe ich da noch einiges vergessen. Ich freu mich über Anregungen, Ergänzungen, Tipps, Korrekturen. Hier im Blog in den Kommentaren, auf Twitter oder per Mail. Auf Twitter werde ich den Hashtag #digitalgehtbesser verwenden.