Wiki Explorator

Statistik-Reports für Wikis

(1) Dr. Klaus Stein, (2) Dr. Steffen Blaschke,
Ein Service des WiO-Projektes (Wikis in Organisationen) am Labor für Semantische Informationsverarbeitung1.
1) Lehrstuhl für angewandte Informatik in den Kultur-, Geschichts-, und Geowissenschaften2) Forschungsstelle für Neue Kommunikationsmedien

Hinweise zur Datenverarbeitung

Um ein Wiki auswerten zu können, müssen die zugehörigen Daten natürlich gelesen werden. Auf dieser Seite finden Sie Informationen zu unserem Umgang mit diesen Daten.

Die folgenden Hinweise sind in erster Linie technischer Natur und für den Wiki-Administrator gedacht.

In Kürze
Kurzbeschreibung der verschiedenen Nutzungsmöglichkeiten. Angaben zum Datenbankzugriff sowie zur Erstellung eines XML Dump.
Ausführlich
Ausführliche Beschreibung und Hintergründe.
Datenspeicherung
Hinweise zur Speicherung der Daten

In Kürze

Sie haben die folgenden Möglichkeiten, den Wiki Explorator zu nutzen:

Mit Datenbankzugriff

Wiki Explorator liest und speichert Daten aus der Wiki-Datenbank. Die Daten werden über das Internet ausgelesen, die Übertragung erfolgt unverschlüsselt.

Sie vertrauen unserer Software (Sie sollten nie einer fremden Webanwendung trauen):
Nutzer und Paßwort aus LocalSettings.php benutzen, sicherstellen, daß der Zugriff vom Rechner www.kinf.wiai.uni-bamberg.de aus erlaubt ist. Hierzu müssen sowohl der Mysql-Server als auch der entsprechende Nutzer Zugriffe von diesem Rechner aus erlauben (siehe unten).
Sie sind vorsichtig (empfohlenes Vorgehen):
  • Einen neuen View wio_user der Tabelle user anlegen, in dem die Paßwort-Felder nicht enthalten sind:
    CREATE VIEW wio_user AS SELECT user_id, user_name, user_real_name, user_touched, user_registration, user_editcount FROM user;
  • Einen neuen Datenbanknutzer anlegen, der ausschließlich die folgenden Tabellen lesen (nicht schreiben!) darf:
    page, revision, text, user_groups, wio_user
    und diesem Zugriff vom Rechner www.kinf.wiai.uni-bamberg.de aus erlauben.
  • Datenbankserver für Zugriffe von extern freischalten.
Sie sind sehr vorsichtig (etwas aufwendiger):
  • Dump der Tabellen page, revision, text, user, user_groups erzeugen.
  • Dump in neue Instanz des Mysql-Servers einspielen (ggf. auf einem anderen Port des gleichen Rechners oder (besser) auf einem anderen Rechner.
  • Auf dieser Kopie Paßwortfelder etc. aus der user-Tabelle löschen.
  • Einen Nutzer anlegen, der lesend auf diese Kopie zugreifen darf und ihn für Zugriffe von außen freischalten.
  • Datenbankserver für Zugriffe von außen freischalten.
Sie haben ein Wiki mit sensiblen Daten (z. B. ein Firmenwiki im Intranet):
Nehmen Sie mit uns Kontakt auf (klaus.stein@uni-bamberg.de).

Mit XML Dump der Datenbank

Alternativ zum direkten Zugriff auf die Datenbank kann Wiki Explorator seine Daten auch aus einem XML Dump file lesen. Allerdings kann der XML-Dump einer Datenbank relativ groß werden, d.h. Hochladen und Verarbeitung dauert länger oder scheitert ggf. ganz. Wir empfehlen den XML-Upload nur zu nutzen, wenn die anderen Möglichkeiten ausscheiden.

Dump erstellen:
mysqldump --xml dbname user user_groups page revision text > xmlfilename

Sensible Daten wie Paßwörter aus der XML-Datei entfernen: entweder schon bei der Erstellung des Dumps, indem wie oben beschrieben der View wio_user anstelle der Tabelle user genutzt wird oder nachträglich durch Löschen der entsprechenden Einträge in der XML-Datei.

Ausführlich

Datenbankzugriff

Um ein Wiki auswerten zu können, benötigt der Wiki Explorator Zugriff auf die Wikidaten. Grundsätzlich reicht es, einfach den Wiki-Datenbanknutzer und dessen Paßwort aus LocalSettings.php zu benutzen (die Rechte des Nutzers müssen so gesetzt sein, daß er vom Rechner www.kinf.wiai.uni-bamberg.de aus auf die Datenbank zugreifen kann).

Zudem muß der Mysql-Server von außen erreichbar sein. In manchen Konfigurationen (Einstellungen in my.cnf) ist  bind-address = 127.0.0.1, dann ist kein externer Zugang möglich.  bind-address = 0.0.0.0  erlaubt Zugriffe von extern.

Eingeschränkter Zugriff

Allerdings kann obiger Datenbanknutzer alle Tabellen der Wiki-Datenbank sowohl lesen als auch schreiben, wir bekommen somit vollen Zugriff auf alle Datenbanken dieses Datenbanknutzers (und wir kennen das zugehörige Paßwort). Wenn Sie unserer Software also nicht vertrauen (und das sollten sie bei fremden Webseiten nie tun), empfehlen wir, einen zusätzlichen Datenbanknutzer mit eingeschränkten Rechten anzulegen, und diesen zu verwenden.

Zudem enthält die user Tabelle sensible Nutzerdaten, vor allem das Paßwort und die Email-Adresse aller Wiki-Nutzer. Diese sind auch deshalb sensibel, weil viele Wiki-Nutzer für unterschiedliche Anwendungen die gleichen Paßwörter verwenden, und gültige Mailadressen zum SPAM-Versenden mißbraucht werden können. (Wiki Explorator liest die Paßwort-Felder nicht aus.)

Da der Datenbankzugriff (die Übertragung der Daten) über das Internet und unverschlüsselt erfolgt, können sie theoretisch von einer dritten Person mitgelesen werden (auch wenn dies sehr unwahrscheinlich ist).

Aus diesen Gründen empfehlen wir einen Datenbanknutzer mit eingeschränkten Rechten einzurichten, der nur Leserechte für diejenigen Tabellen hat, die benötigt werden. Statt der user Tabelle kann ein View wio_user angelegt werden, das die Paßwort- und Emailfelder nicht enthält. Nach Ende der Auswertung kann dieser zusätzliche Datenbanknutzer wieder gesperrt oder gelöscht werden.

Allerdings muß in jedem Fall der Zugriff auf den Datenbankserver von einem externen Rechner aus erlaubt werden (www.kinf.wiai.uni-bamberg.de). Sollte dies zu riskant oder gar nicht möglich sein (da der Server beispielsweise in einem Intranet steht), bleibt, einen Dump der nötigen Tabellen in einen anderen Datenbankserver einzuspielen und diesen für die Auswertung freizuschalten.

Lesen der Datenbank

Folgende Tabellen werden direkt aus der Datenbank gelesen:

TabellennameBeschreibung
page Liste aller Wikiseiten
revision Liste aller Revisionen, d.h. aller Edits.
text Liste aller Texte, d.h. Inhalte der Wikiseiten.
user Liste aller angemeldeten Benutzer. Wird nur gelesen, wenn wio_user nicht existiert.
user_groups Liste aller Benutzergruppen.
wio_user Wenn dieses Table/View existiert, wird es anstelle von user gelesen.
wio_genres Zusätzliche Tabelle mit page-ids und Genre-Informationen. Existiert normalerweise nicht.
wio_roles Zusätzliche Tabelle mit user-ids und Role-Informationen. Existiert normalerweise nicht.

Wikis in Intranets

Wir sind grundsätzlich daran interessiert, Firmenwikis in Intranets zu analysieren. Wir sind in der Lage nach Absprache individuelle Reports zu erstellen.

Beachten Sie bitte, daß wir vor allem an Forschung interessiert und kein reiner Dienstleister sind. Eine Wiki-Auswertung und ggf. Beratung kann im Rahmen einer Forschungskooperation erfolgen, aus der alle Beteiligten Vorteile ziehen.

Datenspeicherung

Wiki Datensätze

Ein Grund für uns, diesen Dienst anzubieten besteht darin, daß wir daran interessiert sind, die Entwicklung vieler unterschiedlicher Wikis im Vergleich zu untersuchen. Hierzu wird von jedem Wiki, zu dem wir einen Report erstellen, ein Dump gespeichert, der uns eine spätere vergleichende Auswertung erlaubt.

Wir verwenden Wiki-Inhalte oder Nutzerdaten ausschließlich zu Forschungszwecken und geben sie nicht an Dritte weiter. Auf Basis dieser Daten erfolgende Veröffentlichungen erfolgen selbstverständlich anonymisiert.

Mail-Adressen

Selbstverständlich werden die in der Datenbank enthaltenen Mailadressen nicht genutzt oder weitergegeben. Die im Reportformular unter Kontakt angegebene Mailadresse wird von uns lediglich dazu benutzt, mit Ihnen Kontakt aufzunehmen und ebenfalls an niemand Dritten weitergegeben.