VALID - Visual Analytics in Data-driven Journalism

Erkenntnisse aus der Informationsflut gewinnen. Die Aufbereitung komplexer Daten ist essenzielle Voraussetzung für Qualität im Datenjournalismus. Ein Forschungsprojekt verbindet die Datenanalyse mit Visual Analytics und hat die Bedürfnisse der JournalistInnen stets im Blick.

Kurzbeschreibung

In der heutigen Informationsgesellschaft müssen komplexe sozio-ökonomische und ökologische Phänomene analysiert und verstanden werden, um Entscheidungen treffen zu können. Dabei spielen JournalistInnen traditionell eine wichtige Rolle, indem sie verborgene Muster aufdecken und über Zusammenhänge informieren, aufklären und unterhalten. Mit der ständig wachsenden Menge und Verfügbarkeit von Daten müssen zunehmend Elemente der Datenanalyse und -visualisierung in die journalistische Arbeit integriert werden. Dadurch ist das Gebiet des Datenjournalismus entstanden, der auf computergestützter, datenbasierter Analyse sowie interaktiver Visualisierung beruht.

Das Projekt VALiD verbindet Datenjournalismus und Visual Analytics. Die Kernidee von Visual Analytics ist die Verknüpfung der hervorragenden kognitiven und visuellen Fähigkeiten des Menschen mit den enormen automatischen Verarbeitungsmöglichkeiten von Computersystemen. Obwohl Nachrichtenorganisationen wie die New York Times oder der Guardian bereits erfolgreich Datenjournalismus betreiben, steht die Mehrheit der JournalistInnen erheblichen Hindernissen bei der Nutzung von Daten gegenüber.

Häufig mangelt es in den Redaktionen an technischem Know-how oder an geeigneten Analysemethoden für die zunehmend komplexen, heterogenen Daten sowie an geeigneten Arbeitsprozessen. Mit dem Fokus auf die Bedürfnisse der NutzerInnen entwickelt das beteiligte Team Techniken, die DatenjournalistInnen bei der Handhabung von komplexen heterogenen Daten unterstützen, sowie eine Reihe von Richtlinien und Best Practices für Abläufe im Datenjournalismus.

Da das heterogene Datenfeld umfangreich ist, fokussiert das Projekt auf zwei Typen: Zum einen werden zeitbezogene Textdaten wie Parlamentsprotokolle des österreichischen Nationalrats unter die Lupe genommen. Diese sind zwar elektronisch verfügbar, liegen aber als unstrukturierte Textmenge vor. Zum anderen werden dynamische Netzwerke wie die Medientransparenzdatenbank untersucht. Diese enthält große Datenmengen über die Medienbelegung und das Anzeigen-Schaltvolumen von staatlichen Organisationen und darüber, wie sich dieses Netzwerk im Laufe der Zeit verändert hat.