ADEQUATe – Analytics & Data Enrichment to improve the Quality of Open Data
Kurzbeschreibung
Die ständig wachsende Menge an frei verfügbaren Daten wird zu einer wichtigen Quelle für Startups und neue Wirtschaftszweige. Die Fähigkeit zur Integration offener und freier Daten in bestehende Datenmanagementsysteme von Unternehmen ist ein Schlüsselfaktor für den Erfolg der datengetriebenen Wirtschaft.
Zur umfassenden Hebung des Potenzials freier Daten, sowie deren effizienter Integration in bestehende Datenquellen, ist es einerseits notwendig, die Qualitätsprobleme von Daten und Metadaten zu identifizieren und beheben zu können und andererseits die Vergleichbarkeit und Interoperabilität von Datensätzen zu erhöhen.
Der entscheidende Punkt ist, den Qualitätsaspekt bereits bei der Veröffentlichung von Daten durch Verwaltungseinheiten oder Private zu berücksichtigen.
Im ADEQUATe Projekt werden Methoden zur
- Messung,
- Beobachtung und
- Verbesserung der Qualität in offenen Daten (Open Data) sowie auf Open Data-Portalen entwickelt.
Statistisch-Algorithmische- sowie Linked-Data- und Crowdsourcing-Ansätze werden in einem Data Quality Monitoring Framework kombiniert sowie auf zwei bestehenden Portalen (data.gv.at, opendataportal.at) in einem user- und datengetriebenen Entwicklungsprozess sukzessive evaluiert und weiterentwickelt. Qualitätsthemen wurden bislang als kein vorrangiges Thema der Open Data-Bewegung behandelt. Mit der steigenden Bedeutung und Verwendung wird Datenqualität jedoch zu einem zentralen Thema.
Das Konsortium forscht und entwickelt neuartige (halb-)automatisierte und communitygetriebene Datenverbesserungsmethoden, die in bestehende offene Datenportale zur Steigerung des Wertes offener Daten integriert werden können. Der Einsatz semantischer Technologien ermöglicht Querverweise zwischen Datensätzen und wird das Potenzial zur Identifikation ähnlicher Daten - und damit die Verwendbarkeit in Anwendungen und Services - steigern.
Das resultierende Framework für Data Quality Monitoring & Evaluation wird in die bestehenden Datenportale data.gv.at und opendataportal.at integriert, um dessen praktische Anwendbarkeit zu überprüfen und das Framework entlang eines daten- und usergetriebenen Software-Entwicklungsprozesses sukzessive zu optimieren.
Während das Projekt als Use Case die Verbesserung von data.gv.at und opendataportal.at als primäres Ziel verfolgt, soll ein großer Teil der erstellten Komponenten einen allgemeinen Nutzen bei der Datenverbesserung liefern. Der Programmcode der erstellten Module wird im Projektverlauf der Öffentlichkeit frei zur Verfügung gestellt.
Projektbeteiligte
- Semantic Web Company GmbH
- Donau-Universität Krems
- Wirtschaftsuniversität Wien
Kontaktadresse
Martin Kaltenböck
E-Mail: m.kaltenböck@semantic-web.at