OBARIS: Ontology-Based Artificial Intelligence in Environmental Sector

Das Projekt OBARIS entwickelt ein Konzept und Technologiepaket für auditierbare semantische KI-Systeme (SWeMLS) und verbessert deren Verständnis und Anwendbarkeit. Es umfasst die Erstellung eines Lifecycle Models und eines Auditability-Frameworks sowie die Entwicklung von Anwendungsbeispielen im Umweltbereich. OBARIS fördert die industrielle Innovation durch praxisnahe Proofs-of-Concept und die Weiterentwicklung von SWeMLS-Technologien.

Kurzbeschreibung

Das Projekt OBARIS zielt darauf ab, den Status quo im Bereich auditierbarer semantischer künstlicher Intelligenzsysteme (Semantic AI Systems – SAIS) voranzutreiben, indem sowohl konzeptionelle Aspekte dieser Systeme als auch die Entwicklung eines Technologiestack untersucht werden, der diese Systemtypen in konkrete Umgebungen überträgt.

OBARIS behandelt eine Reihe an innovativen Aspekten:

Der erste Aspekt ist das Verständnis für die verschiedenen Arten von semantischen KI-Systemen (SAIS) auf konzeptioneller Ebene zu verbessern. Wir haben den Begriff SAIS zu Semantic Web Machine Learning System (SWeMLS) weiterentwickelt. Ein wichtiges Ergebnis ist eine systematisch abgeleitete Taxonomie von SWeML-Systemen und ihren zugrundeliegenden Design-Patterns, basierend auf einer groß angelegten systematischen Literatur Mapping-Studie.

Der zweite Aspekt ist die Entwicklung eines Lifecycle Models, um die Entwicklung konkreter SWeMLS-Implementierungen besser zu steuern. Auf der Grundlage dieses Models haben wir ein konkretes Technologiepaket für die Entwicklung von SWeMLS entworfen. Zu diesem Zweck haben wir eine flexible Pipeline-Architektur entwickelt, die das weit verbreitete NLP Interchange Format (NIF) und Machine Learning Modelle verwendet. Die Pipeline kommuniziert mit einer Reihe von Diensten, die ihre Wiederverwendbarkeit und Erweiterbarkeit gewährleisten.

Der dritte Aspekt betrifft den Entwurf und die Entwicklung eines Auditability-Frameworks für SWeMLS. Dazu haben wir eine semantikbasierte Methode und Modelle entwickelt, die Folgendes ermöglichen: Eine automatisierte Erfassung von Metadaten und eine maschinenlesbare Beschreibung von SWeMLS. Wir verwenden und erweitern die PROV-O und P-Plan Ontologien, um SWeMLS Systemabläufe darzustellen und entsprechende Endpunkte für die automatische Erfassung von diesen Systemspuren zu generieren.

Diese innovativen Aspekte heben die Herausforderungen hervor, die wir im Rahmen des OBARIS-Projekts angehen:

  • das mangelnde Verständnis der Eigenschaften von SWeMLS
  • die Notwendigkeit eines generischen und praktischen Rahmens für die Unterstützung der Auditierbarkeit von SWeMLS
  • die begrenzte Anwendung von SWeMLS im Umweltbereich.

Wir haben unsere entwickelte Software in zwei konkreten Anwendungsfällen im Umweltbereich unseren Projektpartnern vorgestellt und gemeinsam evaluiert: Der erste Showcase befasst sich mit Machine Learning unterstützter Analyse von gesetzlichen Genehmigungsverfahren. Der zweite Showcase beschäftigt sich mit der FAIRifizierung von Nährstoffeinträgen und -flüssen von Flusseinzugsgebieten in Österreich, d.h. das Sammeln und die Integration von heterogenen Mess- und Metadaten aus verschiedenen Quellen zur Erhöhung der Datentransparenz.

Diese innovativen Aspekte und ihre Anwendungen in den konkreten Showcases unterstreichen die Beiträge von OBARIS zu den SDGs, insbesondere zu Ziel 9 „Industrielle Innovation und Infrastruktur". Erstens tragen unsere Ergebnisse zum Verständnis der neuen Welle semantischer KI-Systeme und der Aspekte der Auditierbarkeit dieser Systeme bei. Zweitens haben wir auf der Grundlage unserer Forschungsergebnisse zwei Proofs-of-Concept entwickelt, die die Anwendbarkeit und Weiterentwicklung dieser Technologien aufzeigen.

In Zukunft wollen wir die sogenannten SWeMLS Design Patterns weiter entwickeln und ihren Einfluss auf die Auditierbarkeit und andere Systemcharakteristka erforschen. Des weiteren werden wir unsere Software weiter entwickeln, um weitere Funktionalitäten hinzuzufügen und die Benutzerfreundlichkeit zu erhöhen.

Publikationen

Broschüre: Digitale Technologien (2024)

Intelligent, grün und souverän in die Zukunft - Projekthighlights aus den Jahren 2016-2021. Redaktionsteam FFG: Olaf Hartmann, Anita Hipfinger, Peter Kerschl
Herausgeber: Bundesministerium für Klimaschutz, Umwelt, Energie, Mobilität, Innovation und Technologie
Deutsch, 72 Seiten

Downloads zur Publikation

Projektbeteiligte

Konsortialführung

  • TU Wien, Data Science Forschungsbereich (194-04)

Weitere Konsortialpartner

  • Semantic Web Company (SWC)
  • Umweltbundesamt (UBA)