Zum Inhalt springen
Kategorie-Icon ICT & DIGITAL

Document Dataset Synthesizer

HTBLA Grieskirchen

2022/23

Erfolge bei Jugend Innovativ

3. Preis ICT & Digital

EUR. 1.000,-


Document Dataset Synthesizer
Um der KI einer Linzer Firma das richtige Auslesen von Dokumenten beizubringen, liefern drei Schüler der HTBLA Grieskirchen Übungsmaterial. Es wird komplett künstlich generiert.

Künstliche Intelligenz ist in aller Munde. Auch, dass sie in der Lage ist, Bilder, Texte und sonstiges Datenmaterial zu generieren, wissen mittlerweile die meisten. Für viele ist das aber nicht mehr als eine Spielerei, die es uns ermöglicht, den Papst in einen Parka zu stecken. Es wäre doch gelacht, wenn sich nicht auch für diesen Fortschritt eine sinnvolle Anwendungsmöglichkeit finden ließe.

 

Wenig zu lachen hat das in Linz ansässige Unternehmen opta data, das die Krankenkassenabrechnung für medizinische Dienstleistungseinrichtungen übernimmt. Das ist sehr umständlich: Die Ärzt*innen schicken Scans der Verordnungen an das Unternehmen, das relevante Daten extrahiert und an die Krankenkassa weitergibt. Das Geld geht dann in allen Etappen den umgekehrten Weg. Dabei war für opta data schnell klar, dass es notwendig ist künstliche Intelligenz bei der Datenextraktion einzusetzen, um nicht komplett den Verstand zu verlieren. Doch dann ging ihnen fürs Training der Maschine schnell das vorhandene Material aus.

 

Gut, dass sie durch ein Praktikum Tim Peko kannten, der diesem Problem Abhilfe schaffen konnte. Er entwickelt gemeinsam mit seinen Schulkollegen an der HTBLA Grieskirchen, David Rathmair und Dominik Wernsdorfer, ein System, das beliebig viele und verschiedene Dokumente generiert. Denn ob die Trainingsunterlagen echt sind oder nicht, spielt für die KI und ihren Lernerfolg voraussichtlich keine Rolle. Was zählt, ist, dass sie möglichst viel üben kann, um später mit Sicherheit die richtigen Daten auszulesen.

 

Technisch funktioniert das so: Eine Webapplikation hat eine Server-Client-Architektur. Über die Benutzeroberfläche werden in einer leeren Vorlage Datensätze an Dokumenten konfiguriert und angelegt, schließlich am Server generiert. Zu kompliziert? Keine Sorge: Hauptsache, die KI hat’s verstanden.

Fotocredit: ©  aws, VOGUS / Wolfgang Voglhuber