Refine
Document Type
Keywords
- Active Learning (1)
- Data Labeling (1)
- Data-Centric AI (1)
- Python Framework (1)
- Traceability (1)
Vertrauenswürdige KI in der Medizin - von effizienter Datenannotation bis intuitiver Modellerklärung
(2022)
Die zunehmende Digitalisierung in der Medizin eröffnet durch die seit Jahren stark steigende Menge an verfügbaren Daten neue Möglichkeiten für medizinische KI-Anwendungen. So können beispielsweise Ärzt:innen bei der Diagnostik mit Clinical Decision Support Systemen unterstützt oder die Nachbeobachtung von Medizinprodukten zur Qualitätssicherung im Feld effizienter gestaltet werden.
Um die Vorteile von medizinischen KI-Anwendungen optimal zu nutzen, stellen sich jedoch grundlegende Herausforderungen: So ist beispielsweise für eine sinnvolle Nutzung meist eine ausreichend große Menge annotierter, d.h. befundeter Daten notwendig, deren Annotation selbst sich insbesondere im medizinischen Bereich als sehr zeit- und kostenintensiv manifestiert. Weiter hängt die Akzeptanz und somit die Anwendung in der Breite stark von einer intuitiven Modellerklärung ab, da im medizinischen Umfeld Stakeholder:innen mit sehr unterschiedlicher Expertise aufeinandertreffen.
Im Rahmen des Forschungsprojekts LIFEDATA werden diese zwei Problemstellungen für den Anwendungsfall von EKG-Daten betrachtet. Ein neuartiges Open-Source-Framework soll durch Aktives Lernen den Annotationsprozess effizient gestalten. Das wissenschaftliche Konzept kombiniert dazu mehrere Ansätze, um selbstständig Datenpunkte auszuwählen, die bei der anschließenden Annotation durch medizinische Expert:innen den größten Informationsgewinn mit sich bringen. Weiter werden unterschiedliche EKG-Interpretationsalgorithmen erforscht, um eine intuitive Modellerklärung zu erreichen und somit die Akzeptanz und das Vertrauen in KI-Vorhersagemodelle zu verbessern.
Welchen Beitrag kann das Framework zur Entwicklung einer vertrauenswürdiger KI leisten? Die ganzheitliche Integration von Domänenexpert:innen ermöglicht neue Ansätze bei der Entwicklung von KI-gestützten Systemen in der Medizin. Im Rahmen des Workshops wollen wir mit Ihnen verschiedene Perspektiven entlang des Entwicklungsprozesses erörtern.
Active Learning has become a popular method for iteratively improving data-intensive Artificial Intelligence models. However, it often presents a significant challenge when dealing with large volumes of volatile data in projects, as with an Active Learning loop. This paper introduces LIFEDATA, a Python- based framework designed to assist developers in implementing Active Learning projects focusing on traceability. It supports seamless tracking of all artifacts, from data selection and labeling to model interpretation, thus promoting transparency throughout the entire model learning process and enhancing error debugging efficiency while ensuring experiment reproducibility. To showcase its applicability, we present two life science use cases. Moreover, the paper proposes an algorithm that combines query strategies to demonstrate LIFEDATA’s ability to reduce data labeling effort.