Einleitung

Die Nephropathologie ist ein Teilgebiet der klinischen Pathologie, das ein großes Maß an Spezialisierung und eine enge Interaktion mit Nephrolog:innen erfordert. Ein wesentlicher Trend in der Pathologie generell, insbesondere aber auch in der Nephropathologie, ist die Generierung quantitativer oder semiquantitativer Scores, die meist auf einer manuellen Auswertung basieren, um klinisch relevante Parameter zu erfassen [3, 6, 23]. Im diagnostischen Alltag ist die Erfassung solcher Scores mit einigen Herausforderungen assoziiert, beispielsweise aufgrund des teils erheblichen Zeitaufwands sowie durch hohe Interobservervariabilität. Der zunehmende Präzisionsanspruch an die Pathologie, sowohl aus der Klinik als auch aus der Pathologie an sich selbst, wird in Zukunft zu signifikanten Herausforderungen für die Patholog:innen führen. In Teilen hat dies bereits begonnen: Die Arbeitsbelastung in der Pathologie in Deutschland ist in den letzten Jahren signifikant gestiegen [22]. Mit 1:47.989 ist das Verhältnis von Patholog:innen zu Einwohner:innen in Deutschland das zweitniedrigste in Europa und liegt unter dem europäischen Durchschnitt von 1:32.018 [22]. Zusätzlich hat die Pathologie in Deutschland ein demographisches Problem. Im Jahr 2021 waren 26,92 % und 58,64 % der Patholog:innen in Deutschland älter als 60 und 50 Jahre [30]. Es ist zu befürchten, dass sich diese Problematik in den nächsten Jahren wesentlich verschärfen wird. Hochspezialisierte Teilgebiete wie die Nephropathologie haben dabei ein größeres Risiko, besonders betroffen zu sein.

Durch die breite Verfügbarkeit von Hochdurchsatzscannern, die aus histologischen Objektträgern hochaufgelöste digitale histologische Bilder erstellen können, wurde in den letzten Jahren die effektive Digitalisierung der Histopathologie ermöglicht [17]. In vielen europäischen Ländern wurde diese digitale Transformation durch die COVID-19(„coronavirus disease 2019“)-Pandemie akzeleriert. So gibt es beispielsweise in den Niederlanden bereits pathologische Institute, die seit einigen Jahren vollständig digital, d. h. ohne Mikroskope, arbeiten [26]. Die Digitalisierung der Histopathologie, die nun auch in Deutschland langsam beginnt, bietet viele Möglichkeiten, die oben genannten Herausforderungen anzugehen. Neben grundsätzlichen Verbesserungen zur Steigerung der Effizienz, wie etwa schnell eine konsiliarische Zweitmeinung z. B. durch das Teilen des Bildschirms einzuholen, ist ein wesentlicher Vorteil, dass digitalisierte histologische Bilder der Analyse durch Computer zugänglich sind. Die Möglichkeiten der computerassistierten Nephropathologie werden in diesem Artikel mit dem Fokus auf digitale histologische Bilder beleuchtet. Einschränkend sei erwähnt, dass die digitale Pathologie einen viel breiteren Bereich umfasst als nur die Digitalisierung histologischer Schnittpräparate und deren Analyse, z. B. digitale Nachverfolgbarkeit von Proben in einem Laborinformationssystem, digitale Archivierung von Befunden, strukturierte Befundberichte etc.

Techniken der Bildanalyse unter Einsatz künstlicher Intelligenz

In den letzten Jahren ist die Anzahl von Veröffentlichungen, die computergestützte Analysen für die digitale Pathologie zeigen, exponentiell angestiegen (Abb. 1). Die Anzahl von Start-ups, die computergestützte Bildanalysetools für die digitale Pathologie anbieten, ist ebenfalls deutlich gestiegen. Dabei wird häufig Deep Learning, eine spezielle Technik der Informationsverarbeitung, eingesetzt. Deep Learning ist ein Teilgebiet des maschinellen Lernens (Machine Learning), welches ein Teilgebiet des großen und häufig nicht gut definierten Feldes der Forschung an künstlicher Intelligenz ist (KI; „artificial intelligence“, AI). Machine Learning oder Deep Learning wird bereits in zahlreichen Anwendungen des Alltags eingesetzt. Beispiele sind etwa Spracherkennung, Textübersetzungen oder auch Bilderkennung (z. B. auf dem Smartphone).

Abb. 1
figure 1

Anzahl der Publikationen im Web of Science (WOS) zur digitalen Pathologie und zur künstlichen Intelligenz (KI) in den Jahren 2000–2021: Im Jahr 2014 wurden erstmals mehr als 10.000 Publikationen zum Thema veröffentlicht, im Jahr 2021 waren es über 100.000

Machine Learning oder Deep Learning wird bereits in zahlreichen Anwendungen des Alltags eingesetzt

Deep Learning zeichnet sich insgesamt durch die Nutzung tiefer künstlicher neuronaler Netzwerke (KNN) aus. Grundsätzlich bestehen KNN aus sogenannten Neuronen bzw. Knoten mit ihren Verbindungen, welche in mehreren Schichten organisiert sind. Dabei unterscheidet man eine Eingabeschicht, verborgene Schichten und eine Ausgabeschicht. Es gibt zahlreiche verschiedene KNN, und der Aufbau dieser Schichten variiert stark je nach Netzwerkarchitektur. In den verborgenen Schichten werden die Eingabedaten aus der Eingabeschicht auf eine netzwerkarchitekturspezifische Weise graduell transformiert. Letzten Endes steht in der Ausgabeschicht ein Output, der mit dem gewünschten Ergebnis abgeglichen werden kann. Die Art und Weise, wie die Eingabedaten transformiert werden, wird automatisch im Rahmen des sog. Netzwerktrainings optimiert. Dies hat den Vorteil, das Input-Output-Zusammenhänge nicht explizit definiert werden müssen, sodass mit einer ausreichenden Anzahl von Beispielen und einem hinreichend langen Trainingsprozess eine Optimierung des KNN für verschiedene, auch sehr komplexe Aufgaben erreicht werden kann.

Voraussetzungen

Die in der digitalen Pathologie am häufigsten verwendete Form des Deep Learning ist das überwachte Lernen („supervised learning“), in dem ein KNN anhand von zuvor erstellten Annotationen, beispielsweise Diagnosen, optimiert wird. Dabei gilt allgemein der Grundsatz, dass die Leistung des KNN von Qualität, Größe und Repräsentativität der Trainings- und Testdaten abhängig ist. Somit ist das Erstellen von Datensätzen und Kohorten essenziell, um eine zuverlässige Einbindung in Diagnostik und Forschung zu gewährleisten. Aktuell ist die größte Herausforderung in der Entwicklung von Deep-Learning-Modellen in der Pathologie und spezifisch in der Nephropathologie das Fehlen solcher Datensätze. Die Fallstricke beim Erstellen von geeigneten Datensätzen liegen sowohl auf Patienten- und auf Bild- als auch auf Annotationsebene. Auf Patientenebene sollten Imbalancen oder fehlende Repräsentation von Alter, Geschlecht, Ethnizität oder Krankheitsstadien vermieden werden. Auf Bildebene ist eine unterschiedliche Färbeintensität in unterschiedlichen Zentren vorhanden. Die Annotationen (Diagnosen) können sich je nach Zentrum ebenfalls unterscheiden. Während des Trainingsprozesses können KNN Input-Output-Beziehungen, die in den Datensätzen enthalten sind, nutzen, auch wenn diese für Menschen nicht offensichtlich sind [21, 25]. Dies birgt die Gefahr, dass eine in den Daten enthaltene Verzerrung (Bias) von den KNN genutzt wird, anstatt tatsächlich klinisch/biologisch relevante Merkmale zu nutzen, insbesondere wenn nur ein monozentrischer Datensatz verwendet wird. Zur robusten Abschätzung der Nutzbarkeit eines Deep-Learning-Systems für den klinisch-diagnostischen Einsatz sind daher multizentrische Datensätze und diverse Patientenkollektive unumgänglich. Mittlerweile existieren entsprechende Empfehlungen zur Zusammenstellung von Datensätzen für die digitale Pathologie [1, 16]. Um KNN optimal zu trainieren und die Architekturen aufgabenspezifisch zu modifizieren, sind eine große Expertise und enge Kooperation mit spezialisierten Computerwissenschaftlern notwendig. Sollte dies nicht möglich sein, kann ggf. auf automatisierte Methoden (AutoML) zurückgegriffen werden [14].

Anwendungen

Im diagnostischen Alltag kann ein einziges KNN nicht das volle Aufgabenspektrum der nephropathologischen Diagnostik abdecken. Stattdessen dient ein KNN gegenwärtig meist der Lösung einer einzigen spezifischen Fragestellung. Multitasking-Ansätze, in denen ein Modell mehrere Aufgaben übernimmt [9], werden zukünftig voraussichtlich häufiger eingesetzt. In der digitalen Nephropathologie gibt es vielfältige Anwendungsmöglichkeiten für eine Computerassistenz (Abb. 2), die aber aktuell in der nephropathologischen Routinediagnostik in Deutschland und international nicht eingesetzt werden. In den folgenden Abschnitten wird eine Auswahl von kürzlich publizierten Anwendungen diskutiert.

Abb. 2
figure 2

Potenzielle Anwendungsfelder von Deep-Learning-Systemen in der digitalen Pathologie: Generative Netze erzeugen synthetische (künstliche Daten) und können so z. B. eine immunhistologische Färbung in eine PAS(„periodic acid-Schiff“)-Färbung translatieren. Bei der Klassifikation werden einem Bild eine oder mehrere Klassen (z. B. Diagnosen) zugewiesen. Mittels Regression können kontinuierliche Werte aus Bildern vorhergesagt werden, z. B. die Dauer, bis ein Endpunkt erreicht wird. Bildregressionsanwendungen in der digitalen Nephropathologie sind den Autoren zum Zeitpunkt der Erstellung des Artikels nicht bekannt. Bei der Segmentierung werden histologische Strukturen umrandet und einer Klasse zugewiesen. Basierend auf der Segmentierung oder unabhängig davon, können quantitative Merkmale aus der Histologie extrahiert und mit klinischen Variablen korreliert werden („pathomics“ oder Pathomik; CKD „chronic kidney disease“, NGM „next generation morphometry“)

Klassifikation

Bei der Klassifikation werden Datenpunkte kategorisiert, d. h., eine Nierenbiopsie wird z. B. einer oder mehreren diagnostischen Klassen zugeordnet. Viele der entwickelten Systeme funktionieren „end-to-end“, d. h. automatisiert vom digitalisierten histologischen Präparat bis zur Diagnose. Der Vorteil solcher Systeme ist, dass direkt eine bestimmte, diagnostisch oder klinisch relevante Information generiert wird. Klassifikationsanwendungen in der Nephropathologie umfassen bislang beispielsweise die Einordnung glomerulärer Läsionen [24, 28], die Zuweisung einer diagnostischen Klasse in Nierentransplantatbiopsien [19] oder die Graduierung der Fibrose in Nierenbiopsien [29]. Die Nephropathologie profitiert hierbei von anerkannten Definitionen, die dabei helfen, die Trainingsdaten konsistent zu annotieren, beispielsweise für glomeruläre Läsionen [11] oder für diagnostische Kategorien der Nierentransplantatabstoßung [20].

Es wurden Methoden entwickelt, um die Entscheidungen von KNN erklärbarer bzw. interpretierbarer zu machen

Auch wenn solche Systeme viel Potenzial für die Anwendung im klinischen Alltag besitzen, sind sie aktuell limitiert, z. B. durch die Fokussierung auf ein sehr spezielles Problem und eine fehlende Erklärbarkeit der Entscheidungsfindung der KNN. Der Vorteil für die Entwicklung, dass Input-Output-Beziehungen nicht explizit definiert werden, ist für die Erklärbarkeit ein Nachteil. Es wurden daher verschiedene Methoden entwickelt, um die Entscheidungen von KNN erklärbarer bzw. interpretierbarer zu machen [2]. Diese sind von bedeutender Wichtigkeit, um in der Diagnostik das Vertrauen in die Systeme zu stärken und deren Schwächen zu verstehen. In der Forschung können diese Methoden dabei helfen, beispielsweise in einem histologischen Präparat die für eine Klassifikation relevanten Areale zu identifizieren. Diese können dann gezielt analysiert werden.

Segmentierung und quantitative Analyse

Eine andere Anwendungsmöglichkeit in der Nephropathologie besteht in der Segmentierung, d. h. dem präzisen Markieren definierter histologischer Strukturen. Diese Strukturen werden nicht nur umzeichnet, sondern auch benannt, d. h. einer Klasse zugewiesen (z. B. glomeruläres Kapillarkonvolut, Tubulus, Gefäß usw.). Anders als bei den für die Klassifizierung konzipierten KNN sind Segmentierungsergebnisse visuell unmittelbar nachvollziehbar (Abb. 2). Diese Segmentierung bildet die Grundlage für kompartimentspezifische Analysen und die Quantifizierung der Nierenhistologie, z. B. durch Extraktion von vorher definierten Merkmale wie der Größe oder von Formmerkmalen wie der Zirkularität einer histologischen Struktur.

In mehreren Studien wurden KNN für die Segmentierung von Nierenhistologie entwickelt, z. B. für die automatische Erkennung und Abgrenzung relevanter histologischer Strukturen [4, 12, 15, 18]. Die verwendeten Klassen unterscheiden sich in den genannten Studien. Beispielsweise wurde in der ersten Studie, die ein solches Multiklassensegmentierungs-KNN vorgestellt hat, unter anderem zwischen proximalen und distalen Tubuli sowie zwischen global sklerotischen und nicht global sklerotischen Glomeruli unterschieden [12]. In einer anderen Studie konnten peritubuläre Kapillaren segmentiert werden – eine besondere Herausforderung, für die fast 20.000 manuelle Annotationen benötigt wurden [18]. In Kombination mit Systemen zur Detektion von Leukozyten könnte über dieses KNN langfristig das Banff-Kriterium der peritubulären Kapillaritis quantifiziert werden. Das entzündliche Milieu in Nierentransplantatbiopsien von Nieren mit verspäteter Funktionsaufnahme wurde mittels Multispektralfärbungen und KNN analysiert [13]. Solche Systeme stellen wichtige Meilensteine auf dem Weg zu einer quantitativen Nierentransplantatpathologie dar. In einer anderen Studie wurde gezeigt, dass eine exakte KNN-basierte Quantifizierung von interstitieller Fibrose, tubulärer Atrophie und Glomerulosklerose, d. h. von wichtigen Merkmalen eines chronischen Nierenschadens, möglich ist [8]. Es wurde auch ein Segmentierungs-KNN für die Nierenhistologie von Mäusen und anderen Spezies für die präklinische Forschung entwickelt [4]. Auch hier wurden quantitative Daten, basierend auf der Segmentierung, generiert, die bestimmte Elemente der Histologie beschreiben (hier: Tubulusdilatation). Kürzlich wurde das Konzept, quantitative Daten aus der Histologie zu generieren, für humane Nierenbiopsien deutlich erweitert. Es konnte gezeigt werden, dass durch ein solches groß angelegtes Data Mining der Histologie unabhängige prädiktive digitale Biomarker für die Langzeitprognose von IgA(Immunglobulin A)-Nephropathie-Patient:innen ermittelt werden können [15]. Durch eine unüberwachte Analyse der quantitativen Beschreibung der Glomeruli in dieser Kohorte konnte, basierend auf der glomerulären Filtrationsrate zum Zeitpunkt der Biopsie, eine morphometrische Progression von gesunden zu kranken Glomeruli abgebildet werden. Die morphologische Begutachtung dieser Glomeruli entlang der Progressionsachse zeigte eine fortschreitende Sklerosierung [15]. In Zukunft werden solche Analysemethoden voraussichtlich zunehmen und ggf. neue Zusammenhänge zwischen der Morphologie und Morphometrie der Histologie sowie klinischen Parametern aufdecken.

Generierung synthetischer Daten

Es werden zunehmend generative „gegnerische“ Netze („generative adversarial networks“, GAN) in der digitalen (Nephro‑)Pathologie verwendet. Diese bestehen in der Regel aus 2 KNN – einem Generator, welcher möglichst realistisch wirkende artifizielle Daten (z. B. Bilder) erzeugt, und einem Diskriminator, welcher versucht, echte Bilder von künstlich erzeugten zu unterscheiden. Im Verlauf des Trainings entwickeln sich eine fortlaufende, gegenseitige Anpassung und Leistungssteigerung der KNN, sodass schlussendlich artifizielle, aber teils hochrealistische Bilder erzeugt werden können. Generative Netze können z. B. verschiedene Färbungen inkl. Immunhistochemie und Immunfluoreszenz ineinander konvertieren, die Anzahl von Bildern von Fällen seltener Erkrankungen steigern oder andere Trainingsdaten für KNN erstellen. Die Translation beispielsweise einer immunhistochemischen Färbung in eine PAS-Färbung [5] ist hilfreich, wenn ein Segmentierungs-KNN nur auf PAS-Schnitten trainiert wurde. Durch die Translation in eine PAS-Färbung ist die immunhistochemische Färbung durch das KNN segmentierbar mit dem Potenzial, eine kompartimentspezifische Analyse der Immunhistochemie automatisiert durchzuführen. Durch die Translation von Färbungen in Spezialfärbungen und vice versa [10] könnten langfristig mehr Gewebeschnitte für spezielle Färbungen zur Verfügung stehen. So könnten beispielsweise in der Aufarbeitung von Nierentransplantatbiopsien mehr Immunzellfärbungen eingesetzt werden, die dann digital in eine PAS-Färbung umgerechnet und segmentiert werden, um automatisiert beispielsweise Tubulitis, Glomerulitis und peritubuläre Kapillaritis zu quantifizieren.

Diskussion

Die Möglichkeiten, die sich durch die digitale Pathologie insbesondere mit Computerunterstützung in der Diagnostik ergeben, sind enorm. Durch den schnellen Zugriff auf archivierte digitale Histologiepräparate ist z. B. ein zügiger Abgleich mit Vorbefunden möglich. Telepathologisch lassen sich einfach und schnell Zweitmeinungen einholen, was insbesondere die Dauer von konsiliarischen Befundungen verringern könnte. Die Flexibilität der Arbeit wird sich erhöhen, da auch von Zuhause oder unterwegs befundet werden kann. Insgesamt ist davon auszugehen, dass die Digitalisierung den Arbeitsalltag in der Pathologie verbessert. Durch synthetische Daten könnten Kosten gespart oder individuellere Probenaufarbeitungen durchgeführt werden, durch quantitative Assistenz könnten präzisere und reproduzierbare Scoring-Systeme etabliert werden, durch automatisierte Klassifikation könnte eine reproduzierbare (computergenerierte) Zweitmeinung eingeholt oder es könnten Fälle triagiert werden und vieles mehr. Zu all diesen Anwendungen sind bereits Publikationen erschienen, die die prinzipielle Durchführbarkeit aufzeigen. Die Systeme werden aktuell hauptsächlich in der Forschung angewendet, wo sie neuartige Möglichkeiten der präzisen quantitativen morphologischen Analyse eröffnen.

Das Forschungsgebiet des Deep Learning in Pathologie und Nephropathologie ist noch relativ neu, was möglicherweise ein Grund dafür ist, dass die Entwicklungen noch nicht in der alltäglichen Diagnostik verbreitet sind. Die Translation ist somit ein wichtiger künftiger Fokus der computerassistierten digitalen Pathologie. Dies wird prospektive Studien erfordern, um Evidenz für die Nutzbarkeit und v. a. für den klinischen Nutzen der genannten Methoden zu generieren. Die weit überwiegende Mehrzahl der gegenwärtig durchgeführten Studien wird an retrospektiv gesammelten und teils deutlich kuratierten Datensätzen durchgeführt [27]. Die aktuell geringe Evidenz hinsichtlich des klinischen Nutzens ist nicht nur ein Problem der computerassistierten digitalen Pathologie. Fast die Hälfte der in der digitalen Medizin tätigen Firmen zeigt gemäß einer US-amerikanischen Datenbankrecherche keine Daten, die die Wirksamkeit bzw. den Mehrwert ihrer Anwendungen belegt [7]. In Deutschland ist eine prospektive Überprüfung aktuell durch die mangelhafte Digitalisierung der Diagnostik eine Herausforderung. Innerhalb der deutschen Pathologie werden diese Aspekte gegenwärtig adressiert, z. B. im Bereich der Obduktionen im Rahmen des Deutschen Registers für COVID-19-Obduktionen (www.deregcovid.ukaachen.de) und des Nationalen Autopsienetzwerks (NATON). In diesen Projekten stellt die Digitalisierung der Autopsiepathologie als Anwendungsfall jeweils ein zentrales Ziel dar. Zudem gibt es zunehmend multizentrische Projekte, wie das durch den Innovationsfond unterstützte Projekt Transplant.KI (Augmentierte Diagnostik von Nierentransplantatbiopsien mittels Künstlicher Intelligenz) oder das durch das Bundesministerium für Bildung und Forschung (BMBF) unterstütze Projekt STOP-FSGS (Speed Translation-Oriented Progress to treat focal segmental glomerulosclerosis [FSGS]), in denen die Entwicklung und Validierung von Deep-Learning-Modellen für die Nephropathologie auf multizentrischer Ebene geplant ist. Um klinisch nutzbare Modelle zu entwickeln, werden (deutlich) mehr solcher Initiativen erforderlich sein, in denen Nephrologie und Pathologie sowie weitere Fachrichtungen, insbesondere die Computerwissenschaften, zusammenarbeiten.

Die Translation ist ein wichtiger künftiger Fokus der computerassistierten digitalen Pathologie

Die digitale Pathologie und die computergestützte Diagnostik haben das Potenzial, die Nephropathologie zu revolutionieren. Bis zur klinischen Implementierung liegt noch ein weiter Weg vor uns, der durch multizentrische, interdisziplinäre, kooperative Forschung mit dem Ziel der Verbesserung der Patientenversorgung beschritten werden sollte.

Fazit für die Praxis

  • Für die Nephropathologie liegen aktuell keine zertifizierten Modelle für eine computergestützte Diagnostik vor.

  • Deren Entwicklung und Validierung sollten in multizentrischen, interdisziplinären und letztendlich prospektiven Studien aus Nephrologie und Nephropathologie heraus zusammen mit den Computerwissenschaftlern vorangetrieben werden.