Entwicklung und Validierung eines Deep-Learning-Modells zur Quantifizierung der Glomerulosklerose in Nierenbiopsieproben
Mar 29, 2022
Kontakt:joanna.jia@wecistanche.com/ WhatsApp: 008618081934791
EinführungMehr als 100 000 Patienten warten derzeit auf aNierentransplantation.1 Trotz des wachsenden Bedarfs werden zwischen 17 % und 20 % der für die Transplantation gewonnenen Nieren entsorgt.2-4 Angesichts des Organmangels und der steigenden Nachfrage nachNierentransplantationen, besteht eine dringende Notwendigkeit, unnötige Organverwerfungen zu verringern.3
Das Biopsieergebnis gilt als der wichtigste Faktor bei der Entscheidung, die Niere eines Spenders zu verwenden oder zu entsorgen.5 Zahlreiche Untersuchungen haben einen Zusammenhang mit chronischen Schäden beim Spender hergestelltNierenbiopsieprobenmit Transplantationsergebnissen.6-12 Ein Niveau von 20 ProzentGlobale Glomerulosklerosewird häufig als Schnittpunkt bei der Entscheidung zur Transplantation verwendet und ist ein wesentlicher Faktor dafür, warum das Biopsieergebnis der häufigste Grund dafür ist, dass ein Organ in den Vereinigten Staaten für eine Transplantation abgelehnt wird.4
Jüngste Studien zeigen, dass akzeptable Nieren aufgrund unterschiedlicher und inkonsistenter Interpretationen von Spenderbiopsieproben verworfen werden.3,13,14 Sogar eine scheinbar einfache Metrik wie der ProzentsatzGlobale Glomeruloskleroseunterliegt erheblichen menschlichen Schwankungen.15-17 Das Einfrieren von Artefakten, Mangel an Fachkenntnissen, unzureichende Stichproben und die zeitkritische Natur dieser Bewertungen tragen alle zu menschlichen Fehlern bei.
Kürzlich hat Deep Learning (DL) das Potenzial gezeigt, die Reproduzierbarkeit und Genauigkeit bei histopathologischen Untersuchungen zu verbessern.18-26 Frühere Studien aus anderen Labors haben DL-Ansätze zur automatisierten Erkennung von nicht-sklerotischen und global sklerotischen Glomeruli verwendet.27-31Allerdings , beruhen diese Techniken auf speziellen Färbungen wie Periodsäure-Schiff- oder Masson-Trichrom-Färbungen, die in der zeitkritischen Einstellung von Gefrierschnitten unpraktisch sind. Frühere Arbeiten von Mitgliedern unserer Gruppe beschreiben unseres Wissens nach die einzigen gemeldeten Ergebnisse, die eine hohe Leistung für die automatisierte Quantifizierung von Prozent zeigenGlobale Glomeruloskleroseunter Verwendung von Whole-Slide-Bildern (WSIs) von mit Hämatoxylin-Eosin gefärbten Gefrierschnitten.

cistanche gutes Bodybuilding: zur Stärkung der Nieren
Wir vermuten, dass ein DL-Ansatz für die Untersuchung des SpendersNierenbiopsieprobenübertrifft Humanpathologen bei der ProzentauswertungGlobale Glomeruloskleroseund dass eine weitere Verbesserung ermöglicht wird, indem mehrere Schnittebenen untersucht werden. Es wird angenommen, dass diese erhöhte Gewebeentnahme die Wahrscheinlichkeit einer unnötigen Organentsorgung verringert und die Frage beantwortet, ob DL-Techniken mit einer wesentlichen Erhöhung des verfügbaren Spenderorganpools verbunden sind.
Schlüsselwörter:Glomerulosklerose,Niere, Nierenbiopsieproben, Nierentransplantation, globale Glomerulosklerose
MethodenDiese Studie folgte der TRIPOD-Berichtsleitlinie für diagnostische und prognostische Studien. Diese Studie wurde vom Institutional Review Board der Washington University überprüft und genehmigt, das auch auf die Notwendigkeit der Einholung einer informierten Patienteneinwilligung verzichtete, da in dieser Studie nur nicht identifizierbare Bioproben aus einem vorhandenen Datensatz verwendet wurden.
DatensammlungDie WSIs wurden von Biopsieproben verstorbener Spender gewonnen – 98 mit Hämatoxylin-Eosin gefärbte Gefrierschnitte und 51 permanente Schnitte –, die von insgesamt 83 entnommen wurdenNierenindem sowohl Keil- als auch Nadelproben verwendet werden. Gefrierschnitt-Biopsieproben und Dauerschnitt-Biopsieproben wurden von verschiedenen Nieren erhalten. Von 83 Exemplaren hatten 62 mindestens 2 Schnittebenen. Biopsieprobenbilder aus der Datenbank der Washington University stammen von Gift of Life Michigan (abgerufen zwischen August 2015 und November 2016 mit einem Sakura-Scanner; Vergrößerung 20-fach) und der Washington University (abgerufen zwischen Juni 2015 und Juni 2017 über Mid-America Transplant unter Verwendung einer Aperio Scanscope CS-Scanner; Vergrößerung 20-fach). Jeder verstorbene Organspender, der zwischen diesen Daten vorstellig wurde und sich aNierenbiopsiefür die digitale intraoperative pathologische Untersuchung war für diese Studie geeignet. Die demografischen Merkmale und klinischen Merkmale der Spender waren den Ermittlern nicht bekannt. Alle Scans wurden bei voller Auflösung (0,5 μm/Pixel) vom SVS- in das TIFF-Format konvertiert. Die Bildgrößen reichten von 105 Megapixel bis 1448 Megapixel.
DatenanmerkungDie Objektträger wurden zunächst von einem staatlich geprüften Experten für nicht sklerotische und sklerotische Glomeruli kommentiertNierePathologe (PW oder JPG), überarbeitet von einem zweiten staatlich geprüften Pathologen (TCL) mit Erfahrung in der Interpretation von SpendernNierenbiopsieproben, gefolgt von einer abschließenden Überarbeitung durch einen anderen vom Vorstand zertifizierten ExpertenNierePathologe (PCW oder JPG). Die endgültigen überarbeiteten Anmerkungen dienten als Grundwahrheit (dh als Goldstandard) für Modelltraining und -evaluierung. Typische Schwankungen der Glomerulizahlen bei jeder Revision sind in eAbbildung 1 im Anhang dargestellt. Ein internes Plug-in, das für Fiji32 geschrieben wurde, wurde verwendet, um Glomeruli auf jedem WSI manuell zu skizzieren und zu klassifizieren, um pixelweise Etikettenmasken von Glomerulusregionen mit derselben Auflösung wie das übergeordnete WSI zu generieren. Glomeruli wurden entweder als global sklerotisch (definiert als Sklerose, die das gesamte glomeruläre Büschel betrifft, einschließlich veraltet, verfestigt und verschwindend) klassifiziertglobale Glomerulosklerose)oder nicht global sklerotisch. Alle anderen Bereiche wurden zusammengefasst und als Tubulointerstitium bezeichnet. Insgesamt 1544 global sklerosierte und 6914 nicht global sklerosierte Glomeruli wurden in 149 separaten Bildern markiert. Die Biopsieproben zeigten einen weiten prozentualen BereichGlobale Glomerulosklerose(0 Prozent -77 Prozent ). Die mittlere (SD) Anzahl an Glomeruli pro Objektträger betrug 57 (31).
DL-ModellarchitekturDas in dieser Studie verwendete DL-Modell war ein vollständig konvolutionelles neuronales Netzwerk basierend auf der in früheren Arbeiten beschriebenen VGG16-Architektur33, an der ein Mitglied unserer Gruppe beteiligt war.34 Kurz gesagt, Daten wurden in das vortrainierte VGG16-basierte Netzwerk mit unten eingefrorenen Gewichten eingegeben dem Flaschenhals (dh unmittelbar vor den dicht verbundenen Klassifikationsschichten). Die dicht verbundenen VGG16-Klassifizierungsschichten wurden durch 5 vollständig gefaltete Schichten mit trainierbaren Gewichten ersetzt. Die Verwendung einer vollständig konvolutionellen Architektur durch das gesamte Netzwerk ermöglichte eine "Bild-zu-Bild"-Transformation anstelle einer "Bild-zu-Etikett"-Transformation für jeden Eingabebildfleck, wobei letzteres ein Ansatz ist, der weniger genau und viel mehr ist rechenaufwändig.34 Das vollständig gefaltete Modell generierte heruntergerechnete Pixelkarten, die auf den Eingabebildfleck registriert waren, was die Wahrscheinlichkeit angab, dass jedes Ausgabepixel Tubulointerstitium, nicht global sklerosierter Glomerulus oder global sklerosierter Glomerulus war.
TrainingsparameterBilder wurden in 2048 × 2048- Pixel (1024 × 1024 μm) teilweise überlappende Bildfelder (Schrittweite, 1664 Pixel oder 838 μm) für die Trainingseingabe zerlegt. Patches wurden für das Training ausgewählt, indem zufällig aus dem gesamten Pool von Bildpatches (ungefähr 6500 Patches in jedem Cross-Validation-Trainingssatz, die Länge einer einzelnen Epoche) ausgewählt wurden. Eingabepatches wurden zufällig gespiegelt oder gedreht (um 0 Grad, 90 Grad, 180 Grad oder 270 Grad), was zu einer 8--fachen Vermehrung der Trainingsdaten für insgesamt etwa 52 000 mögliche Trainingspatches im führte Probenpool. Das Training wurde mit TensorFlow durchgeführt, indem der kategoriale Kreuzentropieverlust minimiert und klassenweise unter Verwendung eines Verhältnisses von sklerosierten zu nicht sklerosierten zu tubulointerstitiellen Kategorien von 10:5:1 gewichtet wurde, um das Klassenungleichgewicht auszugleichen. Stochastische Gradientenabstiegsoptimierung wurde mit einer zyklischen Lernrate zwischen 1e-4 und 1e-2 und einer Stapelgröße von 4 für 15 Epochen verwendet.
KreuzvalidierungDas Modell wurde in 10--facher Kreuzvalidierung trainiert und getestet, wobei 10 % der WSIs in jeder Faltung vom Training ausgeschlossen wurden, und das resultierende Modell (das mit den verbleibenden 90 % der Daten trainiert wurde) wurde verwendet, um Vorhersagen zu generieren auf den zurückgehaltenen WSIs. Bilder aus verschiedenen Ebenen des gleichenNierewurden immer zusammen ausgetragen. Es wurden keine Informationen aus einem Testsatz einer Kreuzvalidierungsfaltung verwendet, um das Training der entsprechenden Faltung zu informieren. Vorhersagen für zurückgehaltene Objektträger wurden stückweise gemäß dem oben beschriebenen Bildwürfelschema generiert (dh 2048 × 2048-Pixel-Felder mit 1664- Pixelschritten), und die Ergebnisse wurden wieder zusammengesetzt, um Ausgabewahrscheinlichkeitskarten für ganze WSIs zu erstellen.
NachbearbeitungZur Lokalisierung einzelner Glomeruli aus den Wahrscheinlichkeitskarten wurde ein Standard-Laplace-Algorithmus für die Erkennung von Gaußschen Blobs verwendet, der gut geeignet ist, um kreisförmige Regionen mit hoher Bildintensität in mehreren Maßstäben zu identifizieren. ProzentGlobale Glomerulosklerosewurde mit der Formel 100 × S/N berechnet, wobei S die Anzahl der global sklerosierten Glomeruli und N die Gesamtzahl der Glomeruli ist.

Statistische AnalyseDie pixelweise Übereinstimmung zwischen Annotations- und Vorhersagewahrscheinlichkeitskarten wurde über den Dice-Koeffizienten und die Schnittpunkt-über-Union-Metrik quantifiziert, die aggregiert für alle Pixel in jedem Ausgabelabel berechnet wurden. Glomeruli-Zählungen wurden nach Blob-Erkennungsverarbeitung auf sklerosierten und nicht sklerosierten Wahrscheinlichkeitskartenkanälen erhalten. ProzentGlobale Glomerulosklerosewurde aus diesen Zählungen für einzelne Bilder und für einzelne berechnetNieren, indem Zählungen für alle Ebenen (normalerweise 2) gepoolt werden, die jeder zugeordnet sindNiere.Die Anzahl der Glomeruli wurde mit der Grundwahrheit der Annotation verglichen, wobei die Genauigkeit anhand des Pearson-Korrelationskoeffizienten r und des quadratischen Mittelwertfehlers (RMSE) bewertet wurde. Entsprechende Mengenangaben für ProzentGlobale Glomerulosklerosewurden für die Schätzungen von Pathologen auf Abruf berechnet, und diese Werte wurden mit der Leistung des Modells verglichen.
Kategorisierung vonNierenals "akzeptabel" für die Transplantation oder "abgelehnt" wurde bei 20 Prozent festgestelltGlobale Glomerulosklerose, ein häufig verwendeter Grenzwert in der aktuellen klinischen Praxis, der auf historischen Daten basiert. Ein F1-Score wurde als Funktion der korrekten Unterscheidung berechnet, ob eine Stichprobe in Bezug auf Ground-Truth-Anmerkungen über oder unter dem 20-Prozent-Grenzwert lag. Der Cohen-κ-Koeffizient (ein Indikator für die Übereinstimmung zwischen Bewertern) wurde auch für die Unterscheidung des Modells und der Bereitschaftspathologen am 20-Prozent-Grenzwert im Vergleich zur Ground-Truth-Annotation und untereinander berechnet.
Denn die Definition vonGlobale Glomerulosklerosenatürlich als Mittelwert einer Beta-Verteilung ausgedrückt wird, die durch die Parameter S (Anzahl der global sklerosierten Glomeruli) und (N – S) (Anzahl der nicht global sklerosierten Glomeruli) gegeben ist, wurde sie verwendet, um 95-Prozent-Vorhersageintervalle zu berechnen, die als Indikator für dienen Ausgabepräzision. Ein 2-seitiges P < .05="" wurde="" als="" statistisch="" signifikant="" angesehen.="" alle="" statistischen="" analysen="" wurden="" von="" märz="" 2018="" bis="" august="" 2020="" mit="" den="" python-paketen="" scikit-learn,="" version="" 0.22.1,="" und="" scipy.stats,="" version="" 1.4.1="">
Ergebnisse
AusgabevisualisierungDie vorhergesagten Bildausgaben für WSIs mit gefrorenem Schnitt und permanentem Schnitt zeigten eine qualitative Übereinstimmung mit Zielannotationskarten (Abbildung 1). Die aggregierten Dice-Koeffizienten waren 0,784 für nicht global sklerosierte Glomeruli und 0,600 für global sklerosierte Glomeruli; aggregierte Schnittmenge über Vereinigungsmetriken für dieselben Gruppen betrugen 0,645 für nicht global sklerosierte Glomeruli und 0,429 für global sklerosierte Glomeruli. Bemerkenswerterweise zeigten sogar gefrorene Schnitte mit erheblichen Artefakten eine qualitative visuelle Übereinstimmung zwischen der Grundwahrheit der Annotation und den Vorhersagen (Beispiel in Abbildung 1A).
Bewertung des Prozentsatzes der globalen Glomerulosklerose basierend auf einzelnen ObjektträgernKreuzvalidiertGlomeruloskleroseVorhersagen auf einzelnen Objektträgern zeigten auch eine Korrelation mit Anmerkungen (r {{0}}.916; 95-Prozent-KI, 0.886-0.939; und RMSE=5.631 ; 95-Prozent-KI, 4,{{10}},517; P < ,001)="" (abbildung="" 2a).="" die="" trennung="" der="" ergebnisse="" nach="" objektträgerpräparationstechnik="" zeigte,="" dass="" vorhersagen="" auf="" gefrorenen="" schnitten="" eine="" ähnliche="" korrelation="" mit="" der="" grundwahrheit="" zeigten="" (r="0,918;" 95 prozent-ki,="" 0,879-0,944;="" rmse="" {{="" 20}}.20;="" p="">< .001)="" (eabbildung="" 3a="" im="" anhang),="" während="" die="" permanente="" gruppe="" eine="" höhere="" leistung="" zeigte="" (r="0.940;" 95-prozent-ki,="" 0,896-0.965;="" rmse="4.32;" p="">< .001)="" (eabbildung="" 3d="" im="" anhang).="" die="" gesamtzahl="" der="" vom="" modell="" erkannten="" glomeruli="" ist="" in="" abbildung="" 3a="" und="" b="" dargestellt="" und="" veranschaulicht="" die="" korrelationen="" von="" nicht="" global="" sklerosierten="" glomeruli="" mit="" der="" grundwahrheit="" (r="0.955;" 95-prozent-ki,="" 0,938-0.967="" ;="" rmse="8.383;" p="">< .001)="" und="" global="" sklerosierte="" glomeruli="" mit="" ground="" truth="" (r="0.934;" 95="" %="" ci,="" 0.909-0.952;="" rmse="" {{50="" }}.718;="" p="">< .001).="" die="" mittleren="" (sd)="" unterschiede="" in="" der="" anzahl="" der="" glomeruli="" zwischen="" annotation="" und="" vorhersage="" betrugen="" 3,1="" (7,8)="" für="" nicht="" global="" sklerosierte="" glomeruli="" und="" 0,2="" (4,7)="" für="" global="" sklerosierte="" glomeruli.="" ähnliche="" positive="" ergebnisse="" für="" die="" vorhergesagte="" anzahl="" von="" glomeruli="" wurden="" beobachtet,="" als="" die="" objektträger="" nach="" behandlung="" getrennt="" wurden="" (eabbildung="" 2a,="" b,="" e="" und="" f="" im="">

Bewertung des Prozentsatzes der globalen Glomerulosklerose basierend auf gepoolten Objektträgern Die Pooling-Ebenen verbesserten die Glomeruli-Zählleistung des Modells (Abbildung 3C und D; eAbbildung 2C, D, G und H im Anhang) sowie die Glomerulosklerose-Korrelation mit Anmerkungen, wie in Abbildung 2B gezeigt ( r=0,933; 95-Prozent-KI, 0,898-0,956; und RMSE=5,094; 95-Prozent-KI, 3,{{ 13}}.301; P < .001,="" für="" kombinierte="" gefrorene="" und="" permanente="" schnitte),="" wodurch="" die="" leistung="" der="" pathologen="" auf="" abruf="" bei="" denselben="" fällen="" verbessert="" wurde="" (r="0.884;" 95 prozent-ki,="" 0,{{21}="" }.923="" und="" rmse="6.523;" 95-prozent-ki,="" 5.191-7.783;="" p="">< .001)="" (abbildung="" 2c).="" der="" durch="" rmse="" gemessene="" globale="" glomerulosklerose-fehler="" war="" für="" das="" modell="" um="" 22="" prozent="" niedriger="" als="" für="" bereitschaftspathologen.="" die="" übereinstimmung="" zwischen="" den="" vorhersagen="" des="" modells="" zur="" globalen="" glomerulosklerose="" für="" einzelne="" und="" gepoolte="" stufen="" ist="" in="" eabbildung="" 4="" im="" anhang="" als="" residuum="" in="" bezug="" auf="" die="" grundwahrheit="" der="" anmerkung="">

Behandlung von Geschlechtsnierenerkrankungen
Bewertung des Nierenfehlcharakterisierungsrisikos Die gepoolten prozentualen globalen Glomerulosklerose-Ergebnisse für die Anmerkungen, Modellvorhersagen und Bereitschaftspathologen wurden sortiert und in der Reihenfolge zunehmender prozentualer globaler Glomerulosklerose für alle 83 in die Studie eingeschlossenen Nieren zusammen mit den entsprechenden 95-Prozent-Vorhersageintervallen und dargestellt der 20-Prozent-Grenzwert für die Akzeptanz oder Ablehnung von Spenderorgantransplantaten (Abbildung 4B-F). Da alle Ebenen des Schnitts zum Zeitpunkt der Biopsie von den diensthabenden Pathologen ausgewertet werden, gelten ihre Ergebnisse als gepoolte Auswertungen. Bei Nieren mit Vorhersageintervallen, die die 20-Prozent-Grenzlinie überlappen, besteht ein höheres Risiko für eine fehlerhafte Annahme oder Ablehnung, wenn die Anzahl der Glomeruli falsch geschätzt wird. Die Wahrscheinlichkeit, dass eine Niere mit mehr als 20 Prozent globaler Glomerulosklerose fälschlicherweise kategorisiert wird, ist in Abbildung 4A dargestellt. Unter Verwendung einzelner Objektträger war die prognostizierte Fehlerrate des DL-Modells 15 Prozent niedriger als bei Bereitschaftspathologen und nahezu identisch mit Ground-Truth-Anmerkungen (dh dem Idealfall). Mit gepoolten Ebenen sank die prognostizierte Fehlerrate des DL-Modells auf 37 Prozent niedriger als die für die Bereitschaftspathologen. In ähnlicher Weise war die prognostizierte Fehlerrate des DL-Modells für eine fehlerhafte Organakzeptanz bei Verwendung individueller Konzentrationen um 21 Prozent niedriger als die für Pathologen im Bereitschaftsdienst und um 34 Prozent niedriger, wenn gepoolte Konzentrationen verwendet wurden.
Der F1-Score und Cohen κ zeigten ähnliche Ergebnisse. Die F1-Punktzahl des DL-Modells für einzelne EbenenGlobale Glomeruloskleroseunter 20 Prozent betrug 0,896 und 0,950 für die individuellen Werte über 20 Prozent. Diese Metriken verbesserten sich beim Pooling auf 0,926 für diejenigen unter 2{{20}} Prozent und 0,964 für diejenigen über 20 Prozent . Dies ist im Vergleich zu den F1-Werten für Bereitschaftspathologen von 0,852 für diejenigen unter 20 Prozent und 0,929 für diejenigen über 20 Prozent günstig. Cohen κ für die Modellvorhersagen auf individuellen Ebenen in Bezug auf die Grundwahrheit betrug 0,847 und verbesserte sich auf 0,891 für gepoolte Ebenen. Cohen κ für

Bereitschaftspathologen in Bezug auf gepoolte Anmerkungen war mit einem Wert von 0,781 niedriger und betrug 0,714 im Vergleich zu den Vorhersagen auf gepoolter Ebene des Modells. Die Übereinstimmung zwischen Pathologen- und Modellergebnissen für Ergebnisse auf gepoolter Ebene ist in eAbbildung 5 im Anhang als Residuum in Bezug auf Ground Truth, sortiert nach Ground Truth, dargestelltGlobale GlomeruloskleroseProzentsatz und Gesamtzahl der Glomeruli. Der Wert der mehrstufigen Betrachtung wird durch die Auswertung der Vorhersageintervalle aus der Beta-Verteilung aufgezeigt. Eine Illustration der Beta-Verteilung für eine hypothetische Biopsieprobe mit 15 ProzentGlobale Glomeruloskleroseist in Abbildung 5A für Pools von 1, 2, 3 und 4 Ebenen gezeigt, wobei angenommen wird, dass jede Ebene 58 beobachtete Glomeruli aufweist (die mittlere Anzahl für diese Studie). Die Höhe jeder Kurve bei einem gegebenen Wert auf der horizontalen Achse kann als relative Wahrscheinlichkeit der Prozentschätzung interpretiert werdenGlobale Glomerulosklerosedieser Wert sein, angesichts der wahren Verteilung von sklerosierten und normalen Glomeruli. Die Fläche unter der Kurve liefert somit eine Schätzung der Wahrscheinlichkeit des ErhaltensGlobale GlomeruloskleroseSchätzungen innerhalb der Integrationsgrenzen. Die Verteilung verengte sich mit zunehmender Bündelung. Noch wichtiger ist, dass die normalisierte Fläche unter der Kurve über den nominellen 20-Prozent-Abstoßungsgrenzwert hinaus von 14 Prozent bei Verwendung von nur einer Stufe auf 2 Prozent bei der Zusammenfassung von 4 Stufen abnahm (Abbildung 5B), eine 7--fache Verringerung der Wahrscheinlichkeit für falsch überschätztGlobale Glomeruloskleroseund fälschlicherweise weggeworfen, was ein brauchbares Organ sein sollte. Um die Vorteile des Level-Pooling weiter zu veranschaulichen, zählen Glomeruli für 1000 zufällig ausgewählte Auswertungen von Spenderbiopsieproben (aus derselben Datenbank wie die 83Nierenbiopsieprobenin dieser Studie verwendet) wurden verwendet, um die Auswirkungen des Level-Poolings für eine große Population zu simulieren. Das

Schätzungen von Pathologen im Bereitschaftsdienst wurden als Ersatz für die Zählung der Glomeruli auf Grundwahrheit verwendet, und das Datenpooling wurde simuliert, indem die gemeldeten Zählungen pro Level mit der Anzahl der simulierten Levels im Pool multipliziert wurden. Wendet man die oben beschriebene Analyse auf dieses Szenario an, ergibt sich die Zahl der irrtümlichen Organentwürfe pro 1000Nierenwould decrease from 31 to 13 by increasing the number of levels evaluated from 1 to 4 (Figure 5C). As a demonstration of the potential clinical workflow with the incorporation of DL techniques, the DL model's predicted annotations for 25 cases from the study data set were randomly selected (5 each with 0%-5%, 6%-10%, 11%-15%, 16%-20%, and >20 Prozent globale Glomerulosklerose) und wurden einem Pathologen vorgelegt, der die histologischen Bilder mit überlagerten modellgenerierten Glomeruli-Klassifikationen auswertete. Der Pathologe korrigierte dann alle übersehenen oder ungenau markierten Glomeruli in einer Art und Weise und einem Zeitrahmen, der mit der gegenwärtigen klinischen Praxis vereinbar ist. Die vom Pathologen ergänzte Auswertung korrelierte besser mit der Wahrheit (r=0.958) und hatte einen geringeren Fehler (RMSE=4.352) als entweder der Pathologe auf Abruf (r=0. 613; RMSE=0.898) oder das DL-Modell allein (r=0.847; RMSE=7.535) (eAbbildung 7 im Anhang).

Diskussion
Das DL-Modell lieferte ermutigende Ergebnisse sowohl in qualitativen (visuellen) als auch in quantitativen Befunden und rekapitulierte Ergebnisse, die in früheren Arbeiten von Mitgliedern unserer Gruppe an einem kleineren Trainingsset beschrieben wurden - Nennen Sie die Leistung von Pathologen. Die Zeit, die das Modell benötigte, um eine individuelle WSI zu verarbeiten, betrug ungefähr 5 Minuten, was gut innerhalb der typischen Einschränkungen einer intraoperativen Konsultation in der Pathologie liegt.
Die Vergrößerung von Zählfehlern bei Verwendung einer kleinen Stichprobe hebt den Wert hervor, der durch das Poolen von Ergebnissen aus mehreren Ebenen gewonnen wird, die aus einer einzigen erhalten werdenNierenbiopsie.Die typische Dicke eines SpendersNierenbiopsieProbe ist 1 mm. Der Pathologe untersucht nur einen repräsentativen 5- μm dicken Abschnitt dieses Gewebes und lässt einen erheblichen Teil unbewertetNiereungeprüft. Obwohl die in den nachfolgenden Abschnitten entnommenen Glomeruli möglicherweise nicht unabhängig voneinander sind, kann der Objektträgervorbereitungsprozess zu einer erheblichen Variabilität der globalen Glomerulosklerose von Abschnitt zu Abschnitt führen, unabhängig von der Variabilität des Beobachters (eAbbildung 6 im Anhang). Durch die Auswertung von mehr Gewebeschnitten kann der Effekt dieser Variabilität minimiert und die Zuverlässigkeit der Auswertung der Biopsieproben verbessert werden. Dieser Vorteil wird in der vorliegenden Studie für jede Metrik deutlich beobachtet (Abbildungen 2-4), die alle eine Verbesserung bei der Untersuchung von zusätzlichem Gewebe zeigten.
Der derzeitige Behandlungsstandard erfordert die Bewertung von nur 25 Glomeruli und 1 bis 2 Schnittebenen, da mehr Bewertungen durch Humanpathologen im zeitkritischen Kontext der Organtransplantation praktisch nicht möglich sind. Der Einsatz von DL-Techniken zur Steigerung der menschlichen Leistungsfähigkeit in diesem Umfeld könnte dem Spenderpool lebenswichtig benötigte Organe hinzufügen. Ein möglicher klinischer Arbeitsablauf mit der Einbeziehung von DL-Techniken könnte wie folgt aussehen: Eine Probe kommt im Labor für Gefrierschnitte an, wo ein Objektträger für Gefrierschnitte präpariert und gescannt wird. Die WSI wird dann zur Analyse unter Verwendung des DL-Modells an einen sicheren Ort hochgeladen. Während das DL-Modell analysiert, kann sich der Pathologe anmelden und die Probe auf andere relevante Befunde überprüfen. Das Ergebnis des DL-Modells wäre innerhalb von 5 bis 10 Minuten verfügbar, würde dem Pathologen als grafische Überlagerung der Glomeruli-Klassifikationen auf dem Histologiebild präsentiert, dann vom Pathologen überprüft (und gegebenenfalls geändert) und in den Bericht aufgenommen. Der eigentliche Bericht würde direkt mit der klinischen elektronischen Patientenakte verbunden.

EinschränkungenEs gibt einige Einschränkungen für diese Studie. Es handelte sich um eine monozentrische Studie. Obwohl die WSIs mit 2 Scannern an 2 Institutionen generiert wurden, wurde der Datensatz mit gefrorenen Schnitten vollständig an 1 Institution generiert, während der Datensatz mit permanenten Schnitten von einer anderen generiert wurde. Obwohl ein kleiner vorläufiger Datensatz (n=17) darauf hindeutete, dass Modellvorhersagen für Gefrierschnitte eine angemessene Übereinstimmung mit den zugehörigen permanenten Schnitten aufwiesen und dass das Modell diensthabende Pathologen bei diesen Gefrierschnitten übertraf (eAbbildung 8 im Anhang), ist dies der Fall Die Studie befasste sich nicht direkt mit der separaten Frage, wie genau die gefrorenen Schnitte (sowie deren Beurteilungen durch Pathologen) mit dauerhaften Schnitten übereinstimmten, die später von derselben Biopsieprobe entnommen und verarbeitet wurden.
Der Datensatz war im Vergleich zu anderen DL-Studien klein. Insgesamt wurden jedoch fast 8500 Glomeruli untersucht, eine relativ hohe Zahl. Die Einschränkung bei der Auswertung größerer Fallzahlen liegt im zeitaufwändigen Prozess der seriellen Kommentierung von WSIs. Um die Robustheit dieses Modells weiter zu bewerten, sind zusätzliche Studien erforderlich, in denen das Modell unter Verwendung von WSIs getestet wird, die von zusätzlichen Labors und Scannern generiert wurden.
SchlussfolgerungenDiese prognostische Studie ergab eine bessere Leistung für die Quantifizierung von ProzentGlobale Glomeruloskleroseaus WSIs von gefrorenem und permanentem Hämatoxylin-Eosin-gefärbtem SpendertransplantatNierenbiopsieprobendurch ein DL-Modell als durch vom Bereitschaftsrat zertifizierte Pathologen. Die Leistung wurde weiter verbessert, indem zusätzliche Gewebeschnitte untersucht wurden, ein Prozess, der aufgrund der zeitkritischen Natur der Auswertung von Spenderbiopsieproben die Kapazität von Pathologen übersteigt. Die Ergebnisse zeigten eine verringerte Wahrscheinlichkeit einer falschen Charakterisierung von ProzentGlobale Glomerulosklerosebei der Verwendung des DL-Modells, wodurch die Wahrscheinlichkeit einer unangemessenen Verwerfung eines Spenderorgans oder der Verwendung eines suboptimalen Organs verringert wird. Die Ergebnisse veranschaulichen die erheblichen Vorteile, die mit DL-Methoden in der klinischen Praxis der chirurgischen Pathologie erzielt werden könnten.

