Shashank Reddy Vadyala
Die Koloskopie wird zur Vorsorgeuntersuchung auf Dickdarmkrebs (CRC) eingesetzt. Durch die Extraktion von Details der Koloskopiebefunde aus Freitext in elektronischen Gesundheitsakten (EHRs) kann das Patientenrisiko für CRC und Kolorektalkarzinom-Vorsorgeuntersuchungen ermittelt werden. Wir haben die Genauigkeit eines Deep-Learning-Modellrahmens entwickelt und evaluiert, um Informationen für das klinische Entscheidungsunterstützungssystem zu extrahieren und relevante Freitextberichte, darunter Indikationen, Pathologie und Befundnotizen, zu interpretieren. Der Bio-Bi-LSTM-CRF-Rahmen wurde unter Verwendung von Bi-LSTM (Bidirectional Long Short-term Memory) und CRF (Conditional Random Fields) entwickelt, um mehrere klinische Merkmale aus diesen Freitextberichten zu extrahieren, darunter Indikationen für die Koloskopie, Befunde während der Koloskopie und Pathologie des resezierten Materials. Wir haben das Bio-Bi-LSTM-CRF- und bestehende Bi-LSTM-CRF-Modelle anhand von 80 % von 4.000 manuell annotierten Notizen von 3.867 Patienten trainiert. Diese klinischen Notizen stammten von einer Gruppe von Patienten über 40 Jahren, die in vier Veterans Affairs Medical Centres eingeschrieben waren. Insgesamt 10 % der verbleibenden kommentierten Notizen wurden zum Trainieren von Hyperparametern verwendet und die restlichen 10 % wurden verwendet, um die Genauigkeit unseres Modells Bio-Bi-LSTM-CRF zu bewerten und mit Bi-LSTMCRF zu vergleichen. Unsere Experimente zeigen, dass die bidirektionalen Encoderdarstellungen durch Integration des Wörterbuchfunktionsvektors von Bio-Bi-LSTM-CRF und des Strategie-Ansatzes zur Einbettung von Zeichenfolgen eine effektive Möglichkeit sind, Merkmale von Koloskopien aus EHR-extrahierten klinischen Notizen zu identifizieren. Das Bio-Bi-LSTM-CRF-Modell schafft neue Möglichkeiten, Patienten mit einem Risiko für Dickdarmkrebs zu identifizieren und ihre gesundheitlichen Folgen zu untersuchen.