Sally Yepes und Maria Mercedes Torres
Angesichts der Heterogenität des klinischen Verhaltens von Krebspatienten mit identischer histopathologischer Diagnose ist die Suche nach nicht erkannten molekularen Subtypen, subtypspezifischen Markern und die Bewertung ihrer klinisch-biologischen Relevanz eine Notwendigkeit. Diese Aufgabe profitiert heute von den Hochdurchsatz-Genomtechnologien und dem freien Zugang zu den von den internationalen Genomprojekten und den Informationsrepositorien generierten Datensätzen. Strategien des maschinellen Lernens haben sich bei der Identifizierung versteckter Trends in großen Datensätzen als nützlich erwiesen und tragen zum Verständnis der molekularen Mechanismen und der Subtypisierung von Krebs bei. Die Übertragung neuer molekularer Subklassen und Biomarker in klinische Umgebungen erfordert jedoch ihre analytische Validierung und klinische Studien, um ihren klinischen Nutzen zu bestimmen. Hier geben wir einen Überblick über den Arbeitsablauf zur Identifizierung und Bestätigung von Krebssubtypen, fassen verschiedene methodische Prinzipien zusammen und heben repräsentative Studien hervor. Die Generierung öffentlicher Big Data zu den häufigsten bösartigen Erkrankungen macht die Molekularpathologie zu einer datenbankgesteuerten Disziplin.