Georges Natsoulis, Nancy Zhang, Katrina Welch, John Bell und Hanlee P Ji
Wir haben die Möglichkeiten der tiefen, gezielten Sequenzierung von Sequenzern der nächsten Generation genutzt und einen neuartigen zweistufigen Algorithmus zur Erkennung von Insertionen und Deletionen (Indels) (IDA) entwickelt, der Indels aus einzelnen Lesesequenzen mit hoher Rechenleistung und Empfindlichkeit bestimmen kann, wenn die Indels geringfügig kleiner sind als die Wildtyp-Referenzsequenz. Zunächst identifiziert er mögliche Indelpositionen unter Verwendung spezifischer Sequenzalignment-Artefakte, die von schnellen Alignment-Programmen erzeugt werden. Zweitens bestätigt er die Position des möglichen Indels durch Verwendung des Smith-Waterman-Algorithmus (SW) auf einer eingeschränkten Teilmenge von Sequenz-Reads. Wir zeigen, dass IDA auf Indels unterschiedlicher Größe aus tiefen, gezielten Sequenzierungsdaten bei niedrigen Fraktionen anwendbar ist, bei denen das Indel durch die Wildtyp-Sequenz verdünnt ist. Unser Algorithmus ist nützlich zum Erkennen von Indelvarianten, die bei variablen Allelfrequenzen vorhanden sind, wie sie in Heterozygoten und gemischtem Normal-Tumor-Gewebe auftreten können.