Ilya Y. Zhbannikov, Samuel S. Hunter, Matthew L. Settles und James A. Foster
Mit dem Aufkommen der Next-Generation (NG)-Sequenzierung ist es möglich geworden, ein ganzes Genom schnell und kostengünstig zu sequenzieren. Bei manchen Experimenten muss jedoch nur ein Teil der Sequenz-Reads extrahiert und zusammengesetzt werden, beispielsweise bei der Durchführung von Transkriptomstudien, der Sequenzierung mitochondrialer Genome oder der Charakterisierung von Exomen. Mit der Roh-DNA-Bibliothek eines vollständigen Genoms scheint es ein triviales Problem zu sein, interessante Reads zu identifizieren. Es ist jedoch nicht immer einfach, bekannte Tools wie BLAST, BLAT, Bowtie und SOAP vor der Assemblierungsphase direkt in eine Bioinformatik-Pipeline zu integrieren, entweder aufgrund von Inkompatibilität mit den Dateieingaben des Assemblers oder weil es wünschenswert ist, Informationen zu integrieren, die separat extrahiert werden müssen. Um beispielsweise Flussdiagramme von einem Roche 454-Sequenzer in den Newbler-Assembler zu integrieren, müssen sie zuerst aus den ursprünglichen SFF-Dateien extrahiert werden. Wir präsentieren SlopMap, ein bioinformatisches Software-Dienstprogramm, das eine schnelle Identifizierung ähnlich bereitgestellter Zielsequenzen aus der Roche 454- oder Illumnia-DNA-Bibliothek ermöglicht. Mit einer einfachen und intuitiven Befehlszeilenschnittstelle sowie Dateiausgabeformaten, die mit Assemblerprogrammen kompatibel sind, kann SlopMap ohne zusätzliche Programmierarbeit direkt in die Pipeline zur Verarbeitung biologischer Daten eingebettet werden. Darüber hinaus bewahrt SlopMap die für den Roche 454-Assembler erforderlichen Flussdiagramminformationen auf.