Curtis Davis, Karthik Kota, Venkat Baldhandapani, Wei Gong, Sahar Abubucker, Eric Becker, John Martin, Kristine M. Wylie, Radhika Khetani, Matthew E. Hudson, George M. Weinstock Weinstock und Makedonka Mitreva
Die jüngsten Fortschritte bei Sequenzierungstechnologien der nächsten Generation erfordern Alignment-Algorithmen und Software, die mit der erhöhten Datenproduktion Schritt halten können. Standardalgorithmen, insbesondere Proteinähnlichkeitssuchen, stellen erhebliche Engpässe in Analysepipelines dar. Insbesondere für metagenomische Ansätze ist es heute oft notwendig, Hunderte Millionen Sequenzablesungen in großen Datenbanken zu durchsuchen. Hier beschreiben wir mBLAST, einen beschleunigten Suchalgorithmus für übersetzte und/oder Proteinalignments in großen Datensätzen, der auf dem Basic Local Alignment Search Tool (BLAST) basiert und die hohe Empfindlichkeit von BLAST beibehält. Die mBLAST-Algorithmen erreichen eine erhebliche Geschwindigkeitssteigerung gegenüber den Programmen BLASTX, TBLASTX und BLASTP des National Center for Biotechnology Information (NCBI) für große Datensätze und ermöglichen Analysen innerhalb angemessener Zeitrahmen auf Standardcomputerarchitekturen. In diesem Artikel wird die Wirkung von mBLAST anhand von Sequenzen demonstriert, die aus der Mikrobiota gesunder Menschen aus dem Human Microbiome Project stammen. mBLAST ist als Plug-in-Ersatz für BLAST für alle Studien konzipiert, die Sequenzen mit kurzen Leselängen beinhalten und Hochdurchsatzanalysen umfassen. Die mBLAST-Software ist für akademische Benutzer kostenlos unter www.multicorewareinc.com verfügbar.