Xiaoli Jiao, Xin Zheng, Liang Ma, Geetha Kutty, Emile Gogineni
PacBio RS, eine neu entstehende DNA-Sequenzierungsplattform der dritten Generation, basiert auf einer Echtzeit-, Einzelmolekül-, Nano-Nitch-Sequenzierungstechnologie, die im Gegensatz zu den kürzeren Reads der Sequenzierungstechnologien der ersten und zweiten Generation sehr lange Reads (bis zu 20 kb) generieren kann. Da es sich um eine neue Plattform handelt, ist es wichtig, die Sequenzierungsfehlerrate sowie die Qualitätskontrollparameter (QC) zu bewerten, die mit den PacBio-Sequenzdaten verbunden sind. In dieser Studie wurde eine Mischung aus 10 bereits bekannten, eng verwandten DNA-Amplikons mithilfe der PacBio RS-Sequenzierungsplattform sequenziert. Nachdem wir die aus dem obigen Sequenzierungsexperiment abgeleiteten Circular Consensus Sequence (CCS)-Reads mit den bekannten Referenzsequenzen abgeglichen hatten, stellten wir fest, dass die mittlere Fehlerrate ohne Read-QC 2,5 % betrug und sich mit einer auf SVM basierenden Multiparameter-QC-Methode auf 1,3 % verbesserte. Darüber hinaus wurde eine De-Novo-Assemblierung als Downstream-Anwendung verwendet, um die Auswirkungen verschiedener QC-Ansätze zu bewerten. Diese Benchmark-Studie zeigt, dass es trotz der nachträglichen Fehlerkorrektur bei CCS-Reads immer noch notwendig ist, eine angemessene Qualitätskontrolle bei CCS-Reads durchzuführen, um erfolgreiche Downstream-Ergebnisse in der Bioinformatik zu erzielen.