Abstrakt

ToxTree: Deskriptorbasierte maschinelle Lernmodelle zur Vorhersage der hERG- und Nav1.5-Kardiotoxizität

Issar Arab, Khaled Barakat

Eine medikamentenvermittelte Blockade des spannungsgesteuerten Kaliumkanals (hERG) und des spannungsgesteuerten Natriumkanals (Nav1.5) kann zu schweren kardiovaskulären Komplikationen führen. Diese zunehmende Besorgnis spiegelt sich im Bereich der Arzneimittelentwicklung wider, da das häufige Auftreten von Kardiotoxizität bei vielen zugelassenen Arzneimitteln dazu führte, dass ihre Verwendung entweder eingestellt oder in einigen Fällen vom Markt genommen wurde. Die Vorhersage potenzieller hERG- und Nav1.5-Blocker zu Beginn des Arzneimittelentdeckungsprozesses kann dieses Problem lösen und somit den Zeit- und Kostenaufwand für die Entwicklung sicherer Arzneimittel verringern. Ein schneller und kostengünstiger Ansatz ist die Verwendung von In-silico-Vorhersagemethoden, um potenzielle hERG- und Nav1.5-Blocker in den frühen Phasen der Arzneimittelentwicklung auszusortieren. Hier stellen wir zwei robuste 2D-Deskriptor-basierte QSAR-Vorhersagemodelle für die Vorhersage der hERG- und Nav1.5-Haftung vor. Die Modelle des maschinellen Lernens wurden sowohl für Regression, Vorhersage des Wirksamkeitswerts eines Arzneimittels als auch für Mehrklassenklassifizierung bei drei verschiedenen Wirksamkeitsgrenzwerten (d. h. 1 μM, 10 μM und 30 μM) trainiert, wobei ToxTree-hERG Classifier, eine Pipeline von Random-Forest-Modellen, anhand eines großen kuratierten Datensatzes mit 8380 einzigartigen molekularen Verbindungen trainiert wurde. ToxTree-Nav1.5 Classifier, eine Pipeline von kernelisierten SVM-Modellen, wurde hingegen anhand eines großen manuell kuratierten Satzes mit 1550 einzigartigen Verbindungen trainiert, die aus den öffentlich verfügbaren Bioaktivitätsdatenbanken ChEMBL und PubChem abgerufen wurden. Das hERG-Modell ergab eine Mehrklassengenauigkeit von Q4 = 74,5 % und eine binäre Klassifizierungsleistung von Q2 = 93,2 %, Sensitivität = 98,7 %, Spezifität = 75 %, MCC = 80,3 % und einen CCR = 86,8 % bei einem externen Testsatz mit N = 499 Verbindungen. Der vorgeschlagene Induktor übertraf die meisten Kennzahlen des neuesten veröffentlichten Modells und anderer vorhandener Tools. Darüber hinaus führen wir das erste Nav1.5-Haftungsvorhersagemodell ein, das ein Q4 = 74,9 % und eine binäre Klassifizierung von Q2 = 86,7 % mit MCC = 71,2 % und F1 = 89,7 % erreicht, ausgewertet anhand eines externen Testsatzes von 173 einzigartigen Verbindungen. Die in diesem Projekt verwendeten kuratierten Datensätze werden der Forschungsgemeinschaft öffentlich zugänglich gemacht.

Haftungsausschluss: Dieser Abstract wurde mit Hilfe von Künstlicher Intelligenz übersetzt und wurde noch nicht überprüft oder verifiziert.