Indiziert in
  • Datenbank für wissenschaftliche Zeitschriften
  • Öffnen Sie das J-Tor
  • Genamics JournalSeek
  • JournalTOCs
  • Forschungsbibel
  • Ulrichs Zeitschriftenverzeichnis
  • Elektronische Zeitschriftenbibliothek
  • RefSeek
  • Hamdard-Universität
  • EBSCO AZ
  • OCLC – WorldCat
  • Gelehrtersteer
  • SWB Online-Katalog
  • Virtuelle Bibliothek für Biologie (vifabio)
  • Publons
  • MIAR
  • Genfer Stiftung für medizinische Ausbildung und Forschung
  • Euro-Pub
  • Google Scholar
Teile diese Seite
Zeitschriftenflyer
Flyer image

Abstrakt

Gradient Boosting als SNP-Filter: eine Bewertung anhand simulierter Daten und Haarmorphologiedaten

Lubke GH, Laurin C, Walters R, Eriksson N, Hysi P, Spector TD, Montgomery GW, Martin NG, Medland SE und Boomsma DI

Normalerweise bestehen genomweite Assoziationsstudien aus der Regression des Phänotyps für jeden SNP separat mithilfe eines additiven genetischen Modells. Obwohl es statistische Modelle für rezessive, dominante, SNP-SNP- oder SNP-Umwelt-Interaktionen gibt, ist eine Bewertung aller möglichen Effekte für genomweite Daten aufgrund der Testlast unpraktisch. Wir befürworten einen zweistufigen Ansatz, bei dem der erste Schritt aus einem Filter besteht, der auf verschiedene Arten von SNP-Haupt- und Interaktionseffekten reagiert. Ziel ist es, die Anzahl der SNPs erheblich zu reduzieren, sodass in einem zweiten Schritt eine spezifischere Modellierung möglich wird. Wir bieten eine Bewertung einer statistischen Lernmethode namens „Gradient Boosting Machine“ (GBM), die als Filter verwendet werden kann. GBM erfordert keine a priori-Spezifikation eines genetischen Modells und ermöglicht die Einbeziehung einer großen Anzahl von Kovariablen. GBM kann daher verwendet werden, um mehrere GxE-Interaktionen zu untersuchen, was im parametrischen Rahmen von GWAS nicht möglich wäre. Wir zeigen in einer Simulation, dass GBM auch unter günstigen Bedingungen für das in GWAS häufig verwendete Standard-Additiv-Regressionsmodell gut funktioniert und empfindlich auf die Erkennung von Interaktionseffekten reagiert, selbst wenn eine der interagierenden Variablen einen Null-Haupteffekt hat. Letzterer würde in GWAS nicht erkannt werden. Unsere Auswertung wird von einer Analyse empirischer Daten zur Haarmorphologie begleitet. Wir schätzen die phänotypische Varianz, die durch die zunehmende Anzahl der am höchsten bewerteten SNPs erklärt wird, und zeigen, dass es ausreicht, im ersten Schritt eines zweistufigen Ansatzes 10.000 bis 20.000 SNPs auszuwählen.

Haftungsausschluss: Dieser Abstract wurde mit Hilfe von Künstlicher Intelligenz übersetzt und wurde noch nicht überprüft oder verifiziert.