Indiziert in
  • Datenbank für wissenschaftliche Zeitschriften
  • Öffnen Sie das J-Tor
  • Genamics JournalSeek
  • JournalTOCs
  • Forschungsbibel
  • Ulrichs Zeitschriftenverzeichnis
  • Elektronische Zeitschriftenbibliothek
  • RefSeek
  • Hamdard-Universität
  • EBSCO AZ
  • OCLC – WorldCat
  • Gelehrtersteer
  • SWB Online-Katalog
  • Virtuelle Bibliothek für Biologie (vifabio)
  • Publons
  • MIAR
  • Genfer Stiftung für medizinische Ausbildung und Forschung
  • Euro-Pub
  • Google Scholar
Teile diese Seite
Zeitschriftenflyer
Flyer image

Abstrakt

Informationstheoretische Merkmalsauswahl für einen multirelationalen naiven Bayes-Klassifikator

Vimalkumar B. Vaghela, Kalpesh H. Vandra und Nilesh K. Modi

 Heutzutage werden Daten in relationalen Strukturen gespeichert. Beim üblichen Vorgehen beim Mining dieser Daten verbinden wir oft mehrere Relationen mithilfe von Fremdschlüsselverknüpfungen zu einer einzigen Relation, was als „Flatten“ bezeichnet wird. Das Flatten kann Probleme wie Zeitaufwand, Datenredundanz und statistische Verzerrung der Daten verursachen. Daher ergeben sich kritische Fragen hinsichtlich der Frage, wie Daten direkt anhand zahlreicher Relationen minen werden können. Die Lösung dieses Problems ist ein Ansatz namens „Multi-Relationales Data Mining“ (MRDM). Andere Probleme sind irrelevante oder redundante Attribute in einer Relation, die möglicherweise nicht zur Klassifizierungsgenauigkeit beitragen. Daher ist die Merkmalsauswahl ein wesentlicher Datenvorverarbeitungsschritt beim multi-relationalen Data Mining. Indem wir für das Data Mining irrelevante oder redundante Merkmale aus den Relationen herausfiltern, verbessern wir die Klassifizierungsgenauigkeit, erreichen eine gute Zeitleistung und verbessern die Verständlichkeit der Modelle. Wir haben die auf Entropie basierende Merkmalsauswahlmethode für den multi-relationalen naiven Bayes-Klassifikator vorgeschlagen. Wir haben die Methode InfoDist und Pearsons Korrelationsparameter verwendet, die dazu dienen, irrelevante und redundante Merkmale aus der multirelationalen Datenbank herauszufiltern und die Klassifizierungsgenauigkeit zu verbessern. Wir haben unseren Algorithmus anhand des PKDD-Finanzdatensatzes analysiert und im Vergleich zu den vorhandenen Merkmalsauswahlmethoden eine bessere Genauigkeit erzielt.

Haftungsausschluss: Dieser Abstract wurde mit Hilfe von Künstlicher Intelligenz übersetzt und wurde noch nicht überprüft oder verifiziert.