Gonapa Vasudha
Data Mining ist ein Prozess zum Entdecken von Mustern in großen Datensätzen, der Methoden an der Schnittstelle zwischen maschinellem Lernen, Statistik und Datenbanksystemen verwendet. Data Mining ist ein interdisziplinäres Teilgebiet der Informatik und Statistik mit dem Gesamtziel, Informationen (mit intelligenten Methoden) aus einem Datensatz zu extrahieren und die Informationen in eine verständliche Struktur für die weitere Verwendung umzuwandeln. Data Mining ist der Analyseschritt des Prozesses „Wissensentdeckung in Datenbanken“ oder KDD. Neben dem Rohanalyseschritt umfasst es auch Datenbank- und Datenverwaltungsaspekte, Datenvorverarbeitung, Modell- und Inferenzüberlegungen, Interessantheitsmetriken, Komplexitätsüberlegungen, Nachbearbeitung entdeckter Strukturen, Visualisierung und Online-Aktualisierung.