Sakura Yua
Data Mining bezieht sich auf das Extrahieren oder „Schürfen“ von Wissen aus großen Datenmengen. Der Begriff ist jedoch irreführend. Das Schürfen von Gold aus Gestein oder Sand wird als Goldschürfen und nicht als Gesteins- oder Sandschürfen bezeichnet. Daher wird Data Mining sehr treffend als „Wissensschürfen aus Daten“ bezeichnet, was leider etwas lang ist. Dieser Begriff spiegelt möglicherweise nicht den Schwerpunkt auf dem Schürfen aus großen Datenmengen wider. Der Data Mining-Prozess lässt sich in fünf Schritte unterteilen. Zunächst sammeln Organisationen Daten und laden sie in ihre Data Warehouses. Anschließend speichern und verwalten sie die Daten entweder auf internen Servern oder in der Cloud. Unternehmensanalysten, Managementteams und Wissenstechnologieexperten greifen auf die Daten zu und legen fest, wie sie diese organisieren müssen. Anschließend sortiert Anwendungssoftware die Daten anhand der Ergebnisse des Benutzers, und schließlich präsentiert der Endbenutzer die Daten in einem leicht zu teilenden Format, beispielsweise einem Diagramm oder einer Tabelle.