Jagdish G
Beim Clustering geht es darum, die Population oder Datenpunkte in verschiedene Gruppen aufzuteilen, wobei Datenpunkte innerhalb derselben Gruppe anderen Datenpunkten innerhalb derselben Gruppe ähnlicher sind als denen in anderen Gruppen. Einfach ausgedrückt besteht das Ziel darin, Gruppen mit ähnlichen Merkmalen zu trennen und sie Clustern zuzuordnen. Es handelt sich um eine anspruchsvolle Aufgabe der explorativen Datenverarbeitung und eine Standardtechnik für die statistische Datenanalyse, die in vielen Bereichen eingesetzt wird, darunter Mustererkennung, Bildanalyse, Informationsabruf, Bioinformatik, Datenkomprimierung, Spezialeffekte und maschinelles Lernen.