Clustering: Gruppen finden in unbeschrifteten Daten
Clustering ist ein wichtiger Bestandteil im unüberwachten maschinellen Lernen. Dabei werden Datenpunkte in Gruppen (Cluster) zusammengefasst, die sich ähnlich sind. Dieser Artikel vergleicht drei beliebte Clustering-Algorithmen: K-Means, hierarchisches Clustering und DBSCAN. Wir schauen uns die mathematischen Grundlagen, die Rechenzeit und die Effektivität für verschiedene Datentypen an.