I would say use what you are mastering and available for you, K-means or any statistical concepts and methods could be used with different tools and coding languages.
K means is a statistical concept to estimate the variance from the mean on a range of variables. The alternative is to evaluate the exact deviation on a line by line basis, which can be resource intensive on large data sets.
Joan, there are other alternatives to K-Means: DBSCAN, K-Harmonic, Fuzzy K-Means.., but sincerely I am not used to those.
Joan, you may use an open source tool called Gephi (https://gephi.org/users/download/) for clustering. It provides different algorithms and methods for clustering and can deal with large amounts of data. Cheers
Keine Lösung gefunden?
Hierdurch wird dieser Kommentar als beste Antwort markiert und Ihre Frage geschlossen.
Sind Sie sicher?
Hierdurch wird Ihre Frage ohne beste Antwort geschlossen.
Sind Sie sicher?
Hierdurch wird der Inhalt den Moderatoren als unangebracht gemeldet.
Sind Sie sicher?