Comparison of data clustering algorithms// Sworld Jornal Issue No23, Part 1 January 2024 – P. 116-127
Переглянути
Дата
2024-01Автор
Doroshenko, I. V.
Knihnitska, T. V.
Kreshtanovych, M. A.
Metadata
Показати повний опис матеріалуКороткий опис(реферат)
У статті проведено порівняння алгоритмів кластеризації даних: K-Means, Hierarchical Agglomerative Clustering (HAC), Density-Based Spatial Clustering of Applications with Noise (DBSCAN), Expectation–Maximization clustering using Gaussian Mixture Models (GMM). Порівняння здійснюється завдяки наперед згенерованим наборам даних, які мають різний характер поведінки: концентричні кола (2 кластери), смужки (3), хмари (3), нероздільна множина (1), серпи (2). Для кожного з наборів даних застосовано перелічені методи і визначено найкращий алгоритм кластеризації для певного типу даних. Розглянуті алгоритми кластеризації даних додатково застосовано до трьох наборів реальних даних. Для візуалізації результатів порівняння створено інтерактивний веб-застосунок для інтерактивної кластеризації даних згаданими алгоритмами, який розгорнуто на хмарному сервері shinyapps.io.