成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

詳解基于凸集投影方法的聚類算法

譯文 精選
大數據 數據分析
聚類分析(或聚類)是一種數據分析技術,它能夠探索和分組一組向量(或數據點),使同一聚類中的向量彼此之間比其他聚類中的向量更相似。聚類算法被廣泛應用于例如數據分析、模式識別和圖像處理等許多應用場景中。

譯者 | 朱先忠

審校 | 重樓

聚類分析(或聚類)是一種數據分析技術,它能夠探索和分組一組向量(或數據點),使同一聚類中的向量彼此之間比其他聚類中的向量更相似。聚類算法被廣泛應用于例如數據分析、模式識別和圖像處理許多應用場景中。

本文介紹一種新的基于凸集投影(POCS:Projection onto Convex Sets)方法的聚類算法,稱為基于POCS的聚類算法。最初的論文在IWIS2022中介紹,源代碼也已在Github上發布。

凸集定義與啟示

凸集被定義為一組數據點,其中連接該集中任意兩個點x1和x2的線段完全包含在該集合中。根據凸集的定義,空集?、單例集、線段、超平面和歐氏球被認為是凸集。數據點也被認為是凸集,因為它是單例集(一個只有一個元素的集)。一概念啟示我們可發現一條新的研究路徑,即凸集投影的概念可以應用于聚類數據點。

凸集投影

首先,讓我們一起簡單回顧一下凸集投影的概念(沒有方程形式)。凸集投影的方法大致可以分為兩種形式:交替和平行。

交替凸集投影

從數據空間中的任意點開始,從該點到兩個(或多個)相交凸集的交替投影將收斂到集的交點內的一個點。下圖給出了相應的圖形說明。

當凸集不相交時,交替投影將收斂到貪婪極限環,貪婪極限環取決于投影的階數。

平行凸集投影

與交替形式不同,并行形式的凸集投影同時執行從數據點到所有凸集的投影,并且每個投影具有重要的權重。對于兩個非空相交凸集,類似于交替版本,平行投影收斂到集的相交點。

在不相交凸集的情況下,投影將收斂到最小化解?;谕辜队暗木垲愃惴ǖ闹饕枷?/span>是從這一性質出發產生的。

有關凸集投影的更多詳細信息,您可以訪問原始論文和/或其他一些推薦論文(包括可用的pdf文件):

基于凸集投影方法的聚類算法

利用并行凸集投影方法的收斂性,作者提出了一種非常簡單但(在一定程度上)有效的聚類算法。該算法以類似于經典K-Means算法的精神進行操作,但每個算法處理每個數據點的方式存在差異,即K-Means方法以相等的加權重要性處理每個數據點。然而,另一方面,基于凸集投影的聚類算法,以不同的重要性權重處理每個數據點,該重要性權重與從數據點到集群原型的距離成正比。

該算法的偽代碼如下所示:

實驗結果

作者網站聚類基本基準出發,在一些公共基準數據集上檢驗了基于凸集投影的聚類算法的性能。下表總結了這些數據集的描述。

在本文中,作者將基于凸集投影的聚類算法與其他傳統聚類方法(包括K-Means和模糊C-Means算法)的性能進行了比較。下表總結了針對執行時間和集群錯誤方面的評估結果。

可視化聚類結果也如下圖所示


有關更多詳細信息,您可以在此處查看原始論文

示例代碼

讓我們在一個非常簡單的數據集上使用這個算法。為了簡單起見,可以使用以下命令安裝已發布的算法包:

pip install pocs-based-clustering

首先,讓我們導入幾個必要的包,并創建一個簡單的數據集,其中以10個集群為中心,周圍環繞著5000個數據點:

#導入包
import time
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from pocs_based_clustering.tools import clustering
# 生成一個簡單的數據集
num_clusters = 10
X, y = make_blobs(n_samples=5000, centers=num_clusters, \
 cluster_std=0.5, random_state=0)
plt.figure(figsize=(8,8))
plt.scatter(X[:, 0], X[:, 1], s=50)
plt.show()

現在,使用內置函數執行聚類并顯示實驗結果:

# 基于凸集投影方法的聚類算法
centroids, labels = clustering(X, num_clusters, 100)
# 顯示結果
plt.figure(figsize=(8,8))
plt.scatter(X[:, 0], X[:, 1], c=labels, s=50, cmap='viridis')
plt.scatter(centroids[:, 0], centroids[:, 1], s=100, c='red')
plt.show()

結論

在這篇文章中,我簡要回顧了一種基于凸集投影(POCS)方法的簡單而有效的聚類技術,稱為基于凸集投影的聚類算法。該算法利用凸集投影的收斂性將其應用于聚類任務,并在一定程度上實現了可行的改進。該算法的有效性已經在一些基準數據集上得到了驗證。

原始論文可以在arXiv(預印本:https://arxiv.org/abs/2208.08888)或IEEE Xplore(已發表論文:https://ieeexplore.ieee.org/document/9920762)上找到。該代碼也在Github代碼倉庫網站上發布。

我很高興歡迎您來到我的Facebook頁面分享有關機器學習的內容:深入機器學習。我的其他值得注意的帖子也可以在下面這些內容中找到:

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:POCS-based Clustering Algorithm Explained,作者:LA Tran



責任編輯:華軒 來源: 51CTO
相關推薦

2023-04-02 14:16:45

凸集算法集合

2019-10-12 10:11:02

數據集聚類算法

2023-10-31 09:00:00

2017-04-05 09:20:14

聚類算法機器學習大數據

2017-04-07 13:00:49

機器學習大數據聚類算法

2025-03-31 08:28:24

大型語言模型LLMDeepSeek

2014-07-02 10:34:08

聚類算法算法

2025-05-22 10:06:49

2020-07-09 15:26:18

Python聚類算法語言

2024-10-18 17:14:13

2017-05-15 11:10:10

大數據聚類算法

2016-09-30 01:10:12

R語言聚類方法

2020-05-13 15:57:59

聚類分析算法監督學習

2011-07-26 10:16:14

SQL Server數據挖掘

2011-07-25 15:39:49

SQL SERVER數聚類算法順序聚類算法

2022-05-17 09:14:50

聚類算法python

2022-07-29 10:31:33

算法Python

2022-03-03 19:52:25

聚類算法D2CDBSCAN

2018-05-28 15:33:09

無監督學習算法Python

2022-09-07 23:54:17

機器學習無監督學習算法
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲国产一区在线 | 99免费视频 | 国产免费一区二区三区网站免费 | 久久久久久久一区 | 少妇黄色| 亚洲精品久久久久久一区二区 | 亚洲精品一区国语对白 | 91中文字幕在线 | 欧美精品一区二区三区在线 | 亚洲国产18 | 91天堂| 国产午夜亚洲精品不卡 | 色噜噜狠狠色综合中国 | 中文字幕11页 | 日韩欧美精品一区 | 国产精品久久国产愉拍 | 夜夜操天天干 | 黄色一级大片视频 | 欧美黄视频 | av日韩高清 | 91精品在线播放 | 亚洲人成网亚洲欧洲无码 | 国产精品久久久久久久久免费软件 | 久久久无码精品亚洲日韩按摩 | 国产成人精品一区二区三区在线观看 | 国产精品久久国产精品 | 欧美一区二区三区在线观看 | 亚洲精品久久国产高清情趣图文 | 粉嫩在线 | 日韩欧美在线观看 | 狠狠av| 日韩在线视频一区 | 粉色午夜视频 | 国产精品无码久久久久 | 超碰伊人| 性网站免费| 国产高清免费视频 | 久草资源在线视频 | 欧美日韩一卡 | 久久久久久国产精品免费免费 | 精精国产xxxx视频在线播放 |