-
n_clusters
:一个整数,指定降维的维数,即 。eigen_solver
:一个字符串或者None
,指定求解特征值的求解器。可以为:'arpack'
:使用arpack
求解器。'lobpcg'
:使用lobpcg
求解器。'amg'
:使用amg
求解器。它要求安装pyamg
。优点是计算速度快,支持大规模、稀疏数据,但是可能导致不稳定。
random_state
:指定随机数种子。n_init
:一个整数,指定二次聚类时的k-means
算法的 参数,它会重复执行k-means
算法n_init
轮,选择效果最好的那轮作为最终聚类的输出。gamma
:一个浮点数,它给出了rbf,poly,sigmoid,laplacian,chi2
核的系数。如果
affinity='nearest_neighbors'
,则忽略该参数。degree
:一个整数,当使用多项式核时,指定多项式的度。coef0
:一个整数,当使用多项式核和sigmoid
核时,指定偏置。n_neighbors
:一个整数,指定当计算相似度矩阵时,考虑样本周围近邻的多少个样本。如果
affinity='rbf'
,则忽略该参数。assign_labels
:一个字符串,指定二次聚类的算法。'kmeans'
:使用k-means
算法执行二次聚类。'discretize'
:使用discretize
执行二次聚类。
n_jobs
:指定并行度。
-
affinity_matrix
:一个形状为(n_samples,n_samples)
的数组,给出了相似度矩阵。labels_
:一个形状为(n_samples,)
的数组,给出了每个样本的簇标记。
方法:
fit_predict(X[, y])
:训练模型并执行聚类,返回每个样本所属的簇标记。