• n_clusters:一个整数,指定降维的维数,即 。

      • eigen_solver:一个字符串或者None,指定求解特征值的求解器。可以为:

        • 'arpack':使用arpack 求解器。
        • 'lobpcg':使用lobpcg 求解器。
        • 'amg':使用amg 求解器。它要求安装pyamg。优点是计算速度快,支持大规模、稀疏数据,但是可能导致不稳定。
      • random_state:指定随机数种子。

      • n_init:一个整数,指定二次聚类时的k-means 算法的 参数,它会重复执行k-means 算法n_init 轮,选择效果最好的那轮作为最终聚类的输出。

      • gamma:一个浮点数,它给出了rbf,poly,sigmoid,laplacian,chi2 核的系数。

        如果affinity='nearest_neighbors',则忽略该参数。

      • degree:一个整数,当使用多项式核时,指定多项式的度。

      • coef0:一个整数,当使用多项式核和sigmoid 核时,指定偏置。

      • n_neighbors:一个整数,指定当计算相似度矩阵时,考虑样本周围近邻的多少个样本。

        如果affinity='rbf',则忽略该参数。

      • assign_labels:一个字符串,指定二次聚类的算法。

        • 'kmeans':使用k-means 算法执行二次聚类。
        • 'discretize':使用discretize 执行二次聚类。
      • n_jobs:指定并行度。
      • affinity_matrix:一个形状为(n_samples,n_samples) 的数组,给出了相似度矩阵。
      • labels_:一个形状为(n_samples,) 的数组,给出了每个样本的簇标记。
    1. 方法:

      • fit_predict(X[, y]):训练模型并执行聚类,返回每个样本所属的簇标记。