-
bandwidth
:一个浮点数,指定带宽参数。如果未指定,则通过
sklearn.cluster.estimate_bandwith()
函数来自动计算。seeds
:一个形状为[n_samples,n_features]
的数组,用于初始化核函数。如果未指定,则通过
sklearn.cluster.get_bin_seeds()
函数来自动计算。bin_seeding
:一个布尔值。- 如果为,则并不会使用所有的点来计算核函数,而是使用网格边界上的点(网格宽度为带宽)来计算。这会加速算法的执行,因为核函数的初始化需要的点大大降低。
-
当
bin_seeding=True
时,仅仅接收那些网格内包含超过min_bin_freq
个数据点的网格。 cluster_all
:一个布尔值,指定是否对所有数据点进行聚类。- 如果为
False
,则对离群点不聚类,将离群点的簇标记设置为-1
。 - 如果为,则对离群点也聚类,将离群点划分到离它最近的簇中。
- 如果为
n_jobs
:一个整数,指定并行度。
方法:
fit(X[, y])
:训练模型。:训练模型并执行聚类,返回每个样本所属的簇标记。