人工智能机器学习分为无监督学习、有监督学习和强化学习。无监督学习一般分为聚类分析、降维、关联规则分析,其实现不需要目标的参与,而是在输入变量中寻找某些规律。
聚类分析最直观的理解就是“物以类聚”,即数据集中的某些样本会因为某些相似性而自然的聚集在一起形成一个簇,每个簇就是一类。
通过实际应用场景,学习掌握著名的聚类分析算法Kmeans
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
#构造样本数据
data = np.array([[2, 2], [3, 3], [4, 1], [3, 6], [4, 7], [5, 2], [3, 9], [6, 8], [6, 6], [7, 7]])
print(data)
#源数据可视化展示
plt.scatter(data[:, 0], data[:, 1], c="red", marker='o', label='samples')
plt.legend()
plt.show()
样本数据
#KMeans聚类(分为2类)
kms = KMeans(n_clusters=2)
kms.fit(data)
#获取分类结果
label = kms.labels_
# 聚类结果可视化
plt.scatter(data[label == 0][:, 0], data[label == 0][:, 1], c="red", marker='o', label='class0')
plt.scatter(data[label == 1][:, 0], data[label == 1][:, 1], c="green", marker='*', label='class1')
plt.legend()
plt.show()
二分类数据展示
留言与评论(共有 0 条评论) “” |