首页 > 技术文章 > 4.K均值算法--应用

rinkong0403 2020-06-14 04:07 原文

1. 应用K-means算法进行图片压缩

读取一张图片

观察图片文件大小,占内存大小,图片数据结构,线性化

用kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别,每个类别的颜色

压缩图片生成:以聚类中收替代原像素颜色,还原为二维

观察压缩图片的文件大小,占内存大小

 

源代码:

import matplotlib.pyplot as plt
import matplotlib.image as ig
import numpy as np
import sys
from sklearn.cluster import KMeans


# 读取一张图片
pd = ig.imread('G:\大三机器学习/02.jpg')

# 观察图片文件大小,占内存大小,图片数据结构,线性化

print("片的文件大小", pd.size)
print("片的存大小", sys.getsizeof(pd))


X = pd.reshape(-1, 3) # 把二维的变成线性的
n_colors = 64 # 将图片分成64种颜色
model = KMeans(n_colors) # 构建模型
labels = model.fit_predict(X)
colors = model.cluster_centers_ # 聚类中心


# 观察压缩图片的文件大小,占内存大小
# 解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

new_image = colors[labels].reshape(pd.shape)
plt.imshow(pd)
plt.title("")
plt.show()

实验结果
原图:

压缩后图:


 

 

 

 

 

 

2. 观察学习与生活中可以用K均值解决的问题。

从数据-模型训练-测试-预测完整地完成一个应用案例。

这个案例会作为课程成果之一,单独进行评分。

 

 

推荐阅读