python - RGB 图像中最主要的颜色 - OpenCV / NumPy / Python
问题描述
我有一个 python 图像处理函数,它使用尝试获取图像的主色。我利用我在这里找到的一个函数https://github.com/tarikd/python-kmeans-dominant-colors/blob/master/utils.py
它可以工作,但不幸的是我不太明白它的作用,我了解到它np.histogram
相当慢,我应该使用cv2.calcHist
它,因为它的速度要快 40 倍,据此:https ://docs.opencv.org/trunk/d1/db7/tutorial_py_histogram_begins .html
我想了解我必须如何更新要使用的代码cv2.calcHist
,或者更好的是,我必须输入哪些值。
我的功能
def centroid_histogram(clt):
# grab the number of different clusters and create a histogram
# based on the number of pixels assigned to each cluster
num_labels = np.arange(0, len(np.unique(clt.labels_)) + 1)
(hist, _) = np.histogram(clt.labels_, bins=num_labels)
# normalize the histogram, such that it sums to one
hist = hist.astype("float")
hist /= hist.sum()
# return the histogram
return hist
pprint
是这个clt
,不确定这是否有帮助
KMeans(algorithm='auto', copy_x=True, init='k-means++', max_iter=300,
n_clusters=1, n_init=10, n_jobs=1, precompute_distances='auto',
random_state=None, tol=0.0001, verbose=0)
我的代码可以在这里找到:https ://github.com/primus852/python-movie-barcode
我是一个非常初学者,所以任何帮助都非常感谢。
按要求:
示例图像
最主要的颜色:
rgb(22,28,37)
直方图的计算时间:
0.021515369415283203s
解决方案
可以提出两种使用np.unique
和np.bincount
来获得最主要颜色的方法。此外,在链接页面中,它bincount
作为一种更快的替代方案进行了讨论,因此这可能是要走的路。
方法#1
def unique_count_app(a):
colors, count = np.unique(a.reshape(-1,a.shape[-1]), axis=0, return_counts=True)
return colors[count.argmax()]
方法#2
def bincount_app(a):
a2D = a.reshape(-1,a.shape[-1])
col_range = (256, 256, 256) # generically : a2D.max(0)+1
a1D = np.ravel_multi_index(a2D.T, col_range)
return np.unravel_index(np.bincount(a1D).argmax(), col_range)
1000 x 1000
在密集范围内对彩色图像进行验证和计时,以[0,9)
获得可重复的结果 -
In [28]: np.random.seed(0)
...: a = np.random.randint(0,9,(1000,1000,3))
...:
...: print unique_count_app(a)
...: print bincount_app(a)
[4 7 2]
(4, 7, 2)
In [29]: %timeit unique_count_app(a)
1 loop, best of 3: 820 ms per loop
In [30]: %timeit bincount_app(a)
100 loops, best of 3: 11.7 ms per loop
进一步提升
利用multi-core
大numexpr
数据模块进一步提升 -
import numexpr as ne
def bincount_numexpr_app(a):
a2D = a.reshape(-1,a.shape[-1])
col_range = (256, 256, 256) # generically : a2D.max(0)+1
eval_params = {'a0':a2D[:,0],'a1':a2D[:,1],'a2':a2D[:,2],
's0':col_range[0],'s1':col_range[1]}
a1D = ne.evaluate('a0*s0*s1+a1*s0+a2',eval_params)
return np.unravel_index(np.bincount(a1D).argmax(), col_range)
计时 -
In [90]: np.random.seed(0)
...: a = np.random.randint(0,9,(1000,1000,3))
In [91]: %timeit unique_count_app(a)
...: %timeit bincount_app(a)
...: %timeit bincount_numexpr_app(a)
1 loop, best of 3: 843 ms per loop
100 loops, best of 3: 12 ms per loop
100 loops, best of 3: 8.94 ms per loop
推荐阅读
- ruby-on-rails - 休息客户端/硒网络驱动程序的 Heroku 超时
- string - 在bash中循环查找结果
- windows - Netcat 命令:未知 IP 地址
- python - Pandas:选择第一个不再为负的值,返回该行
- python - AttributeError:模块“火炬”没有属性“设备”
- javascript - 从嵌入中获取高亮文本
- gradle - Gradle ArtifactHandler 是如何工作的
- model-view-controller - MVC 应用程序中的服务层是否有任何设计模式?
- android - 用于显示运营商分配的 IP 地址的 Android 代码
- java - Nginx 服务器使用 SSL 连接到 Java Spring