python - 如何将图像划分为大小均匀、需要时重叠的图块?
问题描述
我有一个图像,其高度/宽度尺寸分别为 3837x5126 像素。
我的目标是将此图像划分为精确尺寸为 1000x1000 像素的单独图块。如果图像不能被平均划分,则应创建重叠图块,使图块均为 1000x1000 像素。
这是在 PowerPoint 中创建的粗略可视化,以说明我正在尝试做的事情:
我的思考过程是这样的:
- 将图像除以我的理想尺寸(1000)
- 注意剩下的
- 通过将该余数除以所有除法来创建偏移量
- 对于每个除法,减去偏移量
- 重叠的瓷砖是用 1000x1000 尺寸创建的。
这是我到目前为止的代码。
import numpy as np
def get_divisions(num, divisor):
n = num / divisor
divisions = math.floor(n)
remainder = n % 1
offset = remainder / divisions
return divisions, offset
def get_tiles(height, width, window_size=1000):
number_of_rows, row_offset = get_divisions(height, window_size)
number_of_columns, col_offet = get_divisions(width, window_size)
tiles = []
for row in range(number_of_rows):
for col in range(number_of_columns):
if row == 0:
row_offset = 0
if col == 0:
col_offset = 0
x = (col * window_size) - (col_offset * window_size)
y = (row * window_size) - (row_offset * window_size)
w = window_size
h = window_size
tiles.append([x, y, h, w])
return np.array(tiles, dtype="uint32")
height = 3837
width = 5126
get_tiles(height, width)
输出:
array([[ 0, 0, 1000, 1000],
[1000, 0, 1000, 1000],
[2000, 0, 1000, 1000],
[3000, 0, 1000, 1000],
[4000, 0, 1000, 1000],
[ 0, 1000, 1000, 1000],
[1000, 1000, 1000, 1000],
[2000, 1000, 1000, 1000],
[3000, 1000, 1000, 1000],
[4000, 1000, 1000, 1000],
[ 0, 2000, 1000, 1000],
[1000, 2000, 1000, 1000],
[2000, 2000, 1000, 1000],
[3000, 2000, 1000, 1000],
[4000, 2000, 1000, 1000]], dtype=uint32)
如您所见,我的矩阵[x, y, h, w]
不正确,因为有一些 x,y 点位于 3837x5126 像素图像之外。
任何帮助将不胜感激!
编辑:
这是@HansHirse 给出的答案并添加了一些测试。
import unittest
import math
import numpy as np
def tile(h, w, tile_width=None, tile_height=None, window_size=100):
np.seterr(divide='ignore', invalid='ignore')
if not tile_width:
tile_width = window_size
if not tile_height:
tile_height = window_size
wTile = tile_width
hTile = tile_height
if tile_width > w or tile_height > h:
raise ValueError("tile dimensions cannot be larger than origin dimensions")
# Number of tiles
nTilesX = np.uint8(np.ceil(w / wTile))
nTilesY = np.uint8(np.ceil(h / hTile))
# Total remainders
remainderX = nTilesX * wTile - w
remainderY = nTilesY * hTile - h
# Set up remainders per tile
remaindersX = np.ones((nTilesX-1, 1)) * np.uint16(np.floor(remainderX / (nTilesX-1)))
remaindersY = np.ones((nTilesY-1, 1)) * np.uint16(np.floor(remainderY / (nTilesY-1)))
remaindersX[0:np.remainder(remainderX, np.uint16(nTilesX-1))] += 1
remaindersY[0:np.remainder(remainderY, np.uint16(nTilesY-1))] += 1
# Initialize array of tile boxes
tiles = np.zeros((nTilesX * nTilesY, 4), np.uint16)
k = 0
x = 0
for i in range(nTilesX):
y = 0
for j in range(nTilesY):
tiles[k, :] = (x, y, hTile, wTile)
k += 1
if j < (nTilesY-1):
y = y + hTile - remaindersY[j]
if i < (nTilesX-1):
x = x + wTile - remaindersX[i]
return tiles
class TestTilingWithoutRemainders(unittest.TestCase):
def test_it_returns_tiles_without_overflow(self):
self.assertEqual(tile(500, 500, window_size=500).tolist(), np.array([[0, 0, 500, 500]], dtype="uint16").tolist())
self.assertEqual(tile(250, 500, window_size=250).tolist(), np.array(
[[0, 0, 250, 250], [250, 0, 250, 250]], dtype="uint16"
).tolist())
self.assertEqual(tile(500, 250, window_size=250).tolist(), np.array(
[[0, 0, 250, 250], [0, 250, 250, 250]], dtype="uint16"
).tolist())
class TestTilingWithRemainders(unittest.TestCase):
def test_it_returns_tiles_with_overflow(self):
self.assertEqual(tile(500, 501, window_size=500).tolist(), np.array(
[[0, 0, 500, 500], [1, 0, 500, 500]], dtype="uint16"
).tolist())
self.assertEqual(tile(251, 250, window_size=250).tolist(), np.array(
[[0, 0, 250, 250], [0, 1, 250, 250]], dtype="uint16"
).tolist())
class TestTilingWithInvalidWindowSizes(unittest.TestCase):
def test_it_raises_an_error_with_invalid_tile_height(self):
self.assertRaises(ValueError, tile, 500, 500, tile_height=50000000)
def test_it_raises_an_error_with_invalid_tile_width(self):
self.assertRaises(ValueError, tile, 500, 500, tile_width=50000000)
def test_it_raises_an_error_with_invalid_window_size(self):
self.assertRaises(ValueError, tile, 500, 500, window_size=50000000)
解决方案
我的解决方案来了。不幸的是,我的代码不是基于你的,但我希望你仍然可以遵循它。主要方法与您在问题中描述的完全相同。
让我们看一下代码:
import cv2
import numpy as np
# Some image; get width and height
image = cv2.resize(cv2.imread('path/to/your/image.png'), (512, 383))
h, w = image.shape[:2]
# Tile parameters
wTile = 100
hTile = 100
# Number of tiles
nTilesX = np.uint8(np.ceil(w / wTile))
nTilesY = np.uint8(np.ceil(h / hTile))
# Total remainders
remainderX = nTilesX * wTile - w
remainderY = nTilesY * hTile - h
# Set up remainders per tile
remaindersX = np.ones((nTilesX-1, 1)) * np.uint16(np.floor(remainderX / (nTilesX-1)))
remaindersY = np.ones((nTilesY-1, 1)) * np.uint16(np.floor(remainderY / (nTilesY-1)))
remaindersX[0:np.remainder(remainderX, np.uint16(nTilesX-1))] += 1
remaindersY[0:np.remainder(remainderY, np.uint16(nTilesY-1))] += 1
# Initialize array of tile boxes
tiles = np.zeros((nTilesX * nTilesY, 4), np.uint16)
# Determine proper tile boxes
k = 0
x = 0
for i in range(nTilesX):
y = 0
for j in range(nTilesY):
tiles[k, :] = (x, y, hTile, wTile)
k += 1
if (j < (nTilesY-1)):
y = y + hTile - remaindersY[j]
if (i < (nTilesX-1)):
x = x + wTile - remaindersX[i]
print(tiles)
对于某些具有尺寸[512, 383]
和图块大小[100, 100]
的图像,tiles
数组如下所示:
[[ 0 0 100 100]
[ 0 94 100 100]
[ 0 188 100 100]
[ 0 283 100 100]
[ 82 0 100 100]
[ 82 94 100 100]
[ 82 188 100 100]
[ 82 283 100 100]
[164 0 100 100]
[164 94 100 100]
[164 188 100 100]
[164 283 100 100]
[246 0 100 100]
[246 94 100 100]
[246 188 100 100]
[246 283 100 100]
[329 0 100 100]
[329 94 100 100]
[329 188 100 100]
[329 283 100 100]
[412 0 100 100]
[412 94 100 100]
[412 188 100 100]
[412 283 100 100]]
你会得到 24 个瓷砖,每个瓷砖的大小[100, 100]
和最相似的重叠都是可能的。
如果我们切换到一些具有尺寸的图像[500, 300]
,我们会得到这些tiles
:
[[ 0 0 100 100]
[ 0 100 100 100]
[ 0 200 100 100]
[100 0 100 100]
[100 100 100 100]
[100 200 100 100]
[200 0 100 100]
[200 100 100 100]
[200 200 100 100]
[300 0 100 100]
[300 100 100 100]
[300 200 100 100]
[400 0 100 100]
[400 100 100 100]
[400 200 100 100]]
如您所见,只剩下 15 个图块,而且完全没有重叠。
希望有帮助!
推荐阅读
- java - SOAP 加密 - javax.crypto.BadPaddingException:未知块类型
- java - 带有java的MJML是否可以使用循环
- javascript - javascript按日期分组元素
- windows - 通过 SSH 在 Windows Sever 的网络驱动器中运行批处理文件的最佳方法
- java - 使用加速度计通知他们是否触摸了手机
- swift - 如何识别活动应用程序正在使用的文件?
- amazon-web-services - DynamoDB GSI 数据复制
- yaml - 附加到扩展管道作业名称
- javascript - 类型错误 - 无法读取未定义的属性 x
- vulkan - 更新顶点缓冲区的小部分