Python 结合opencv实现图片截取和拼接

打印 上一主题 下一主题

主题 904|帖子 904|积分 2712

实践环境

python 3.6.2
scikit-build-0.16.7
win10
opencv_python-4.5.4.60-cp36-cp36m-win_amd64.whl
下载地址:
https://pypi.org/project/opencv-python/4.5.4.60/#files
https://files.pythonhosted.org/packages/57/6c/7f4f56b2555d5c25dd4f41fc72a16dc6402cb2b4f967da11d8d26c669b55/opencv_python-4.5.4.60-cp36-cp36m-win_amd64.whl
注意:下载时不用下abi版的,比如 opencv_python-4.6.0.66-cp36-abi3-win_amd64.whl 不能用,
因为数据类型为 np.uint8,也就是0~255,
依赖包安装
  1. pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple scikit-build # 解决     ModuleNotFoundError: No module named 'skbuild'问题
  2. pip install opencv_python-4.5.4.60-cp36-cp36m-win_amd64.whl
复制代码
代码实践

示例图片


代码
  1. import os
  2. import numpy as np
  3. import cv2
  4. from datetime import datetime
  5. from PIL import Image
  6. def capture_image(image_file_path, left, upper, width, height, target_file_name=None):
  7.     '''截取图片'''
  8.     right = left + width
  9.     lower = upper + height
  10.     if os.path.exists(image_file_path):
  11.         image = Image.open(image_file_path)
  12.         # width, height = image.size
  13.         # print('图片宽度', width, '图片高度', height)
  14.         head, ext = os.path.splitext(image_file_path)
  15.         if not target_file_name:
  16.             target_file_name = 'pic_captured%s%s' % (datetime.now().strftime('%Y%m%d%H%M%S%f'), ext)
  17.         target_file_path = '%s%s' % (head, target_file_name)
  18.         image.crop((left, upper, right, lower)).save(target_file_path)
  19.         return target_file_path
  20.     else:
  21.         error_msg = '图片文件路径不存在:%s' % image_file_path
  22.         print(error_msg)
  23.         raise Exception(error_msg)
  24. def append_picture(image1_path, image2_path):
  25.     '''拼接图片'''
  26.     image1 = cv2.imread(image1_path, -1)
  27.     shape = image1.shape
  28.     height1, width1, channel1 = shape
  29.     # print(shape)     # 输出:(315, 510, 4)
  30.     # print(image1)    # 输出一3维数组
  31.     # print(len(image1), len(image1[0]))  # 输出:315 510
  32.     image2 = cv2.imread(image2_path, -1)
  33.     height2, width2, channel2 =  image2.shape
  34.     total_height = max(height1, height2)
  35.     total_width = width1 + width2
  36.     dst = np.zeros((total_height, total_width, channel1), np.uint8)
  37.     dst[0:height1, 0:width1] = image1
  38.     dst[0:height2, width1:total_width] = image2
  39.     cv2.imwrite("merge.png", dst)
  40. if __name__ == '__main__':
  41.     # 截取图片
  42.     image_path1 = capture_image('example.png', 10, 30, 510, 315)
  43.     image_path2 = capture_image('example.png', 520, 30, 518, 315)
  44.     append_picture(image_path1, image_path2)
复制代码
运行结果

截取的图片


合并的图片

代码补充说明


  • imread(filename, flags=None)

    • filename  图片路径
    函数返回一个3三元组:(height, width, channel) ,元素中元素从左到右分别表示图片的高度,宽度,通道数(彩色图片是三通道的,每个通道表示图片的一种颜色(RGB),对于OpenCV读取到的图片的通道顺序是BGR) ,假设图片3元组为 (315, 510, 4) ,表示有315行,即315个二维数组,510列,即每个二维数组有510个一维数组。

    • flags 标志位

      • cv2.IMREAD_COLOR:默认参数,表示读入一副彩色图片,忽略alpha通道,可用1作为实参替代
      • cv2.IMREAD_GRAYSCALE:读入灰度图片,可用0作为实参替代
      • cv2.IMREAD_UNCHANGED:读入完整图片,包括alpha通道,可用-1作为实参替代
        PS:alpha通道,又称A通道,是一个8位的灰度通道,该通道用256级灰度来记录图像中的透明度复信息,定义透明、不透明和半透明区域,其中黑表示全透明,白表示不透明,灰表示半透明


  • imwrite(filename, img, params=None)
    将图片矩阵以文件的形式储存起来

    • filename 待保存的图片路径
    • img  Mat或Mat的矢量)要保存的一个或多个图像。
    • params 特定格式的参数对(paramId_1、paramValue_1、paramId_2、paramValue_2……),参阅cv::ImwriteFlags

  • zeros(shape, dtype=None, order='C')
    返回一个用零填充的给定形状和类型的新数组(ndarray)

    • shape 整数或者整数元组。新数组的形状,例如(2, 3) or 2。
    • dtype  数据类型,可选。数组所需的数据类型,比如,numpy.int8。  默认   numpy.float64。
    • order  {'C', 'F'},可选,默认: 'C'。是否在内存中按行优先(row-major)顺序(C语言风格)或者列优先(column-major)(Fortran风格)顺序存储多维数据。
    示例
    1. >>> import numpy as np
    2. # 创建2维数组
    3. >>> array = np.zeros([2, 3])
    4. >>> print(array) # 输出一个二维数组 一个包含2个一维数组,每个一维数组包含3个元素
    5. [[0. 0. 0.]
    6. [0. 0. 0.]]
    7. >>> array = np.zeros([2, 3], np.int64) # 指定数组元素数据类型为int64
    8. >>> print(array)
    9. [[0 0 0]
    10. [0 0 0]]
    11. >>> array = np.zeros([2, 3], np.float64) #  指定数组元素数据类型为float64
    12. >>> print(array)
    13. [[0. 0. 0.]
    14. [0. 0. 0.]]
    15. >>> array = np.zeros([3, 2])  # 输出一个二维数组 一个包含3个一维数组,每个一维数组包含2个元素
    16. >>> print(array)
    17. [[0. 0.]
    18. [0. 0.]
    19. [0. 0.]]
    20. # 创建3维数组
    21. >>> array = np.zeros((2, 3, 4), np.int8)
    22. >>> print(array) # 输出一个3维数组 一个包含2个二维数组,每个二维数组包含3个一维数组,每个一维数组包含4个元素
    23. [[[0 0 0 0]
    24.   [0 0 0 0]
    25.   [0 0 0 0]]
    26. [[0 0 0 0]
    27.   [0 0 0 0]
    28.   [0 0 0 0]]]
    复制代码
  • 冒号在Numpy数组索引中的作用说明
    3维数组为例
    ndarray[index1:index2, index3:index4, index5:index6]
    indexN:indexM 表示获取索引在范围[indexN, indexM)内的数组元素(注意,不包含索引为indexM的元素),这里的indexN代表起始元素索引,可选,默认为0,indexM代表结束元素索引,可选,默认为所在层级数组元素个数+1
    index1:index2  表示获取三维数组中,索引在范围[index1, index2)内的数组元素,即二维数组
    index3:index4  表示获取上述二维数组中,索引在范围[index3, index4)内的数组元素,即一维数组
    index5:index6  表示获取上述一维数组中,索引在范围[index5, index6)内的数组元素
    示例
    1. >>> array = np.array([[[1, 2, 3], [4, 5, 6], [7, 8, 9]], [[11, 12, 13], [14, 15, 16], [17, 18, 19]], [[20, 21, 22], [23, 24, 25], [26, 27, 28]]]) # 创建一个3维 ndarray
    2. >>> array
    3. array([[[ 1,  2,  3],
    4.         [ 4,  5,  6],
    5.         [ 7,  8,  9]],
    6.        [[11, 12, 13],
    7.         [14, 15, 16],
    8.         [17, 18, 19]],
    9.        [[20, 21, 22],
    10.         [23, 24, 25],
    11.         [26, 27, 28]]])
    12. >>> array[:] # 获取全部元素,等价于array[:, :, :]  
    13. array([[[ 1,  2,  3],
    14.         [ 4,  5,  6],
    15.         [ 7,  8,  9]],
    16.        [[11, 12, 13],
    17.         [14, 15, 16],
    18.         [17, 18, 19]],
    19.        [[20, 21, 22],
    20.         [23, 24, 25],
    21.         [26, 27, 28]]])
    22. >>> array[:, :, :]
    23. array([[[ 1,  2,  3],
    24.         [ 4,  5,  6],
    25.         [ 7,  8,  9]],
    26.        [[11, 12, 13],
    27.         [14, 15, 16],
    28.         [17, 18, 19]],
    29.        [[20, 21, 22],
    30.         [23, 24, 25],
    31.         [26, 27, 28]]])
    32. >>> array[1:2]  # 获取索引在[1,2)范围内的二维数组
    33. array([[[11, 12, 13],
    34.         [14, 15, 16],
    35.         [17, 18, 19]]])
    36. >>> array[1:]    # 获取索引在[1,3)范围内的二维数组
    37. array([[[11, 12, 13],
    38.         [14, 15, 16],
    39.         [17, 18, 19]],
    40.        [[20, 21, 22],
    41.         [23, 24, 25],
    42.         [26, 27, 28]]])
    43. >>> array[:2]    # 获取索引在[0,2)范围内的二维数组
    44. array([[[ 1,  2,  3],
    45.         [ 4,  5,  6],
    46.         [ 7,  8,  9]],
    47.        [[11, 12, 13],
    48.         [14, 15, 16],
    49.         [17, 18, 19]]])
    50.         
    51. >>> array[1:2, 1:2] # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组
    52. array([[[14, 15, 16]]])
    53. >>> array[1:2, :2]  # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[0,2)范围内的一维数组
    54. array([[[11, 12, 13],
    55.         [14, 15, 16]]])
    56. >>> array[1:2, 1:]  # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,3)范围内的一维数组
    57. array([[[14, 15, 16],
    58.         [17, 18, 19]]])
    59. >>> array[1:2, :]   # 获取索引在[1,2)范围内的二维数组的全部元素
    60. array([[[11, 12, 13],
    61.         [14, 15, 16],
    62.         [17, 18, 19]]])
    63. >>> array[1:2, 1:2, 1:2]  # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组,一维数组中只获取索引在[1,2)范围内的元素
    64. array([[[15]]])
    65. >>> array[1:2, 1:2, 1:]   # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组,一维数组中只获取索引在[1,3)范围内的元素
    66. array([[[15, 16]]])
    67. >>> array[1:2, 1:2, :2]   # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组,一维数组中只获取索引在[0,2)范围内的元素
    68. array([[[14, 15]]])
    69. >>> array[1:2, 1:2, :]    # 获取索引在[1,2)范围内的二维数组,二维数组中只获取索引在[1,2)范围内的一维数组,获取一维数组的所有元素
    70. array([[[14, 15, 16]]])
    复制代码

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

知者何南

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表