【利用PyQt5和YOLOv11开辟电脑屏幕地区的实时分类GUI】——选择检测地区 ...

打印 上一主题 下一主题

主题 883|帖子 883|积分 2653

这个系列专栏是为了记录在研一打仗到的第一个横向课题中的实际应用,我的任务包括,练习一个多分类的深度学习模型,为模型开辟一个GUI方便无盘算机背景的人利用。同时我盼望将它打包成一个exe文件,当其他人的电脑没有对应的python环境时也可以利用该系统。在编程语言的选择上,我对python最为熟练,C++稍微差一些,因此起首选择python开辟,在日后如有机会,盼望可以利用C++重写该系统。
  设计思绪:

  • 要对屏幕中的指定地区举行实时检测,因此必要编写一个DiagnosisAreaSelector.py选择检测地区,还必要一个ScreenCapture.py来实时捕获屏幕。
  • 当诊断地区选择成功后,必要利用DLInference.py对实时捕获的屏幕举行推理。
  • 当得到推理效果后,我们必要利用ResultPlot.py将效果可视化,方便观察
  • 利用PyQt5绘制页面,编写信号与槽函数将一些相关功能绑定在按钮上,必要为实时捕获屏幕和模型推理功能放置在不同的线程中防止主线程卡死。
   在实际的检测过程中,也许我们并不必要对屏幕中的所有内容举行深度学习模型的推理,以是我在这里设计了一个选择模型推理地区的功能。在这里我将该类起名为:DiagnosisAreaSelector.py
  一、代码:

可以解开print语句的注释调试代码。
  1. import numpy as np
  2. import cv2
  3. import pyautogui
  4. from MouseController import mouse_listener
  5. from PIL import ImageGrab
  6. import time
  7. class DiagnosisArea:
  8.     def __init__(self):
  9.         self.lt_xy = None
  10.         self.rb_xy = None
  11.         self.frame_count = 0
  12.         self.start_time = time.time()
  13.         pass
  14.     def acquire_accord(self, wh_format: bool, looklike_window: str):
  15.         '''
  16.         :param wh_format: 是否需要宽高形式的数据:left, top, width, height。如果选择False,则会返回lt_xy, rb_xy,分别是区域左上坐标的元组和右下坐标的元组。
  17.         :param looklike_window: 相似区域的图像
  18.         :return: 以不同格式表示的检测区域
  19.         '''
  20.         # looklike_window,如果每次启动程序要检测的区域都很相似,那么可以传入一个looklike_window,他会自动找到屏幕上的这部分区域,并将其设置为检测区域
  21.         left, top, width, height = -1, -1, -1, -1
  22.         # 在我的实际应用中并没有使用left, top, width, height格式的数据,因此就没有将它设置为属性
  23.         try:  # 如果能找到完全相同的区域,直接返回该区域坐标
  24.             left, top, width, height = pyautogui.locateOnScreen(looklike_window)
  25.         except (
  26.                 pyautogui.ImageNotFoundException
  27.         ):  # 如果找不到完全相同的区域,就通过鼠标监听的方式获取区域坐标
  28.             # print("The image was not found on the screen.")
  29.             # print("Start listening for the image...")
  30.             window = mouse_listener()
  31.             window.listen()
  32.             if len(window.accord) == 2 and window.accord[0] != window.accord[1]:
  33.                 self.lt_xy = window.accord[0]
  34.                 self.rb_xy = window.accord[1]
  35.                 if self.lt_xy[0] > self.rb_xy[0] or self.lt_xy[1] > self.rb_xy[1]:
  36.                     # print(
  37.                     #     "错误:请先在区域的左上角按下鼠标,再在区域的右下角松开鼠标。"
  38.                     # )
  39.                     self.acquire_accord(
  40.                         wh_format=False, looklike_window=looklike_window
  41.                     )  # 递归调用以重新选择
  42.                 # else:
  43.                 #     # print("窗口区域已设置:", self.lt_xy, self.rb_xy)
  44.             else:
  45.                 # print("未能获取正确的坐标。请重新选择。")
  46.                 self.acquire_accord(
  47.                     wh_format=False, looklike_window=looklike_window
  48.                 )
  49.         if wh_format:
  50.             if self.lt_xy is not None and self.rb_xy is not None:
  51.                 left = self.lt_xy[0]
  52.                 top = self.lt_xy[1]
  53.                 # 计算宽度和高度
  54.                 width = self.rb_xy[0] - self.lt_xy[0]
  55.                 height = self.rb_xy[1] - self.lt_xy[1]
  56.                 # 返回左上角坐标和宽高
  57.             return left, top, width, height
  58.         else:
  59.             if left != -1 and top != -1 and width != -1 and height != -1:
  60.                 self.lt_xy, self.rb_xy = self.caculate_accord(left, top, width, height)
  61.             return self.lt_xy, self.rb_xy
  62.     def cap_screen(self, looklike_window: str):
  63.         if self.lt_xy is None and self.rb_xy is None:
  64.             # print("执行了这段代码")
  65.             self.acquire_accord(wh_format=False, looklike_window=looklike_window)
  66.         screen = self.lt_xy + self.rb_xy
  67.         img = ImageGrab.grab(screen)
  68.         return img
  69.     def caculate_accord(self, left, top, width, height):
  70.         lt_xy = (left, top)
  71.         rb_xy = (left + width, top + height)
  72.         return lt_xy, rb_xy
  73.     # --------------------------------测试用函数------------------------------------
  74.     def dispaly_realtime(self, looklike_window):
  75.         while True:
  76.             self.frame_count += 1
  77.             current_time = time.time()
  78.             elapsed_time = current_time - self.start_time
  79.             if elapsed_time > 1:  # 每秒计算一次帧率
  80.                 frame_rate = self.frame_count / elapsed_time
  81.                 print(f"接收到图像的帧率Frame rate: {frame_rate} frames per second")
  82.                 self.frame_count = 0
  83.                 self.start_time = current_time
  84.             img = self.cap_screen(looklike_window)
  85.             img_np = cv2.cvtColor(np.array(img), cv2.COLOR_RGB2BGR)
  86.             cv2.imshow("Diagnosis Area", img_np)
  87.             if cv2.waitKey(1) & 0xFF == ord("q"):
  88.                 break
  89.     def draw_rect(self, lt_xy, rb_xy):
  90.         screenshot = pyautogui.screenshot()
  91.         frame = np.array(screenshot)
  92.         frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
  93.         cv2.rectangle(frame, lt_xy, rb_xy, (0, 255, 0), 2)
  94.         cv2.imshow("window", frame)
  95.         cv2.waitKey(0)
  96.         cv2.destroyAllWindows()
  97. if __name__ == "__main__":
  98.     window = DiagnosisArea()
  99.     looklike_window = "D:/Desktop/srm_GUI/assets/like_window.png"
  100.     window.cap_screen(looklike_window)
  101.     window.dispaly_realtime(looklike_window)
  102.     cv2.destroyAllWindows()
复制代码

二、总结:


  • 这里的Image.grab()方法有点慢,在实际中利用了mss库方法。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

刘俊凯

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表