当前位置: 首页 > news >正文

文本字符分割算法尝试

一、基于opencv的分割算法

import cv2
import numpy as np
from matplotlib import pyplot as plt

img = cv2.imread('scratch.png', 0)
# global thresholding
ret1, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# Otsu's thresholding
th2 = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
# Otsu's thresholding
# 阈值一定要设为 0 !
ret3, th3 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# plot all the images and their histograms
images = [img, 0, th1, img, 0, th2, img, 0, th3]
titles = [
  'Original Noisy Image', 'Histogram', 'Global Thresholding (v=127)',
  'Original Noisy Image', 'Histogram', "Adaptive Thresholding",
  'Original Noisy Image', 'Histogram', "Otsu's Thresholding"
]
# 这里使用了 pyplot 中画直方图的方法, plt.hist, 要注意的是它的参数是一维数组
# 所以这里使用了( numpy ) ravel 方法,将多维数组转换成一维,也可以使用 flatten 方法
# ndarray.flat 1-D iterator over an array.
# ndarray.flatten 1-D array copy of the elements of an array in row-major order.
for i in range(3):
  plt.subplot(3, 3, i * 3 + 1), plt.imshow(images[i * 3], 'gray')
  plt.title(titles[i * 3]), plt.xticks([]), plt.yticks([])
  plt.subplot(3, 3, i * 3 + 2), plt.hist(images[i * 3].ravel(), 256)
  plt.title(titles[i * 3 + 1]), plt.xticks([]), plt.yticks([])
  plt.subplot(3, 3, i * 3 + 3), plt.imshow(images[i * 3 + 2], 'gray')
  plt.title(titles[i * 3 + 2]), plt.xticks([]), plt.yticks([])
plt.show()

二、基于skimage的分割算法尝试

参考链接:

Niblack and Sauvola Thresholding — skimage 0.24.1rc0.dev0 documentation (scikit-image.org)

 Python图像处理二值化方法实例汇总_python_脚本之家 (jb51.net)

skimage sauvola阈值 (主要用于文本检测)

import matplotlib
import matplotlib.pyplot as plt

from skimage.data import page
from skimage.filters import (threshold_otsu, threshold_niblack,
               threshold_sauvola)


matplotlib.rcParams['font.size'] = 9


image = page()
binary_global = image > threshold_otsu(image)

window_size = 25
thresh_niblack = threshold_niblack(image, window_size=window_size, k=0.8)
thresh_sauvola = threshold_sauvola(image, window_size=window_size)

binary_niblack = image > thresh_niblack
binary_sauvola = image > thresh_sauvola

plt.figure(figsize=(8, 7))
plt.subplot(2, 2, 1)
plt.imshow(image, cmap=plt.cm.gray)
plt.title('Original')
plt.axis('off')

plt.subplot(2, 2, 2)
plt.title('Global Threshold')
plt.imshow(binary_global, cmap=plt.cm.gray)
plt.axis('off')

plt.subplot(2, 2, 3)
plt.imshow(binary_niblack, cmap=plt.cm.gray)
plt.title('Niblack Threshold')
plt.axis('off')

plt.subplot(2, 2, 4)
plt.imshow(binary_sauvola, cmap=plt.cm.gray)
plt.title('Sauvola Threshold')
plt.axis('off')

plt.show()

三、IntegralThreshold(主要用于文本检测)

工程所在链接

GitHub - Liang-yc/IntegralThreshold: Adaptive Thresholding Using the Integral Image.

相关文章:

  • 磁盘调度管理中移臂调度和旋转调度
  • react 使用Ant Design中DatePicker设置mode=“year“无法获取value
  • 自动驾驶---什么是Frenet坐标系?
  • [数据集][目标检测]水面垃圾检测数据集VOC+YOLO格式2027张1类别
  • 通过redis-operator 来部署 Redis Cluster 集群
  • GIT使用常见问题
  • 【Linux 从基础到进阶】MongoDB 数据库安装与调优
  • Java笔试面试题AI答之正则表达式(3)
  • Java中的TCP/IP与UDP协议Socket入门
  • linux~~目录结构远程登录教程(xshell+xftp)
  • CSS解析:盒模型
  • 前端宝典二十七:React Native最佳实践实例推荐
  • 【Spring Boot 3】【Web】ProblemDetail
  • 【C++取经之路】map的详细介绍及其使用
  • XSS 漏洞 - 学习手册
  • P1597 语句解析
  • Java 入门指南:初识 Java NIO
  • Android终端如何快速接入GB28181平台实现实时音视频回传
  • 【JupyterLab】pip安装过程问题记录(未完)
  • OpenAI 联合创始人的 AI 安全公司 SSI 筹集 10 亿美元资金|TodayAI
  • 广西干旱程度有所缓解,未来一周旱情偏重地区降水量仍不足
  • 美国“杜鲁门”号航母一战机坠海
  • “五一”假期倒计时,节前错峰出游机票降价四成
  • 安阳一村支书微信群骂村民被警方行拘,辩称对方先“污蔑造谣”
  • 上海“生育友好岗”已让4000余人受益,今年将推产假社保补贴政策
  • 《沙尘暴》:用贴近生活的影像和表演拍摄悬疑剧