当前位置: 首页 > news >正文

【图片识别分类】如何快速识别照片中的水印文字,对图片进行关键字分类,快速整理水印相机拍摄图片,基于WPF和腾讯OCR的技术实现

项目背景

在施工现场,施工人员通常会使用水印相机拍摄照片,这些照片带有时间、地点、施工阶段等水印信息。为了便于管理和归档,需要快速识别照片中的水印文字,并根据关键字对照片进行分类和整理。

界面设计

界面设计简洁直观,方便用户快速上手:

  • 主窗口:包含一个图片选择区域、一个识别结果展示区域、一个关键字分类区域以及几个操作按钮(如“选择图片”、“开始识别”、“导出结果”等)。

  • 图片选择区域:用户可以通过按钮选择需要处理的图片文件,支持批量选择。

  • 识别结果展示区域:显示图片中识别到的文字内容。

  • 关键字分类区域:用户可以输入关键字,系统会根据关键字对图片进行分类。

  • 操作按钮

    • 选择图片:打开文件选择对话框,选择图片。

    • 开始识别:调用腾讯 OCR API 对选中的图片进行文字识别。

    • 导出结果:将识别结果和分类结果导出到表格或文件中。

详细代码步骤

以下是基于 WPF 和腾讯 OCR 的实现代码:

1. 引入必要的命名空间
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net.Http;
using System.Text;
using System.Threading.Tasks;
using System.Windows;
using System.Windows.Controls;
using System.Windows.Data;
using System.Windows.Documents;
using System.Windows.Input;
using System.Windows.Media;
using System.Windows.Media.Imaging;
using System.Windows.Navigation;
using System.Windows.Shapes;
using Newtonsoft.Json;
using TencentCloud.Common;
using TencentCloud.Common.Profile;
using TencentCloud.Ocr.V20181119;
using TencentCloud.Ocr.V20181119.Models;
2. 主窗口代码

csharp

复制

public partial class MainWindow : Window
{private string secretId = "your_secret_id";private string secretKey = "your_secret_key";private List<string> imagePaths = new List<string>();public MainWindow(){InitializeComponent();}private async void btnSelectImages_Click(object sender, RoutedEventArgs e){Microsoft.Win32.OpenFileDialog openFileDialog = new Microsoft.Win32.OpenFileDialog{Multiselect = true,Filter = "Image files (*.jpg;*.jpeg;*.png)|*.jpg;*.jpeg;*.png"};if (openFileDialog.ShowDialog() == true){imagePaths = openFileDialog.FileNames.ToList();txtResults.Text = "Selected images: " + string.Join(", ", imagePaths);}}private async void btnStartRecognition_Click(object sender, RoutedEventArgs e){if (imagePaths.Count == 0){MessageBox.Show("Please select images first.");return;}List<string> results = new List<string>();foreach (var imagePath in imagePaths){string result = await RecognizeImageText(imagePath, secretId, secretKey);results.Add(result);txtResults.Text += $"\n\nImage: {imagePath}\nResult: {result}";}}private async Task<string> RecognizeImageText(string imagePath, string secretId, string secretKey){try{Credential cred = new Credential(secretId, secretKey);HttpProfile httpProfile = new HttpProfile{Endpoint = "ocr.tencentcloudapi.com"};ClientProfile clientProfile = new ClientProfile{HttpProfile = httpProfile};OcrClient client = new OcrClient(cred, "ap-guangzhou", clientProfile);GeneralBasicOCRRequest req = new GeneralBasicOCRRequest{ImageBase64 = Convert.ToBase64String(File.ReadAllBytes(imagePath))};GeneralBasicOCRResponse resp = await client.GeneralBasicOCR(req);return JsonConvert.SerializeObject(resp, Formatting.Indented);}catch (Exception ex){return $"OCR recognition failed: {ex.Message}";}}private void btnExportResults_Click(object sender, RoutedEventArgs e){SaveFileDialog saveFileDialog = new SaveFileDialog{Filter = "Text files (*.txt)|*.txt"};if (saveFileDialog.ShowDialog() == true){File.WriteAllText(saveFileDialog.FileName, txtResults.Text);MessageBox.Show("Results exported successfully.");}}
}
3. XAML 界面代码
<Window x:Class="WpfApp.MainWindow"xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"Title="OCR Image Recognition" Height="450" Width="800"><Grid><Grid.RowDefinitions><RowDefinition Height="Auto"/><RowDefinition Height="*"/><RowDefinition Height="Auto"/></Grid.RowDefinitions><Button x:Name="btnSelectImages" Content="Select Images" Grid.Row="0" Margin="10" Click="btnSelectImages_Click"/><TextBox x:Name="txtResults" Grid.Row="1" Margin="10" VerticalScrollBarVisibility="Auto" TextWrapping="Wrap"/><Button x:Name="btnStartRecognition" Content="Start Recognition" Grid.Row="2" Margin="10" Click="btnStartRecognition_Click"/><Button x:Name="btnExportResults" Content="Export Results" Grid.Row="2" Margin="10" HorizontalAlignment="Right" Click="btnExportResults_Click"/></Grid>
</Window>

总结优化

  1. 性能优化:对于大量图片的处理,可以考虑使用多线程或异步编程来提高识别效率。

  2. 功能扩展:可以增加更多功能,如支持更多图片格式、支持对识别结果的编辑和校正。

  3. 用户体验:进一步优化界面设计,使其更加友好和直观。

  4. 错误处理:增强错误处理机制,确保在识别失败或网络问题时能够给用户清晰的提示。

通过上述实现,可以快速识别施工现场照片中的水印文字,对图片进行关键字分类,并快速整理水印相机拍摄的图片,提高工作效率

相关文章:

  • QML中的3D功能--自定义着色器开发
  • 实现Azure Synapse Analytics安全地请求企业内部API返回数据
  • Flink框架十大应用场景
  • 嵌入式软件--stm32 DAY 2
  • 为什么浮点数会搞出Infinity和NAN两种类型?浮点数的底层原理?IEEE 754标准揭秘?
  • VSCode安装与环境配置(Mac环境)
  • 【计算机视觉】CV实战项目- Face-and-Emotion-Recognition 人脸情绪识别
  • sqlilabs-Less11 POST注入
  • 一个项目中多个Composer的使用方法
  • LibModbus 主从机通信应用实例
  • 【今日三题】判断是不是平衡二叉树(递归) / 最大子矩阵(二维前缀和) / 小葱的01串(滑动窗口)
  • 【技术派后端篇】 Redis 实现用户活跃度排行榜
  • 数据库备份-docker配置主从数据库
  • IntelliJ IDEA右键快捷方式设置方法
  • Sentinel源码—5.FlowSlot借鉴Guava的限流算法二
  • uniApp小程序保存定制二维码到本地(V3)
  • YOLOv11改进有效涨点专栏:从理论到实战的深度优化指南
  • docker转移镜像
  • 那就聊一聊mysql的锁
  • 【基于Fluent+Python耦合的热管理数字孪生系统开发:新能源产品开发的硬核技术实践】
  • 玉渊谭天丨先爆视频再爆订单,美关税影响下企业因短视频火出圈
  • 智慧菜场团标试验:标准化的同时还能保留个性化吗?
  • 全国首家由司法行政部门赋码登记的商事调解组织落户上海
  • 海外考古大家访谈|马克·波拉德:以考古意识为本位的科技考古学家
  • 中国船东协会:强烈要求美方停止基于政治偏见的调查和行动
  • 上海一季度人民币贷款增4151亿,住户存款增3134亿