WPF制作文字OCR软件（一）：本地图片OCR识别

您所在的位置：网站首页 › 苹果图片转文字的软件 › WPF制作文字OCR软件（一）：本地图片OCR识别

WPF制作文字OCR软件（一）：本地图片OCR识别

2024-07-10 14:56| 来源: 网络整理| 查看: 265

WPF制作文字OCR软件（一）：本地图片OCR识别一、前言

上一篇文章，我使用python来进行文字OCR，但是python在图形化编程方面并不友好，所以我打算放弃使用python来搭建一款文字OCR软件。从这篇文章开始，我将分成几个部分来分享如何使用WPF（Windows Presentation Foundation）利用百度智能云API制作一款文字OCR软件。

WPF（Windows Presentation Foundation）是微软推出的基于Windows 的用户界面框架，属于.NET Framework 3.0的一部分。它提供了统一的编程模型、语言和框架，真正做到了分离界面设计人员与开发人员的工作；同时它提供了全新的多媒体交互用户图形界面。（截自百度百科WPF）

首先需要说明的一点是，我并没有系统性地学过WPF甚至是C#语言，本人只不过有一些C++的基础，外加学过一点MFC而已，如果大家只是想要利用WPF做一个小应用，这些基础已经足够了。

本篇文章主要介绍如何使用WPF从本地图片上获取上面的文字。

二、编写程序 1.创建项目

进入Visual Studio（我使用的是vs2017）中新建工程，在其他语言中选择Visual C#再选择WPF应用在这里插入图片描述我使用的框架为.NET Framework 4.6.1

2.实现本地图片OCR功能

创建完工程后，进入MainWindow.xaml.cs中，定义两个变量clientId和clientSecret自己在百度智能云上创建的应用的API_KEY和SECRET_KEY；在这里插入图片描述之后添加以下代码：

/// /// 获得accessToken /// /// AccessToken public static String getAccessToken() { String authHost = "https://aip.baidubce.com/oauth/2.0/token"; System.Net.Http.HttpClient client = new System.Net.Http.HttpClient(); List paraList = new List(); paraList.Add(new KeyValuePair("grant_type", "client_credentials")); paraList.Add(new KeyValuePair("client_id", clientId)); paraList.Add(new KeyValuePair("client_secret", clientSecret)); try { System.Net.Http.HttpResponseMessage response = client.PostAsync(authHost, new System.Net.Http.FormUrlEncodedContent(paraList)).Result; String result = response.Content.ReadAsStringAsync().Result; String[] SpiltStr1 = result.Split(','); String[] SpiltStr2 = SpiltStr1[3].Split(':'); String[] SpiltStr3 = SpiltStr2[1].Split('"'); return SpiltStr3[1]; } catch { System.Windows.MessageBox.Show("出错了，请检查网络之后重试"); return null; } } /// /// 上传图片，获得识别内容 /// /// private string GetWords(string path) { DateTime startTime = DateTime.Now; string token = getAccessToken(); string host = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + token; Encoding encoding = Encoding.Default; System.Net.HttpWebRequest request = (System.Net.HttpWebRequest)System.Net.WebRequest.Create(host); request.Method = "post"; request.KeepAlive = true; // 图片的base64编码 string base64 = getFileBase64(path); String str = "image=" + HttpUtility.UrlEncode(base64); byte[] buffer = encoding.GetBytes(str); request.ContentLength = buffer.Length; request.GetRequestStream().Write(buffer, 0, buffer.Length); HttpWebResponse response = (HttpWebResponse)request.GetResponse(); StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.UTF8); string result = reader.ReadToEnd(); return result; } /// /// 转换为用 Base64 数字编码的字符串表示形式 /// /// 文件路径 /// 字符串 public static String getFileBase64(String fileName) { FileStream filestream = new FileStream(fileName, FileMode.Open); byte[] arr = new byte[filestream.Length]; filestream.Read(arr, 0, (int)filestream.Length); string baser64 = Convert.ToBase64String(arr); filestream.Close(); return baser64; }

上面说过官方的程序存在BUG，因为官方给出的获取Access Token的程序有一点问题。如果只是使用官方程序，会返回如下错误，可以看出是Access token的问题。在这里插入图片描述通过Debug可以发现在getAccessToken()函数中返回的不仅仅有Access token，还有其他值，所以需要进行一点处理，对字符串进行分割。处理的程序如下：

String[] SpiltStr1 = result.Split(','); String[] SpiltStr2 = SpiltStr1[3].Split(':'); String[] SpiltStr3 = SpiltStr2[1].Split('"'); return SpiltStr3[1];

需要注意在使用上面的程序时，需要添加如下引用 using System.IO; using System.Net; using System.Web; 其中 System.Web可能需要从引用中添加，而不只是单单写在程序中

我们在项目下面新建一个文件夹，然后将一张图片放在该文件夹内，如图：在这里插入图片描述在mainwindow函数中添加如下程序：

public MainWindow() { InitializeComponent(); string str=GetWords("D:\\VS2017Project\\OCRCSDN\\OCRCSDN\\resources\\wpf.png"); MessageBox.Show(str); }

消息框返回的信息为：在这里插入图片描述

很显然，这并不是我们所需要的信息，所以接下来要对返回的信息进行处理。通过观察，我们可以发现返回的信息符合json的格式，所以可以将字符串json化之后进行处理。

3.字符串JSON化处理

首先点击项目-->管理Nuget程序包,搜索json，选择第一个Newtonsoft.Json安装。在这里插入图片描述安装好后，在mainwindow.xaml.cs中添加以下程序：

public String Str2Json(string text) { JObject jo = (JObject)Newtonsoft.Json.JsonConvert.DeserializeObject(text); string str = ""; for (int i = 0; i

【本文地址】

WPF制作文字OCR软件（一）：本地图片OCR识别

WPF制作文字OCR软件（一）：本地图片OCR识别

今日新闻

推荐新闻