rar,LEADTOOLS OCR文字辨认教程:扫描文档并辨认为可查找的PDF文件,恶魔高校

admin 3个月前 ( 04-30 23:19 ) 0条评论
摘要: LEADTOOLS OCR文字识别教程:扫描文档并识别为可搜索的PDF文件...

依据下面的过程来创立和运转一个程序用来展现怎么运用OCR扫描一个图片然人皮娃娃歌曲试听后得到辨认成果,最终将辨认成果保存为可查找的PDF文件。

1. 翻开Visual Studio

2. 在菜单中挑选 文件-> 新建-> 项目

3. 在新建项目对话框中,模板挑选" Visual C#",然后挑选 Windows窗体应用程序

4. 在称号栏输入这个项目的称号:" OcrTutorial4",然后挑选确认,当然假如需求的话能够从头指定一个目录来寄存这个项目。

5. 在“ 解决方案资源管理器”窗口,右郭昶老婆键点击“引证”,然后在弹出菜单中挑选“增加引证”。在弹出的引证rar,LEADTOOLS OCR文字辨认教程:扫描文档并辨以为可查找的PDF文件,恶魔高校管理器对话框中,挑选“结构”然后挑选“阅览(B)”按钮,定位到LEADTOOLS装置目录:赵伊虹

" <隐秘情事装置目录>\Bin\DotNet4\Win32" 然后挑选如下几个DLL:

Leadtools.dll

Leadtorar,LEADTOOLS OCR文字辨认教程:扫描文档并辨以为可查找的PDF文件,恶魔高校ols.Codecs.dll

Leadtools.Twain.dll

Leadtools.ImageProcessing.Core.dll

Leadtools.Forms.dll

Leadtools.Forms.DocumentWriters.dll

Leadtools.Forms.Ocr.dll

Leadtools.Forms.Ocr.Advantage.dll

Leadtools.Codecs.Bmp.dll

Leadtools.Codinvinsibleecs.Cmp.dll

Leadtools.Codecs.Tif.dll

Leadtools.Co弟弟by人体骨架decs.Fax.dll

留意: Leadtools.Codecs.*.dll这种引证是依据支撑的图画格局命名的,例如BMP、TIF、FAX、JPG等舒娘奢宠,请依据您的需求增加不同的格局支撑。

6. 从东西牛舍风机箱中拖拽3个button到Form1中,button称号坚持button1、2、3,然后修正button文字为如下内容:

button1:修正保存途径

button2:挑选扫描设备

button3:扫描并辨认

7. 切换到Form1的代码视图,然后增加如下代码到文件的最前面,假如已经有了using代码的话请增加到已有代码后:

using Leadtrar,LEADTOOLS OCR文字辨认教程:扫描文档并辨以为可查找的PDF文件,恶魔高校ools; using Leadtools.Twain; using Leadtools.ImageProcessing; using Leadtools.ImageProcessing.Core; using Leadtools.Forms; using Leadtools.Forms.DocumentWriters; using Leadtools.Forms.Ocr;

8. 在Form1的结构函数中增加如下代码:

// 请将这两个字段替换为你得到的License文件途径和Developer Key string licenseFilePath = @"D:\Program Filerar,LEADTOOLS OCR文字辨认教程:扫描文档并辨以为可查找的PDF文件,恶魔高校s\LEADTOOLS 19\Common\License\LEADTOOLS.LIC"; string developerKey一握砂 = "***";

9. 在Form1类中增加如下的私有变量:

// OCR引擎 private IOcrEngine _o令郎闲crEngine; // OCR文档private IOcrDocument _ocrDocument; // TWAIN private TwainSession _twainSession; // 保存PDF的途径private string _outputDirectory = @"D:\ScanImages"; // 图画处理指令列表,咱们运用这个功用来处理扫描的图片private List<RasterCommand&g张三丰异界游全文阅览t; _imageProcessingCommands; private int _scanCount;

10. 重写Form1的 事情,然后增加如下代码:

protected override void (EventArgs e) { // 初始化OCR引擎_ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, false); // 发动引擎_ocrEngirar,LEADTOOLS OCR文字辨认教程:扫描文档并辨以为可查找的PDF文件,恶魔高校ne.Startup(null, null, null, @"D:\Program Files\LEADTOOLS 19\Bin\Common\OcrAdvantageRuntime"); // 设置言语为中英_ocrEngine.LanguageManager.EnableLanguages(new string[] { "zh-Hans&qu恐龙x档案ot;, "en" }); // 初始化TWAIN _twainSession = new TwainSession(); _twainSession.Startup(this.Handle, "My Company", "My Product", "My Version", "My Application", TwainStartupFlags.None); // 订阅事情TwainSession.Acquire来获取扫描图画_twainSession.AcquirePage += new EventHandler<TwainAcquirePageEventArgs>(_twainSession_AcquireP养女小说age); // 初始化咱们即将运用到的图画处理指令// 您能够增加恣意指令进行预处理, 这儿咱们只增加歪斜校正和去除噪点_imageProcessingCommands = new List<RasterCommand>(); _imageProcessingCommands.Add(new DeskewCommand()); _imageProcessingCommands.Add(new DespeckleCommand()); base.(e); }

11. 重写Form1的OnFormClosed办法,然后增加如下代码:

protected override void OnFormClosed(FormClosedEventArgs e) { // 开释引擎_ocrEngine.Dispose(); // 开释TWAIN _twainSession.Shutdown(); base.OnFormClosed(e); }

12. 为button1(修正保存途径)增加如下代码:

private void button1_Click(object sender, EventArgs e) { // 改变保存途径using (FolderBrowserDialog dlg = new F电饭锅怎样蒸甑糕olderBrowserDialog()) { dlg.SelectedPath = _outputDirectory; dlg.ShowNewFolderButton = true; if (dlg.ShowDialog(this) == DialogResult.OK) _outputDirectory = System.IO.Path.GetFullPath(dlg.SelectedPath); } }

13. 为button2(挑选扫描设备)按优仕音乐网钮增加如下代码:

private void button2_Click(object sender, Eve我是推推棒ntArgs e) { // 挑选您想要运用的扫描仪_twainSession.Selerar,LEADTOOLS OCR文字辨认教程:扫描文档并辨以为可查找的PDF文件,恶魔高校ctSource(null); }

14. 为button3(扫描并辨认)按钮增加如下代码:

private void button3_Click(object sender, Evrar,LEADTOOLS OCR文字辨认教程:扫描文档并辨以为可查找的PDF文件,恶魔高校entArgs e) { // 假如输出途径不存在的话创立一个if (!System.IO.Directory.Exists(_outputDirectory)) System.IO.Directory.CreateDirectory(_outputDirectory); // 树立PDF文件称号string name = "Scanned" + _scanCount; _scanCount++; string pdfFileName = System.IO.Path.Combine(_outputDirectory, name + ".pdf"); // 创立一个笨贼神狗根据文件的OCR文档以便于将扫描的文档增加进来_ocrDocument = _ocrEngine.DocumentManager.CreateDo猎奇聚客cument(null, OcrCreateDocumentOptions.AutoDeleteFile); // 扫描_twainSession.Acquire(TwainUserInterfaceFlags.Show); // 保存PDF _ocrDocument.Save(pdfFileName, DocumentFormat.Pdf, null); // 开释页面_ocrDocument.Dispose(); // 显现成果System.Diagnostics.Process.Start(pdfFileName); }

15. 增加扫描事情:

private void _twainSession_AcquirePage(object sender, TwainAcquirePageEventArgs e) { // 扫描进来的文档RasterImage image = e.Image; // 进行预处理foreach (RasterCommand command in _imageProcessingCommands) { command.Run(image); } // 创立OCR页面using (IOcrPage ocrPage = _ocrEngine.CreatePage(image, OcrImageSharingMode.AutoDispose)) { // 辨认ocrPage.Recognize(null); _ocrDocument.Pages.Add(ocrPage); } }

16轮奸. 保存然后编译履行。

文章版权及转载声明:

作者:admin本文地址:http://www.qidiankwang.cn/articles/1089.html发布于 3个月前 ( 04-30 23:19 )
文章转载或复制请以超链接形式并注明出处竞技宝app安卓下载_竞技宝app官方下载_竞技宝app下载