文通TH-OCR免费版可以将上传的图片文字转换成可编辑的文字,可一键图片转换文字,也可手动进行版面分析,只转换你需要的部分,文字识别速度快。支持JPG、PNG、GIF、BMP、DOC、TIF等图片格式。文通TH-OCR免费版集图像采集、识别、导出于一体,OCR文字识别方便快捷。
公司简介
北京文通科技有限公司是享誉国内外的OCR(光学字符识别)技术生产商、文档影像技术和应用解决方案提供商。文通科技以TH-OCR文字识别和手写识别技术为核心,研发出多项产品并提供多种行业解决方案。目前,文通科技已经拥有跨平台(包括Windows/Linux/Android/IOS及嵌入式平台)的智能图像处理、亚洲文字OCR、手写识别、二维条码识别等自有知识产权技术。
基础功能
1:此软件具有文通最新识别核心,识别正确率高,识别速度快;
2:支持导入图像,支持连接扫描仪扫描图像
3:支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG等多种格式的图像文件;
4:可识别简体、繁体和英文三种语言;
软件特色
XML技术
系统基于开放式的XML数据结构,可以对数据进行扩充和再定义。支持第三方开发厂商方便地进行文档数据的转换、迁移和再利用。
版面还原
强大的版面还原技术,可将识别后的报刊、杂志、图书等多种形式的文档,通过还原字体、字号、版面位置、字体颜色等信息以原版原式呈现在读者面前,最终生成优质的全息PDF文档。
识别核心
内置文通公司最新研发的高性能文字识别引擎,中文识别率达99.8%以上。英文、日文、韩文的识别率居世界领先水平。
UNICODE编码
采用UNICODE国际编码标准。系统可在一个统一的平台下,同时处理包括中文、日文、韩文、英文在内的多种文字的识别和校对修改。
自学习软件
针对古籍、科研等特殊领域文档中经常出现的特殊文字,即使不在国家标准范围以内或者TH-OCR字库中并没有支持,用户也可通过自学习功能,将这些文字的图像学习进入系统,使得调整后的核心可以支持这些文字的识别。
双层PDF批量制作功能
可以实现图像文件到PDF文件的自动转换,生成的PDF文件能够实现全文检索,可以复制粘贴,也可以对某个指定目录进行长期监视,真正实现无人操作。
安装步骤
1、在本网站下载软件安装包,双击打开下载的.exe文件,进入软件安装界面
2、软件正在安装中,我们耐心等待安装进度条完成就可以了。
3、软件安装完毕
使用方法
1、首先点击图像采集,软件会提示你是扫描导入,还是本机导入。你可以根据自己意愿选择。
2、点击 简单版面分析,软件会自动文字定位,在整幅图像上寻找文字进行定位。
3、点击识别系统就会进行OCR识别,把识别结果显示到右侧的空白处。
4、最后一步就是导出了。你可以导出PDF,TXT或者复制到剪切板。
识别出的文字全为乱码。
答:(1)图像文件倾斜,进行倾斜较正即可解决; (2)是否定义的文字属性(包括“简体多体”、“繁体多体”、“纯英文”及“手写体”)与原稿不符,修改正确即可; (3)是否原稿中的文字旁有辅助线,字体为斜体或艺术字等..
OCR识别效果不理想的原因是什么?
网友评论 查看所有0条评论>>