ImageOCR

操作系统 云服务/平台 技术难度 关注领域
Linux   中级

嵌入

任务目标

希望可以识别图片中的文字信息,应用于一些需要提取图片中信息的场景。期望可以准确识别出图片中的中英文文字信息,并将文字信息输出,供后续场景使用。

所需材料/所需清单/工具

  • Qualcomm® QRB2210 SOC Open Kit

  • USB Line

  • Charger

  • Cameramodule

源码/示例/可执行的应用程序

  • 源代码

附加资料

  • 视频链接

  • Tesseract-OCR语言模型(Tesseract开源项目)

构建/汇编指令

(1) 配置RB1专用SDK后,创建交叉编译环境;

(2) 交叉编译环境下,配置tesseract所需第三方库环境,如leptonica、libgif、libjpeg、libpng、libtiff、zlib等;

(3) 交叉编译环境下,编译开源库tesseract,生成头文件、lib库等编译产物;

(4) 交叉编译环境下,通过Cmake编译直接生成产品;

使用说明

(1) 准备英文文字图片或中文文字图片,放在image_ocr可执行程序同级目录;

(2) 准备libgif.so、liblept.so、libtesseract.so等image_ocr可执行程序需要的动态库文件,放在image_ocr可执行程序同级目录;

(3) 准备tesseract语言模型文件夹tessdata,放在image_ocr可执行程序同级目录;;

(4) 执行image_ocr可执行程序,需要带两个参数:

第一个参数是图片路径名称,可根据实际情况携带参数;

第二个参数是加载图片类型,其中1为英文文字图片,2为中文文字图片,可根据实际情况携带参数;

adb push ./english_pictire.jpg /data

adb push ./chinese_picture.jpg /data

adb push ./path/to/libgif*.so /data

adb push ./path/to/liblept*.so /data

adb push ./path/to/libtesseract*.so /data

adb push ./path/to/tessdata /data

adb push ./image_ocr /data;

adb shell

cd data

. /image_ocr english_pictire.jpg 1

. /image_ocr chinese_picture.jpg 2

贡献者信息

姓名 公司

Zhang

zhangzz6687@thundersoft.com
中科创达

Tian

yafang.tian@thundercomm.com

中科创达

He

siyuan.he@thundersoft.com

中科创达

Yan

zhe.yan@thundersoft.com

中科创达

 

如提交有关内容(以下简称为“提交内容”),则表明您向高通公司授予有关以下各项的免费、永久性、非排他性、不受限制、全球范围内的许可:(a)公布、使用、复制、转授、改编、传输、公开执行或展示提交内容;(b)在没有限制条件的情况下使用、复制、修改、改编、发布、翻译、创作衍生作品、分发、执行、演示、托管、提供和发布您的提交内容;(c)向第三方转授无限制的行使针对提交内容所授予的前述任何权利的权利。前述权利应当包括利用提交内容中的任何理念、概念、知识产权、或专有权利的权利,包括但不限于在任何相关司法管辖区内根据著作权、商标、服务标记或专利等法律所享有的权利,同时高通公司无须向您支付任何款项。您声明并保证,您拥有有关提交内容的所有权利、所有权和权益,或您已被授予有关提交内容的充分权利,以确保能够按照前述方式使用提交内容。

 

Qualcomm 解决方案

 

高通 AI Hub

全新高通 AI Hub 包含预优化AI模型库,支持在搭载骁龙和高通平台的终端上进行无缝部署。
该模型库为开发者提供超过75个主流的AI和生成式AI模型,比如Whisper、ControlNet、Stable Diffusion和Baichuan-7B,可在不同执行环境(runtime)中打包,能够在不同形态终端中实现卓越的终端侧AI性能、降低内存占用并提升能效。所有模型均经过优化,以充分利用高通AI引擎内所有核心(NPU、CPU和GPU)的硬件加速能力,从而使推理速度提升4倍。

了解更多

SDK 下载

本版块下载 SDK,只需简单注册,就可轻松下载。