Mr_老冷 发表于 7 天前

【EasyClick】paddleOcrOnnx模型使用说明及下载地址

说明:
paddleOcrOnnx一般需要4个文件
    det.onnx:检测模型,必须
    rec.onnx:识别模型,必须
    labels.txt:字典文件,必须
    cls.onnx:分类模型,可选,识别旋转类需要


模型下载地址:
官网:https://rapidai.github.io/RapidOCRDocs/main/model_list/
魔塔社区:https://www.modelscope.cn/models/RapidAI/RapidOCR/files
github:https://github.com/RapidAI/Rapid ... default_models.yaml


det.onnx中,语言对应关系

模型文件名对应语言 / 用途说明
ch_PP-OCRv4_det_infer.onnx中文(简体)文本检测专为中文设计的文字检测模型,适用于中国大陆常见的中文排版(如竖排、横排、多行等)
ch_PP-OCRv4_det_server_infer.onnx中文(简体)检测(服务器优化版)与上一个功能相同,但结构更紧凑,推理速度更快,适合部署在服务端(API 推理)
en_PP-OCRv3_det_infer.onnx英文文本检测针对英文字符设计的检测模型,适用于英文字母、数字、标点组成的文本块
Multilingual_PP-OCRv3_det_infer.onnx多语言通用检测支持多种语言混合文本(如中英混排、中日韩混合),适用于国际化文档或复杂排版


rec.onnx中,语言模型对应关系,如ch_PP-OCRv4_rec_infer.onnx

文件名语言字符类型示例
arabic_...阿拉伯语阿拉伯字母مرحبا، العالم
ch_doc_...中文(文档级)简体汉字文档内容、表格、多行文本
ch_...简体中文汉字你好、北京、中国
chinese_cht_...繁体中文汉字你好、台灣、中國
cyrillic_...eslav_...俄语 / 乌语等西里尔字母Привет, Россия
devanagari_...印地语 / 尼泊尔语天城文नमस्ते, भारत
en_...英语拉丁字母Hello World
japan_...日语平假名 + 片假名 + 汉字こんにちは、日本語
ka_...格鲁吉亚语格鲁吉亚字母გიანბის დღე
korean_...韩语谚文 + 汉字안녕하세요, 한국어
latin_...法语 / 德语 / 西班牙语等拉丁字母Bonjour, Hallo, Hola
ta_...泰米尔语泰米尔字母வணக்கம், தமிழ்
te_...泰卢固语泰卢固字母నమస్తే, తెలుగు


det与rec的搭配:
中文/英文选对应的开头cn_/en_开头的det文件
其他语言用Multilingual_或cn_开头的det文件

labels.txt
需要在github链接中,自己找对应的txt进行下载




其他说明:
带mobile的是对手机端优化的
带server的是对服务器部署进行了优化


页: [1]
查看完整版本: 【EasyClick】paddleOcrOnnx模型使用说明及下载地址