• 多方向证照图片的OCR方案详解

    • 2022-06-16 19:43
    • 字数 562
    • 阅读 234

    在诸如文档扫描、证照拍摄等过程中,有时为了拍摄更清晰,会将拍摄设备进行旋转,导致得到的图片也是不同方向的。此时,标准的OCR流程无法很好地应对这些数据。利用图像分类技术,可以预先判断含文字图像的方向,并将其进行方向调整,从而提高OCR处理的准确性。该案例提供了用户使用 PaddleClas 的超轻量图像分类方案(PULC,Practical Ultra Lightweight image Classification)快速构建轻量级、高精度、可落地的含文字图像方向的分类模型。该模型可以广泛应用于金融、政务等行业的旋转图片的OCR处理场景中。

    但在真实产业中,要实现高精度的文字图像方向不是一件容易的事,在实际场景中存在着各种各样的问题:

    如何能够在不影响整体流程速度的前提下达到最高的方向识别精度;

    拍摄的照片会存在像素低、光线暗等问题;

    针对上述场景,本次飞桨产业实践范例库推出了针对多方向的证照图片的OCR实践示例,提供从数据准备、技术方案、模型训练优化,到模型部署的全流程可复用方案,有效解决了对不同方向的证照图片进行有效OCR处理的问题,并且极大地降低了数据标注和算力成本,适用于金融、政府等多个产业应用。

    教程地址:https://aistudio.baidu.com/aistudio/projectdetail/4226610

back_to_top