新闻资讯

OCR文本识别,场景虽小,大有乾坤(2)

2021-05-24 采集侠

  机器不同于人眼,尤其在现实场景中,字体设计、文本背板、语种以及外部的光线环境等各类因素都可能对机器识别造成干扰,而这也正是当前AI视觉企业在文本识别算法上需要攻破的技术方向。

  当然,我们也看到了相关企业在算法研究上取得的进展。比如针对低质量图像、生僻字、艺术字的识别。

  大华依托自研的“巨灵”人工智能平台,对识别算法进行深度改进,运用多尺度融合、跨层链接等先进技术,提高了算法对这类文本的识别效果;紫光华智则结合多尺度融合、注意力机制、多模型融合等先进技术及基础数据分析,对难例样本进行数据增强,实现了对图片像素低、质量差、艺术字体等识别效果的大幅提升; 华为云采用了黑边处理、自动纠偏、去噪、图像自动旋转、多种二值化等方法处理图像,从而提高了扭曲、复杂背景、光照、模糊场景下的文字检测识别准确率。

  在AI视觉企业的持续探索之下,文本识别算法也得以不断演进,而伴随着算法的日趋成熟,作为AI赋能千行百业的又一个典型,文本识别场景虽小,却大有乾坤!