科普课堂:OCR模式识别分析

模式识别是指通过计算机技术研究生物体(包含人在内)对事物的感知过程的方法论。任何一种环境或者客体所包含的信息,都可以称为一种模式,对生物体认识并做出判断的一个细化的研究,就叫模式识别。

模式识别在结果上,与数学中 “集合”的概念相似,但“集合”是结果,模式识别是过程,导致这个集合的过程。

模式识别是人工智能的基础学科,也广泛应用于生活中,比如文字识别、语音识别、条码识别、指纹识别、遥感识别、人证合一。提到这些例子,应该就有助于大家的理解。

模式识别的历史方法论

模式识别是一个复杂的研究项目,要涉及生理学、生物学、心理学、数学、计算机学、统计学等多个学科的综合研究,所以人类对模式识别的研究经历了漫长的阶段,不同阶段形成了不同的方法论。


决策方法论

简单来理解,就是将模式事物进行数字化处理,长宽高、黑白灰等各种信息,将这些信息提取出来,组成一个新的特征,也就是从表面事物抽象到了理论层面,从而可以判定这个事物到底是什么。


结构方法论

类似树状结构的识别模式,将一个模式划分为多个不同的子模式,再将子模式划分为更加细小的子模式,就像是不断扩充下级一样。将各子模式之间的关系结合起来,就是模式识别。


统计方法论

一般我们学的统计的方法有: 判别函数法,近邻分类法,特征分析法 等等,我们将所有事物排列在一起,通过 有相似性的样本在模式空间中互相接近 来进行区分,从而判断事物是什么。类似“物以类聚、人以群分”。


例如文字识别,文字识别的定义是,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。 利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。  

我们将文字这些信息,通过计算机程序、数学分析、逻辑分析等等处理方法,与字符库进行对比,判断出到底是什么字。

文字识别也综合使用上述模式识别方法论。例如,统计分析方法,  将输入的文字与给定的各类别标准文字(模板)进行相关匹配,计算输入文字与各模板之间的相似性程度,取相似度最大的类别作为识别结果。

文通OCR识别技术源于清华实验室,以图像文字识别技术为核心,研发出多项产品并提供多种行业解决方案,依靠完善的服务体系,拓宽了产品技术应用领域。目前已经拥有跨平台 的亚洲文字OCR、人脸识别、智能图像处理、手写识别、车牌识别、证件识别、名片识别、二维条码识别、深度学习等自有知识产权技术。公司业务深入至金融保险、智能交通、税务、公共安全、政府等行业领域。


更多相关资讯请搜索 智能交通王钰楠

请使用浏览器的分享功能分享到微信等