人工智能在当下已经不再是新潮的概念,在下一代技术跃进出现之前,业务场景的落地比让人眼花缭乱的技术名词更具备现实价值。随着大部分企业深度学习,尤其是计算机视觉和自然语言处理等技术的飞速发展,文字识别技术(OCR)近几年得到了迅速的提升。与此同时,在智能化终端的大趋势下,本地化智能识别凭借更高效快捷的体验以及高度的隐私保护和零流量消耗等优势备受瞩目和亲睐,越来越多的应用算法开始倾向终端化完成,OCR也不例外。
OCR技术能够把光学文字转变为计算机字符,但对于文本和数据处理工作,将纸质文档上的数据通过人工智能技术变成计算机结构化数据,则能更有效地搭建知识桥梁,将人力从重复的人工录入转移到非重复的数据分析,产生更深层次的业务价值。
翰智集团作为人工智能厂商代表,目前已研发多种智能化产品和解决方案,翰智OCR平台依托领先的深度学习算法和海量数据沉淀,可快速从图片中定位并识别字段,通用文字识别及主流卡证票据识别准确率高达98%以上赋能企业应用于单据识别、协同办公、内容审核、合规检验等业务场景,提高内部管理效率,降低成本,增加企业竞争力。进一步扩展业务定制能力,为企业提供强大的视觉基础模型以及一整套视觉任务定制与应用能力。
卡证票据识别
在卡证票据识别方面,以财务场景为例,翰智OCR基于先进的文本检测算法,通过领先的深度学习技术,使用DCNN和RNN组合而成的CRNN网络,专门用于识别图像中的序列式对象,与CTC loss配合使用,可对各种表格,图片,文档、证件、面单等通用场景、多种语言的文字进行快速、精准的检测和识别,适用于印刷体、手写体、倾斜、折叠、旋转等场景的通用文本识别 、通用文字识别,支持超52种语言识别,助力全企业实现票据智能扫描、识别、验真、合规自动检查、发票与订单数据匹配、数字化数据、影像留存等全流程财税管理,作业效率提升500%~1000%。
表格识别
在表格识别方面,翰智OCR引入表格识别功能,通过“文件转换excel”功能服务于大众生活和办公需求。用户可以拍摄个人合同、清单、工作表格等自动提取图片、PDF中的文字内容,并将其转化为可编辑的excel文档,便于二次编辑和分享。近半年来,“文件转换excel”相关功能累计被调用百万次。
同时,翰智OCR智能文字识别技术覆盖了图片、PDF格式文档中多种类的表格识别需求,包括有线表,三线表,无线表等,并且支持合并单元格、多表格并存等复杂情况的识别。
同时,翰智OCR支持本地化部署和云服务API调用提供各类文字识别的云端接口,可直接调用API或使用HTTP SDK进行识别应用,服务使用简单便捷,兼容性强。
目前,翰智OCR在身份证识别、名片识别、营业执照识别等领域应用,已成功服务富力、雅居乐、中海物业、中建、华菱等客户,帮助企业组织化解海量非结构化数据人工处理成本高、低效、易出错的难题,助力实现内容自动化及业务流程自动化,释放非结构化数据潜能,大幅提升协作效率。