在金融领域,纸质单据是最为常用的信息载体,存在大量影像文字信息录入的需求。由于行业特殊性,单据、票据、证照的类型复杂多变,影像信息人工分类与录入会消耗大量人力、物力和时间成本,严重影响业务流程的效率和用户体验。
文思海辉金融依托AI+OCR技术,面向银行、保险、证券领域全力打造文字识别利器——智能字符识别系统(简称:ICR系统),针对金融机构不同应用场景,解决其文字识别、结构化输出、快速适配训练等业务痛点。
“AI+OCR”,识别不惧强干扰
传统的OCR识别场景中,普遍难点是对于环境干扰的处理和优化,比如印刷品上的文字压线、污迹等因素,可能会导致识别结果有误。文思海辉金融ICR系统在识别过程中充分考虑了这些因素,可对识别对象进行图像预处理,并采用自主研发的AI干扰检测模型进行识别和去除,在强干扰下最大可能的保障识别内容的准确性。系统盖常见的300多种中英文字体,训练样本量达820万个,英文字符识别准确率超99%,中文字符识别准确率达95%以上,极大提升了金融机构各式各样的单据、票证识别准确率,为下游业务系统使用识别信息提供了效率和准确度的双重保障。
标注工具,保障信息结构化输出
金融行业因其特殊性,在单据识别字符的同时,还需要实现识别结果的结构化输出,以满足内部各业务系统的使用需求,这对于识别内容的结构化输出能力提出了更高要求。
文思海辉金融ICR系统包含各类模型(如:字符识别模型、文本定位模型)独立离线部署,并提供模板标注工具,包括单据模板标注、单据分类特征标注、单据分类,单据栏位提取、NLP校正等在内的一系列参数管理功能,方便用户根据自身的应用场景进行适配,支持自定义新的模板并进行标注,用户只需在系统参数中上传模板单据,设置需要结构化的字段和栏位,通过简单的标注即可快速实现新模板的结构化提取功能。
支持多种业务场景下的识别
• 开户业务
ICR系统可精准识别各类身份证件,自动进行信息结构化提取,在用户注册过程中快速完成身份证、护照、银行卡等证件的识别录入,极大提升用户体验。
• 贸易金融
支持贸易金融业务常见的单据识别,如国际汇款业务单据识别,出口议付/交单的常见单据识别等,并可提供智能审单功能。智能审单系统在接收到ICR识别的结构化数据后,对其进行智能化审核,并形成审核意见、审核结论,从而反馈给单据作业人员进行参考或确认。
• 商业合同
支持商业合同信息识别和智能结构化提取,包括合同中主体、风险条款、合同金额等业务要素信息,秒速完成自动定位、切割、分类、识别、输出,是金融机构,各类型企业快速处理合同审核的好帮手。
• 财务报表
系统可以自动判断财务报表类型,读取报表数据,可智能匹配到用户自定义标注的需要识别的位置、栏目、模板,并按照标准化、模块化的形式展示识别结果,提高数据采集的效率和准确度,解决自动填入系统问题。
除此以外,文思海辉金融ICR系统还支持各类业务单据/凭证的印章提取和识别,并支持票印比对、批量增值税发票识别和结构化提取与比对等服务,也可根据用户具体业务场景进行定制化开发,依托敏捷的开发方式以及“AI+OCR”技术,全面提升金融机构单据、合同、证照的识别准确率与结构化输出能力。
2019年人民银行印发《金融科技(FinTech)发展规划(2019-2021年)》,“人工智能”被数次提及,其重要度可见一斑。未来,文思海辉金融将持续专注金融场景探索,结合自身技术实力,助力金融机构加速创新、优化运营、助力增长、升级体验,实现行业的精细化运营和服务升级,推动金融普惠化和场景化的创新。