(12)发明专利申请
(10)申请公布号 CN 112639818 A(43)申请公布日 2021.04.09
(21)申请号 201980055493.X(22)申请日 2019.08.08(30)优先权数据
2018-158182 2018.08.27 JP2018-158183 2018.08.27 JP2018-158185 2018.08.27 JP(85)PCT国际申请进入国家阶段日2021.02.23(86)PCT国际申请的申请数据
PCT/JP2019/031435 2019.08.08(87)PCT国际申请的公布数据WO2020/045039 JA 2020.03.05(71)申请人 京瓷办公信息系统株式会社地址 日本大阪府(72)发明人 川崎智广
(54)发明名称OCR系统(57)摘要
OCR系统通过OCR处理从票据(50)中获取字符数据,其特征在于,用于管理将票据(50)的发行人的发行人名称与OCR处理所使用字体的字体名称进行关联的OCR用信息表(34e),在针对票据(50)中的发行人记载内容读取对象区域执行OCR处理的情况下,基于在OCR用信息表中与该票据(50)的发行人的发行人名称相关联的字体名称
来执行OCR处理(S156)。所指的字体,
权利要求书3页 说明书21页 附图24页
按照条约第19条修改的权利要求书2页
(74)专利代理机构 北京航忱知识产权代理事务
所(普通合伙) 11377
代理人 陈立航(51)Int.Cl.
G06K 9/62(2006.01)G06K 9/03(2006.01)
CN 112639818 ACN 112639818 A
权 利 要 求 书
1/3页
1.一种OCR系统,通过OCR处理从文档中获取字符数据,其特征在于,具备OCR用信息管理部和OCR执行部,
所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与OCR处理所使用字体的种类进行关联的OCR用信息,
所述OCR执行部用于执行针对所述文档的OCR处理,
所述OCR执行部在针对所述文档中的特定区域执行OCR处理的情况下,使用所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述种类的字体,来执行OCR处理。
2.根据权利要求1所述的OCR系统,其特征在于,
所述文档包含该文档的所述发行人的所述标识信息,所述OCR执行部通过针对所述文档的OCR处理,获取该文档的所述发行人的所述标识信息,并使用所述OCR用信息中与获取的所述标识信息相关联的所述种类的字体,针对该文档的所述特定区域执行OCR处理。
3.根据权利要求1所述的OCR系统,其特征在于,带标记文档是指附加了区域用标记的所述文档,所述区域用标记用于确定所述特定区域,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,确定出所述区域用标记所确定的所述特定区域内的字符字体的所述种类,
所述OCR执行部从所述带标记文档中确定出所述种类后,所述OCR用信息管理部将所述种类包含在所述OCR用信息中。
4.根据权利要求3所述的OCR系统,其特征在于,所述带标记文档中附加了标识信息标记,所述标识信息标记用于获取所述带标记文档的所述发行人的所述标识信息,
所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,获取由所述标识信息标记确定出的所述标识信息,
所述OCR执行部从所述带标记文档中获取到所述标识信息后,所述OCR用信息管理部将所述标识信息包含在所述OCR用信息中。
5.根据权利要求4所述的OCR系统,其特征在于,
所述特定区域的上端一边的位置是指与所述文档中的所述标识信息标记的纵向上的最上部位置隔着特定距离的上侧位置,
所述特定区域的下端一边的位置是指与所述文档中的所述标识信息标记的纵向上的最下部位置隔着特定距离的下侧位置,
所述特定区域的左端一边的位置是指与所述文档中的所述标识信息标记的横向上的最左边位置隔着特定距离的左侧位置,
所述特定区域的右端一边的位置是指与所述文档中的所述标识信息标记的横向上的最右边位置隔着特定距离的右侧位置。
6.一种OCR系统,通过OCR处理从文档中获取字符数据,其特征在于,具备OCR用信息管理部、OCR执行部和校正受理部,
所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与针对该发行人所发行的所述文档执行OCR处理的可靠性进行关联的OCR用信息,
所述OCR执行部用于执行针对所述文档的OCR处理,
2
CN 112639818 A
权 利 要 求 书
2/3页
所述校正受理部用于受理所述字符数据的校正,带标记文档是指附加了可靠性标记的所述文档,所述可靠性标记用于表示所述可靠性,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,获取由所述可靠性标记表示的所述可靠性,
所述OCR执行部从所述带标记文档中获取所述可靠性后,所述OCR用信息管理部将所述可靠性包含在所述OCR用信息中,
在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述可靠性,来执行消息通知。
7.根据权利要求6所述的OCR系统,其特征在于,
所述文档中包含该文档的所述发行人的所述标识信息,所述OCR执行部通过针对所述文档的OCR处理,获取该文档的所述发行人的所述标识信息,
在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与所述OCR执行部从所述文档中获取的所述标识信息相关联的所述可靠性,来执行消息通知。
8.根据权利要求6所述的OCR系统,其特征在于,所述带标记文档中附加了标识信息标记,所述标识信息标记用于获取所述带标记文档的所述发行人的所述标识信息,
所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,获取由所述标识信息标记确定出的所述标识信息,
所述OCR执行部从所述带标记文档中获取到所述标识信息后,所述OCR用信息管理部将所述标识信息包含在所述OCR用信息中。
9.根据权利要求6所述的OCR系统,其特征在于,所述OCR用信息中,OCR处理所使用字体的种类与所述标识信息相关联,所述OCR执行部在针对所述文档中的特定区域执行OCR处理的情况下,使用所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述种类的字体,来执行OCR处理。
10.根据权利要求9所述的OCR系统,其特征在于,所述带标记文档中附加了区域用标记,所述区域用标记用于确定所述区域,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,确定出由所述区域用标记确定的所述区域内的字符字体的所述种类,
所述OCR执行部从所述带标记文档中确定出所述种类后,所述OCR用信息管理部将所述种类包含在所述OCR用信息中。
11.根据权利要求6所述的OCR系统,其特征在于,所述可靠性标记含有表示所述可靠性低的标记、表示所述可靠性高的标记以及将OCR处理的可靠性高和低区别表示的标记这三种标记中的至少一种。
12.一种OCR系统,通过OCR处理从文档中获取字符数据,其特征在于,具备OCR执行部,所述OCR执行部用于执行针对所述文档的OCR处理,带标记文档是指附加了特定信息标记的所述文档,所述特定信息标记用于获取特定信息,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,将符合条件的字符串作为所述特定信息来获取,符合条件是指:所述字符串是由与所述特定信息标记所重叠的字
3
CN 112639818 A
权 利 要 求 书
3/3页
符在同一行上的部分或全部字符构成的,并且所述字符串包含与所述特定信息标记重叠的字符,而且所述字符串内部彼此相邻的字符之间的距离小于等于特定距离。
13.根据权利要求12所述的OCR系统,其特征在于,所述特定信息是指所述文档的发行人的标识信息,所述OCR系统具备OCR用信息管理部,所述OCR用信息管理部用于管理将所述文档的所述发行人的所述标识信息与OCR处理所使用字体的种类进行关联的OCR用信息,
所述带标记文档中附加了区域用标记,所述区域用标记用于确定该带标记文档中的特定区域,
所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,确定出由所述区域用标记确定的所述区域内的字符字体的所述种类,
所述OCR执行部从所述带标记文档中确定出所述种类后,所述OCR用信息管理部将所述种类包含在所述OCR用信息中,
所述OCR执行部在针对所述文档中的所述区域执行OCR处理的情况下,使用所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述种类的字体,来执行OCR处理。
14.根据权利要求12所述的OCR系统,其特征在于,所述特定信息是指所述文档的发行人的标识信息,所述OCR系统具备OCR用信息管理部和校正受理部,
所述OCR用信息管理部用于管理将所述文档的所述发行人的所述标识信息与可靠性进行关联的OCR用信息,所述可靠性是指针对该发行人所发行的所述文档执行OCR处理的可靠性,
所述校正受理部用于受理所述字符数据的校正,
所述带标记文档中附加了用于表示所述可靠性的可靠性标记,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,确定出由所述可靠性标记表示的所述可靠性,
所述OCR执行部从所述带标记文档中获取到所述可靠性后,所述OCR用信息管理部将所述可靠性包含在所述OCR用信息中,
在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述可靠性,来执行消息通知。
15.根据权利要求14所述的OCR系统,其特征在于,
所述OCR用信息管理部在所述OCR用信息中将所述文档的所述发行人的所述标识信息与OCR处理所使用字体的种类进行关联,
所述OCR执行部分别基于所述种类的字体以及与所述种类的字体不同的字体来执行OCR处理,
所述校正受理部将含有差异的确认用画面发送到用户终端,所述差异是指基于所述种类的字体执行OCR处理而生成的所述字符数据与基于所述不同的字体执行OCR处理而生成的所述字符数据之间的差异。
4
CN 112639818 A
说 明 书OCR系统
1/21页
技术领域
[0001]本发明涉及一种OCR系统,通过OCR处理从文档中获取字符数据。
背景技术
[0002]现有技术中,已知有一种通过OCR处理从文档的特定区域内获取字符数据的OCR系统(例如,参照专利文献1)。
〔专利文献〕
[0003]专利文献1:日本特开2010‑073201号公报发明内容
[0004]然而,现有的OCR系统中,在文档的特定区域内的字符字体种类与针对该区域的OCR处理所使用的字体种类不同的情况下,有时会产生OCR处理的字符识别精度降低这一问题。
[0005]还有,现有的OCR系统中,OCR处理的可靠性根据文档的不同而不同,但用户无法知道OCR处理对于具体某个文档的可靠性,因此,当需要对通过OCR处理从文档中获取的字符数据进行校正时,会存在字符数据的校正工作负担很重的问题。[0006]而且,现有的OCR系统中,在用户期望作为特定信息来获得的字符串中至少有一个字符未被特定信息标记覆盖的情况下,就不会将未被特定信息标记覆盖的字符作为特定信息的一部分来获取,因此就存在不能正确获取用户所期望的字符串这一问题。[0007]由此,本发明的目的在于提供一种OCR系统,能够提高OCR处理的字符识别精度。[0008]本发明的另一目的是提供一种OCR系统,能够减轻对通过OCR处理从文档中获取的字符数据进行校正的工作负担。
[0009]本发明的又一目的是提供一种OCR系统,能够提高正确获取用户所期望字符串的可能性。
[0010]根据本发明的第一观点,OCR系统通过OCR处理从文档中获取字符数据,其特征在于,所述OCR系统具备OCR用信息管理部和OCR执行部,所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与OCR处理所使用字体的种类进行关联的OCR用信息,所述OCR执行部用于执行针对所述文档的OCR处理,所述OCR执行部在针对所述文档中的特定区域执行OCR处理的情况下,使用所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述种类的字体,来执行OCR处理。[0011]根据本发明的第二观点,OCR系统通过OCR处理从文档中获取字符数据,其特征在于,所述OCR系统具备OCR用信息管理部、OCR执行部和校正受理部,所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与针对该发行人所发行的所述文档执行OCR处理的可靠性进行关联的OCR用信息,所述OCR执行部用于执行针对所述文档的OCR处理,所述校正受理部用于受理所述字符数据的校正,带标记文档是指附加了可靠性标记的所述文档,所述可靠性标记用于表示所述可靠性,所述OCR执行部在针对所述带标记文档执行OCR处理的
5
CN 112639818 A
说 明 书
2/21页
情况下,获取由所述可靠性标记表示的所述可靠性,所述OCR执行部从所述带标记文档中获取所述可靠性后,所述OCR用信息管理部将所述可靠性包含在所述OCR用信息中,在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述可靠性,来执行消息通知。[0012]根据本发明的第三观点,OCR系统通过OCR处理从文档中获取字符数据,其特征在于,所述OCR系统具备OCR执行部,所述OCR执行部用于执行针对所述文档的OCR处理,带标记文档是指附加了特定信息标记的所述文档,所述特定信息标记用于获取特定信息,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,将符合条件的字符串作为所述特定信息来获取,符合条件是指:所述字符串是由与所述特定信息标记所重叠的字符在同一行上的部分或全部字符构成的,并且所述字符串包含与所述特定信息标记重叠的字符,而且所述字符串内部彼此相邻的字符之间的距离小于等于特定距离。
〔发明效果〕
[0013]本发明的OCR系统能够提高OCR处理的字符识别精度。[0014]还有,本发明的OCR系统能够减轻对通过OCR处理从文档中获取的字符数据进行校正的工作负担。[0015]而且,本发明的OCR系统能够提高正确获取用户所期望字符串的可能性。附图说明
[0016]图1是本发明的第一实施方式所涉及的OCR系统框图。
图2是与图1中的票据数据管理系统所管理的票据数据相对应的票据的一个例子。图3是图1中的图像形成装置为MFP时的图像形成装置框图。
图4是图1中的票据数据管理系统由1台计算机构成的情况下的票据数据管理系统
框图。
图5是图4中的票据数据库的一个例子。图6是图4中的OCR用信息表的一个例子。图7是图4中的校正信息数据库的一个例子。图8是图1中的用户终端的框图。
图9是图4中的票据数据管理系统在更新OCR用信息表时的动作流程图。图10是图2中的票据附加了特定标记的一个例子。图11是图9中的发行人名称获取处理的流程图。
图12是图11所示的发行人名称获取处理中抽取的发行人名称获取用区域的一个
例子。
图13是图11所示的发行人名称获取处理中的检测位置的一个例子。
图14A是图4所示的票据数据管理系统以一种字体通过OCR处理将票据数据存储到
票据数据库中时的局部动作流程图。
图14B是图14A中的动作的后续动作流程图。图15是图14中的动作的后续动作流程图。
图16A是图14A中的发行人名称识别处理的局部流程图。图16B是图16A中的动作的后续动作流程图。
6
CN 112639818 A
说 明 书
3/21页
图17是图4所示的票据数据管理系统进行票据数据确认时的动作流程图。
图18是本发明的第二实施方式所涉及的OCR系统的票据数据管理系统中存储的校
正信息数据库的一个例子。
图19A是本发明的第二实施方式所涉及的OCR系统的票据数据管理系统以两种字
体通过OCR处理将票据数据存储到票据数据库中时的局部动作流程图。
图19B是图19A中的动作的后续动作流程图。图20是图19B中的动作的后续动作流程图。
图21是本发明的第二实施方式所涉及的OCR系统的票据数据管理系统进行票据数
据确认时的动作流程图。
图22是图2中的票据附加了特定标记的另一个例子,不同于图10的例子。具体实施方式
[0017]以下,使用附图对本发明的实施方式进行说明。[0018](第一实施方式)
首先,对本发明的第一实施方式所涉及的OCR(Optical Character Recognition)
系统的结构进行说明。
[0019]图1是本实施方式所涉及的OCR系统10的框图。[0020]如图1所示,OCR系统10具备图像形成装置20,图像形成装置20作为根据原稿来读取图像的读取装置。图像形成装置20例如由MFP(Multifunction Peripheral)、扫描仪专用机等图像形成装置来构成。除了图像形成装置20以外,OCR系统10还可以具备至少一个结构与图像形成装置20相同的图像形成装置。
[0021]OCR系统10具备票据数据管理系统30,票据数据管理系统30用于管理作为电子文档的票据的数据(以下称为“票据数据”)。票据数据管理系统30可以由1台计算机构成,也可以由多台计算机构成。票据数据管理系统30也可以是在云端上运行的系统。
[0022]图2是与票据数据管理系统30所管理的票据数据相对应的票据50的一个例子。[0023]图2所示的票据50包含:作为发行人标识信息的发行人名称51、发行人的标志图像52、发行人记载的特定内容(以下称为“发行人记载内容”。)53。图2中,发行人名称51是“ABC COMPANY”。
[0024]如图1所示,OCR系统10具备用户终端40,对票据数据进行确认的数据确认者等用户使用用户终端40。用户终端40例如由PC(Personal Computer)等计算机构成。除了用户终端40以外,OCR系统10还可以具备至少一个结构与用户终端40相同的用户终端。
[0025]OCR系统10中的图像形成装置20与票据数据管理系统30能够通过LAN(Local Area Network)或者互联网等网络11进行通信。票据数据管理系统30与OCR系统10中的用户终端40能够通过网络11进行通信。
[0026]图3是图像形成装置20为MFP时的框图。[0027]图3所示的图像形成装置20具备操作部21、显示部22、打印机23、扫描仪24、传真通信部25、通信部26、存储部27和控制部28。操作部21是输入各种操作的操作装置。操作装置例如是按钮等。显示部22例如是显示各种信息的LCD(Liquid Crystal Display)等显示设备。打印机23是在例如纸张等记录介质上进行图像印刷的印刷装置。扫描仪24是根据原稿
7
CN 112639818 A
说 明 书
4/21页
来读取图像的读取装置。传真通信部25是通过公共电话线等通信线路与未图示的外部传真机装置进行传真通信的传真装置。通信部26是通过LAN、互联网等网络或者不经网络而直接通过有线或无线与外部装置进行通信的通信装置。存储部27例如是存储各种信息的半导体存储器、HDD(Hard Disk Drive)等非易失性存储装置。控制部28对图像形成装置20进行整体控制。
[0028]控制部28例如具备CPU(Central Processing Unit)、ROM(Read Only Memory)以及RAM(Random Access Memory),ROM中存储了计算机程序和各种数据,RAM是作为控制部28的CPU操作区域来使用的存储器。控制部28的CPU用于执行存储在存储部27或控制部28的ROM中的程序。
[0029]图4是票据数据管理系统30由1台计算机构成的情况下的框图。[0030]图4所示的票据数据管理系统30具备操作部31、显示部32、通信部33、存储部34和控制部35。操作部31是输入各种操作的操作装置。操作装置例如是键盘、鼠标等。显示部32是显示各种信息的显示设备。显示设备例如是LCD等。通信部33是通过LAN、互联网等网络或者不经网络而直接通过有线或无线与外部装置进行通信的通信装置。存储部34是存储各种信息的非易失性存储装置。存储装置例如是半导体存储器或者HDD等。控制部35对票据数据管理系统30进行整体控制。
[0031]存储部34存储了作为文档OCR程序的票据OCR程序34a、OCR软件34b、字体数据库34c。文档OCR程序是通过OCR处理从票据中获取字符数据的程序。字体数据库34c用于存储由OCR软件34b使用的字体。票据OCR程序34a、OCR软件34b和字体数据库34c例如都可以在票据数据管理系统30的制造阶段安装在票据数据管理系统30中,也可以从CD(Compact
Serial Bus)存储器等外部存储介Disk)、DVD(Digital Versatile Disk)、USB(Universal
质中添加安装到票据数据管理系统30中,也可以从网络上添加安装到票据数据管理系统30。
[0032]存储部34存储了票据数据库34d,票据数据库34d用于存储票据数据。[0033]图5是票据数据库34d的一个例子。[0034]图5所示的票据数据库34d中,按照每条票据数据关联地存储作为票据数据标识信息的票据数据ID以及票据数据。票据数据包含票据的图像数据和票据的字符数据。例如,图5中,票据数据ID“D001”、图像数据“D001.JPG”和字符数据“D001.xlsx”相互关联。[0035]如图4所示,存储部34存储OCR用信息表34e,OCR用信息表34e保存了OCR用信息,OCR用信息是用于OCR处理的信息。
[0036]图6是OCR用信息表34e的一个例子。
[0037]图6所示的OCR用信息表34e按照每个发行人关联地存储着发行人名称读取对象区域、票据发行人的发行人名称、标志图像、发行人记载内容读取对象区域、字体名称、OCR处理的可靠性。发行人名称读取对象区域是在票据50中用于读取发行人名称51的区域。标志图像是发行人名称所指的发行人的图像。发行人记载内容读取对象区域是在票据50中用于读取发行人记载内容53的区域。字体名称是票据50中的发行人记载内容读取对象区域内的字符字体种类。OCR处理的可靠性是指:针对发行人名称所指的发行人发行的票据50来执行的OCR处理的可靠程度。例如,在图6中,发行人名称读取对象区域“(x1,y1)‑(x2,y2)”、发行人名称“ABC COMPAMY”、标志图像“LOGO1.JPG”、发行人记载内容读取对象区域“(x3,y3)‑
8
CN 112639818 A
说 明 书
5/21页
(x4,y4)”、字体名称“Calibri”、OCR处理的可靠性“高”相互关联。
[0038]发行人名称读取对象区域和发行人记载内容读取对象区域由图像数据中的坐标来表示。
[0039]标志图像是由负责人注册在OCR用信息表34e中,负责人是指让数据确认者来确认表格数据的人。
[0040]如图4所示,存储部34存储了校正信息数据库34f,校正信息数据库34f中按不同的票据数据呈现票据数据的校正状态以及在票据的字符数据校正时用于引起注意的通知类型(以下称为“通知类型”)。
[0041]图7是校正信息数据库34f的一个例子。
[0042]图7所示的校正信息数据库34f按照不同的票据数据关联地存储着票据数据ID、票据数据的校正状态、通知类型、OCR处理所使用字体的字体名称、字符数据。字符数据是以字体名称所指的字体执行OCR处理而生成的数据。例如,在图7中,票据数据ID“D001”、票据数据的校正状态“未校正”、通知类型“可靠性低”、OCR处理所使用字体的字体名称“Arial”、以字体名称所指的字体执行OCR处理而生成的字符数据“D001a.xlsx”相互关联。[0043]票据数据的校正状态例如有“未校正”和“已校正”。[0044]通知类型例如有“可靠性高”、“可靠性低”、“非最佳区域”、“非最佳字体”、“非最佳区域字体”。“可靠性高”是指:针对票据的最佳区域以最佳字体执行OCR处理,而且OCR处理的可靠性高。“可靠性低”是指:针对票据的最佳区域以最佳字体执行OCR处理,但OCR处理的可靠性低。“非最佳区域”是指:针对票据的非最佳区域以最佳字体执行OCR处理的情况。“非最佳字体”是指:针对票据的最佳区域以非最佳字体执行OCR处理的情况。“非最佳区域字体”是指:针对票据的非最佳区域以非最佳字体执行OCR处理的情况。[0045]图4中的控制部35例如具备CPU、ROM和RAM,ROM中存储了计算机程序和各种数据,RAM是作为控制部35的CPU操作区域来使用的存储器。控制部35的CPU用于执行存储在存储部34或控制部35的ROM中的程序。
[0046]控制部35通过执行票据OCR程序34a来实现OCR执行部35a、OCR用信息管理部35b、校正受理部35c。OCR执行部35a针对票据50由OCR软件34b来执行OCR处理。OCR用信息管理部35b用于管理OCR用信息表34e。校正受理部35c用于受理由OCR处理从票据50中获取的字符数据的校正。
[0047]图8是用户终端40的框图。[0048]如图8所示,用户终端40具备操作部41、显示部42、通信部43、存储部44和控制部45。操作部41是输入各种操作的操作装置。操作装置例如是键盘、鼠标等。显示部42是显示各种信息的显示设备。显示设备例如是LCD等。通信部43是通过LAN、互联网等网络或者不经网络而直接通过有线或无线与外部装置进行通信的通信装置。存储部44是存储各种信息的非易失性存储装置。非易失性存储装置例如是半导体存储器、HDD等。控制部45对用户终端40进行整体控制。
[0049]控制部45例如具备CPU、ROM和RAM,ROM中存储了计算机程序和各种数据,RAM是作为控制部45的CPU操作区域来使用的存储器。控制部45的CPU是用于执行存储在存储部44或控制部45的ROM中的程序。[0050]接下来,对OCR系统10的动作进行说明。
9
CN 112639818 A[0051]
说 明 书
6/21页
首先,对OCR系统10更新OCR用信息表34e时的动作进行说明。
[0052]图9是票据数据管理系统30在更新OCR用信息表34e时的动作流程图。[0053]如图9所示,票据数据管理系统30的OCR执行部35a判断是否接收到附加了发行人名称标记的票据的图像数据,直到判断为接收到了附加了对发行人名称进行确定的发行人名称标记(标识信息标记)的票据50的图像数据为止(S101)。例如,由负责人(让数据确认者来确认表格数据的负责人)使用荧光笔等书写用具在纸质的票据50附加了特定标记之后,附加了特定标记的票据50由图像形成装置20的扫描仪24读取,由此生成的图像数据可以作为附加了发行人名称标记的票据50的图像数据。然后,所生成的票据50的图像数据也可以由图像形成装置20发送到票据数据管理系统30。还有,附加了发行人名称标记的票据50的图像数据也可以在特定标记由用户终端40附加到票据50的图像数据上之后由用户终端40发送到票据数据管理系统30。
[0054]图10是附加了特定标记的票据50的一个例子。
[0055]图10所示的票据50是含有特定标记的带标记文档,特定标记有发行人名称标记61、发行人记载内容标记62、OCR可靠性标记63。发行人名称标记61是用于从票据50中获取发行人名称51的标识信息标记。发行人名称标记61是以特定的荧光色对票据50中的发行人名称51的至少一部分进行的涂抹。发行人记载内容标记62是用于从票据50中确定出发行人记载内容读取对象区域的区域用标记。发行人记载内容标记62是针对票据50中的发行人记载内容读取对象区域进行描画的荧光色外包围。OCR可靠性标记63用于表示针对发行人名称51所指的发行人发行的票据进行的OCR处理的可靠性。OCR可靠性标记63是票据50中以荧光色描画的×标记。
[0056]发行人名称标记61、发行人记载内容标记62和OCR可靠性标记63例如由负责人(让数据确认者来确认表格数据的负责人)添加在纸质的票据50上或者添加在票据50的图像数据上。OCR可靠性标记63例如是基于过去的OCR处理的字符识别精度而添加在票据50的发行人所发行的票据上。OCR可靠性标记63例如由负责人添加在纸质的票据50上或者添加在票据50的图像数据上。[0057]如图9所示,OCR执行部35a在S101中判断为接收到了附加了发行人名称标记61的票据50的图像数据后,执行用于获取发行人名称的发行人名称获取处理(S102)。[0058]图11是发行人名称获取处理的流程图。[0059]图11的动作是如下情况时的动作例子,该情况是:图9的S101中判断接收到的票据50的图像数据所表示的图像(以下称为“对象票据图像”)中的发行人名称的字符串方向是对象票据图像中的横向,对象票据图像中的发行人名称的字符高度方向是对象票据图像中的纵向。
[0060]如图11所示,OCR执行部35a抽取对象票据图像中用于获取发行人名称的特定区域(以下称为“发行人名称获取用区域”)的图像(S131)。发行人名称获取用区域是矩形区域,具备沿着对象票据图像的纵向延伸的一对边和沿着对象票据图像的横向延伸的一对边。[0061]发行人名称获取用区域的上端一边的位置可以是对象票据图像中的发行人名称标记的纵向上的最上部位置,也可以是与对象票据图像中的发行人名称标记的纵向上的最上部位置隔着特定距离的上侧位置。其中,特定距离可以是与对象票据图像中的发行人名称标记的纵向上的最上部位置到最下部位置之间的距离(以下称为“标记纵向宽度”)相对
10
CN 112639818 A
说 明 书
7/21页
应的距离,也可以是与标记纵向宽度无关的固定距离。
[0062]发行人名称获取用区域的下端一边的位置可以是对象票据图像中的发行人名称标记的纵向上的最下部位置,也可以是与对象票据图像中的发行人名称标记的纵向上的最下部位置隔着特定距离的下侧位置。其中,特定距离可以是对应于标记纵向宽度的距离,也可以是与标记纵向宽度无关的固定距离。
[0063]发行人名称获取用区域的左端一边的位置可以与对象票据图像的左端一边的位置相同,也可以是与对象票据图像中的发行人名称标记的横向上的最左边位置隔着特定距离的左侧位置。其中,特定距离可以是与对象票据图像中的发行人名称标记的横向上的最左边位置到最右边位置之间的距离(以下称为“标记横向宽度”)相对应的距离,也可以是与标记横向宽度无关的固定距离。
[0064]发行人名称获取用区域的右端一边的位置可以与对象票据图像的右端一边的位置相同,也可以是与对象票据图像中的发行人名称标记的横向上的最右边位置隔着特定距离的右侧位置。其中,特定距离可以是对应于标记横向宽度的距离,也可以是与标记横向宽度无关的固定距离。
[0065]图12是图11所示的发行人名称获取处理中抽取的发行人名称获取用区域70的一个例子。
[0066]图12所示的发行人名称获取用区域70中,发行人名称51“DEF COMPANY”中与发行人名称标记61重叠的字符只有“DE”。[0067]如图11所示,在S131的处理之后,关于S131中抽取的发行人名称获取用区域70的图像中与发行人名称标记61重叠的字符,OCR执行部35a对纵向上的最上部位置、最下部位置和中心位置进行检测(S132)。
[0068]图13是图11所示的发行人名称获取处理中的检测位置的一个例子。[0069]图13所示的发行人名称获取用区域70中,位置71a是与发行人名称标记61重叠的字符“DE”在纵向上的最上部位置。位置71b是字符“DE”在纵向上的最下部位置。位置71c是字符“DE”在纵向上的中心位置。[0070]如图11所示,在S132的处理之后,关于S131中抽取的发行人名称获取用区域70的图像所含的全部字符,OCR执行部35a对纵向上的最上部位置、最下部位置和中心位置进行检测(S133)。[0071]然后,在S131中抽取的发行人名称获取用区域70的图像所含的全部字符中,OCR执行部35a基于S132中检测的各位置和S133中检测的各位置,抽取出与发行人名称标记61所重叠的字符在同一行的字符(S134)。S134的处理是指用于防止错误获取的处理,防止的错误获取是指:与发行人名称标记61所重叠的字符不在同一行的字符被后面说明的S136的处理错误地作为发行人名称的一部分进行获取。[0072]S134的处理之后,OCR执行部35a抽取出符合条件的字符串,符合条件是指:该字符串由S134中抽取的字符构成,该字符串内彼此相邻的字符之间距离小于等于特定距离,该字符串包含S131中抽取的发行人名称获取用区域70的图像中与发行人名称标记61重叠的字符(S135)。其中,特定距离例如可以是与发行人名称标记61重叠的字符的5个字符距离等,即是对应于字符宽度的距离,例如1cm等,也可以是与字符宽度无关的固定距离。S135的处理是指用于防止错误获取的处理,该错误获取是指:字符虽然是与发行人名称标记61所
11
CN 112639818 A
说 明 书
8/21页
重叠的字符在同一行但却明显与发行人名称没有关系,这样的字符被后面说明的S136的处理错误地作为发行人名称的一部分进行获取。[0073]S135的处理之后,OCR执行部35a通过OCR软件34b来获取S135中抽取的字符串,并作为发行人名称(S136),然后结束图11所示的发行人名称获取处理。[0074]例如,在图12所示的发行人名称获取用区域70中,OCR执行部35a可以通过图11所示的发行人名称获取处理来获取作为发行人名称的“DEF COMPANY”。[0075]如图9所示,在S102的发行人名称获取处理之后,OCR执行部35a根据发行人名称获取处理中获取的发行人名称的位置,确定出发行人名称读取对象区域(S103)。[0076]S103的处理之后,OCR执行部35a判断在对象票据图像中是否附加了发行人记载内容标记62(S104)。
[0077]OCR执行部35a在S104中判断为对象票据图像中已附加了发行人记载内容标记62时,根据发行人记载内容标记62确定出发行人记载内容读取对象区域(S105)。[0078]然后,OCR执行部35a确定出在对象票据图像中通过S105确定了的发行人记载内容读取对象区域内的字符字体名称(S106)。也就是说,OCR执行部35a通过在字体数据库34c中搜索,来确定出已在对象票据图像中确定了的发行人记载内容读取对象区域所含的字符的字体名称。
[0079]OCR执行部35a在S104中判断为对象票据图像中未附加发行人记载内容标记62时,或者在S106的处理结束后,判断对象票据图像中是否附加了OCR可靠性标记(S107)。[0080]OCR执行部35a在S107中判断为对象票据图像中附加了OCR可靠性标记63时,获取到OCR处理(针对S102的发行人名称获取处理所获取的发行人名称所指的发行人发行的票据50进行的OCR处理)的可靠性为“低”(S108)。
[0081]在S107中判断为对象票据图像中没有附加OCR可靠性标记63后,或者在S108的处理结束后,OCR用信息管理部35b将S101~S108的处理执行结果反映到OCR用信息表34e中(S109)。也就是说,首先,在S102的发行人名称获取处理中获取的发行人名称未包含在OCR用信息表34e中的情况下,OCR用信息管理部35b将S102的发行人名称获取处理中获取的发行人名称注册到OCR用信息表34e中。其中,OCR用信息管理部35b在将发行人名称注册到OCR用信息表34e中的情况下,将“高”作为该发行人名称所关联的OCR处理的可靠性注册到OCR用信息表34e中。然后,在执行了S108中的OCR处理可靠性获取的情况下,OCR用信息管理部35b将“低”作为S102的发行人名称获取处理中获取的发行人名称所关联的OCR处理可靠性,以覆盖的方式注册到OCR用信息表34e中。还有,OCR用信息管理部35b将S103中确定出的发行人名称读取对象区域作为S102的发行人名称获取处理中获取的发行人名称所关联的发行人名称读取对象区域,以覆盖的方式注册到OCR用信息表34e中。还有,OCR用信息管理部35b在S105中确定了发行人记载内容读取对象区域的情况下,将S105中确定出的发行人记载内容读取对象区域作为S102的发行人名称获取处理中获取的发行人名称所关联的发行人记载内容读取对象区域,以覆盖的方式注册到OCR用信息表34e中。还有,OCR用信息管理部35b在S106中确定了字体名称的情况下,将S106中确定出的字体名称作为S102的发行人名称获取处理中获取的发行人名称所关联的字体名称,以覆盖的方式注册到OCR用信息表34e中。
[0082]在S109的处理结束后,OCR执行部35a执行图9中的S101处理。
12
CN 112639818 A[0083]
说 明 书
9/21页
接下来,说明OCR系统10以一种字体执行OCR处理来将票据数据存储到票据数据库
34d时的动作。[0084]图14A、图14B和图15是票据数据管理系统30以一种字体执行OCR处理来将票据数据存储到票据数据库34d时的动作流程图。[0085]如图14A、图14B和图15所示,票据数据管理系统30的OCR执行部35a判断是否接收了票据50的图像数据,直到接收到票据50的图像数据为止(S151)。例如,票据50的图像数据可以是纸质的票据50由图像形成装置20的扫描仪24读取而生成的图像数据,并从图像形成装置20发送到票据数据管理系统30。还有,票据50的图像数据也可以由未图示的计算机生成并从未图示的计算机发送到票据数据管理系统30。
[0086]OCR执行部35a在S151中判断为接收到了票据50的图像数据后,执行发行人名称识别处理,确定出S151中判断接收到的图像数据所表示的票据(以下称为“对象票据”)的发行人名称(S152)。
[0087]图16A是图14A中的发行人名称识别处理的局部流程图。图16B是图16B中的动作的后续动作流程图。
[0088]如图16A所示,OCR执行部35a判断OCR用信息表34e中是否注册了发行人名称读取对象区域(S191)。
[0089]OCR执行部35a在S191中判断为OCR用信息表34e中注册了发行人名称读取对象区域后,仅将还未作为对象注册到OCR用信息表34e中的1个发行人名称读取对象区域作为对象(S192)。
[0090]然后,在S151中判断接收的图像数据所示的图像(即对象票据图像)中,OCR执行部35a针对当前对象的发行人名称读取对象区域,通过OCR软件34b执行OCR处理(S193)。[0091]然后,OCR执行部35a判断OCR用信息表34e中当前对象的发行人名称读取对象区域所关联的发行人名称是否被包含在S193中执行的OCR处理所获取的字符串中(S194)。
[0092]OCR执行部35a在S194中判断为OCR用信息表34e中当前对象的发行人名称读取对象区域所关联的发行人名称被包含在S193中执行的OCR处理所获取的字符串中之后,将OCR用信息表34e中当前对象的发行人名称读取对象区域所关联的发行人名称确定为对象票据的发行人名称(S195),然后结束图16A中的发行人名称识别处理。
[0093]OCR执行部35a在S194中判断为OCR用信息表34e中当前对象的发行人名称读取对象区域所关联的发行人名称未被包含在S193中执行的OCR处理所获取的字符串中之后,如图16B所示,判断是否存在还未作为对象注册到OCR用信息表34e中的发行人名称读取对象区域(S196)。
[0094]OCR执行部35a在S196中判断为还存在未作为对象注册到OCR用信息表34e中的发行人名称读取对象区域之后,执行S192的处理。
[0095]OCR执行部35a在S191中判断为OCR用信息表34e中还未注册发行人名称读取对象区域之后,或者在S196中判断为不存在还未作为对象注册到OCR用信息表34e中的发行人名称读取对象区域之后,通过图像匹配处理判断OCR用信息表34e中注册的标志图像是否被包含在对象票据图像中(S197)。
[0096]OCR执行部35a在S197中判断为OCR用信息表34e中注册的标志图像被包含在对象票据图像中之后,将OCR用信息表34e中标志图像(在S197中判断为包含在对象票据图像中
13
CN 112639818 A
说 明 书
10/21页
的标志图像)所关联的发行人名称确定为对象票据的发行人名称(S198),然后结束图16A和图16B的发行人名称识别处理。
[0097]OCR执行部35a在S197中判断为OCR用信息表34e中注册的标志图像未被包含在对象票据图像中之后,结束图16A和图16B的发行人名称识别处理。[0098]如图14A所示,在S152的发行人名称识别处理结束后,OCR执行部35a判断S152的发行人名称识别处理中是否确定出了发行人名称(S153)。
[0099]OCR执行部35a在S153中判断为S152的发行人名称识别处理中确定出了发行人名称之后,判断S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中是否关联了字体名称(S154)。
[0100]OCR执行部35a在S154中判断为S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中已关联了字体名称之后,判断S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中是否关联了发行人记载内容读取对象区域(S155)。[0101]如图14A和图14B所示,OCR执行部35a在S155中判断为S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中已关联了发行人记载内容读取对象区域之后,针对对象票据图像中的该发行人记载内容读取对象区域,基于S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中所关联的字体名称所指的字体,通过OCR软件34b执行OCR处理(S156)。[0102]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S157),票据数据包含字符数据和S151中判断接收到的图像数据,字符数据包含S152的发行人名称识别处理中确定出的发行人名称和S156中执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S157中存储的票据数据。[0103]然后,OCR执行部35a判断S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中是否已关联了OCR处理的可靠性“低”(S158)。
[0104]OCR执行部35a在S158中判断为S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中未关联OCR处理的可靠性“低”之后,将通知类型“可靠性高”、票据数据的校正状态“未校正”、S156中的OCR处理所使用的字体名称、含有S156中执行OCR处理所获取字符串的字符数据,与S157中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库34f中(S159),然后执行S151的处理。
[0105]OCR执行部35a在S158中判断为S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中已关联了OCR处理的可靠性“低”之后,将通知类型“可靠性低”、票据数据的校正状态“未校正”、S156中的OCR处理所使用的字体名称、含有S156中执行OCR处理所获取字符串的字符数据,与S157中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库34f中(S160),然后执行S151的处理。
[0106]OCR执行部35a在S155中判断为S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中未关联发行人记载内容读取对象区域之后,针对对象票据图像,基于S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中所关联的字体名称所指的字体,通过OCR软件34b执行OCR处理(S161)。[0107]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S162),票据数据包含字符数据和S151中判断接收到的图像数据,字符数据包含S152的发行人名称识别处理中确定
14
CN 112639818 A
说 明 书
11/21页
出的发行人名称和S161中执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S162中存储的票据数据。[0108]然后,OCR执行部35a将通知类型“非最佳区域”、票据数据的校正状态“未校正”、S161中的OCR处理所使用的字体名称、含有S161中执行OCR处理所获取字符串的字符数据,与S162中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库34f中(S163),然后执行S151的处理。[0109]如图14A和图15所示,OCR执行部35a在S154中判断为S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中未关联字体名称之后,判断S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中是否已关联发行人记载内容读取对象区域(S164)。
[0110]OCR执行部35a在S164判断为S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中已关联了发行人记载内容读取对象区域之后,针对对象票据图像中的该发行人记载内容读取对象区域,基于通用字体通过OCR软件34b执行OCR处理(S165)。[0111]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S166),票据数据包含字符数据和S151中判断接收到的图像数据,字符数据包含S152的发行人名称识别处理中确定出的发行人名称和S165中执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S166中存储的票据数据。[0112]然后,OCR执行部35a将通知类型“非最佳字体”、票据数据的校正状态“未校正”、S165中的OCR处理所使用的字体名称、含有S165中执行OCR处理所获取字符串的字符数据,与S166中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库34f中(S167),然后执行S151的处理。
[0113]OCR执行部35a在S164判断为S152的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中未关联发行人记载内容读取对象区域之后,针对对象票据图像,基于通用字体通过OCR软件34b执行OCR处理(S168)。[0114]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S169),票据数据包含字符数据和S151中判断接收到的图像数据,字符数据包含S152的发行人名称识别处理中确定出的发行人名称和S168中执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S169中存储的票据数据。
[0115]OCR执行部35a在S153中判断为S152的发行人名称识别处理中未确定出发行人名称之后,针对对象票据图像,基于通用字体通过OCR软件34b执行OCR处理(S170)。[0116]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S171),票据数据包含字符数据和S151中判断接收到的图像数据,字符数据包含S170中执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S171中存储的票据数据。[0117]OCR执行部35a在S169或S171的处理之后,将通知类型“非最佳区域字体”、票据数据的校正状态“未校正”、S168或S170中的OCR处理所使用的字体名称、含有S168或S170中执行OCR处理所获取字符串的字符数据,与S169中S171中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库34f中(S172),然后执行S151的处理。[0118]接下来,说明OCR系统10确认票据数据时的动作。
[0119]图17是票据数据管理系统30进行票据数据确认时的动作流程图。
15
CN 112639818 A[0120]
说 明 书
12/21页
数据确认者能够通过用户终端40的操作部41,来指示用户终端40显示票据数据管
理系统30所管理的票据数据的列表。用户终端40的控制部45在被指示要显示票据数据管理系统30所管理的票据数据的列表时,向票据数据管理系统30请求票据数据管理系统30所管理的票据数据的列表显示。
[0121]票据数据管理系统30的校正受理部35c从用户终端40接收到票据数据管理系统30所管理的票据数据的列表显示请求后,执行图17中的动作。[0122]如图17所示,校正受理部35c将列表显示画面(列表显示画面用于显示票据数据库34d所含的票据数据的列表)发送到用户终端40(S211)。其中,校正受理部35c将校正信息数据库34f所含的校正状态包含在列表显示画面中。[0123]用户终端40的控制部45接收到S211中发送来的列表显示画面后,将接收到的列表显示画面显示在显示部42上。因此,数据确认者能够通过操作部41,从显示部42所显示的列表显示画面中选择数据确认者自己期望进行确认的票据数据。例如,数据确认者能够将显示部42所显示的列表显示画面中校正状态为“未校正”的票据数据中的任意一条作为数据确认者自己期望进行确认的票据数据进行选择。在列表显示画面中选择了票据数据后,用户终端40的控制部45向票据数据管理系统30请求所选择的票据数据。[0124]在S211的处理之后,票据数据管理系统30的校正受理部35c判断是否由用户终端40请求了票据数据,直到判断为由用户终端40请求了票据数据为止(S212)。[0125]校正受理部35c在S212中判断为由用户终端40请求了票据数据之后,将S212中判断为由用户终端40请求了的票据数据(以下称为“对象票据数据”)的确认用画面发送到用户终端40(S213)。其中,校正受理部35c将票据数据库34d所含的对象票据数据的图像数据所表示的图像、票据数据库34d所含的对象票据数据的字符数据所表示的字符串、校正信息数据库34f中对象票据数据所关联的字体名称、校正信息数据库34f中对象票据数据所关联的字符数据所表示的字符串、校正信息数据库34f中对象票据数据所关联的通知类型对应的通知包含在确认用画面中。关于通知类型对应的通知,例如在通知类型是“可靠性高”的情况下,为“请进行确认。”这一消息。还有,关于通知类型对应的通知,例如在通知类型是“可靠性低”的情况下,为“这是过去存在很多错误校正的票据。请仔细检查所有项目。”这一消息。还有,关于通知类型对应的通知,例如在通知类型是“非最佳区域”的情况下,为“针对非最佳区域执行了OCR处理。请仔细检查所有项目。”这一消息。还有,关于通知类型对应的通知,例如在通知类型是“非最佳字体”的情况下,为“基于非最佳字体执行了OCR处理。请仔细检查所有项目。”这一消息。还有,关于通知类型对应的通知,例如在通知类型是“非最佳区域字体”的情况下,为“针对非最佳区域基于非最佳字体执行了OCR处理。请仔细检查所有项目。”这一消息。[0126]用户终端40的控制部45接收到S213中发送来的确认用画面之后,将接收的确认用画面显示在显示部42上。因此,在显示部42所显示的确认用画面中,数据确认者能够确认票据数据的字符数据所表示的字符串与票据数据的图像数据所表示的图像中含有的字符串是否一致。然后,例如在票据数据的字符数据所表示的字符串与票据数据的图像数据所表示的图像中含有的字符串不一致的情况下,数据确认者能够通过操作部41在确认用画面中指示进行票据数据的字符数据的校正。用户终端40的控制部45接收到票据数据的字符数据的校正指示后,将所指示的校正内容通知到票据数据管理系统30。还有,数据确认者也能够
16
CN 112639818 A
说 明 书
13/21页
通过操作部41在确认用画面中指示结束票据数据的确认。用户终端40的控制部45接收到票据数据的确认结束指示后,将票据数据的确认结束通知到票据数据管理系统30。[0127]在S213的处理之后,票据数据管理系统30的校正受理部35c判断用户终端40是否指示了票据数据的字符数据的校正(S214)。
[0128]校正受理部35c在S214中判断为用户终端40指示了进行票据数据的字符数据的校正后,根据来自用户终端40的指示内容,对票据数据库34d中的对象票据数据的字符数据进行校正(S215),然后将校正信息数据库34f中对象票据数据所关联的校正状态设定为“已校正”(S216)。
[0129]校正受理部35c在S214中判断为用户终端40未指示进行票据数据的字符数据的校正之后,或者在S216的处理结束后,判断用户终端40是否指示了票据数据的确认结束(S217)。
[0130]校正受理部35c在S217中判断为用户终端40未指示票据数据的确认结束后,执行S214的处理。
[0131]校正受理部35c在S217中判断为用户终端40指示了票据数据的确认结束后,结束图17中的动作。
[0132]如上所述,OCR系统10基于票据50的发行人的发行人名称在OCR用信息表34e中所关联的字体名称的字体,针对该票据50中的发行人记载内容读取对象区域执行OCR处理(S156)。因此,能够提高票据50中的发行人记载内容读取对象区域内的字符字体的字体名称(字体的种类)与针对该发行人记载内容读取对象区域执行OCR处理所使用字体的字体名称(字体的种类)相同的可能性。其结果,能够提高OCR处理的字符识别精度。在能够提高OCR处理的字符识别精度的情况下,OCR系统10能够降低数据确认者对于由OCR处理从票据50中获取的字符数据进行的校正量,能够缩短数据确认者进行字符数据校正的操作时间。[0133]另外,例如在字体的原因导致OCR处理的字符识别精度本来就差的情况下,或者在印刷票据50的图像形成装置的印刷性能问题导致OCR处理的字符识别精度较差的情况下,即使使票据50中的发行人记载内容读取对象区域内的字符字体的字体名称与针对该发行人记载内容读取对象区域执行OCR处理所使用字体的字体名称相同,OCR处理的字符识别精度也可能较差。OCR系统10在票据50的字符数据的校正时,根据该票据50的发行人的发行人名称在OCR用信息表34e中所关联的OCR处理可靠性,来执行消息通知(S213)。因此,能够减少数据确认者在字符数据校正时的错误。
[0134]OCR系统10通过针对票据50的OCR处理,来获取该票据50的发行人的发行人名称(标识信息)(S152)。然后,基于所获取的发行人名称在OCR用信息表34e中关联的字体名称的字体,针对该票据50的发行人记载内容读取对象区域执行OCR处理(S156)。因此,能够提高便利性。
[0135]OCR系统10通过针对带标记文档执行OCR处理,确定出带标记文档中由发行人记载内容标记所确定的发行人记载内容读取对象区域内的字符字体的字体名称(字体的种类)(S106)。然后,OCR系统10将确定出的字体名称(字体的种类)包含在OCR用信息表34e中(S109)。因此,能够容易地将字体的字体名称注册到OCR用信息表34e中。[0136]OCR系统10通过针对带标记文档执行OCR处理,获取带标记文档中由发行人名称标记所确定的发行人的发行人名称(S102)。然后,OCR系统10将获取的发行人名称包含在OCR
17
CN 112639818 A
说 明 书
14/21页
用信息表34e中(S109)。因此,能够容易地将发行人的发行人名称注册到OCR用信息表34e中。
[0137]在票据50的字符数据校正时,OCR系统10根据该票据50的发行人的发行人名称在OCR用信息表34e中所关联的OCR处理可靠性,来执行消息通知(S213)。因此,能够减轻对通过OCR处理从票据50中获取的字符数据进行校正操作的负担。[0138]OCR系统10通过针对带标记文档执行OCR处理,获取带标记文档中由OCR可靠性标记所表示的OCR处理可靠性(S108)。然后,OCR系统10将所获取的可靠性包含在OCR用信息表34e中(S109)。因此,能够容易地将OCR处理可靠性注册到OCR用信息表34e中。[0139]OCR系统10通过针对票据50的OCR处理,获取该票据50的发行人的发行人名称(S152)。然后,OCR系统10在票据50的字符数据的校正时,根据获取到的发行人名称在OCR用信息表34e中所关联的OCR处理可靠性,来执行消息通知(S213)。因此,能够提高便利性。[0140]OCR系统10通过针对带标记文档执行OCR处理,获取带标记文档中由发行人名称标记61(特定信息标记)确定出的发行人的发行人名称(S102)。然后,OCR系统10将获取的发行人名称包含在OCR用信息表34e中(S109)。因此,能够容易地将发行人的发行人名称注册到OCR用信息表34e中。
[0141]OCR系统10在针对带标记文档执行OCR处理的情况下,将符合条件的字符串作为发行人名称来获取,符合条件是指:该字符串是由与发行人名称标记61所重叠的字符在同一行上的部分或全部字符构成的,并且该字符串包含与发行人名称标记61重叠的字符,而且该字符串内部彼此相邻的字符之间的距离小于等于特定距离(S134~S136)。因此,即使是发行人名称标记61没有重叠在利用者所期望的字符串(也就是说,发行人名称中的至少一个字符)上的情况,也能够提高正确获取发行人名称的可能性。
[0142]即使票据50中针对发行人名称的发行人名称标记61的附加方式不完整,OCR系统10也能够提高正确获取发行人名称的可能性。因此,能够降低将错误的发行人名称注册到OCR用信息表34e中的可能性。其结果,OCR系统10能够降低以下操作的必要性,该操作是指:用户针对票据50重新正确地附加上发行人名称标记61,并使图像形成装置的扫描仪再次读取重新正确地附加上了发行人名称标记61的票据50。[0143]OCR系统10在票据50的字符数据的校正时,根据该票据50的发行人的发行人名称在OCR用信息表34e中所关联的OCR处理可靠性,来执行消息通知(S213)。因此,能够减轻对通过OCR处理从票据50中获取的字符数据进行校正操作的负担。[0144](第二实施方式)
首先,说明本发明的第二实施方式所涉及的OCR系统的结构。
[0145]除了以下说明的结构以外,本实施方式所涉及的OCR系统的结构与第一实施方式所涉及的OCR系统10(参照图1)的结构相同。本实施方式所涉及的OCR系统的结构中,与OCR系统10的结构相同的结构标上与OCR系统10的结构相同的符号,省略其详细说明。
[0146]本实施方式所涉及的OCR系统的票据数据管理系统30在存储部34中存储了校正信息数据库334f(参照图18),以此替换校正信息数据库34f(参照图7)。
[0147]图18是本实施方式所涉及的OCR系统的票据数据管理系统30中存储的校正信息数据库334f的一个例子。
[0148]图18中的校正信息数据库334f中,OCR处理使用的第一字体的字体名称、由基于第
18
CN 112639818 A
说 明 书
15/21页
一字体的OCR处理所生成的字符数据、OCR处理使用的第二字体的字体名称、由基于第二字体的OCR处理所生成的字符数据替换OCR处理所使用字体的字体名称、以字体名称所指的字体执行OCR处理而生成的字符数据,与票据数据ID、票据数据的校正状态、通知类型进行了关联。例如,图18中,票据数据ID“D001”、票据数据的校正状态“未校正”、通知类型“可靠性低”、OCR处理使用的第一字体的字体名称“Arial”、由基于第一字体的OCR处理所生成的字符数据“D001a.xlsx”、OCR处理使用的第二字体的字体名称“Calibri”、由基于第二字体的OCR处理所生成的字符数据“D001b.xlsx”相互关联。[0149]接下来,说明本实施方式所涉及的OCR系统的动作。[0150]除了以下说明的动作以外,本实施方式所涉及的OCR系统的动作与第一实施方式所涉及的OCR系统10(参照图1)的动作相同。本实施方式所涉及的OCR系统的动作中,省略与OCR系统10的动作相同的动作的详细说明。[0151]首先,说明本实施方式所涉及的OCR系统通过基于两种字体的OCR处理将票据数据存储到票据数据库34d中时的动作。[0152]图19A、图19B和图20是票据数据管理系统30通过基于两种字体的OCR处理将票据数据存储到票据数据库34d中时的动作流程图。[0153]如图19A、图19B和图20所示,票据数据管理系统30的OCR执行部35a执行与S151~S155(参照图14A)处理相同的S451~S455处理。
[0154]OCR执行部35a在S455中判断为S452的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中已关联了发行人记载内容读取对象区域之后,针对对象票据图像中的该发行人记载内容读取对象区域,分别基于第一字体(第一字体是S452的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中关联的字体名称所表示的字体)和第二字体(第二字体是不同于第一字体的通用字体),通过OCR软件34b执行OCR处理(S456)。[0155]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S457),票据数据包含字符数据和S451中判断接收到的图像数据,字符数据包含S452的发行人名称识别处理中确定出的发行人名称和S456中以第一字体执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S457中存储的票据数据。[0156]然后,OCR执行部35a执行与S158(参照图14)处理同样的S458处理。
[0157]OCR执行部35a在S458中判断为S452的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中未关联OCR处理的可靠性“低”之后,将通知类型“可靠性高”、票据数据的校正状态“未校正”、S456中基于第一字体的OCR处理所使用的字体名称、含有S456中执行基于第一字体的OCR处理所获取字符串的字符数据、S456中基于第二字体的OCR处理所使用的字体名称、含有S456中执行基于第二字体的OCR处理所获取字符串的字符数据,与S457中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库334f中(S459),然后执行S451的处理。
[0158]OCR执行部35a在S458中判断为S452的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中已关联了OCR处理的可靠性“低”之后,将通知类型“可靠性低”、票据数据的校正状态“未校正”、S456中基于第一字体的OCR处理所使用的字体名称、含有S456中执行基于第一字体的OCR处理所获取字符串的字符数据、S456中基于第二字体的OCR处理所使用的字体名称、含有S456中执行基于第二字体的OCR处理所获取字符串的字符数据,与
19
CN 112639818 A
说 明 书
16/21页
S457中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库334f中(S460),然后执行S451的处理。
[0159]OCR执行部35a在S455中判断为S452的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中未关联发行人记载内容读取对象区域之后,针对对象票据图像,分别基于第一字体(第一字体是S452的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中关联的字体名称所表示的字体)和第二字体(第二字体是不同于第一字体的通用字体),通过OCR软件34b执行OCR处理(S461)。[0160]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S462),票据数据包含字符数据和S451中判断接收到的图像数据,字符数据包含S452的发行人名称识别处理中确定出的发行人名称和S461中以第一字体执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S462中存储的票据数据。[0161]然后,OCR执行部35a将通知类型“非最佳区域”、票据数据的校正状态“未校正”、S461中基于第一字体的OCR处理所使用的字体名称、含有S461中执行基于第一字体的OCR处理所获取字符串的字符数据、S461中基于第二字体的OCR处理所使用的字体名称、含有S461中执行基于第二字体的OCR处理所获取字符串的字符数据,与S462中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库334f中(S463),然后执行S451的处理。
[0162]OCR执行部35a在S454中判断为S452的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中未关联字体名称之后,执行与S164(参照图15)处理相同的S464处理。
[0163]OCR执行部35a在S464中判断为S452的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中已关联了发行人记载内容读取对象区域之后,针对对象票据图像中的该发行人记载内容读取对象区域,分别基于第一字体(第一字体是通用字体)和第二字体(第二字体是不同于第一字体的通用字体),通过OCR软件34b执行OCR处理(S465)。[0164]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S466),票据数据包含字符数据和S451中判断接收到的图像数据,字符数据包含S452的发行人名称识别处理中确定出的发行人名称和S465中以第一字体执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S466中存储的票据数据。[0165]然后,OCR执行部35a将通知类型“非最佳字体”、票据数据的校正状态“未校正”、S465中基于第一字体的OCR处理所使用的字体名称、含有S465中执行基于第一字体的OCR处理所获取字符串的字符数据、S465中基于第二字体的OCR处理所使用的字体名称、含有S465中执行基于第二字体的OCR处理所获取字符串的字符数据,与S466中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库334f中(S467),然后执行S451的处理。
[0166]OCR执行部35a在S464中判断为S452的发行人名称识别处理中确定出的发行人名称在OCR用信息表34e中未关联发行人记载内容读取对象区域之后,针对对象票据图像,分别基于第一字体(第一字体是通用字体)和第二字体(第二字体是不同于第一字体的通用字体),通过OCR软件34b执行OCR处理(S468)。[0167]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S469),票据数据包含字
20
CN 112639818 A
说 明 书
17/21页
符数据和S451中判断接收到的图像数据,字符数据包含S452的发行人名称识别处理中确定出的发行人名称和S468中以第一字体执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S469中存储的票据数据。
[0168]OCR执行部35a在S453中判断为S452的发行人名称识别处理中未确定出发行人名称之后,针对对象票据图像,分别基于第一字体(第一字体是通用字体)和第二字体(第二字体是不同于第一字体的通用字体),通过OCR软件34b执行OCR处理(S470)。[0169]然后,OCR执行部35a将票据数据存储到票据数据库34d中(S471),票据数据包含字符数据和S451中判断接收到的图像数据,字符数据包含S470中以第一字体执行的OCR处理所获取的字符串。其中,OCR执行部35a将票据数据ID自动分配给S471中存储的票据数据。[0170]在S469或S471的处理之后,OCR执行部35a将通知类型“非最佳区域字体”、票据数据的校正状态“未校正”、S468或S470中基于第一字体的OCR处理所使用的字体名称、含有S468或S470中执行基于第一字体的OCR处理所获取字符串的字符数据、S468或S470中基于第二字体的OCR处理所使用的字体名称、含有S468或S470中执行基于第二字体的OCR处理所获取字符串的字符数据,与S469或S471中存储到票据数据库34d的票据数据的票据数据ID建立关联并存储到校正信息数据库334f中(S472),然后执行S451的处理。[0171]接下来,说明本实施方式所涉及的OCR系统进行票据数据确认时的动作。[0172]图21是票据数据管理系统30进行票据数据确认时的动作流程图。
[0173]票据数据管理系统30的校正受理部35c从用户终端40接收到票据数据管理系统30所管理的票据数据的列表显示请求后,执行图21中的动作。[0174]如图21所示,校正受理部35c执行与S211~S212(参照图17)处理相同的S511~S512处理。
[0175]校正受理部35c在S512中判断为由用户终端40请求了票据数据之后,将S512中判断为由用户终端40请求了的票据数据(也就是对象票据数据)的确认用画面发送到用户终端40(S513)。其中,校正受理部35c将票据数据库34d所含的对象票据数据的图像数据所表示的图像、票据数据库34d所含的对象票据数据的字符数据所表示的字符串、校正信息数据库334f中对象票据数据所关联的第一字体名称、基于校正信息数据库334f中对象票据数据所关联的第一字体进行的OCR处理所生成的字符数据表示的字符串、校正信息数据库334f中对象票据数据所关联的第二字体名称、基于校正信息数据库334f中对象票据数据所关联的第二字体进行的OCR处理所生成的字符数据表示的字符串、校正信息数据库334f中对象票据数据所关联的通知类型所对应的通知,包含在确认用画面中。校正受理部35c使基于第一字体的OCR处理所生成的字符数据表示的字符串与基于第二字体的OCR处理所生成的字符数据表示的字符串之差异显示包含在确认用画面中。关于通知类型对应的通知,例如在通知类型是“可靠性高”的情况下,为“只需确认基于两种字体的OCR处理分别生成的字符数据所表示的字符串的差异。”这一消息。关于通知类型对应的通知,例如在通知类型是“可靠性低”的情况下,为“这是过去存在很多错误校正的票据。请仔细检查所有项目。”这一消息。关于通知类型对应的通知,例如在通知类型是“非最佳区域”的情况下,为“针对非最佳区域执行了OCR处理。请仔细检查所有项目。”这一消息。关于通知类型对应的通知,例如在通知类型是“非最佳字体”的情况下,为“基于非最佳字体执行了OCR处理。请仔细检查所有项目。”这一消息。关于通知类型对应的通知,例如在通知类型是“非最佳区域字体”的情况下,
21
CN 112639818 A
说 明 书
18/21页
为“针对非最佳区域基于非最佳字体执行了OCR处理。请仔细检查所有项目。”这一消息。[0176]在S513的处理之后,票据数据管理系统30的校正受理部35c执行与S214~S217(参照图17)处理相同的S514~S517处理,然后结束图21中的动作。[0177]在上述的各实施方式中,用于确定发行人名称51的发行人名称标记61是以特定荧光色对发行人名称51的至少一部分进行涂抹,不过也可以是以特定荧光色进行涂抹以外的其它方式。例如,发行人名称标记61不是对发行人名称51的至少一部分进行涂抹,而是圈住发行人名称51的至少一部分。还有,发行人名称标记61也可以由红色、蓝色等荧光色以外的颜色进行描画。发行人名称标记61可以是以不同于发行人记载内容标记62的颜色进行描画,也可以是以不同于OCR可靠性标记63的颜色进行描画。[0178]在上述的各实施方式中,发行人记载内容标记62是以荧光色圈住发行人记载内容读取对象区域,不过也可以是以荧光色圈住发行人记载内容读取对象区域以外的其它方式。例如,发行人记载内容标记62也可以由红色、蓝色等荧光色以外的颜色进行描画。发行人记载内容标记62可以是以不同于发行人名称标记61的颜色进行描画,也可以是以不同于OCR可靠性标记63的颜色进行描画。[0179]在上述的各实施方式中,OCR可靠性标记63是以荧光色描画的×标记,不过也可以是以荧光色描画的×标记以外的其它方式。例如,OCR可靠性标记63可以是在发行人记载内容标记62围起来的范围的外部描画的星号标记、复选标记之类的标记,例如也可以如图22所示,是在发行人记载内容标记62围起来的范围的内部描画的线条之类的标记。OCR可靠性标记63可以是以不同于发行人名称标记61的颜色进行描画,也可以是以不同于发行人记载内容标记62的颜色进行描画。OCR可靠性标记63也可以以发行人名称标记61和发行人记载内容标记62中的至少一种颜色进行描画。例如,关于OCR可靠性标记63,在OCR处理的可靠性高的情况下,可以是以发行人名称标记61和发行人记载内容标记62的黄色荧光色进行描画,在OCR处理的可靠性低的情况下,可以是以发行人名称标记61和发行人记载内容标记62的粉色荧光色进行描画。
[0180]在上述的各实施方式中,OCR可靠性标记63是表示OCR处理可靠性低的标记。不过,OCR可靠性标记63也可以是表示OCR处理可靠性高的标记,还可以是将OCR处理的可靠性高和低区别表示的标记。
[0181]在上述的各实施方式中,在S131中抽取的图像所含的全部字符中,票据数据管理系统30的OCR执行部35a基于S132中检测的各位置和S133中检测的各位置,抽取出与S131中抽取的图像中发行人名称标记61所重叠的字符在同一行的字符(S134)。不过,在S131中抽取的图像所含的全部字符中,OCR执行部35a也可以通过S134的方法以外的方法来抽取出与S131中抽取的图像中发行人名称标记61所重叠的字符在同一行的字符。[0182]在上述的各实施方式中,票据数据管理系统30的OCR执行部35a通过在发行人名称获取处理中抽取出发行人名称获取用区域(S131),从而在发行人名称获取处理中只将发行人名称获取用区域作为处理对象。因此,与在发行人名称获取处理中将对象票据图像整体作为处理对象的结构相比较,OCR执行部35a能够抑制发行人名称获取处理中作为处理对象的区域的大小。其结果,能够抑制控制部35中用于发行人名称获取处理的RAM大小。不过,OCR执行部35a也可以在发行人名称获取处理中不抽取发行人名称获取用区域,而将对象票据图像整体作为处理对象。
22
CN 112639818 A[0183]
说 明 书
19/21页
在上述的各实施方式中,票据数据管理系统30的OCR执行部35a抽取出符合条件的
字符串(S135),并将S135中抽取的字符串作为发行人名称(S136),符合条件是指:该字符串由S134中抽取的字符构成,该字符串内彼此相邻的字符之间距离小于等于特定距离,该字符串包含S131中抽取的图像中与发行人名称标记61重叠的字符。不过,OCR执行部35a也可以抽取出符合另一条件的字符串,并在S136中将抽取的字符串作为发行人名称,符合另一条件是指:该字符串由S134中抽取的字符构成,该字符串的整体长度小于等于特定距离,该字符串包含S131中抽取的图像中与发行人名称标记61重叠的字符。其中,特定距离例如可以是与发行人名称标记61重叠的字符的20个字符距离等,即是对应于字符宽度的距离,例如15cm等,也可以是与字符宽度无关的固定距离。还有,在S136中,OCR执行部35a也可以将S134中抽取的全部字符所构成的字符串作为发行人名称。因此,即使是发行人名称标记61没有重叠在利用者所期望的字符串(也就是说,发行人名称中的至少一个字符)上的情况,也能够提高正确获取利用者所期望的字符串的可能性。
[0184]上述的各实施方式中说明了的票据数据管理系统30的至少一部分功能也可以不在票据数据管理系统30中实现,而是在图像形成装置中实现。同样地,上述的各实施方式中说明了的票据数据管理系统30的至少一部分功能也可以不在票据数据管理系统30中实现,而是在用户终端40中实现。
[0185]本发明中的文档在上述各实施方式中是票据,不过也可以是票据以外的文档。[0186]本申请进一步公开了以下的附录。另外,以下的附录并非旨在限定本发明。
(附录1)
一种文档OCR程序,通过OCR处理从文档中获取字符数据,其特征在于,所述文档OCR程序使计算机实现OCR用信息管理部和OCR执行部的功能,
所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与OCR处理所使
用字体的种类进行关联的OCR用信息,
所述OCR执行部用于执行针对所述文档的OCR处理,
所述OCR执行部在针对所述文档中的特定区域执行OCR处理的情况下,使用所述
OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述种类的字体,来执行OCR处理。
(附录2)
一种OCR方法,通过OCR处理从文档中获取字符数据,其特征在于,所述OCR方法具备OCR用信息管理步骤和OCR执行步骤,
所述OCR用信息管理步骤用于管理将所述文档的发行人的标识信息与OCR处理所
使用字体的种类进行关联的OCR用信息,
所述OCR执行步骤用于执行针对所述文档的OCR处理,
所述OCR执行步骤在针对所述文档中的特定区域执行OCR处理的情况下,使用所述
OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述种类的字体,来执行OCR处理。
(附录3)
一种文档OCR程序,通过OCR处理从文档中获取字符数据,其特征在于,所述文档OCR程序使计算机实现OCR用信息管理部、OCR执行部和校正受理部的功
23
CN 112639818 A
说 明 书
20/21页
能,
所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与针对该发行人
所发行的所述文档执行OCR处理的可靠性进行关联的OCR用信息,
所述OCR执行部用于执行针对所述文档的OCR处理,所述校正受理部用于受理所述字符数据的校正,带标记文档是指附加了可靠性标记的所述文档,所述可靠性标记用于表示所述可
靠性,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,获取由所述可靠性标记表示的所述可靠性,
所述OCR执行部从所述带标记文档中获取所述可靠性后,所述OCR用信息管理部将
所述可靠性包含在所述OCR用信息中,
在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与
该文档的所述发行人的所述标识信息相关联的所述可靠性,来执行消息通知。
(附录4)
一种OCR方法,通过OCR处理从文档中获取字符数据,其特征在于,所述OCR方法具备OCR用信息管理步骤、OCR执行步骤和校正受理步骤,
所述OCR用信息管理步骤用于管理将所述文档的发行人的标识信息与针对该发行
人所发行的所述文档执行OCR处理的可靠性进行关联的OCR用信息,
所述OCR执行步骤用于执行针对所述文档的OCR处理,所述校正受理步骤用于受理所述字符数据的校正,带标记文档是指附加了可靠性标记的所述文档,所述可靠性标记用于表示所述可
靠性,所述OCR执行步骤在针对所述带标记文档执行OCR处理的情况下,获取由所述可靠性标记表示的所述可靠性,
所述OCR执行步骤从所述带标记文档中获取所述可靠性后,所述OCR用信息管理步
骤将所述可靠性包含在所述OCR用信息中,
在所述文档的所述字符数据的校正时,所述校正受理步骤根据所述OCR用信息中
与该文档的所述发行人的所述标识信息相关联的所述可靠性,来执行消息通知。
(附录5)
一种OCR系统,通过OCR处理从文档中获取字符数据,其特征在于,具备OCR执行部,所述OCR执行部用于执行针对所述文档的OCR处理,带标记文档是指附加了特定信息标记的所述文档,所述特定信息标记用于获取特
定信息,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,将符合条件的字符串作为所述特定信息来获取,符合条件是指:所述字符串是由与所述特定信息标记所重叠的字符在同一行上的部分或全部字符构成的,并且所述字符串包含所述特定信息标记所重叠的字符,而且所述字符串的整个长度小于等于特定距离。
(附录6)
一种文档OCR程序,通过OCR处理从文档中获取字符数据,其特征在于,所述文档OCR程序使计算机实现OCR执行部的功能,所述OCR执行部用于执行针对
所述文档的OCR处理,
带标记文档是指附加了特定信息标记的所述文档,所述特定信息标记用于获取特
24
CN 112639818 A
说 明 书
21/21页
定信息,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,将符合条件的字符串作为所述特定信息来获取,符合条件是指:所述字符串是由与所述特定信息标记所重叠的字符在同一行上的部分或全部字符构成的,并且所述字符串包含与所述特定信息标记重叠的字符,而且所述字符串内部彼此相邻的字符之间的距离小于等于特定距离。
(附录7)
一种文档OCR程序,通过OCR处理从文档中获取字符数据,其特征在于,所述文档OCR程序使计算机实现OCR执行部的功能,所述OCR执行部用于执行针对
所述文档的OCR处理,
带标记文档是指附加了特定信息标记的所述文档,所述特定信息标记用于获取特
定信息,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,将符合条件的字符串作为所述特定信息来获取,符合条件是指:所述字符串是由与所述特定信息标记所重叠的字符在同一行上的部分或全部字符构成的,并且所述字符串包含所述特定信息标记所重叠的字符,而且所述字符串的整个长度小于等于特定距离。
(附录8)
一种OCR方法,通过OCR处理从文档中获取字符数据,其特征在于,具备OCR执行步骤,所述OCR执行步骤用于执行针对所述文档的OCR处理,带标记文档是指附加了特定信息标记的所述文档,所述特定信息标记用于获取特
定信息,所述OCR执行步骤在针对所述带标记文档执行OCR处理的情况下,将符合条件的字符串作为所述特定信息来获取,符合条件是指:所述字符串是由与所述特定信息标记所重叠的字符在同一行上的部分或全部字符构成的,并且所述字符串包含与所述特定信息标记重叠的字符,而且所述字符串内部彼此相邻的字符之间的距离小于等于特定距离。
(附录9)
一种OCR方法,通过OCR处理从文档中获取字符数据,其特征在于,具备OCR执行步骤,所述OCR执行步骤用于执行针对所述文档的OCR处理,带标记文档是指附加了特定信息标记的所述文档,所述特定信息标记用于获取特
定信息,所述OCR执行步骤在针对所述带标记文档执行OCR处理的情况下,将符合条件的字符串作为所述特定信息来获取,符合条件是指:所述字符串是由与所述特定信息标记所重叠的字符在同一行上的部分或全部字符构成的,并且所述字符串包含所述特定信息标记所重叠的字符,而且所述字符串的整个长度小于等于特定距离。
25
CN 112639818 A
说 明 书 附 图
1/24页
图1
26
CN 112639818 A
说 明 书 附 图
2/24页
图2
27
CN 112639818 A
说 明 书 附 图
3/24页
图3
28
CN 112639818 A
说 明 书 附 图
4/24页
图4
29
CN 112639818 A
说 明 书 附 图
5/24页
图5
30
说 明 书 附 图
6/24页
图6
31
CN 112639818 A
说 明 书 附 图
7/24页
图7
32
CN 112639818 A
CN 112639818 A
说 明 书 附 图
8/24页
图8
33
CN 112639818 A
说 明 书 附 图
9/24页
图9
34
CN 112639818 A
说 明 书 附 图
10/24页
图10
35
CN 112639818 A
说 明 书 附 图
11/24页
图11
图12
36
说 明 书 附 图
12/24页
图13
37
CN 112639818 A
CN 112639818 A
说 明 书 附 图
13/24页
图14A
38
CN 112639818 A
说 明 书 附 图
14/24页
图14B
39
CN 112639818 A
说 明 书 附 图
15/24页
图15
40
CN 112639818 A
说 明 书 附 图
16/24页
图16A
41
CN 112639818 A
说 明 书 附 图
17/24页
图16B
42
CN 112639818 A
说 明 书 附 图
18/24页
图17
43
说 明 书 附 图
19/24页
图18
44
CN 112639818 A
CN 112639818 A
说 明 书 附 图
20/24页
图19A
45
CN 112639818 A
说 明 书 附 图
21/24页
图19B
46
CN 112639818 A
说 明 书 附 图
22/24页
图20
47
CN 112639818 A
说 明 书 附 图
23/24页
图21
48
CN 112639818 A
说 明 书 附 图
24/24页
图22
49
CN 112639818 A
按照条约第19条修改的权利要求书
1/2页
1.2.3.4.5.
6.一种OCR系统,通过OCR处理从文档中获取字符数据,其特征在于,具备OCR用信息管理部、OCR执行部和校正受理部,
所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与针对该发行人所发行的所述文档执行OCR处理的可靠性进行关联的OCR用信息,
所述OCR执行部用于执行针对所述文档的OCR处理,所述校正受理部用于受理所述字符数据的校正,带标记文档是指附加了可靠性标记的所述文档,所述可靠性标记用于表示所述可靠性,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,获取由所述可靠性标记表示的所述可靠性,
所述OCR执行部从所述带标记文档中获取所述可靠性后,所述OCR用信息管理部将所述可靠性包含在所述OCR用信息中,
在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述可靠性,来执行消息通知。
7.根据权利要求6所述的OCR系统,其特征在于,
所述文档中包含该文档的所述发行人的所述标识信息,所述OCR执行部通过针对所述文档的OCR处理,获取该文档的所述发行人的所述标识信息,
在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与所述OCR执行部从所述文档中获取的所述标识信息相关联的所述可靠性,来执行消息通知。
8.根据权利要求6所述的OCR系统,其特征在于,所述带标记文档中附加了标识信息标记,所述标识信息标记用于获取所述带标记文档的所述发行人的所述标识信息,
所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,获取由所述标识信息标记确定出的所述标识信息,
所述OCR执行部从所述带标记文档中获取到所述标识信息后,所述OCR用信息管理部将所述标识信息包含在所述OCR用信息中。
9.根据权利要求6所述的OCR系统,其特征在于,所述OCR用信息中,OCR处理所使用字体的种类与所述标识信息相关联,所述OCR执行部在针对所述文档中的特定区域执行OCR处理的情况下,使用所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述种类的字体,来执行OCR处理。
10.根据权利要求9所述的OCR系统,其特征在于,所述带标记文档中附加了区域用标记,所述区域用标记用于确定所述区域,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,确定出由所述区域用标记确定的所述区域内的字符字体的所述种类,
50
CN 112639818 A
按照条约第19条修改的权利要求书
2/2页
所述OCR执行部从所述带标记文档中确定出所述种类后,所述OCR用信息管理部将所述种类包含在所述OCR用信息中。
11.根据权利要求6所述的OCR系统,其特征在于,所述可靠性标记含有表示所述可靠性低的标记、表示所述可靠性高的标记以及将OCR处理的可靠性高和低区别表示的标记这三种标记中的至少一种。
12.一种OCR系统,通过OCR处理从文档中获取字符数据,其特征在于,具备OCR执行部,所述OCR执行部用于执行针对所述文档的OCR处理,带标记文档是指附加了特定信息标记的所述文档,所述特定信息标记用于获取特定信息,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,将符合条件的字符串作为所述特定信息来获取,符合条件是指:所述字符串是由与所述特定信息标记所重叠的字
并且所述字符串包含与所述特定信息标记重叠的符在同一行上的部分或全部字符构成的,
字符,而且所述字符串内部彼此相邻的字符之间的距离小于等于特定距离,
所述特定信息是指所述文档的发行人的标识信息,所述OCR系统还具备OCR用信息管理部和校正受理部,
所述OCR用信息管理部用于管理将所述文档的所述发行人的所述标识信息与可靠性进行关联的OCR用信息,所述可靠性是指针对该发行人所发行的所述文档执行OCR处理的可靠性,
所述校正受理部用于受理所述字符数据的校正,
所述带标记文档中附加了用于表示所述可靠性的可靠性标记,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,确定出由所述可靠性标记表示的所述可靠性,
所述OCR执行部从所述带标记文档中获取到所述可靠性后,所述OCR用信息管理部将所述可靠性包含在所述OCR用信息中,
在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述可靠性,来执行消息通知。
13.14.
15.根据权利要求12所述的OCR系统,其特征在于,
所述OCR用信息管理部在所述OCR用信息中将所述文档的所述发行人的所述标识信息与OCR处理所使用字体的种类进行关联,
所述OCR执行部分别基于所述种类的字体以及与所述种类的字体不同的字体来执行OCR处理,
所述校正受理部将含有差异的确认用画面发送到用户终端,所述差异是指基于所述种类的字体执行OCR处理而生成的所述字符数据与基于所述不同的字体执行OCR处理而生成的所述字符数据之间的差异。
51
因篇幅问题不能全部显示,请点此查看更多更全内容