识别手写汉字的笔顺的方法、系统和计算设备与流程

您所在的位置:网站首页 笔顺的方法 识别手写汉字的笔顺的方法、系统和计算设备与流程

识别手写汉字的笔顺的方法、系统和计算设备与流程

2024-07-11 04:22| 来源: 网络整理| 查看: 265

识别手写汉字的笔顺的方法、系统和计算设备与流程

1.本发明涉及汉字识别领域,更具体地,涉及识别手写汉字的笔顺的方法、系统和计算设备。

背景技术:

2.汉字是我国文化的载体,其书写过程也是一种体验中国传统文化丰厚底蕴的过程。但随着电脑、手机的普及和网络的高速发展,数字化时代的到来改变了人们的书写方式,书写汉字的各种输入法层出不穷,打字效率也越来越高。虽然这种输入法打字的确给人们的书写带来了很多便利,但人们享受高效的数字生活的同时,中国博大精深的汉字文化也受到了前所未有的冲击。随着人们用笔写字的机会日益减少,“汉字遗忘症”、“电脑失写症”日趋蔓延,忽视笔画、笔顺的现象尤为严重。3.但写字是小学语文教学的一项重要内容,是素质教育的一部分,也是弘扬和集成中华民族传统文化的基础工程。小学语文新课程标准对低年级小学生的识字写字要求是“掌握汉字的基本笔画和常用的偏旁部首,能按笔顺规则用硬笔书写”,可见在小学生识字写字的启蒙阶段,掌握汉字的笔顺至关重要。此外,一笔一划的写字过程也是一种培养学生耐心和观察力的过程,对学生思维的培养、智力的开发和良好行为的形成都十分有益。4.然而,上述写字“遗忘症”现象也在潜移默化地影响着低年级小学生的汉字书写习惯。随着电脑、手机使用者的日益低龄化,小学生的汉字书写水平也普遍下降,提笔忘字、字迹潦草是司空见惯的事情,汉字笔顺书写正确与否被忽略的现象尤为严重。人工辅导纠错,不仅耗时耗力,而且老师或者家长的过度干预可能会引起小学生的反感,从而更加影响小学生良好汉字书写习惯的培养。

技术实现要素:

5.为了解决上述问题而提出了本发明。根据本发明的一方面,提供了一种用于识别手写汉字的笔顺的方法,所述方法包括:获取待识别的手写汉字的轨迹点序列,并对所述手写汉字的轨迹点序列进行预处理,得到所述手写汉字的关键点序列;基于所述手写汉字的关键点序列提取所述手写汉字的笔画特征,其中所述笔画特征包括基本特征和语义特征;以及利用经训练的笔顺识别模型对所述手写汉字的笔画特征与相应的模板汉字的笔画特征一起进行处理,得到笔顺识别结果。6.在一个实施例中,其中经训练的笔顺识别模型包括经训练的空间变换网络和笔顺识别网络,其中所述空间变换网络用于对所述手写汉字的笔画特征进行空间变换,得到经变换的手写汉字的笔画特征;所述笔顺识别网络用于对所述经变换的手写汉字的笔画特征与所述模板汉字的笔画特征一起进行处理,得到笔顺识别结果。7.在一个实施例中,其中所述笔顺识别网络包括隐层特征提取模块,用于从所述经变换的手写汉字的笔画特征和所述模板汉字的笔画特征分别提取出手写汉字的手写汉字隐层特征和模板汉字的模板汉字隐层特征。8.在一个实施例中,其中所述笔顺识别网络还包括特征融合模块,用于将所提取的所述手写汉字隐层特征和所述模板汉字隐层特征进行融合处理,得到所述手写汉字隐层特征和所述模板汉字隐层特征的差异特征。9.在一个实施例中,其中所述笔顺识别网络还包括笔顺识别模块,用于基于所述差异特征识别出所述笔顺识别结果。10.在一个实施例中,所述基本特征包括所述笔画线段上各个关键点的坐标和书写时间,所述语义特征包括所述笔画线段的贝塞尔特征、路径签名特征、关键点间的距离、曲率、笔画走向特征中的一个或更多个。11.在一个实施例中,其中对所述手写汉字的轨迹点序列进行预处理,得到所述手写汉字的关键点序列的步骤包括:对所述手写汉字的轨迹点序列进行处理,得到所述手写汉字的轨迹点均匀分布的笔画线段;针对每个轨迹点均匀分布的笔画线段,计算其上所有轨迹点对应的曲率夹角和与前一个轨迹点之间的距离,基于所述曲率夹角和/或所述距离确定所述笔画线段的关键点序列;对各个笔画线段的关键点序列进行组合,得到所述手写汉字的关键点序列。12.在一个实施例中,所述方法还包括:由汉字识别模型对待识别的手写汉字进行识别,得到汉字识别结果,根据所述汉字识别结果匹配并获取所述相应的模板汉字。13.在一个实施例中,所述方法还包括:所述方法还包括:如果所述笔顺识别结果指示待识别的所述手写汉字的笔顺错误,则获取所述相应的模板汉字的正确笔顺并呈现给用户。14.在一个实施例中,其中所述笔顺识别网络为循环神经网络。15.在一个实施例中,其中所述空间变换网络和所述笔顺识别网络是通过联合训练的训练方式被训练为用于识别手写汉字的笔顺。16.在一个实施例中,其中所述空间变换网络和所述笔顺识别网络通过以下步骤进行训练:获取作为训练样本的手写汉字和相应的模板汉字;由空间变换网络对所述模板汉字进行空间变换,使得经变换的模板汉字与所述手写汉字具有相同的笔顺;利用所述笔顺识别网络中的隐层特征提取模块分别提取出所述手写汉字的手写汉字隐层特征和所述经变换的模板汉字的模板汉字隐层特征,并得到第一损失函数;利用所述笔顺识别网络中的特征融合模块对所述手写汉字隐层特征和所述模板汉字隐层特征进行融合处理,得到所述手写汉字隐层特征和所述模板汉字隐层特征的差异特征,并得到第二损失函数;以及基于所述第一损失函数和所述第二损失函数调节所述空间变换网络和所述笔顺识别网络的权重,得到经训练的空间变换网络和笔顺识别网络。17.根据本发明的另一实施例,提供了一种用于识别手写汉字的笔顺的系统,所述系统包括:处理器,用于使用一个或更多个神经网络来:对所获取的手写汉字的轨迹点序列进行预处理,得到所述手写汉字的关键点序列;基于所述手写汉字的关键点序列提取所述手写汉字的笔画特征,其中所述笔画特征包括基本特征和语义特征;以及利用所述神经网络中的笔顺识别模型对所述手写汉字的笔画特征与相应的模板汉字的笔画特征一起进行处理,得到笔顺识别结果,和存储器,用于存储所述一个或更多个神经网络的网络参数。18.根据本发明的又一实施例,提供了一种计算设备,所述计算设备包括:预处理模块,用于获取待识别的手写汉字的轨迹点序列,并对所述手写汉字的轨迹点序列进行预处理,得到所述手写汉字的关键点序列;特征提取模块,用于基于所述手写汉字的关键点序列提取所述手写汉字的笔画特征,其中所述笔画特征包括基本特征和语义特征;和特征处理模块,用于对所述手写汉字的笔画特征与存储的相应的模板汉字的笔画特征一起进行处理,得到笔顺识别结果。19.根据本发明的又一实施例,提供了一种计算设备,所述计算设备包括存储器和处理器,所述存储器上存储有计算机程序,所述计算机程序在被所述处理器运行时,使得所述处理器执行如上所述的方法。20.根据本发明的再一实施例,提供了一种计算机可读介质,所述计算机可读介质上存储有计算机程序,所述计算机程序在被运行时,执行如上所述的方法。21.根据本发明实施例的识别手写汉字的笔顺的方法、系统和计算设备,能够获取手写汉字并进行实时分析,准确识别出书写该手写汉字的笔顺正确与否,并将识别结果反馈给用户,不仅可以大幅度提高手写汉字笔顺的识别效率,缓解家长和老师的辅导教学压力,同时还可以辅助书写者养成按照正确笔顺书写汉字的习惯。附图说明22.通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。23.图1示出了根据本发明的一个实施例的用于实现根据本发明实施例的用于识别手写汉字的笔顺的方法、系统和计算设备的电子设备。24.图2示出了根据本发明的一个实施例的用于识别手写汉字的笔顺的方法的步骤流程图。25.图3示出了根据本发明一个实施例的对手写汉字的轨迹点序列进行预处理的主要过程的示意图。26.图4示出了根据本发明一个实施例的笔顺识别模型的示意性框图。27.图5示出了根据本发明一个实施例的笔顺识别网络的示意性结构框图。28.图6示出了根据本发明一个实施例的用于识别手写汉字的笔顺的系统的示意性结构框图。29.图7示出了根据本发明的一个实施例的计算设备的示意性结构框图。30.图8示出了根据本发明的另一实施例的计算设备的示意性结构框图。具体实施方式31.为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。32.如上所述,人工辅导小学生书写汉字不仅耗时耗力,而且老师或者家长的过度干预可能会引起小学生的反感。33.因此为了帮助培养小学生良好书写汉字的习惯,本发明提供了一种用于识别手写汉字的笔顺的方法,所述方法包括:获取待识别的手写汉字的轨迹点序列,并对所述手写汉字的轨迹点序列进行预处理,得到所述手写汉字的关键点序列;基于所述手写汉字的关键点序列提取所述手写汉字的笔画特征,其中所述笔画特征包括基本特征和语义特征;以及利用经训练的笔顺识别模型对所述手写汉字的笔画特征与相应的模板汉字的笔画特征一起进行处理,得到笔顺识别结果。34.本发明能够获取手写汉字并进行实时分析,准确识别出书写该手写汉字的笔顺正确与否,并将识别结果反馈给用户,不仅可以大幅度提高手写汉字笔顺的识别效率,缓解家长和老师的辅导教学压力,同时还可以辅助书写者养成按照正确笔顺书写汉字的习惯。35.下面结合具体实施例详细描述根据本发明的识别手写汉字的笔顺的方法、系统和计算设备。36.首先,参照图1来描述用于实现根据本发明实施例的用于识别手写汉字的笔顺的方法、系统和计算设备的电子设备100。37.在一个实施例中,电子设备100可以是例如笔记本电脑、台式计算机、平板电脑、学习机、移动设备(诸如,智能手机、电话手表等)、嵌入式计算机、塔式服务器、机架服务器、刀片服务器或任何其他合适的电子设备。38.在一个实施例中,电子设备100可以包括至少一个处理器102和至少一个存储器104。39.其中,存储器104可以是易失性存储器,诸如随机存取存储器(ram)、高速缓存存储器(cache)、动态随机存取存储器(dram)(包括堆叠的dram)或高带宽存储器(hbm)等,也可以是非易失性存储器,诸如只读存储器(rom)、闪存、3d xpoint等。在一个实施例中,存储器104的某些部分可以是易失性存储器,而另一部分可以是非易失性存储器(例如,使用两级存储器层次结构)。存储器104用于存储计算机程序,该计算机程序在被运行时,能够实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其他期望的功能。40.处理器102可以是中央处理单元(cpu)、图形处理单元(gpu)、微处理器或具有数据处理能力和/或指令执行能力的其他处理单元。处理器102可经由通信总线通信地耦合到任何合适数量或种类的组件、外围设备、模块或设备。在一个实施例中,通信总线可以使用任何合适的协议来实现,诸如外围组件互连(pci)、快速外围组件互连(pcie)、加速图形端口(agp)、超传输或任何其他总线或一个或更多个点对点通信协议。41.电子设备100还可以包括输入装置106和输出装置108。其中,输入装置106是用于接收用户输入的装置,其可以包括键盘、鼠标、触摸板、麦克风等。此外,输入装置106也可以是任何接收信息的接口。输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音),其可以包括显示器、扬声器等中的一个或更多个。此外,输出装置108也可以是任何其他具备输出功能的设备,例如打印机等。42.下面参考图2描述根据本发明的一个实施例的用于识别手写汉字的笔顺的方法200的步骤流程图。在一个实施例中,用于识别手写汉字的笔顺的方法200可以在线地执行,也可以离线地执行。43.如图2所示,用于识别手写汉字的笔顺的方法200可以包括如下步骤:44.在步骤s210:获取待识别的手写汉字的轨迹点序列,并对所述手写汉字的轨迹点序列进行预处理,得到所述手写汉字的关键点序列。45.其中,手写汉字的轨迹点序列可以包含各种信息,例如轨迹点的坐标和轨迹点的书写时间等。46.在一个实施例中,待识别的手写汉字的轨迹点序列可通过现有的通用学习机或者其他可支持手写输入的任意电子设备(例如,如上所述的电子设备100)来获取。举例来说,用户在电子设备上书写汉字时,该电子设备可根据书写者的手写速度、硬件设置的采样率、压力参数等自适应地采集手写汉字的轨迹点序列并上传至云端保存或在本地保存,从而本发明便可从云端或本地获取到输入的手写汉字的轨迹点序列。47.由于不同电子设备采用的硬件不同,从而采集到的手写汉字的轨迹点的采样率、压力等参数会有所不同,同时由于每个人的书写习惯和书写速度不同,这就导致不同人手写同一个字,甚至同一人在不同时刻手写同一个汉字,存在所写汉字的形态不同、轨迹点个数不同等,因此在将输入的手写汉字的轨迹点序列送入到后面的笔顺识别模型之前,可以对输入的手写汉字的轨迹点序列进行预处理,以增加后端笔顺识别模型的鲁棒性。48.参见图3,图3示出了根据本发明的一个实施例的对手写汉字的轨迹点序列进行预处理的主要过程的示意图。如图3所示,在一个实施例中,其中对手写汉字的轨迹点序列进行预处理,得到该手写汉字的关键点序列可以包括如下步骤:49.步骤a.对手写汉字的轨迹点序列进行处理,得到所述手写汉字的轨迹点均匀分布的笔画线段。50.在一个实施例中,该步骤可以通过先分离笔画线段再对笔画线段重采样的方法来实现,具体地:51.首先,可先根据手写汉字的起笔点和落笔点分离出每个笔画线段的轨迹点序列。52.每个人在书写每个汉字时,每个笔画都对应一个起笔点和一个落笔点,即使在连笔情况下,连笔笔画也会对应一个起笔点和落笔点,由此可根据输入的手写汉字的起笔点和落笔点分离出每个笔画线段的轨迹点序列。53.然后,对笔画线段的轨迹点序列进行重采样,得到该手写汉字的轨迹点均匀分布的笔画线段。54.具体地,针对分离出的每个笔画线段,计算该笔画线段的总长度,根据设定的采样率对该笔画线段的总长度进行轨迹点均匀的重采样,使得采样得到的每个笔画线段内的轨迹点都是均匀分布的。55.步骤b.针对每个轨迹点均匀分布的笔画线段,计算其上所有轨迹点对应的曲率夹角和与前一个轨迹点之间的距离,基于该曲率夹角和/或该距离确定笔画线段的关键点序列。56.具体地,针对每个轨迹点均匀分布的笔画线段,计算该笔画线段上所有轨迹点对应的曲率夹角θ、与前一个轨迹点之间的距离d。57.其中,某轨迹点与前一个轨迹点之间的距离d可以直接根据两个轨迹点的坐标差进行计算即可。具体地,设该轨迹点的坐标为(x2,y2),前一个轨迹点的坐标为(x1,y1),则该轨迹点与前一个轨迹点之间的距离对于曲率夹角θ,其是指当前轨迹点与前一个轨迹点和后一个轨迹点连线间的夹角大小。58.针对每个笔画线段内的每个轨迹点,可以计算出上述两个量,然后可以分别设定距离阈值为t1,曲率夹角阈值为t2,并且当d;t1或者θ;t2时,可以认为该轨迹点不是关键点,应予以滤除。当d;t1,或者θ;t2,或者同时满足d;t1且θ;t2时,则认为该轨迹点是关键点。应理解,上述将轨迹点确定为关键点的判断方法仅仅是示例性的,并不是限制,还可采用本领域公知的其他判断方法,本发明对此不作限定。59.在提取到每个笔画线段的关键点后,组成每个笔画线段的关键点序列。60.步骤c.对各个笔画线段的关键点序列进行组合,得到所述手写汉字的关键点序列。61.具体地,在提取到每个手写汉字的每个笔画对应的关键点序列后,将其组合成该手写汉字的关键点序列,以用于后续的笔画特征提取步骤。62.步骤s220:基于手写汉字的关键点序列提取手写汉字的笔画特征,其中笔画特征包括基本特征和语义特征。63.在一个实施例中,可以利用神经网络提取手写汉字的笔画特征,其中该神经网络可以为经训练的本领域公知的任何神经网络,例如循环神经网络(rnn)、深度神经网络(dnn)、深度信念网络(dbn)等,本发明对此不作限定。64.在一个实施例中,基本特征可以包括笔画线段上各个关键点的坐标和书写时间,语义特征可以包括笔画线段的贝塞尔(bezier)特征、路径签名(path signature)特征、关键点间的距离、曲率、笔画走向特征中的一个或更多个特征,本发明对此不作限定。65.本发明提取的特征除坐标等基本特征外,还包括语义特征,相比于仅将基本特征而无任何语义特征送入后端笔顺识别模型而言,将这些富含语义特征的笔画特征送入到后端笔顺识别模型,更加有助于该模型学习到有利于笔顺识别的关键抽象语义特征。66.步骤s230:利用经训练的笔顺识别模型对所述手写汉字的笔画特征与相应的模板汉字的笔画特征一起进行处理,得到笔顺识别结果。67.其中,模板汉字的笔画特征的获取可以采用多种方式,本发明对此不作限定。68.在一个实施例中,可预先建立存储有若干个模板汉字的模板汉字库,在获取了待识别的手写汉字后,对其进行识别并得到汉字识别结果,然后根据该汉字识别结果匹配并获取与该手写汉字相应的模板汉字,并对该模板汉字进行步骤s210、s220中的类似处理,得到该模板汉字的笔画特征。69.其中,可采用本领域公知的任何方法来建立模板汉字库。在一个实施例中,可以采用信息交换用汉字编码字符集gb2312中收录的6763个汉字来建立模板汉字库,还可以采用其他方法来建立模板汉字库,例如网络爬取、计算机生成等,本发明对此不作限定。70.在一个实施例中,可以直接存储模板汉字的轨迹点序列,在匹配并获取到相应的模板汉字后,对相应的模板汉字的轨迹点序列进行上述处理,得到该模板汉字的笔画特征。71.在一个实施例中,还可以直接存储模板汉字的关键点序列,在匹配并获取到相应的模板汉字后,基于相应的模板汉字的关键点序列提取该模板汉字的笔画特征。在一个实施例中,甚至可以直接存储模板汉字的笔画特征,在匹配并获取到相应的模板汉字后,直接获取该相应的模板汉字的笔画特征。72.参考图4,图4示出了根据本发明的一个实施例的笔顺识别模型400的示意性框图。如图4所示,在一个实施例中,经训练的笔顺识别模型可以包括经训练的空间变换网络410和笔顺识别网络420,其中空间变换网络410用于对手写汉字的笔画特征进行空间变换,得到经变换的手写汉字的笔画特征;笔顺识别网络420用于对该经变换的手写汉字的笔画特征与模板汉字的笔画特征一起进行处理,得到笔顺识别结果。73.由于不同人的书写习惯不同,会导致待识别的手写汉字与模板汉字在形态上存在较大差别,如果直接将待识别的汉字与模板汉字组成输入对输入笔顺识别网络420,由于笔顺识别网络的容量限制,对于形变较大的手写汉字很难识别正确。因此,为了减少待识别的手写汉字的形变对识别结果的影响,在笔顺识别网络420前引入空间变换网络410,用于对手写汉字的笔画特征进行空间变换,即对手写汉字进行空间形变矫正,使得经变换的手写汉字的形态向相应模板汉字的形态靠近,从而提高手写汉字识别结果的准确性。74.示例性地,空间变换网络410可采用任何具有调整空间形变的深度学习网络进行构建,本发明对此不作限定。75.在一个实施例中,笔顺识别网络420可以为循环神经网络(rnn)。应理解,笔顺识别网络还可以为其他能够实现笔顺识别的神经网络,本发明对此不作限定。76.参考图5,图5示出了根据本发明的一个实施例的笔顺识别网络420的示意性结构框图。如图5所示,在一个实施例中,笔顺识别网络420可以包括隐层特征提取模块510、特征融合模块520和笔顺识别模块530。应理解,笔顺识别网络420还可以包括其他有助于识别手写汉字的笔顺的模块,本发明对此不作限定。77.其中,隐层特征提取模块510用于从空间变换网络接收经变换的手写汉字的笔画特征和模板汉字的笔画特征,并从经变换的手写汉字的笔画特征和模板汉字的笔画特征分别提取出手写汉字的手写汉字隐层特征和模板汉字的模板汉字隐层特征。78.在一个实施例中,隐层特征提取模块510可以用循环神经网络(rnn)来实现。应理解,隐层特征提取模块510还可以用其他能够实现隐层特征提取功能的神经网络来实现,本发明对此不作限定。79.其中,特征融合模块520用于从隐层特征提取模块接收所提取的手写汉字隐层特征和模板汉字隐层特征,将手写汉字隐层特征和模板汉字隐层特征进行融合处理,得到该手写汉字隐层特征和模板汉字隐层特征的差异特征。80.在一个实施例中,特征融合模块520可以用循环神经网络(rnn)来实现。应理解,特征融合模块520还可以用其他能够实现融合功能的神经网络来实现,本发明对此不作限定。81.在一个实施例中,将手写汉字隐层特征和模板汉字隐层特征进行融合可以包括:将手写汉字隐层特征和模板汉字隐层特征相减,使得自适应地学习到手写汉字隐层特征与模板汉字隐层特征的不同之处,这样就能保证融合后得到的对比特征消除了与笔顺识别无关的特征,尽可能只保留与笔顺识别有关的差异特征,从而大大减小后续识别模块的识别难度。应理解,还可以通过对手写汉字隐层特征与模板汉字隐层特征进行相加、拼接或引入卷积神经网络(cnn)来自适应地学习到上述差异特征,本发明对此不作限定。82.其中,笔顺识别模块530用于从特征融合模块接收上述差异特征,基于该差异特征识别出笔顺识别结果。笔顺识别模块530的作用是将差异特征转换为用户可识别的识别结果,例如二进制结果,例如0代表待识别的手写汉字的笔顺正确,1代表待识别的手写汉字的笔顺正确。应理解,还可以采用其他形式的识别结果,本发明对此不作限定。83.在一个实施例中,笔顺识别模块530可以用循环神经网络(rnn)来实现。应理解,笔顺识别模块530还可以用其他能够实现识别功能的神经网络来实现,本发明对此不作限定。84.在一个实施例中,方法200还可以包括:对空间变换网络410和笔顺识别网络420一起进行联合训练,以训练为用于识别手写汉字的笔顺。示例性地,该联合训练可以是端到端地联合训练,其有助于空间变换网络学习到正确的空间变换矩阵,使得空间变换网络输出的待识别的手写汉字不仅在空间形态上尽可能接近模板汉字,在隐层特征空间上也更加接近模板汉字,从而更有利于提高手写汉字识别结果的准确性。85.在一个实施例中,空间变换网络410和笔顺识别网络420可以通过以下步骤进行训练:86.获取作为训练样本的手写汉字和相应的模板汉字,由空间变换网络410对该模板汉字进行空间变换,使得经变换的模板汉字与该手写汉字具有相同的笔顺;利用笔顺识别网络中的隐层特征提取模块510分别提取出所述手写汉字的手写汉字隐层特征和所述经变换的模板汉字的模板汉字隐层特征,并得到第一损失函数;利用笔顺识别网络中的特征融合模块520对该手写汉字隐层特征和模板汉字隐层特征进行融合处理,得到手写汉字隐层特征和模板汉字隐层特征的差异特征,并得到第二损失函数;以及基于该第一损失函数和所述第二损失函数调节空间变换网络410和笔顺识别网络420的权重,得到经训练的空间变换网络和笔顺识别网络。87.其中,作为训练样本的手写汉字包括带标记的样本和不带标记的样本,其中带标记的样本称为地面实况(ground truth)数据。由训练样本得到第一损失函数和第二损失函数的过程称为前向传播,基于第一损失函数和第二损失函数调节空间变换网络410和笔顺识别网络420的权重的过程称为反向传播,在经过多次前向传播和反向传播后,最终得到经训练的空间变换网络和经训练的笔顺识别网络。88.上述对空间变换网络410和笔顺识别网络420的训练过程是本领域公知的,在此不再赘述。89.在一个实施例中,方法200还可以包括:如果笔顺识别结果指示待识别的手写汉字的笔顺错误,则获取相应的模板汉字的正确笔顺并呈现给用户。90.在一个实施例中,在笔顺识别结果指示待识别的手写汉字的笔顺错误时,可发出提示信息,以提示用户笔顺错误,并且获取正确笔顺呈现给用户。在一个实施例中,提示信息可以包括声音提示和/或视觉提示。示例性地,声音提示例如警报声、语音提示等,视觉提示例如警示灯、图标等,本发明对此不作限定。91.如上所述,本发明实施例的识别手写汉字的笔顺的方法,能够获取任意手写汉字并进行实时分析,准确识别出书写该手写汉字的笔顺正确与否,并将识别结果反馈给用户,在笔顺书写错误的情况下给予提示并向书写者呈现正确的笔顺,从而不仅可以大幅度提高手写汉字笔顺的识别效率,缓解家长和老师的辅导教学压力,还可以辅助书写者养成按照正确笔顺书写汉字的良好习惯。92.下面参考图6描述根据本发明的一个实施例的用于识别手写汉字的笔顺的系统600的示意性结构框图。如图6所示,用于识别手写汉字的笔顺的系统600可以包括处理器610和存储器620。93.其中,处理器610用于使用一个或更多个神经网络来实现以下处理步骤:对所获取的手写汉字的轨迹点序列进行预处理,得到该手写汉字的关键点序列;基于该手写汉字的关键点序列提取该手写汉字的笔画特征,其中所述笔画特征包括基本特征和语义特征;以及利用神经网络中的笔顺识别模型对所述手写汉字的笔画特征与相应的模板汉字的笔画特征一起进行处理,得到笔顺识别结果。94.示例性地,处理器610可以为本领域公知的任何处理设备,例如,中央处理单元(cpu)、图形处理单元(gpu)、微处理器、微控制器、现场可编程门阵列(fpga)等,本发明对此不作限定。95.其中,存储器620用于存储一个或更多个机器学习模型的模型参数。示例性地,存储器620可以为ram、rom、eeprom、闪存或者其他存储技术、cd‑rom、数字多功能盘(dvd)或其他光盘存储装置、磁带盒、磁带、磁盘存储装置或其他磁存储设备,或者可以用来存储期望的信息且可以由处理器610访问的任何其他介质。96.其中,手写汉字的轨迹点序列可以包含各种信息,例如所有轨迹点的坐标和某轨迹点的书写时间等。97.在一个实施例中,待识别的手写汉字的轨迹点序列可通过现有的通用学习机或者其他可支持手写输入的任意电子设备(例如,如上所述的电子设备100)来获取。举例来说,用户在电子设备上书写汉字时,该电子设备可根据书写者的手写速度、硬件设置的采样率、压力参数等自适应地采集手写汉字的轨迹点序列并上传至云端保存或在本地保存,从而本发明便可从云端或本地获取到输入的手写汉字的轨迹点序列。98.由于不同电子设备采用的硬件不同,从而采集到的手写汉字的轨迹点的采样率、压力等参数会有所不同,同时由于每个人的书写习惯和书写速度不同,这就导致不同人手写同一个字,甚至同一人在不同时刻手写同一个汉字,存在所写汉字的形态不同、轨迹点个数不同等,因此在将输入的手写汉字的轨迹点序列送入到笔顺识别模型之前,可以对输入的手写汉字的轨迹点序列进行预处理,以增加笔顺识别模型的鲁棒性。99.在一个实施例中,其中对手写汉字的轨迹点序列进行预处理,得到该手写汉字的关键点序列可以包括如下步骤:100.步骤a.对手写汉字的轨迹点序列进行处理,得到所述手写汉字的轨迹点均匀分布的笔画线段。101.在一个实施例中,该步骤可以通过先分离笔画线段再对笔画线段重采样的方法来实现,具体地:102.首先,可先根据手写汉字的起笔点和落笔点分离出每个笔画线段的轨迹点序列。103.每个人在书写每个汉字时,每个笔画都对应一个起笔点和一个落笔点,即使在连笔情况下,连笔笔画也会对应一个起笔点和落笔点,由此可根据输入的手写汉字的起笔点和落笔点分离出每个笔画线段的轨迹点序列。104.然后,对笔画线段的轨迹点序列进行重采样,得到该手写汉字的轨迹点均匀分布的笔画线段。105.具体地,针对分离出的每个笔画线段,计算该笔画线段的总长度,根据设定的采样率对该笔画线段的总长度进行轨迹点均匀的重采样,使得采样得到的每个笔画线段内的轨迹点都是均匀分布的。106.步骤b.针对每个轨迹点均匀分布的笔画线段,计算其上所有轨迹点对应的曲率夹角和与前一个轨迹点之间的距离,基于该曲率夹角和/或该距离确定笔画线段的关键点序列。107.具体地,针对每个轨迹点均匀分布的笔画线段,计算该笔画线段上所有轨迹点对应的曲率夹角θ、与前一个轨迹点之间的距离d。108.其中,某轨迹点与前一个轨迹点之间的距离d可以直接根据两个轨迹点的坐标差进行计算即可。具体地,设该轨迹点的坐标为(x2,y2),前一个轨迹点的坐标为(x1,y1),则该轨迹点与前一个轨迹点之间的距离对于曲率夹角θ,其是指当前轨迹点与前一个轨迹点和后一个轨迹点连线间的夹角大小。109.针对每个笔画线段内的每个轨迹点,可以计算出上述两个量,然后可以分别设定距离阈值为t1,曲率夹角阈值为t2,并且当d;t1或者θ;t2时,可以认为该轨迹点不是关键点,应予以滤除。当d;t1,或者θ;t2,或者同时满足d;t1且θ;t2时,则认为该轨迹点是关键点。应理解,上述将轨迹点确定为关键点的判断方法仅仅是示例性的,并不是限制,还可采用本领域公知的其他判断方法,本发明对此不作限定。110.在提取到每个笔画线段的关键点后,组成每个笔画线段的关键点序列。111.步骤c.对各个笔画线段的关键点序列进行组合,得到所述手写汉字的关键点序列。112.具体地,在提取到每个手写汉字的每个笔画对应的关键点序列后,将其组合成该手写汉字的关键点序列,以用于后续的笔画特征提取步骤。113.在一个实施例中,可以利用神经网络提取手写汉字的笔画特征,其中该神经网络可以为经训练的本领域公知的任何神经网络,例如循环神经网络(rnn)、深度神经网络(dnn)、深度信念网络(dbn)等,本发明对此不作限定。114.在一个实施例中,基本特征可以包括笔画线段上各个关键点的坐标和书写时间,语义特征可以包括笔画线段的贝塞尔(bezier)特征、路径签名(path signature)特征、关键点间的距离、曲率、笔画走向特征中的一个或更多个特征,本发明对此不作限定。115.本发明提取的特征除坐标等基本特征外,还包括语义特征,相比于仅将基本特征而无任何语义特征送入笔顺识别模型而言,将这些富含语义特征的笔画特征送入到笔顺识别模型,更加有助于该模型学习到有利于笔顺识别的关键抽象语义特征。116.其中,模板汉字的笔画特征的获取可以采用多种方式,本发明对此不作限定。117.在一个实施例中,可预先建立存储有若干个模板汉字的模板汉字库,在获取了待识别的手写汉字后,对其进行识别并得到汉字识别结果,然后根据该汉字识别结果匹配并获取与该手写汉字相应的模板汉字,并对该模板汉字进行上述类似处理,得到该模板汉字的笔画特征。118.其中,可采用本领域公知的任何方法来建立模板汉字库。在一个实施例中,可以采用信息交换用汉字编码字符集gb2312中收录的6763个汉字来建立模板汉字库,还可以采用其他方法来建立模板汉字库,例如网络爬取、计算机生成等,本发明对此不作限定。119.在一个实施例中,可以直接存储模板汉字的轨迹点序列,在匹配并获取到相应的模板汉字后,对相应的模板汉字的轨迹点序列进行上述处理,得到该模板汉字的笔画特征。120.在一个实施例中,还可以直接存储模板汉字的关键点序列,在匹配并获取到相应的模板汉字后,基于相应的模板汉字的关键点序列提取该模板汉字的笔画特征。在一个实施例中,甚至可以直接存储模板汉字的笔画特征,在匹配并获取到相应的模板汉字后,直接获取该相应的模板汉字的笔画特征。121.在一个实施例中,笔顺识别模型可以包括空间变换网络和笔顺识别网络,其中空间变换网络用于对手写汉字的笔画特征进行空间变换,得到经变换的手写汉字的笔画特征;笔顺识别网络用于对该经变换的手写汉字的笔画特征与模板汉字的笔画特征一起进行处理,得到笔顺识别结果。122.由于不同人的书写习惯不同,会导致待识别的手写汉字与模板汉字在形态上存在较大差别,如果直接将待识别的汉字与模板汉字组成输入对输入笔顺识别网络,由于笔顺识别网络的容量限制,对于形变较大的手写汉字很难识别正确。因此,为了减少待识别的手写汉字的形变对识别结果的影响,在笔顺识别网络前引入空间变换网络,用于对手写汉字的笔画特征进行空间变换,即对手写汉字进行空间形变矫正,使得经变换的手写汉字的形态向相应模板汉字的形态靠近,从而提高手写汉字识别结果的准确性。123.示例性地,空间变换网络可采用任何具有调整空间形变的深度学习网络进行构建,本发明对此不作限定。124.在一个实施例中,笔顺识别网络可以为循环神经网络(rnn)。应理解,笔顺识别网络还可以为其他能够实现笔顺识别的神经网络,本发明对此不作限定。125.在一个实施例中,笔顺识别网络可以包括隐层特征提取模块、特征融合模块和笔顺识别模块。应理解,笔顺识别网络还可以包括其他有助于识别手写汉字的笔顺的模块,本发明对此不作限定。126.其中,隐层特征提取模块用于从空间变换网络接收经变换的手写汉字的笔画特征和模板汉字的笔画特征,并从经变换的手写汉字的笔画特征和模板汉字的笔画特征分别提取出手写汉字的手写汉字隐层特征和模板汉字的模板汉字隐层特征。127.在一个实施例中,隐层特征提取模块可以用循环神经网络(rnn)来实现。应理解,隐层特征提取模块还可以用其他能够实现隐层特征提取功能的神经网络来实现,本发明对此不作限定。128.其中,特征融合模块用于从隐层特征提取模块接收所提取的手写汉字隐层特征和模板汉字隐层特征,将手写汉字隐层特征和模板汉字隐层特征进行融合处理,得到该手写汉字隐层特征和模板汉字隐层特征的差异特征。129.在一个实施例中,特征融合模块可以用循环神经网络(rnn)来实现。应理解,特征融合模块还可以用其他能够实现融合功能的神经网络来实现,本发明对此不作限定。130.在一个实施例中,将手写汉字隐层特征和模板汉字隐层特征进行融合可以包括:将手写汉字隐层特征和模板汉字隐层特征相减,使得自适应地学习到手写汉字隐层特征与模板汉字隐层特征的不同之处,这样就能保证融合后得到的对比特征消除了与笔顺识别无关的特征,尽可能只保留与笔顺识别有关的差异特征,从而大大减小后续识别模块的识别难度。应理解,还可以通过对手写汉字隐层特征与模板汉字隐层特征进行相加、拼接或引入卷积神经网络(cnn)来自适应地学习到上述差异特征,本发明对此不作限定。131.其中,笔顺识别模块用于从特征融合模块接收上述差异特征,基于该差异特征识别出笔顺识别结果。笔顺识别模块的作用是将差异特征转换为用户可识别的识别结果,例如二进制结果,例如0代表待识别的手写汉字的笔顺正确,1代表待识别的手写汉字的笔顺正确。应理解,还可以采用其他形式的识别结果,本发明对此不作限定。132.在一个实施例中,笔顺识别模块可以用循环神经网络(rnn)来实现。应理解,笔顺识别模块还可以用其他能够实现识别功能的神经网络来实现,本发明对此不作限定。133.在一个实施例中,空间变换网络和笔顺识别网络可以一起进行联合训练,以训练为用于识别手写汉字的笔顺。示例性地,该联合训练可以是端到端地联合训练,其有助于空间变换网络学习到正确的空间变换矩阵,使得空间变换网络输出的待识别的手写汉字不仅在空间形态上尽可能接近模板汉字,在隐层特征空间上也更加接近模板汉字,从而更有利于提高手写汉字识别结果的准确性。134.在一个实施例中,空间变换网络和笔顺识别网络可以通过以下步骤进行训练:135.获取作为训练样本的手写汉字和相应的模板汉字,由空间变换网络对该模板汉字进行空间变换,使得经变换的模板汉字与该手写汉字具有相同的笔顺;利用笔顺识别网络中的隐层特征提取模块分别提取出所述手写汉字的手写汉字隐层特征和所述经变换的模板汉字的模板汉字隐层特征,并得到第一损失函数;利用笔顺识别网络中的特征融合模块对该手写汉字隐层特征和模板汉字隐层特征进行融合处理,得到手写汉字隐层特征和模板汉字隐层特征的差异特征,并得到第二损失函数;以及基于该第一损失函数和所述第二损失函数调节空间变换网络和笔顺识别网络的权重,得到经训练的空间变换网络和笔顺识别网络。136.其中,作为训练样本的手写汉字包括带标记的样本和不带标记的样本,其中带标记的样本称为地面实况(ground truth)数据。由训练样本得到第一损失函数和第二损失函数的过程称为前向传播,基于第一损失函数和第二损失函数调节空间变换网络和笔顺识别网络的权重的过程称为反向传播,在经过多次前向传播和反向传播后,最终得到经训练的空间变换网络和经训练的笔顺识别网络。137.上述对空间变换网络和笔顺识别网络的训练过程是本领域公知的,在此不再赘述。138.在一个实施例中,如果笔顺识别结果指示待识别的手写汉字的笔顺错误,则获取相应的模板汉字的正确笔顺并呈现给用户。139.在一个实施例中,在笔顺识别结果指示待识别的手写汉字的笔顺错误时,可发出提示信息,以提示用户笔顺错误,并且获取正确笔顺呈现给用户。在一个实施例中,提示信息可以包括声音提示和/或视觉提示。示例性地,声音提示例如警报声、语音提示等,视觉提示例如警示灯、图标等,本发明对此不作限定。140.如上所述,本发明实施例的识别手写汉字的笔顺的系统,能够获取任意手写汉字并进行实时分析,准确识别出书写该手写汉字的笔顺正确与否,并将识别结果反馈给用户,在笔顺书写错误的情况下给予提示并向书写者呈现正确的笔顺,从而不仅可以大幅度提高手写汉字笔顺的识别效率,缓解家长和老师的辅导教学压力,还可以辅助书写者养成按照正确笔顺书写汉字的良好习惯。141.在又一实施例中,本发明提供了一种计算设备。参考图7,图7示出了根据本发明的一个实施例的计算设备700的示意性结构框图。如图7所示,计算设备700可以包括预处理模块710、特征提取模块720和特征处理模块730。其中,预处理模块710用于获取待识别的手写汉字的轨迹点序列,并对该手写汉字的轨迹点序列进行预处理,得到该手写汉字的关键点序列;特征提取模块720用于基于该手写汉字的关键点序列提取该手写汉字的笔画特征,其中所述笔画特征包括基本特征和语义特征;特征处理模块730用于对该手写汉字的笔画特征与存储的相应的模板汉字的笔画特征一起进行处理,得到笔顺识别结果。根据本发明实施例的计算设备700可以执行前文所述的根据本发明的实施例的用于识别手写汉字的笔顺的方法200。本领域技术人员可以结合前文所述的内容理解根据本发明实施例的计算设备700的具体操作,为了简洁,此处不再赘述。142.在又一实施例中,本发明提供了一种计算设备。参考图8,图8示出了根据本发明的另一实施例的计算设备800的示意性结构框图。如图8所示,计算设备800可以包括存储器810和处理器820,其中存储器810上存储有计算机程序,该计算机程序在被该处理器820运行时,使得处理器820执行如上所述的用于识别手写汉字的笔顺的方法。143.本领域技术人员可以结合前文所述的内容理解根据本技术实施例的计算设备800的具体操作,为了简洁,此处不再赘述具体的细节,仅描述处理器820的一些主要操作如下:144.获取待识别的手写汉字的轨迹点序列,并对所述手写汉字的轨迹点序列进行预处理,得到所述手写汉字的关键点序列;145.基于所述手写汉字的关键点序列提取所述手写汉字的笔画特征,其中所述笔画特征包括基本特征和语义特征;以及146.利用经训练的笔顺识别模型对所述手写汉字的笔画特征与相应的模板汉字的笔画特征一起进行处理,得到笔顺识别结果。147.如上所述,本发明实施例的计算设备,能够获取任意手写汉字并进行实时分析,准确识别出书写该手写汉字的笔顺正确与否,并将识别结果反馈给用户,在笔顺书写错误的情况下给予提示并向书写者呈现正确的笔顺,从而不仅可以大幅度提高手写汉字笔顺的识别效率,缓解家长和老师的辅导教学压力,还可以辅助书写者养成按照正确笔顺书写汉字的良好习惯。148.在又一实施例中,本发明提供了一种计算机可读介质,该计算机可读介质上存储有计算机程序,所述计算机程序在运行时执行如上述实施例所述的方法。任何有形的、非暂时性的计算机可读介质皆可被使用,包括磁存储设备(硬盘、软盘等)、光存储设备(cd‑rom、dvd、蓝光光盘等)、闪存和/或诸如此类。这些计算机程序指令可被加载到通用计算机、专用计算机或其他可编程数据处理设备上以形成机器,使得这些在计算机上或其他可编程数据处理装置上执行的指令可以生成实现指定功能的装置。这些计算机程序指令也可以存储在计算机可读存储器中,该计算机可读存储器可以指示计算机或其他可编程数据处理设备以特定的方式运行,这样存储在计算机可读存储器中的指令就可以形成一件制造品,包括实现指定功能的实现装置。计算机程序指令也可以加载到计算机或其他可编程数据处理设备上,从而在计算机或其他可编程设备上执行一系列操作步骤以产生一个计算机实现的进程,使得在计算机或其他可编程设备上执行的指令可以提供用于实现指定功能的步骤。149.尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。150.在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。151.类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本发明的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。152.本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。153.此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。154.应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。155.以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3