CN109933215B - 汉字拼音转换方法、装置、终端及计算机可读存储介质 - Google Patents
汉字拼音转换方法、装置、终端及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109933215B CN109933215B CN201910103354.1A CN201910103354A CN109933215B CN 109933215 B CN109933215 B CN 109933215B CN 201910103354 A CN201910103354 A CN 201910103354A CN 109933215 B CN109933215 B CN 109933215B
- Authority
- CN
- China
- Prior art keywords
- converted
- vocabulary
- pinyin
- library
- polyphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种汉字拼音转换方法、装置、终端及计算机可读存储介质。本发明实施例的汉字拼音转换方法包括步骤:获取待转换词汇;将待转换词汇与预设的多音字库比对,根据比对结果判断待转换词汇中是否包含多音字;若待转换词汇中包含多音字,则获取待转换词汇的词性种类,并调取与词性种类对应的专用词典;根据专用词典中的与待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将待转换词汇中的非多音字转换成拼音。如此,根据专用词典中的与待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,这样可以保证汉字转化为拼音的正确率。
Description
技术领域
本发明涉及信息数据处理技术领域,尤其涉及一种汉字拼音转换方法、装置、终端及计算机可读存储介质。
背景技术
在金融行业的金融***中,接受用户的输入信息之后,常常需要将输入信息中包含的金融专业词汇、用户名字等汉字转化成拼音写入程序代码中,但是现有技术中,汉字转化拼音的正确率较低。
发明内容
本发明的主要目的在于提供一种汉字拼音转换方法、装置、终端及计算机可读存储介质及计算机可读存储介质,旨在解决汉字转化拼音的正确率较低的技术问题。
为实现上述目的,本发明提供一种汉字拼音转换方法,包括步骤:获取待转换词汇;
将所述待转换词汇与预设的多音字库比对,根据比对结果判断所述待转换词汇中是否包含多音字;
若所述待转换词汇中包含多音字,则获取所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典;
根据所述专用词典中的与所述待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将所述待转换词汇中的非多音字转换成拼音。
优选地,所述将所述待转换词汇与预设的多音字库比对,根据比对结果判断所述待转换词汇中是否包含多音字的步骤包括:
分别将所述待转换词汇中的每个汉字与预设的多音字库比对,判断待转换词汇中是否有汉字与多音字库中的多音字相同;
若判断待转换词汇中有汉字与多音字库中的多音字相同,则判定所述待转换词汇中包含多音字。
优选地,所述获取所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典的步骤包括:
根据所述待转换词汇所在的输入框的信息类型确定与所述待转换词汇对应的输入信息类型;
根据所述输入信息类型确定所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典。
优选地,所述专用词典包括与人名名词对应的姓氏词典,所述若所述待转换词汇中包含多音字,则获取所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典之前,所述汉字拼音转换方法还包括步骤:
获取中华姓氏库,所述中华姓氏库中包含多个姓氏及与每个姓氏对应的拼音;
将中华姓氏库中的姓氏与多音字库比对,提取出包含有多音字的姓氏,并获取所述姓氏中的多音字的拼音;
将包含有多音字的姓氏及所述姓氏中的多音字的拼音存入所述姓氏词典。
优选地,所述待转换词汇的词性种类包括人名名词和非人名名词,所述根据所述专用词典中的与所述待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将所述待转换词汇中的非多音字转换成拼音的步骤包括:
判断所述待转换词汇的词性种类是否为人名名词;
若所述待转换词汇的词性种类为人名名词,则将所述待转换词汇中的多音字及所述多音字之前的汉字作为待确定字段与所述姓氏词典中的各姓氏比对,判断所述姓氏词典中是否有姓氏的连续字段与所述待确定字段相同;
若所述姓氏词典中有姓氏的连续字段与所述待确定字段相同,则根据与所述待确定字段相同的姓氏的拼音将所述待转换词汇中的多音字转换成拼音,并根据汉字拼音库将所述待转换词汇中的非多音字转换成拼音。
优选地,所述专用词典还包括与人名名词对应的用户姓名库,所述根据所述专用词典中的与所述待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将所述待转换词汇中的非多音字转换成拼音的步骤还包括:
若所述姓氏词典中没有姓氏的连续字段与所述待确定字段相同,则将所述待转换词汇与用户姓名库中各用户姓名比对,判断所述用户姓名库中是否有用户姓名与所述待转换词汇相同;
若所述用户姓名库中有用户姓名与所述待转换词汇相同,则根据与所述待转换词汇相同的用户姓名的拼音将所述待转换词汇转换成拼音。
优选地,若所述用户姓名库中有用户姓名与所述待转换词汇相同,则所述若所述用户姓名库中有用户姓名与所述待转换词汇相同,则根据与所述待转换词汇相同的用户姓名的拼音将所述待转换词汇转换成拼音包括:
将所述与所述待转换词汇相同的用户姓名的拼音将发送通过语音播放单元播放以向用户确认拼音是否正确;
接收用户反馈的判定指令,所述判定指令为正确指令或错误;
当所述判定指令为正确时,根据与所述待转换词汇相同的用户姓名的拼音将所述待转换词汇转换成拼音;
当所述判定指令为错误时,将与所述待转换词汇相同的用户姓名中的多音字更正为另一拼音之后,将更正后的拼音通过语音播放单元播放以向用户确认拼音是否正确,直到判定指令为正确,并根据判定指令为正确时语音播放单元播放的拼音将所述待转换词汇转换为拼音。
本发明还提供一种汉字拼音转换装置,所述汉字拼音转换装置包括:
第一获取模块,用于获取待转换词汇;
第一比对模块,用于将所述待转换词汇与预设的多音字库比对,根据比对结果判断所述待转换词汇中是否包含多音字;
第二获取模块,用于在所述待转换词汇中包含多音字时,获取所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典;
转换模块,用于根据所述专用词典中的与所述待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将所述待转换词汇中的非多音字转换成拼音。
本发明还提供一种终端,所述终端包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的汉字拼音转换程序,其中所述汉字拼音转换程序被所述处理器执行时,实现如上任一项所述的汉字拼音转换方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有汉字拼音转换程序,其中所述汉字拼音转换程序被处理器执行时,实现如上任一项所述的汉字拼音转换方法的步骤。
本发明技术方案中,获取待转换词汇;将待转换词汇与预设的多音字库比对,根据比对结果判断待转换词汇中是否包含多音字;若待转换词汇中包含多音字,则获取待转换词汇的词性种类,并调取与词性种类对应的专用词典;根据专用词典中的与待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将待转换词汇中的非多音字转换成拼音。如此,根据专用词典中的与待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,这样可以保证汉字转化为拼音的正确率。
附图说明
图1为本发明实施例方案中涉及的终端的硬件结构示意图;
图2为本发明汉字拼音转换方法第一实施例的流程示意图;
图3为本发明汉字拼音转换方法第二实施例的流程示意图;
图4为本发明汉字拼音转换方法第三实施例的流程示意图;
图5为本发明汉字拼音转换方法第四实施例的流程示意图;
图6为本发明汉字拼音转换方法第五实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的汉字拼音转换方法主要应用于终端,该终端可以是PC、便携计算机、移动终端等具有显示和处理功能的终端。
参照图1,图1为本发明实施例方案中涉及的终端结构示意图。本发明实施例中,终端可以包括处理器1001(例如CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作***、网络通信模块以及汉字拼音转换程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的汉字拼音转换程序,并执行以下汉字拼音转换方法的操作。
基于上述终端的硬件结构,提出本发明汉字拼音转换方法的各个实施例。
本发明提供一种汉字拼音转换方法。
请参阅图2,在本发明一实施例中,汉字拼音转换方法包括以下步骤:
S101:获取待转换词汇;
本发明实施例的汉字拼音转换方法可以由本发明实施例的终端执行。用户在相应的输入框输入需要转换为拼音的词汇之后,终端获取用户输入的待转换词汇。
S102:将待转换词汇与预设的多音字库比对,根据比对结果判断待转换词汇中是否包含多音字;
可根据汉语词典预先建立多音字库,多音字库中包含汉语中所有的多音字及读音。可分别将待转换词汇中的每个汉字与预设的多音字库比对,判断待转换词汇中是否有汉字与多音字库中的多音字相同;若判断待转换词汇中有汉字与多音字库中的多音字相同,则判定待转换词汇中包含多音字。这样可以准确地识别出待转换词汇的多音字。
S103:若待转换词汇中包含多音字,则获取待转换词汇的词性种类,并调取与词性种类对应的专用词典;
用户在输入框输入信息时,输入框的信息类型是确定的,对应的词性种类也是确定的。例如,输入框的输入信息类型为姓名,则对应的词性种类为人名名词,可先根据待转换词汇所在的输入框的信息类型确定与待转换词汇对应的输入信息类型;然后根据输入信息类型确定待转换词汇的词性种类,并调取与词性种类对应的专用词典。例如姓名输入框则输入的信息类型为姓名,对应的词性种类为人名名词;地址输入框输入的信息类型为地址,对应的词性种类为地点名词;工作单位的输入框输入的信息类型为工作单位名称,那么对应的词性种类为机构名词。专用词典包括与人名名词对应的姓氏词典,和与非人名名词对应的非姓氏词典。除人名名词之外的各个词性种类均属于非人名名词,例如,地点名词属于非人名名词,专用词典包括与地点名词对应的地点词典;机构名词也属于非人名名词,专用词典包括与机构名词对应的机构词典。当然,在其他实施例中,词性种类不限于上述种类,可根据输入框输入的信息类型确定其他词性种类。一个词性种类可以对应一个专用词典,也可以对应多个专用词典。
S104:根据专用词典中的与待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将待转换词汇中的非多音字转换成拼音。
专用词典中包括的多个专用名词,专业词典中的专用名词为包含有多音字的专用名词,专业词典中还包括每个专用名词中的多音字在该专用名词中的拼音。汉字拼音库中包含了所有汉字及对应的读音。可将待转换词汇与专用词典比对,找到专用词典中与待转换词汇一致的专用名词,然后根据该专用名词中的多音字的拼音将待转换中的多音字转换为拼音,并根据汉字拼音库将待转换词汇中的非多音字转换成拼音。
本发明实施例的汉字拼音转换方法,获取待转换词汇;将待转换词汇与预设的多音字库比对,根据比对结果判断待转换词汇中是否包含多音字;若待转换词汇中包含多音字,则获取待转换词汇的词性种类,并调取与词性种类对应的专用词典;根据专用词典中的与待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将待转换词汇中的非多音字转换成拼音。如此,根据专用词典中的与待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,这样可以保证汉字转化为拼音的正确率。
请参阅图3,基于上述实施例,专用词典包括与人名名词对应的姓氏词典,步骤S103之前,汉字拼音转换方法还包括步骤:
S105:获取中华姓氏库,中华姓氏库中包含多个姓氏及与每个姓氏对应的拼音;
中华姓氏库中穷举了中国的所有姓氏,并包括每个姓氏对应的拼音。
S106:将中华姓氏库中的姓氏与多音字库比对,提取出包含有多音字的姓氏,并获取姓氏中的多音字的拼音;
S107:将包含有多音字的姓氏及姓氏中的多音字的拼音存入姓氏词典。
将汉字转化为拼音时,非多音字可根据汉字拼音库直接转换为拼音,那么建立姓氏词典时,只需要考虑多音字,从中华姓氏库中提取出包含有多音字的姓氏,并获取姓氏中的多音字的拼音,将包含有多音字的姓氏及姓氏中的多音字的拼音存入姓氏词典,以便于将包含有多音词的姓氏转换为拼音。
需要说明的是,步骤S105-步骤S107可在步骤S102和步骤S103之间执行,也可以在步骤S101和步骤S102之间执行,还可以在步骤S101之间执行。
请参阅图2-图4,基于上述实施例,所述待转换词汇的词性种类包括人名名词和非人名名词,步骤S104包括:
S1041:判断待转换词汇的词性种类是否为人名名词;
可根据输入框的信息类型是确定待转换词汇的词性种类,并判断词性种类是否为人名名词。
S1042:若待转换词汇的词性种类为人名名词,则将待转换词汇中的多音字及多音字之前的汉字作为待确定字段与姓氏词典中的各姓氏比对,判断姓氏词典中是否有姓氏的连续字段与待确定字段相同;
姓氏包括单姓和复姓,姓氏有可能是一个字也有可能是多个字,中国名字为姓氏在前,名字在后,那么可先假设该多音字为姓氏的一部分,将该多音字及多音字之前的汉字作为待确定字段与姓氏词典中的各姓氏比对,通过判断姓氏词典中是否有姓氏的连续字段与待确定字段相同,确定该待确定字段是否为姓氏或者为姓氏的一部分。
S1043:若姓氏词典中有姓氏的连续字段与待确定字段相同,则根据与待确定字段相同的姓氏的拼音将待转换词汇中的多音字转换成拼音,并根据汉字拼音库将待转换词汇中的非多音字转换成拼音。
姓氏词典中有姓氏的连续字段与待确定字段相同,则可确定该待确定字段为姓氏或者为姓氏的一部分,可根据与待确定字段相同的姓氏的拼音将待转换词汇中的多音字转换成拼音,并根据汉字拼音库将待转换词汇中的非多音字转换成拼音。
请参阅图5,基于上述实施例,专用词典还包括与人名名词对应的用户姓名库,步骤S104还包括:
S1044:若姓氏词典中没有姓氏的连续字段与待确定字段相同,则将待转换词汇与用户姓名库中各用户姓名比对,判断用户姓名库中是否有用户姓名与待转换词汇相同;
如果姓氏词典中没有姓氏的连续字段与待确定字段相同,则可认为该多音字不是作为姓氏而是作为名字。将待转换词汇与用户姓名库中各用户姓名比对,通过判断用户姓名库中是否有用户姓名与待转换词汇相同来判断用户姓名库中是否有该待转换词汇。
S1045:若用户姓名库中有用户姓名与待转换词汇相同,则根据与待转换词汇相同的用户姓名的拼音将待转换词汇转换成拼音。
用户姓名库中包括多个用户的姓名及对应的拼音,如果用户姓名库中有用户姓名与待转换词汇相同,则根据与待转换词汇相同的用户姓名的拼音将待转换词汇转换成拼音,这样可保证同一个用户前后两次转换为拼音的结果一致。
若用户姓名库中没有用户姓名与待转换词汇相同,则选择该多音词各读音中,使用频率最高的读音将该多音字转换为拼音,根据汉字拼音库将待转换词汇中的非多音字转换为拼音。
进一步地,若用户姓名库中有用户姓名与待转换词汇相同,可先将与待转换词汇相同的用户姓名的拼音将发送通过语音播放单元播放以向用户确认拼音是否正确;然后接收用户反馈的判定指令,判定指令为正确指令或错误;当判定指令为正确时,根据与待转换词汇相同的用户姓名的拼音将待转换词汇转换成拼音;当判定指令为错误时,将与待转换词汇相同的用户姓名中的多音字更正为另一拼音之后,将更正后的拼音通过语音播放单元播放以向用户确认拼音是否正确,直到判定指令为正确,并根据判定指令为正确时语音播放单元播放的拼音将待转换词汇转换为拼音。这样,当多音字为人名名词中的名字时,可由用户确认读音,更进一步地保证拼音转换的准确度。
请参阅图6,基于上述实施例,专用词典还包括与非人名名词对应的非姓氏词典,步骤S103之前,汉字拼音转换方法还包括步骤:
S108:从大数据平台获取与非人名名词对应的专用词库,专用词库中包含与非人名名词的词性种类对应的多个专用名词;
除人名名词之外的各个词性种类均属于非人名名词,也即是说,非人名名词包括多个词性种类词汇,每个词汇种类对应至少一个专用词库。大数据平台中存储有与非人名名词对应的专用词库。可利用大数据平台收集并存储各类常用专用名词,并形成对应的专用词库。例如,大数据平台可从多个***或网络平台收集并存储多个机构的机构名词,形成机构词典。
S109:将专用词库与多音字库比对,从专用词库中提取出包含有多音字的专用名词,并获取专用名词中的多音字的拼音;
S110:将包含有多音字的专用名词及专用名词中的多音字的拼音存入与专用名词的词性种类对应的非姓氏词典。
将汉字转化为拼音时,非多音字可根据汉字拼音库直接转换为拼音,那么建立非姓氏词典时,只需要考虑多音字,从专用词库中提取出包含有多音字的专用名词,并获取专用名词中的多音字的拼音,将包含有多音字的专用名词及专用名词中的多音字的拼音存入非姓氏词典,以便于将包含有多音词的非人名名词转换为拼音。
此外,本发明还提供一种汉字拼音转换装置。上述任一实施例的汉字拼音转换方法可以由本实施例的汉字拼音转换装置实现,汉字拼音转换装置包括:
第一获取模块,用于获取待转换词汇;
第一比对模块,用于将待转换词汇与预设的多音字库比对,根据比对结果判断待转换词汇中是否包含多音字;
第二获取模块,用于在待转换词汇中包含多音字时,获取待转换词汇的词性种类,并调取与词性种类对应的专用词典;
转换模块,用于根据专用词典中的与待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将待转换词汇中的非多音字转换成拼音。
进一步地,第一比对模块包括:
比对单元,用于分别将待转换词汇中的每个汉字与预设的多音字库比对,判断待转换词汇中是否有汉字与多音字库中的多音字相同;
判定单元,用于判断待转换词汇中有汉字与多音字库中的多音字相同时,判定待转换词汇中包含多音字。
进一步地,第二获取模块包括:
获取单元,用于根据所述待转换词汇所在的输入框的信息类型确定与待转换词汇对应的输入信息类型;
调取单元,用于根据输入信息类型确定待转换词汇的词性种类,并调取与词性种类对应的专用词典。
进一步地,专用词典包括与人名名词对应的姓氏词典,汉字拼音转换装置还包括:
第三获取模块,用于获取中华姓氏库,中华姓氏库中包含多个姓氏及与每个姓氏对应的拼音;
第二比对模块,用于将中华姓氏库中的姓氏与多音字库比对,提取出包含有多音字的姓氏,并获取姓氏中的多音字的拼音;
第一执行模块,用于将包含有多音字的姓氏及姓氏中的多音字的拼音存入姓氏词典。
进一步地,所述待转换词汇的词性种类包括人名名词和非人名名词,转换模块包括:
第一判断单元,用于判断待转换词汇的词性种类是否为人名名词;
第一比对单元,用于在待转换词汇的词性种类为人名名词时,将待转换词汇中的多音字及多音字之前的汉字作为待确定字段与姓氏词典中的各姓氏比对,判断姓氏词典中是否有姓氏的连续字段与待确定字段相同;
第一转换单元,用于在姓氏词典中有姓氏的连续字段与待确定字段相同时,根据与待确定字段相同的姓氏的拼音将待转换词汇中的多音字转换成拼音,并根据汉字拼音库将待转换词汇中的非多音字转换成拼音。
进一步地,专用词典还包括与人名名词对应的用户姓名库,转换模块包括:
第二比对单元,用于在姓氏词典中没有姓氏的连续字段与待确定字段相同时,将待转换词汇与用户姓名库中各用户姓名比对,判断用户姓名库中是否有用户姓名与待转换词汇相同;
第二转换单元,用于在用户姓名库中有用户姓名与待转换词汇相同时,根据与待转换词汇相同的用户姓名的拼音将待转换词汇转换成拼音。
进一步地,第二转换单元包括:
语音控制子单元,用于在所述用户姓名库中有用户姓名与所述待转换词汇相同时,将与待转换词汇相同的用户姓名的拼音将发送通过语音播放单元播放以向用户确认拼音是否正确;
指令接收子单元,用于接收用户反馈的判定指令,判定指令为正确指令或错误;
转换子单元,用于当判定指令为正确时,根据与待转换词汇相同的用户姓名的拼音将待转换词汇转换成拼音;和
当判定指令为错误时,将与待转换词汇相同的用户姓名中的多音字更正为另一拼音之后,将更正后的拼音通过语音播放单元播放以向用户确认拼音是否正确,直到判定指令为正确,并根据判定指令为正确时语音播放单元播放的拼音将待转换词汇转换为拼音。
其中,上述汉字拼音转换装置中各个模块的功能实现与上述汉字拼音转换方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有汉字拼音转换程序,计算机可读存储介质上存储有汉字拼音转换程序,其中汉字拼音转换程序被处理器执行时,实现如上述任一实施例的汉字拼音转换方法的步骤。
其中,汉字拼音转换程序被执行时所实现的方法可参照本发明汉字拼音转换方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (9)
1.一种汉字拼音转换方法,其特征在于,所述汉字拼音转换方法包括步骤:
获取待转换词汇,所述待转换词汇为根据信息类型区分的输入框中输入的信息;
将所述待转换词汇与预设的多音字库比对,根据比对结果判断所述待转换词汇中是否包含多音字;
若所述待转换词汇中包含多音字,则获取所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典;
根据所述专用词典中的与所述待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将所述待转换词汇中的非多音字转换成拼音;
其中,所述获取所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典的步骤包括:
根据所述待转换词汇所在的输入框的信息类型确定与所述待转换词汇对应的输入信息类型;
根据所述输入信息类型确定所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典,所述词性种类包括人名名词和非人名名词,非人名名词至少包括地点名词和机构名词,所述词性种类对应一个或多个专用词典。
2.根据权利要求1所述的汉字拼音转换方法,其特征在于,所述将所述待转换词汇与预设的多音字库比对,根据比对结果判断所述待转换词汇中是否包含多音字的步骤包括:
分别将所述待转换词汇中的每个汉字与预设的多音字库比对,判断待转换词汇中是否有汉字与多音字库中的多音字相同;
若判断待转换词汇中有汉字与多音字库中的多音字相同,则判定所述待转换词汇中包含多音字。
3.根据权利要求1所述的汉字拼音转换方法,其特征在于,所述专用词典包括与人名名词对应的姓氏词典,所述若所述待转换词汇中包含多音字,则获取所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典之前,所述汉字拼音转换方法还包括步骤:
获取中华姓氏库,所述中华姓氏库中包含多个姓氏及与每个姓氏对应的拼音;
将中华姓氏库中的姓氏与多音字库比对,提取出包含有多音字的姓氏,并获取所述姓氏中的多音字的拼音;
将包含有多音字的姓氏及所述姓氏中的多音字的拼音存入所述姓氏词典。
4.根据权利要求3所述的汉字拼音转换方法,其特征在于,所述根据所述专用词典中的与所述待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将所述待转换词汇中的非多音字转换成拼音的步骤包括:
判断所述待转换词汇的词性种类是否为人名名词;
若所述待转换词汇的词性种类为人名名词,则将所述待转换词汇中的多音字及所述多音字之前的汉字作为待确定字段与所述姓氏词典中的各姓氏比对,判断所述姓氏词典中是否有姓氏的连续字段与所述待确定字段相同;
若所述姓氏词典中有姓氏的连续字段与所述待确定字段相同,则根据与所述待确定字段相同的姓氏的拼音将所述待转换词汇中的多音字转换成拼音,并根据汉字拼音库将所述待转换词汇中的非多音字转换成拼音。
5.根据权利要求4所述的汉字拼音转换方法,其特征在于,所述专用词典还包括与人名名词对应的用户姓名库,所述根据所述专用词典中的与所述待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将所述待转换词汇中的非多音字转换成拼音的步骤还包括:
若所述姓氏词典中没有姓氏的连续字段与所述待确定字段相同,则将所述待转换词汇与用户姓名库中各用户姓名比对,判断所述用户姓名库中是否有用户姓名与所述待转换词汇相同;
若所述用户姓名库中有用户姓名与所述待转换词汇相同,则根据与所述待转换词汇相同的用户姓名的拼音将所述待转换词汇转换成拼音。
6.根据权利要求5所述的汉字拼音转换方法,其特征在于,所述若所述用户姓名库中有用户姓名与所述待转换词汇相同,则根据与所述待转换词汇相同的用户姓名的拼音将所述待转换词汇转换成拼音包括:
若所述用户姓名库中有用户姓名与所述待转换词汇相同,则将所述与所述待转换词汇相同的用户姓名的拼音通过语音播放单元播放以向用户确认拼音是否正确;
接收用户反馈的判定指令,所述判定指令为正确指令或错误;
当所述判定指令为正确时,根据与所述待转换词汇相同的用户姓名的拼音将所述待转换词汇转换成拼音;
当所述判定指令为错误时,将与所述待转换词汇相同的用户姓名中的多音字更正为另一拼音之后,将更正后的拼音通过语音播放单元播放以向用户确认拼音是否正确,直到判定指令为正确,并根据判定指令为正确时语音播放单元播放的拼音将所述待转换词汇转换为拼音。
7.一种汉字拼音转换装置,其特征在于,所述汉字拼音转换装置包括:
第一获取模块,用于获取待转换词汇,所述待转换词汇为根据信息类型区分的输入框中输入的信息;
第一比对模块,用于将所述待转换词汇与预设的多音字库比对,根据比对结果判断所述待转换词汇中是否包含多音字;
第二获取模块,用于在所述待转换词汇中包含多音字时,获取所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典;
转换模块,用于根据所述专用词典中的与所述待转换词汇中的多音字对应的拼音将待转换中的多音字转换成拼音,并根据预设的汉字拼音库将所述待转换词汇中的非多音字转换成拼音;
其中,第二获取模块包括:
获取单元,用于根据所述待转换词汇所在的输入框的信息类型确定与待转换词汇对应的输入信息类型;
调取单元,用于根据所述输入信息类型确定所述待转换词汇的词性种类,并调取与所述词性种类对应的专用词典,所述词性种类包括人名名词和非人名名词,非人名名词至少包括地点名词和机构名词,所述词性种类对应一个或多个专用词典。
8.一种计算机终端,其特征在于,所述计算机终端包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的汉字拼音转换程序,其中所述汉字拼音转换程序被所述处理器执行时,实现权利要求1至6中任一项所述的汉字拼音转换方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有汉字拼音转换程序,其中所述汉字拼音转换程序被处理器执行时,实现权利要求1至6中任一项所述的汉字拼音转换方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910103354.1A CN109933215B (zh) | 2019-01-31 | 2019-01-31 | 汉字拼音转换方法、装置、终端及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910103354.1A CN109933215B (zh) | 2019-01-31 | 2019-01-31 | 汉字拼音转换方法、装置、终端及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109933215A CN109933215A (zh) | 2019-06-25 |
CN109933215B true CN109933215B (zh) | 2023-08-15 |
Family
ID=66985488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910103354.1A Active CN109933215B (zh) | 2019-01-31 | 2019-01-31 | 汉字拼音转换方法、装置、终端及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109933215B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112291281B (zh) * | 2019-07-09 | 2023-11-03 | 钉钉控股(开曼)有限公司 | 语音播报及语音播报内容的设定方法和装置 |
CN110569501A (zh) * | 2019-07-30 | 2019-12-13 | 平安科技(深圳)有限公司 | 用户账号生成方法、装置、介质和计算机设备 |
CN110728120A (zh) * | 2019-09-06 | 2020-01-24 | 上海陆家嘴国际金融资产交易市场股份有限公司 | 证件识别过程中自动填入拼音的方法、装置和存储介质 |
CN112632967A (zh) * | 2020-12-30 | 2021-04-09 | 广东德诚科教有限公司 | 一种面向设定策略的中文拼音自动生成方法及装置 |
CN114999450A (zh) * | 2022-05-24 | 2022-09-02 | 网易有道信息技术(北京)有限公司 | 同形异义字的识别方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105336322A (zh) * | 2015-09-30 | 2016-02-17 | 百度在线网络技术(北京)有限公司 | 多音字模型训练方法、语音合成方法及装置 |
CN107193789A (zh) * | 2017-05-22 | 2017-09-22 | 上海携程金融信息服务有限公司 | 含有多音字的中文转换汉语拼音方法及*** |
-
2019
- 2019-01-31 CN CN201910103354.1A patent/CN109933215B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105336322A (zh) * | 2015-09-30 | 2016-02-17 | 百度在线网络技术(北京)有限公司 | 多音字模型训练方法、语音合成方法及装置 |
CN107193789A (zh) * | 2017-05-22 | 2017-09-22 | 上海携程金融信息服务有限公司 | 含有多音字的中文转换汉语拼音方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN109933215A (zh) | 2019-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109933215B (zh) | 汉字拼音转换方法、装置、终端及计算机可读存储介质 | |
CN110164435B (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
TWI296793B (en) | Speech recognition assisted autocompletion of composite characters | |
EP2653964A2 (en) | Methods and systems for speech-enabling a human-to-machine interface | |
US6711542B2 (en) | Method of identifying a language and of controlling a speech synthesis unit and a communication device | |
US6366882B1 (en) | Apparatus for converting speech to text | |
US8862478B2 (en) | Speech translation system, first terminal apparatus, speech recognition server, translation server, and speech synthesis server | |
KR101109265B1 (ko) | 텍스트 입력 방법 | |
EP2184686A1 (en) | Method and system for generating derivative words | |
US20080147380A1 (en) | Method, Apparatus and Computer Program Product for Providing Flexible Text Based Language Identification | |
US20080077406A1 (en) | Mobile Dictation Correction User Interface | |
WO2014201834A1 (en) | Method and device of matching speech input to text | |
CN109326284B (zh) | 语音搜索的方法、装置和存储介质 | |
KR101030831B1 (ko) | 더블―바이트 폰트의 음성 표현을 디스플레이하는 방법 및시스템 | |
CN110827803A (zh) | 方言发音词典的构建方法、装置、设备及可读存储介质 | |
US20060033644A1 (en) | System and method for filtering far east languages | |
CN1359514A (zh) | 多模式数据输入设备 | |
US20090276219A1 (en) | Voice input system and voice input method | |
CN114281979A (zh) | 生成文本摘要的文本处理方法、装置、设备以及存储介质 | |
CN112272847B (zh) | 错误转换词典制作***及语音识别*** | |
CN110827815B (zh) | 一种语音识别方法、终端、***以及计算机存储介质 | |
JP2002366543A (ja) | 文書作成システム | |
CN111354339A (zh) | 词汇音素表构建方法、装置、设备及存储介质 | |
CN110069762A (zh) | 一种文档多音字排序方法、装置、介质和电子设备 | |
JP4622861B2 (ja) | 音声入力システム、音声入力方法、および、音声入力用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |