CN107707745A - 用于提取信息的方法和装置 - Google Patents
用于提取信息的方法和装置 Download PDFInfo
- Publication number
- CN107707745A CN107707745A CN201710875327.7A CN201710875327A CN107707745A CN 107707745 A CN107707745 A CN 107707745A CN 201710875327 A CN201710875327 A CN 201710875327A CN 107707745 A CN107707745 A CN 107707745A
- Authority
- CN
- China
- Prior art keywords
- information
- associated person
- person information
- identified
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000000605 extraction Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 7
- 230000008676 import Effects 0.000 claims 1
- 239000000284 extract Substances 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 9
- 230000006854 communication Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 241000233805 Phoenix Species 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/274—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
- H04M1/2745—Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
- H04M1/27467—Methods of retrieving data
- H04M1/2748—Methods of retrieving data by matching character strings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/086—Recognition of spelled words
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请实施例公开了用于提取信息的方法和装置。该方法的一具体实施方式包括:接收并解析用户的语音信息,生成与该语音信息对应的文本信息;从该文本信息中提取待识别联系人信息;获取该用户的通讯录,其中,该通讯录包括至少两个联系人信息;根据该待识别联系人信息,生成至少两种匹配用信息;对于该至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定该待识别联系人信息与该至少两个联系人信息中的每个联系人信息的匹配度;根据所确定的匹配度,从该通讯录中提取与该待识别联系人信息匹配的联系人信息。该实施方式提高了提取出的联系人信息的准确性。
Description
技术领域
本申请涉及计算机技术领域,具体涉及语音识别技术领域,尤其涉及用于提取信息的方法和装置。
背景技术
语音识别技术(Automatic Speech Recognition,ASR),目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术的应用非常广泛,例如语音拨号、语音导航、室内设备控制、语音文档检索等。在一些场景中,需要通过识别用户的语音,从通讯录中提取用户期望的联系人信息。
然而,现有的从通讯录中提取用户期望的联系人信息,存在着准确率较低的问题。
发明内容
本申请实施例的目的在于提出一种改进的用于提取信息的方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种用于提取信息的方法,上述方法包括:接收并解析用户的语音信息,生成与上述语音信息对应的文本信息;从上述文本信息中提取待识别联系人信息;获取上述用户的通讯录,其中,上述通讯录包括至少两个联系人信息;根据上述待识别联系人信息,生成至少两种匹配用信息;对于上述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定上述待识别联系人信息与上述至少两个联系人信息中的每个联系人信息的匹配度;根据所确定的匹配度,从上述通讯录中提取与上述待识别联系人信息匹配的联系人信息。
第二方面,本申请实施例提供了一种用于提取信息的装置,上述装置包括:解析单元,用于接收并解析用户的语音信息,生成与上述语音信息对应的文本信息;第一提取单元,用于从上述文本信息中提取待识别联系人信息;获取单元,用于获取上述用户的通讯录,其中,上述通讯录包括至少两个联系人信息;生成单元,用于根据上述待识别联系人信息,生成至少两种匹配用信息;确定单元,用于对于上述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定上述待识别联系人信息与上述至少两个联系人信息中的每个联系人信息的匹配度;第二提取单元,用于根据所确定的匹配度,从上述通讯录中提取与上述待识别联系人信息匹配的联系人信息。
第三方面,本申请实施例提供了一种设备,上述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面的方法。
本申请实施例提供的用于提取信息的方法和装置,通过首先利用语音识别,从用户的语音中提取待识别联系人信息,然后根据待识别联系人信息生成至少两种匹配用信息,再后根据每种匹配用信息,确定待识别联系人信息与用户的通讯录中每个联系人信息的匹配度,最后利用这多种匹配度提取联系人信息,在这个过程中,可以利用多种匹配用信息进行匹配,从而可以更好地识别出与用户的真实意思相符合的联系人信息,从而提高提取出的联系人信息的准确性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性***架构图;
图2是根据本申请的用于提取信息的方法的一个实施例的流程图;
图3是根据本申请的用于提取信息的方法的一个应用场景的示意图;
图4是根据本申请的用于提取信息的装置的一个实施例的结构示意图;
图5是适于用来实现本申请实施例的设备的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于提取信息的方法或用于提取信息的装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如语音助手类应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有语音接收功能的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上的语音助手类应用提供支持的后台服务器。后台服务器可以对接收到的语音信息等数据进行分析等处理,并将处理结果(例如根据上述语音信息提取出的信息)反馈给终端设备。
需要说明的是,本申请实施例所提供的用于提取信息的方法一般由服务器105执行,相应地,用于提取信息的装置一般设置于服务器105中。需要说明的是,本申请实施例所提供的用于提取信息的方法在一些情况下也可以由终端设备101、102、103执行。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,其示出了根据本申请的用于提取信息的方法的一个实施例的流程200。上述的用于提取信息的方法,包括以下步骤:
步骤201,接收并解析用户的语音信息,生成与语音信息对应的文本信息。
在本实施例中,用于提取信息的方法运行于其上的电子设备(例如图1所示的服务器)可以首先从用户利用其进行语音输入的终端设备接收用户输入的语音信息,然后解析用户的语音信息,生成与上述语音信息对应的文本信息。
在本实施例中,可以利用语音识别技术,解析用户的语音信息,生成与上述语音信息对应的文本信息,在此不再赘述。
作为示例,用户的语音信息可以是与“拨打张三的电话”对应的语音,生成的文本信息为“拨打张三的电话”。
步骤202,从文本信息中提取待识别联系人信息。
在本实施例中,上述电子设备可以从上述文本信息中提取待识别联系人信息。
作为示例,可以利用语义分析技术,从文本信息中提取待识别联系人信息。例如,可以利用主题模型,对上述文本信息中的关键词进行抽取,然后利用某些规则,例如提取某种词性的关键词,或者提取文本信息中位于某个位置的关键词,从上述文本信息中提取出待识别联系人信息。
作为示例,还可以预先设置联系人关键词集合,利用与联系人关键词集合中的联系人关键词匹配的方式,从上述文本信息中查找出待识别联系人信息,再提取出待识别联系人信息。
作为示例,文本信息为“拨打张三的电话”,从这一文本信息中可以提取出待识别联系人信息“张三”。
步骤203,获取用户的通讯录。
在本实施例中,上述电子设备可以获取上述用户的通讯录。
在本实施例的一些可选的实现方式中,上述电子设备可以从终端设备接收用户的通讯录。
在本实施例的一些可选的实现方式中,上述电子设备还可以从本地获取预先存储的上述用户的通讯录。
步骤204,根据待识别联系人信息,生成至少两种匹配用信息。
在本实施例中,上述电子设备可以根据上述待识别联系人信息,生成至少两种匹配用信息。
在本实施例中,匹配用信息可以用于将待识别联系人信息与通讯录中的联系人信息进行匹配,从而提取出与待识别联系人信息匹配的联系人信息。
作为示例,匹配用信息可以是但不限于以下信息:与上述待识别联系人信息对应的拼音、上述待识别联系人信息对应的声波信息、姓名关键词、称谓关键词。
在本实施例中,步骤204所生成的匹配用信息可以是至少两种。
需要说明的是,用户输入的语音,可能由于用户的一些说话习惯或发音习惯,例如倾向于用缩略语、倾向于口语化表述、带有方言口音等,造成用户的语音不能准确传达用户的真实意思。利用多种匹配用信息进行匹配,可以更好地识别出与用户的真实意思相符合的联系人信息,从而提高提取出的联系人信息的准确性。
步骤205,对于至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定待识别联系人信息与指示两个联系人信息中的每个联系人信息的匹配度。
在本实施例中,上述电子设备可以对于上述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定上述待识别联系人信息与上述至少两个联系人信息中的每个联系人信息的匹配度。
作为示例,步骤204生成匹配用信息A和匹配用信息B。通讯录包括联系人信息C和联系人信息D。对于匹配用信息A,根据匹配用信息A,确定待识别联系人与联系人信息C的匹配度为90%,确定待识别联系人与联系人信息D的匹配度为95%。对于匹配用信息B,根据匹配用信息B,确定待识别联系人与联系人信息C的匹配度为80%,确定待识别联系人与联系人信息D的匹配度为70%。
步骤206,根据所确定的匹配度,从通讯录中提取与待识别联系人信息匹配的联系人信息。
在本实施例中,上述电子设备可以根据所确定的匹配度,从上述通讯录中提取与上述待识别联系人信息匹配的联系人信息。
在本实施例的一些可选的实现方式中,步骤206可以通过以下方式实现:可以按照匹配度由大到小的顺序,选取预定数目个匹配度,然后,从上述通讯录中,提取选取出的匹配度对应的联系人信息。
在本实施例的一些可选的实现方式中,步骤206还可以包括:预先为各种匹配用信息设置权重,然后将步骤205所确定的匹配度与对应的匹配用信息的权重的乘积,作为最终的匹配度。
在本实施例的一些可选的实现方式中,提取出联系人信息可以是多个。在步骤206之后,本实施例所示的方法还可以包括:将提取出的联系人信息发送至上述用户所使用的终端设备,然后,上述终端设备向用户展示接收到的联系人信息,供用户选择。
在本实施例的一些可选的实现方式中,提取出的联系人信息可以是一个。步骤202中,还可以从上述文本信息中识别用户的意图信息。在步骤206之后,本实施例所示的方法还可以包括:生成与意图信息对应的控制指令,例如,拨号指令、生成新短信指令等。将提取的联系人信息和生成的控制指令发送至上述用户所使用的终端设备。然后,上述终端设备可以利用接收到的联系人信息,执行上述控制指令。
继续参见图3,图3是根据本实施例的用于提取信息的方法的应用场景的一个示意图。在图3的应用场景中,用户对着终端设备说出一段语音“给老爸打电话”。然后,终端设备将语音信息“给老爸打电话”发送至服务器。再后,服务器接收并解析上述语音信息,生成与上述语音信息对应的文本信息“给老爸打电话”。再后,服务器可以从上述文本信息中提取待识别联系人信息“老爸”。并且,上述服务器可以获取上述用户的通讯录,例如通讯录中包括联系人信息A和联系人信息B。然后,上述服务器可以根据上述待识别联系人信息,生成至少两种匹配用信息,例如,称谓关键词“老爸”和待识别联系人信息对应的拼音“laoba”。再后,可以根据称谓关键词“老爸”,确定上述待识别联系人信息与联系人信息A的匹配度甲、上述待识别联系人信息与联系人信息B的匹配度乙,并且,可以根据拼音“laoba”,确定上述待识别联系人信息与联系人信息A的匹配度丙、上述待识别联系人信息与联系人信息B的匹配度丁。根据所确定的匹配度甲、匹配度乙、匹配度丙和匹配度丁,从上述通讯录中提取与上述待识别联系人信息匹配的联系人信息,例如,匹配度甲、匹配度乙、匹配度丙和匹配度丁中匹配度丙最大,可以从上述通讯录中提取与匹配度丙对应的联系人信息,即联系人信息A。
本申请的上述实施例提供的方法,通过首先利用语音识别,从用户的语音中提取待识别联系人信息,然后根据待识别联系人信息生成至少两种匹配用信息,再后根据每种匹配用信息,确定待识别联系人信息与用户的通讯录中每个联系人信息的匹配度,最后利用这多种匹配度提取联系人信息,在这个过程中,可以利用多种匹配用信息进行匹配,从而可以更好地识别出与用户的真实意思相符合的联系人信息,从而提高提取出的联系人信息的准确性。
在本实施例的一些可选的实现方式中,匹配用信息可以是与上述待识别联系人信息对应的拼音。
在本实施例的一些可选的实现方式中,步骤204可以包括:确定与上述待识别联系人信息对应的第一拼音。对于上述通讯录中的每个联系人信息,确定与该联系人信息对应的第二拼音。
可以理解,第二拼音至少有两个。为了便于说明,以第一和第二对拼音进行了区分,第一拼音本质还是与待识别联系人对应的拼音。
作为示例,待识别联系人信息为“胡广”,待识别联系人信息对应的第一拼音为“huguang”。
在本实施例的一些可选的实现方式中,步骤205可以包括:对于上述通讯录中的每个联系人,将上述第一拼音和该联系人信息对应的第二拼音导入预先建立的拼音相似度模型,生成上述第一拼音和该第二拼音之间的拼音相似度。在这里上述拼音相似度模型用于表征第一拼音、第二拼音这两者与拼音相似度之间的对应关系。将该拼音相似度确定为上述待识别联系人信息与该联系人信息的匹配度。
在本实现方式中,上述拼音相似度模型可以通过以下过程建立:将大量用户的语音数据(包括口误和方言信息)进行真实表意的标注,并作为并将标注后的语音数据作为训练样本训练初始模型,得到拼音相似度模型。在这里,训练模型所用的样本还可以根据地域进行划分,以训练得到对应于各个区域的拼音相似度模型。
在本实现方式中,上述拼音相似度模型可以是对照表。上述对照表列出了拼音以及拼音之间的拼音相似度。第一拼音和第二拼音的相似度可以从对照表中查找得出。
需要说明的是,利用拼音相似度模型,可以适应用户的发音习惯,例如方言口音、发音不清等,从通讯录中提取出与用户的真实意思相符合的联系人信息。
在本实施例的一些可选的实现方式中,步骤205可以包括:对于上述通讯录中的每个联系人信息,根据上述第一拼音和与该联系人信息对应的第二拼音,确定上述待识别联系人信息与该联系人信息之间的编辑距离。将该编辑距离确定为与上述待识别联系人信息与该联系人信息的匹配度。
在本实现方式中,编辑距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。作为示例,要获得一个姓名与另外一个姓名的编辑距离,需要将两个姓名中包含的字按照顺序比较。例如,要获得“李磊”与“王丽”的编辑距离,需要获得“李”和“王”的编辑距离,再获得“磊”和“丽”的编辑距离,再将两个编辑距离求和。判断两个字的编辑距离是通过对两个字的声母、韵母和声调进行比较。若两个字的声母、韵母或声调中的一个不同,则两个字的发音的编辑距离为1;若两个不同,则编辑距离为2;若三个不同,则编辑距离为3。
在本实施例的一些可选的实现方式中,匹配用信息可以是上述待识别联系人信息对应的声波信息。
在本实施例的一些可选的实现方式中,步骤204可以包括:获取与上述待识别联系人信息对应的第一声波信息。
在本实现方式中,可以从预先存储的声波信息中,获取上述第一声波信息。
在本实现方式中,还可以从上述语音信息中,切分出上述第一声波信息。
在本实施例的一些可选的实现方式中,步骤204还可以包括:对于上述通讯录中的每个联系人信息,获取与该联系人信息对应的第二声波信息。
在本实施例的一些可选的实现方式中,步骤205可以包括:对于上述通讯路中的每个联系人信息,将上述第一声波信息与该联系人信息对应的第二声波信息之间的相似度,确定为上述待识别联系人信息与该联系人信息的匹配度。如何计算声波信息之间的相似度本身,是本领域技术人员可以实现的,在此不再赘述。
在本实施例的一些可选的实现方式中,匹配用信息可以是姓名关键词。
在本实施例的一些可选的实现方式中,步骤204可以包括:从待识别联系人信息中,提取姓名关键词。
作为示例,可以从待识别联系人信息“凤仪美女”中,提出姓名关键词“凤仪”。
在本实现方式中,可以预先设置姓名关键词集合,从待识别联系人信息中,提取出在姓名关键词集合中的词,作为姓名关键词。
在本实施例的一些可选的实现方式中,步骤205可以包括:对于上述通讯录中的每个联系人信息,将上述姓名关键词与该联系人信息的重合度,确定为待识别联系人信息与该联系人信息匹配度。
作为示例,通讯录中的联系人信息为“张凤仪”和“张三”,然后可以计算“凤仪”与“张凤仪”的重合度,还有“凤仪”与“张三”的重合度。作为示例,重合度可以是联系人信息与姓名关键词中相同的字的数量,与联系人信息与姓名关键词中字的和的比值。由此,“凤仪”与“张凤仪”的重合度为40%,“凤仪”与“张三”的重合度为0。
需要说明的是,利用姓名关键词这一匹配用信息,可以适应用户的一些说话习惯,例如倾向于使用缩略语等,从通讯录中提取出与用户的真实意思相符合的联系人信息。
在本实施例的一些可选的实现方式中,匹配用信息是称谓关键词。
在本实施例的一些可选的实现方式中,步骤204可以包括:从待识别联系人信息中,提取称谓关键词关键词。
在本实现方式中,可以预先设置称谓词集合,将上述待识别联系人信息中的各个词与称谓词集合中的称谓词进行匹配,从而提取出称谓关键词。
在本实施例的一些可选的实现方式中,步骤205可以包括:获取预先生成的称谓词关联关系信息。在这里,称谓词关联关系信息用于指示表达相同含义的称谓词之间的关联关系。
作为示例,称谓词“爸爸”和称谓词“老爸”表达相同含义。
在本实施例的一些可选的实现方式中,步骤205还可以包括:根据上述称谓词关联关系信息,获取与上述称谓关键词表达相同含义的目标称谓词。
作为示例,称谓关键词为“爸”,获取的目标称谓词可以包括“爸爸”“老爸”“爹”等。
在本实施例的一些可选的实现方式中,步骤205还可以包括:对于上述通讯录中的每个联系人信息,从上述称谓关键词与该联系人信息的匹配度和上述目标称谓词与该联系人信息的匹配度中,选取最大的匹配度,作为待识别联系人信息与该联系人信息的匹配度。
作为示例,通讯录中包括“美丽的妈妈”和“可爱的老爸”,可以计算“爸”“爸爸”“老爸”“爹”分别与“美丽的妈妈”的匹配度,并且计算“爸”“爸爸”“老爸”“爹”分别与“可爱的老爸”的匹配度。明显地,在这一系列匹配度中,“老爸”与“可爱的老爸”的匹配度最高。
在本实施例的一些可选的实现方式中,可以将为称谓关键词设置最高的优先级,一旦根据称谓关键词查找到匹配度大于预设匹配度阈值的联系人信息,则不采用其它匹配用信息查找出的联系人信息,而是直接提取出根据称谓关键词查找到联系人信息。
需要说明的是,利用称谓关键词这一匹配用信息,可以适应用户的一些表达习惯,例如倾向于口语化表述等,从而识别出用户的真实意思相符合的联系人信息。
需要说明的是,通过上述一系列的匹配用信息的,可以提高对提取出的信息的准确性,并且,降低用户的表达的精准性的要求,例如,用户只需表达出所存储的联系人的部分姓名,即可匹配出期望的联系的。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种用于提取信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例上述的用于提取信息的装置400包括:解析单元401、第一提取单元402、获取单元403、生成单元404、确定单元405和第二提取单元406。其中,解析单元,用于接收并解析用户的语音信息,生成与上述语音信息对应的文本信息;第一提取单元,用于从上述文本信息中提取待识别联系人信息;获取单元,用于获取上述用户的通讯录,其中,上述通讯录包括至少两个联系人信息;生成单元,用于根据上述待识别联系人信息,生成至少两种匹配用信息;确定单元,用于对于上述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定上述待识别联系人信息与上述至少两个联系人信息中的每个联系人信息的匹配度;第二提取单元,用于根据所确定的匹配度,从上述通讯录中提取与上述待识别联系人信息匹配的联系人信息。
在本实施例的一些可选的实现方式中,匹配用信息是与上述待识别联系人信息对应的拼音;以及上述第一生成单元,还用于:确定上述待识别联系人信息对应的第一拼音;对于上述通讯录中的每个联系人信息,确定与该联系人信息对应的第二拼音。
在本实施例的一些可选的实现方式中,上述确定单元,还用于:对于上述通讯录中的每个联系人信息,将上述第一拼音和该联系人信息对应的第二拼音导入预先建立的拼音相似度模型,生成上述第一拼音和该第二拼音之间的拼音相似度,其中,上述拼音相似度模型用于表征第一拼音、第二拼音这两者与拼音相似度之间的对应关系;将该拼音相似度确定为上述待识别联系人信息与该联系人信息的匹配度。
在本实施例的一些可选的实现方式中,上述确定单元,还用于:对于上述通讯录中的每个联系人信息,根据上述第一拼音和与该联系人信息对应的第二拼音,确定上述待识别联系人信息与该联系人信息之间的编辑距离;将该编辑距离确定为上述待识别联系人信息与该联系人信息的匹配度。
在本实施例的一些可选的实现方式中,匹配用信息是上述待识别联系人信息对应的声波信息;以及上述第一生成单元,还用于:获取与上述待识别联系人信息对应的第一声波信息;对于上述通讯录中每个联系人信息,获取与该联系人信息对应的第二声波信息。
在本实施例的一些可选的实现方式中,上述确定单元,还用于:对于上述通讯录中的每个联系人信息,将上述第一声波信息与该联系人信息对应的第二声波信息之间的相似度,确定为上述待识别联系人信息与该联系人信息的匹配度。
在本实施例的一些可选的实现方式中,匹配用信息是姓名关键词;以及上述第一生成单元,还用于:从上述待识别联系人信息中,提取姓名关键词;以及上述确定单元,还用于:对于上述通讯录中的每个联系人信息,将上述姓名关键词与该联系人信息的重合度,确定为上述待识别联系人信息与该联系人信息的匹配度。
在本实施例的一些可选的实现方式中,匹配用信息是称谓关键词;以及上述第一生成单元,还用于:从上述待识别联系人信息中,提取称谓关键词。
在本实施例的一些可选的实现方式中,上述确定单元,还用于:获取预先生成的称谓词关联关系信息,其中,上述称谓词关联关系信息用于指示表达相同含义的称谓词之间的关联关系;根据上述称谓词关联关系信息,获取与上述称谓关键词表达相同含义的目标称谓词;对于上述通讯录中的每个联系人信息,从上述称谓关键词与该联系人信息的匹配度和上述目标称谓词与该联系人信息的匹配度中,选取最大的匹配度,作为上述待识别联系人信息与该联系人信息的匹配度。
在本实施例中,解析单元401、第一提取单元402、获取单元403、生成单元404、确定单元405和第二提取单元406的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202、步骤203、步骤204、步骤205以及步骤206的相关说明,在此不再赘述。
需要说明的是,本实施例提供的用于提取信息的装置中各单元的实现细节和技术效果可以参考本申请中其它实施例的说明,在此不再赘述。
下面参考图5,其示出了适于用来实现本申请实施例的电子设备的计算机***500的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机***500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有***500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括解析单元、第一提取单元、获取单元、生成单元、确定单元和第二提取单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,解析单元还可以被描述为“接收并解析用户的语音信息,生成与上述语音信息对应的文本信息的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:接收并解析用户的语音信息,生成与上述语音信息对应的文本信息;从上述文本信息中提取待识别联系人信息;获取上述用户的通讯录,其中,上述通讯录包括至少两个联系人信息;根据上述待识别联系人信息,生成至少两种匹配用信息;对于上述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定上述待识别联系人信息与上述至少两个联系人信息中的每个联系人信息的匹配度;根据所确定的匹配度,从上述通讯录中提取与上述待识别联系人信息匹配的联系人信息。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (12)
1.一种用于提取信息的方法,其特征在于,所述方法包括:
接收并解析用户的语音信息,生成与所述语音信息对应的文本信息;
从所述文本信息中提取待识别联系人信息;
获取所述用户的通讯录,其中,所述通讯录包括至少两个联系人信息;
根据所述待识别联系人信息,生成至少两种匹配用信息;
对于所述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定所述待识别联系人信息与所述至少两个联系人信息中的每个联系人信息的匹配度;
根据所确定的匹配度,从所述通讯录中提取与所述待识别联系人信息匹配的联系人信息。
2.根据权利要求1所述的方法,其特征在于,匹配用信息是与所述待识别联系人信息对应的拼音;以及
所述根据所述待识别联系人信息,生成至少两种匹配用信息,包括:
确定所述待识别联系人信息对应的第一拼音;
对于所述通讯录中的每个联系人信息,确定与该联系人信息对应的第二拼音。
3.根据权利要求2所述的方法,其特征在于,所述对于所述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定所述待识别联系人信息与所述至少两个联系人信息中的每个联系人信息的匹配度,包括:
对于所述通讯录中的每个联系人信息,将所述第一拼音和该联系人信息对应的第二拼音导入预先建立的拼音相似度模型,生成所述第一拼音和该第二拼音之间的拼音相似度,其中,所述拼音相似度模型用于表征第一拼音、第二拼音这两者与拼音相似度之间的对应关系;将该拼音相似度确定为所述待识别联系人信息与该联系人信息的匹配度。
4.根据权利要求2所述的方法,其特征在于,所述对于所述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定所述待识别联系人信息与所述至少两个联系人信息中的每个联系人信息的匹配度,包括:
对于所述通讯录中的每个联系人信息,根据所述第一拼音和与该联系人信息对应的第二拼音,确定所述待识别联系人信息与该联系人信息之间的编辑距离;将该编辑距离确定为所述待识别联系人信息与该联系人信息的匹配度。
5.根据权利要求1所述的方法,其特征在于,匹配用信息是所述待识别联系人信息对应的声波信息;以及
所述根据所述待识别联系人信息,生成至少两种匹配用信息,包括:
获取与所述待识别联系人信息对应的第一声波信息;
对于所述通讯录中每个联系人信息,获取与该联系人信息对应的第二声波信息。
6.根据权利要求5所述的方法,其特征在于,所述对于所述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定所述待识别联系人信息与所述至少两个联系人信息中的每个联系人信息的匹配度,包括:
对于所述通讯录中的每个联系人信息,将所述第一声波信息与该联系人信息对应的第二声波信息之间的相似度,确定为所述待识别联系人信息与该联系人信息的匹配度。
7.根据权利要求1所述的方法,其特征在于,匹配用信息是姓名关键词;以及
所述根据所述待识别联系人信息,生成至少两种匹配用信息,包括:
从所述待识别联系人信息中,提取姓名关键词;以及
所述对于所述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定所述待识别联系人信息与所述至少两个联系人信息中的每个联系人信息的匹配度,包括:
对于所述通讯录中的每个联系人信息,将所述姓名关键词与该联系人信息的重合度,确定为所述待识别联系人信息与该联系人信息的匹配度。
8.根据权利要求1所述的方法,其特征在于,匹配用信息是称谓关键词;以及
所述根据所述待识别联系人信息,生成至少两种匹配用信息,包括:
从所述待识别联系人信息中,提取称谓关键词。
9.根据权利要求8所述的方法,其特征在于,所述对于所述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定所述待识别联系人信息与所述至少两个联系人信息中的每个联系人信息的匹配度,包括:
获取预先生成的称谓词关联关系信息,其中,所述称谓词关联关系信息用于指示表达相同含义的称谓词之间的关联关系;
根据所述称谓词关联关系信息,获取与所述称谓关键词表达相同含义的目标称谓词;
对于所述通讯录中的每个联系人信息,从所述称谓关键词与该联系人信息的匹配度和所述目标称谓词与该联系人信息的匹配度中,选取最大的匹配度,作为所述待识别联系人信息与该联系人信息的匹配度。
10.一种用于提取信息的装置,其特征在于,所述装置包括:
解析单元,用于接收并解析用户的语音信息,生成与所述语音信息对应的文本信息;
第一提取单元,用于从所述文本信息中提取待识别联系人信息;
获取单元,用于获取所述用户的通讯录,其中,所述通讯录包括至少两个联系人信息;
生成单元,用于根据所述待识别联系人信息,生成至少两种匹配用信息;
确定单元,用于对于所述至少两种匹配用信息中的每种匹配用信息,根据该种匹配用信息,确定所述待识别联系人信息与所述至少两个联系人信息中的每个联系人信息的匹配度;
第二提取单元,用于根据所确定的匹配度,从所述通讯录中提取与所述待识别联系人信息匹配的联系人信息。
11.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710875327.7A CN107707745A (zh) | 2017-09-25 | 2017-09-25 | 用于提取信息的方法和装置 |
US16/105,560 US11217236B2 (en) | 2017-09-25 | 2018-08-20 | Method and apparatus for extracting information |
JP2018154667A JP6633153B2 (ja) | 2017-09-25 | 2018-08-21 | 情報を抽出する方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710875327.7A CN107707745A (zh) | 2017-09-25 | 2017-09-25 | 用于提取信息的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107707745A true CN107707745A (zh) | 2018-02-16 |
Family
ID=61174810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710875327.7A Pending CN107707745A (zh) | 2017-09-25 | 2017-09-25 | 用于提取信息的方法和装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11217236B2 (zh) |
JP (1) | JP6633153B2 (zh) |
CN (1) | CN107707745A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109671436A (zh) * | 2018-12-07 | 2019-04-23 | 陈包容 | 智能语音识别通讯录联系人人名的方法 |
CN109936499A (zh) * | 2019-02-28 | 2019-06-25 | 上海乐愚智能科技有限公司 | 一种信息传输方法、***、服务器及计算器存储介质 |
CN109963022A (zh) * | 2018-12-27 | 2019-07-02 | 广州云趣信息科技有限公司 | 一种基于soundex算法的语音电话本找人方法及流程 |
CN111128142A (zh) * | 2018-10-31 | 2020-05-08 | 深圳市冠旭电子股份有限公司 | 一种智能音箱拨打电话的方法、装置及智能音箱 |
CN111312226A (zh) * | 2020-02-17 | 2020-06-19 | 出门问问信息科技有限公司 | 一种语音识别方法、设备及计算机可读存储介质 |
CN111669451A (zh) * | 2019-03-07 | 2020-09-15 | 顺丰科技有限公司 | 私人邮箱判断方法及判断装置 |
CN112613310A (zh) * | 2021-01-04 | 2021-04-06 | 成都颜创启新信息技术有限公司 | 一种人名匹配方法、装置、电子设备及存储介质 |
CN113992780A (zh) * | 2021-09-13 | 2022-01-28 | 珠海格力电器股份有限公司 | 语音拨号方法、装置、存储介质和设备 |
CN116010562A (zh) * | 2023-03-28 | 2023-04-25 | 之江实验室 | 一种基于多数据源的姓名匹配方法、装置、设备及介质 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113763961B (zh) * | 2020-06-02 | 2024-04-09 | 阿里巴巴集团控股有限公司 | 一种文本处理方法及装置 |
CN112084773A (zh) * | 2020-08-21 | 2020-12-15 | 国网湖北省电力有限公司电力科学研究院 | 一种基于词库双向最大匹配法的电网停电地址匹配方法 |
CN112651236B (zh) * | 2020-12-28 | 2021-10-01 | 中电金信软件有限公司 | 提取文本信息的方法、装置、计算机设备和存储介质 |
CN113326279A (zh) * | 2021-05-27 | 2021-08-31 | 阿波罗智联(北京)科技有限公司 | 语音搜索方法和装置、电子设备、计算机可读介质 |
CN113593569A (zh) * | 2021-07-27 | 2021-11-02 | 德邦物流股份有限公司 | 一种电子面单生成方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308654A (zh) * | 2007-05-14 | 2008-11-19 | 华为技术有限公司 | 一种语音分析识别方法、***与装置 |
US20080317219A1 (en) * | 2007-06-21 | 2008-12-25 | Siemens Communications, Inc. | Method and apparatus for context based voice dialing |
CN103377652A (zh) * | 2012-04-25 | 2013-10-30 | 上海智臻网络科技有限公司 | 一种用于进行语音识别的方法、装置和设备 |
CN104010059A (zh) * | 2014-06-09 | 2014-08-27 | 深圳市中兴移动通信有限公司 | 一种移动终端及其实现拨打电话的方法和装置 |
CN104469002A (zh) * | 2014-12-02 | 2015-03-25 | 科大讯飞股份有限公司 | 确定手机联系人的方法和装置 |
CN104464735A (zh) * | 2014-12-12 | 2015-03-25 | 宇龙计算机通信科技(深圳)有限公司 | 语音信息识别方法、语音信息识别装置与终端 |
CN105187656A (zh) * | 2015-09-23 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 通讯录联系人匹配方法和装置 |
CN106603792A (zh) * | 2017-01-20 | 2017-04-26 | 上海傲硕信息科技有限公司 | 一种号码查找设备 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1159661C (zh) * | 1999-04-08 | 2004-07-28 | 肯特里奇数字实验公司 | 用于中文的标记和命名实体识别的*** |
US20080312928A1 (en) * | 2007-06-12 | 2008-12-18 | Robert Patrick Goebel | Natural language speech recognition calculator |
US10242104B2 (en) * | 2008-03-31 | 2019-03-26 | Peekanalytics, Inc. | Distributed personal information aggregator |
US8880555B2 (en) * | 2010-12-17 | 2014-11-04 | Facebook, Inc. | Ranking of address book contacts based on social proximity |
US9406077B1 (en) * | 2011-10-19 | 2016-08-02 | Google Inc. | System and method for ad keyword scoring |
US9721563B2 (en) * | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
CN103049567A (zh) * | 2012-12-31 | 2013-04-17 | 威盛电子股份有限公司 | 检索方法、检索***以及自然语言理解*** |
JP5583230B2 (ja) | 2013-01-15 | 2014-09-03 | 株式会社Nttドコモ | 情報検索装置及び情報検索方法 |
IL227135B (en) * | 2013-06-23 | 2018-05-31 | Drori Gideon | Method and system for preparing a database of consolidated items |
US9529898B2 (en) * | 2014-08-26 | 2016-12-27 | Google Inc. | Clustering classes in language modeling |
KR101858544B1 (ko) * | 2014-12-09 | 2018-05-17 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 정보 처리 방법 및 장치 |
CN106683677B (zh) * | 2015-11-06 | 2021-11-12 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
MX2018006403A (es) * | 2015-11-24 | 2018-09-24 | Trans Union Llc | Sistema y metodo para la verificacion de direccion automatizada. |
CN107016994B (zh) * | 2016-01-27 | 2020-05-08 | 阿里巴巴集团控股有限公司 | 语音识别的方法及装置 |
US10275472B2 (en) * | 2016-03-01 | 2019-04-30 | Baidu Usa Llc | Method for categorizing images to be associated with content items based on keywords of search queries |
CN107153469B (zh) * | 2016-03-03 | 2021-03-30 | 北京奇简云科技有限公司 | 为输入数据搜索匹配候选项的方法、数据库创建方法、装置及计算机程序产品 |
CN109923512A (zh) * | 2016-09-09 | 2019-06-21 | 上海海知智能科技有限公司 | 人机交互的***及方法 |
CN106776890B (zh) * | 2016-11-29 | 2021-06-29 | 北京小米移动软件有限公司 | 视频播放进度的调整方法及装置 |
US10303681B2 (en) * | 2017-05-19 | 2019-05-28 | Microsoft Technology Licensing, Llc | Search query and job title proximity computation via word embedding |
US20190065612A1 (en) * | 2017-08-24 | 2019-02-28 | Microsoft Technology Licensing, Llc | Accuracy of job retrieval using a universal concept graph |
US10902192B2 (en) * | 2017-11-20 | 2021-01-26 | Adobe Inc. | Dynamic digital document visual aids in a digital medium environment |
US10838962B2 (en) * | 2017-11-30 | 2020-11-17 | Salesforce.Com, Inc. | Metadata driven dataset management |
US20190180753A1 (en) * | 2017-12-12 | 2019-06-13 | Ca, Inc. | Analysis of collaborative dialog data structures from speech processing computer system |
-
2017
- 2017-09-25 CN CN201710875327.7A patent/CN107707745A/zh active Pending
-
2018
- 2018-08-20 US US16/105,560 patent/US11217236B2/en active Active
- 2018-08-21 JP JP2018154667A patent/JP6633153B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308654A (zh) * | 2007-05-14 | 2008-11-19 | 华为技术有限公司 | 一种语音分析识别方法、***与装置 |
US20080317219A1 (en) * | 2007-06-21 | 2008-12-25 | Siemens Communications, Inc. | Method and apparatus for context based voice dialing |
CN103377652A (zh) * | 2012-04-25 | 2013-10-30 | 上海智臻网络科技有限公司 | 一种用于进行语音识别的方法、装置和设备 |
CN104010059A (zh) * | 2014-06-09 | 2014-08-27 | 深圳市中兴移动通信有限公司 | 一种移动终端及其实现拨打电话的方法和装置 |
CN104469002A (zh) * | 2014-12-02 | 2015-03-25 | 科大讯飞股份有限公司 | 确定手机联系人的方法和装置 |
CN104464735A (zh) * | 2014-12-12 | 2015-03-25 | 宇龙计算机通信科技(深圳)有限公司 | 语音信息识别方法、语音信息识别装置与终端 |
CN105187656A (zh) * | 2015-09-23 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 通讯录联系人匹配方法和装置 |
CN106603792A (zh) * | 2017-01-20 | 2017-04-26 | 上海傲硕信息科技有限公司 | 一种号码查找设备 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111128142A (zh) * | 2018-10-31 | 2020-05-08 | 深圳市冠旭电子股份有限公司 | 一种智能音箱拨打电话的方法、装置及智能音箱 |
CN109671436A (zh) * | 2018-12-07 | 2019-04-23 | 陈包容 | 智能语音识别通讯录联系人人名的方法 |
CN109963022A (zh) * | 2018-12-27 | 2019-07-02 | 广州云趣信息科技有限公司 | 一种基于soundex算法的语音电话本找人方法及流程 |
CN109936499A (zh) * | 2019-02-28 | 2019-06-25 | 上海乐愚智能科技有限公司 | 一种信息传输方法、***、服务器及计算器存储介质 |
CN111669451A (zh) * | 2019-03-07 | 2020-09-15 | 顺丰科技有限公司 | 私人邮箱判断方法及判断装置 |
CN111669451B (zh) * | 2019-03-07 | 2022-10-21 | 顺丰科技有限公司 | 私人邮箱判断方法及判断装置 |
CN111312226A (zh) * | 2020-02-17 | 2020-06-19 | 出门问问信息科技有限公司 | 一种语音识别方法、设备及计算机可读存储介质 |
CN112613310A (zh) * | 2021-01-04 | 2021-04-06 | 成都颜创启新信息技术有限公司 | 一种人名匹配方法、装置、电子设备及存储介质 |
CN113992780A (zh) * | 2021-09-13 | 2022-01-28 | 珠海格力电器股份有限公司 | 语音拨号方法、装置、存储介质和设备 |
CN113992780B (zh) * | 2021-09-13 | 2022-11-18 | 珠海格力电器股份有限公司 | 语音拨号方法、装置、存储介质和设备 |
CN116010562A (zh) * | 2023-03-28 | 2023-04-25 | 之江实验室 | 一种基于多数据源的姓名匹配方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
US11217236B2 (en) | 2022-01-04 |
JP6633153B2 (ja) | 2020-01-22 |
JP2019061662A (ja) | 2019-04-18 |
US20190096402A1 (en) | 2019-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107707745A (zh) | 用于提取信息的方法和装置 | |
CN110827805B (zh) | 语音识别模型训练方法、语音识别方法和装置 | |
CN107657017A (zh) | 用于提供语音服务的方法和装置 | |
CN108305626A (zh) | 应用程序的语音控制方法和装置 | |
CN107623614A (zh) | 用于推送信息的方法和装置 | |
CN112309366B (zh) | 语音合成方法、装置、存储介质及电子设备 | |
CN108132995A (zh) | 用于处理音频信息的方法和装置 | |
CN107393541A (zh) | 信息验证方法和装置 | |
CN111951780B (zh) | 语音合成的多任务模型训练方法及相关设备 | |
CN108877782A (zh) | 语音识别方法和装置 | |
CN111369971A (zh) | 语音合成方法、装置、存储介质和电子设备 | |
CN109190124B (zh) | 用于分词的方法和装置 | |
CN108986790A (zh) | 语音识别联系人的方法和装置 | |
CN107705782B (zh) | 用于确定音素发音时长的方法和装置 | |
CN112908292B (zh) | 文本的语音合成方法、装置、电子设备及存储介质 | |
CN112927674B (zh) | 语音风格的迁移方法、装置、可读介质和电子设备 | |
CN112309365A (zh) | 语音合成模型的训练方法、装置、存储介质以及电子设备 | |
CN108900612A (zh) | 用于推送信息的方法和装置 | |
CN107481715A (zh) | 用于生成信息的方法和装置 | |
CN112765971A (zh) | 文本语音的转换方法、装置、电子设备及存储介质 | |
CN110070861A (zh) | 信息处理装置和信息处理方法 | |
CN114255740A (zh) | 语音识别方法、装置、计算机设备和存储介质 | |
CN109087627A (zh) | 用于生成信息的方法和装置 | |
CN107680584A (zh) | 用于切分音频的方法和装置 | |
CN111859970B (zh) | 用于处理信息的方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180216 |
|
RJ01 | Rejection of invention patent application after publication |