JPS63163496A - Parallel retrieval/collation type recognition system - Google Patents

Parallel retrieval/collation type recognition system

Info

Publication number
JPS63163496A
JPS63163496A JP61308659A JP30865986A JPS63163496A JP S63163496 A JPS63163496 A JP S63163496A JP 61308659 A JP61308659 A JP 61308659A JP 30865986 A JP30865986 A JP 30865986A JP S63163496 A JPS63163496 A JP S63163496A
Authority
JP
Japan
Prior art keywords
recognition
attribute
search
database
temporary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61308659A
Other languages
Japanese (ja)
Inventor
長野 ゆかり
松澤 和光
重郎 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP61308659A priority Critical patent/JPS63163496A/en
Publication of JPS63163496A publication Critical patent/JPS63163496A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (発明の属する技術分野) 本発明は、例えば、音声等の自然言語を入力として、演
奏会等の催事情報をデータベースから自律的に検索する
自律型認識システムに関するものである。
[Detailed Description of the Invention] (Technical field to which the invention pertains) The present invention relates to an autonomous recognition system that autonomously searches a database for information on events such as concerts using natural language such as voice as input. be.

(従来の技術) 音声認識を用いたデータベース検索は、将来のデータベ
ース検索のあるべき姿として強い期待が持たれているが
、音声認識技術については未開拓の部分があり、現実に
は、発声者の特性の影響、背景ノイズの影響等から、認
識確率は余り高くとれない。この様な現状を打破する手
法として、入力項目間の相関関係を利用して認識確度を
向上させる手法がある。なお、本明細書では、この認識
確度を向上させる手法を「検索照合」と呼ぶことにし以
下簡単に述べる。
(Conventional technology) Database searches using voice recognition have strong expectations as the future of database searches, but there are still unexplored areas of voice recognition technology, and in reality, The recognition probability cannot be very high due to the influence of the characteristics of the image, the influence of background noise, etc. As a method to overcome this current situation, there is a method of improving recognition accuracy by using correlations between input items. Note that in this specification, this method of improving recognition accuracy will be referred to as "search and verification" and will be briefly described below.

第3図は従来の検索照合の手法を説明する図であり、(
a)は話者の発声単語、(b)は検索対象データベース
、(C)は従来型検索照合を示す。
Figure 3 is a diagram explaining the conventional search and matching method.
(a) shows the words uttered by the speaker, (b) shows the database to be searched, and (C) shows conventional search matching.

また、従来型検索照合(C)のうち、(C1)は演奏者
の入力、(C2)は演奏会場の入力、(C3)は日付の
入力、を示している。
Further, among the conventional search and verification (C), (C1) shows the input of the performer, (C2) shows the input of the performance venue, and (C3) shows the input of the date.

第3図(b)に示す検索対象データベースにより、発声
者は、この中にある公演、例えば「20日の森昌×の波
谷区民会館の公演」のキップを注文しようとしているも
のとする。認識システムは、発声者から音声データを収
集して、どの公演かを特定する必要がある。この場合、
発声者は、認識システムのガイダンスに従い、例えば、 〔認識システム〕[演奏者は誰でしょうか?」〔発声者
〕   「森昌×」 〔認識システム〕r会場はどこでしょうか?」〔発声者
〕   「波谷区民会館」 〔認識システム〕「公演日は何日を御希望ですか?」〔
発声者〕「20日」 の様にシステムに検索条件を入力することになる。
Based on the search target database shown in FIG. 3(b), it is assumed that the speaker is trying to order a ticket for a performance included in the search database, for example, "Morimasa x performance at Hatani Civic Hall on the 20th." The recognition system needs to collect audio data from the speaker to identify which performance. in this case,
The speaker follows the guidance of the recognition system and asks, for example, [Recognition system] [Who is the performer? ” [Speaker] “Morimasa ×” [Recognition system] r Where is the venue? ” [Speaker] “Hatani Civic Hall” [Recognition system] “What day would you like the performance to be?” [
Speaker] You will enter search conditions into the system, such as "20th."

この場合、音声認識処理部は、各入力項目に認識処理を
行うが、必ずしも、入力単語と同一の単語を認識結果と
して出力できるとは限らない。
In this case, the speech recognition processing section performs recognition processing on each input item, but it is not necessarily possible to output the same word as the input word as a recognition result.

従って、現状の技術では、複数の単語候補を出力する手
段が用いられている。この様子を第3図を用いて説明す
る。
Therefore, in the current technology, means for outputting a plurality of word candidates is used. This situation will be explained using FIG. 3.

第3図(a)は、発声された単語であり、森昌×の波谷
区民会館の20日の公演を予約しようとしている。
Figure 3 (a) shows the words that were uttered, and I am trying to book Morimasa x's performance at Hatani Civic Hall on the 20th.

第3図(b)には検索対象のデータベースの例を記載し
た。ここでは、リレーショナル型データベース形式とし
、属性(縦方向の列)の個数を3、タプル数7の例を示
した。
FIG. 3(b) shows an example of a database to be searched. Here, an example is shown in which the relational database format is used, the number of attributes (vertical columns) is 3, and the number of tuples is 7.

なお、本明細書では、データベース管理システムとして
、リレーショナル型データベース形式を用いるが、デー
タベースの管理方式は、本発明の趣旨には直接の関係は
なく、ここに示したタプルの様に、催事情報が一組のデ
ータとして抽出できるものであれば何でも良い。
In this specification, a relational database format is used as the database management system, but the database management method has no direct relation to the purpose of the present invention, and event information is stored in the tuple shown here. Anything can be used as long as it can be extracted as a set of data.

第3図(c)に従来の検索照合の手順を示した。FIG. 3(c) shows a conventional search and matching procedure.

まず認識処理部は、第一の属性である演奏者の入力(c
l)に対して、認識結果を出力する。ここで、認識単語
辞書としては、現実には全てのアーティストを含んだ1
000程度の単語数があるものとするが、ここでは説明
の簡単化のため4単語とし、認識結果として2候補を出
力したものとする。
First, the recognition processing unit first processes the performer's input (c), which is the first attribute.
The recognition result is output for l). Here, in reality, the recognition word dictionary is one that includes all artists.
It is assumed that there are approximately 000 words, but here, for the sake of simplicity, it is assumed that there are 4 words, and that 2 candidates are output as the recognition result.

「森光×」「森昌×jの2つの単語候補について、正し
い単語は2番口「森昌×」であるが、この段階では分か
らない。そこで、次に第3図(c)に示す様に、この複
数の候補(ここでは、「森光×」「森昌×」)の各々に
ついて、データベースを検索して、当該属性のデータが
一致するものを選びだす。
Regarding the two word candidates "Morimitsu ×" and "Morimasa × j," the correct word is the second word "Morimasa ×," but this is not known at this stage. Then, as shown in Figure 3(c), the database is searched for each of these multiple candidates (here, "Morimitsu ×" and "Morimasa ×"), and the data of the relevant attribute matches. Choose what to do.

第3図(c)では、「森光×」「森昌×」の各々の場合
について、2個と3個のタプルを含むリレーションが生
成されている。ここでは、この中間に作られたデータベ
ースをテンポラリデータベースと呼ぶ。
In FIG. 3(c), relations containing 2 and 3 tuples are generated for each of "Mori Mitsuru ×" and "Mori Masa ×". Here, this intermediate database is called a temporary database.

次に、このテンポラリなデータベースから、次の属性で
ある演奏会場名を聞き出すためのテンポラリな認識辞書
を作成する。この様に、認識辞書を検索結果から作成す
る点が検索照合の大きな特徴である。
Next, from this temporary database, a temporary recognition dictionary is created to retrieve the next attribute, the performance venue name. In this way, a major feature of search matching is that a recognition dictionary is created from the search results.

即ち、中間的に得られているテンポラリなりシーション
から、会場名として「厚生年金会館j「渋川市民会館」
 「波谷区民会館」の3単語の辞書を作成できる。そこ
で、入力に対してこの3単語辞書で認識処理を行い、第
3図(c)に示す様に、「渋川市民会館」 「波谷区民
会館」が出力されるものとする。
In other words, from the temporary seat obtained intermediately, the venue name is ``Welfare Pension Hall J``Shibukawa Civic Hall''.
You can create a dictionary of the three words "Hatani Civic Hall." Therefore, it is assumed that recognition processing is performed on the input using this three-word dictionary, and "Shibukawa Civic Hall" and "Hatani Civic Hall" are output as shown in FIG. 3(c).

この認識結果から、先程作成されていたテンポラリなデ
ータベースより、各々、演奏会場が「渋川市民会館」 
「波谷市民会館」のもののみを取り出して新たなデータ
ベースを形成する。この例では、たまたま各々のりシー
ションのタプル個数は1であるが、その個数はデータベ
ースのデータに依存して決まる。あとは、日付けについ
て、「14日」と「20日」の2単語辞書を用いた認識
処理を行い、正解の「20日」を得ることになる。
Based on this recognition result, the performance venue is "Shibukawa Civic Hall" from the temporary database created earlier.
A new database will be created by extracting only the information from ``Hatani Civic Hall''. In this example, the number of tuples in each glue session happens to be 1, but the number is determined depending on the data in the database. After that, recognition processing is performed on the date using a two-word dictionary of "14th" and "20th" to obtain the correct answer "20th".

この様に、その都度検索結果から新しい認識辞書を作成
しつつ認識処理を進めていく一連の操作を検索照合と呼
ぶ・ 第3図の従来の検索照合では、例えば、第一の属性であ
る演奏者の辞書が1000単語あり、候補単語中に正し
い単語が出力されてくる確率が例えば85%と比較的低
いものとしても、第二、第三の属性、この場合、演奏会
場公演日については、辞書の単語数が著しく少ないため
正しい単語が候補単語中に含まれる確率は例えば98%
となり、入力音声の認識率を著しく向」ニさせることが
出来る。
In this way, a series of operations that proceed with recognition processing while creating a new recognition dictionary from the search results each time are called search matching.In the conventional search matching shown in Figure 3, for example, the first attribute Even if a person's dictionary has 1000 words and the probability of outputting a correct word among the candidate words is relatively low, say 85%, the second and third attributes, in this case, the concert venue performance date, Since the number of words in the dictionary is extremely small, the probability that the correct word will be included in the candidate words is, for example, 98%.
Therefore, the recognition rate of input speech can be significantly improved.

しかし、全体としては正しいタプルが認識結果から指摘
できる確率は、 0.85 X O,98X O,98= 0.82とな
り、80%程度に過ぎなく、残り20%については正し
いタプルが得られない。
However, overall, the probability that a correct tuple can be pointed out from the recognition result is 0.85 X O, 98 .

これは第一の属性に対する認識率が低いためであり、従
来の検索照合の問題点である。
This is because the recognition rate for the first attribute is low, which is a problem with conventional search and matching.

(発明の目的) 本発明の目的は、従来の検索照合の際に問題となる正し
いタプルを得られない確率を削減した認識システムを提
供することにある。
(Object of the Invention) An object of the present invention is to provide a recognition system that reduces the probability of not obtaining a correct tuple, which is a problem in conventional search and matching.

(発明の構成) (発明の特徴と従来の技術との差異) 本発明は、属性順列を換えて、従来の検索照合認識シス
テムを繰り返して適用することにより、高い確率で正し
くタプルを選び出すことの出来る認識システムを提供す
ることにある。
(Structure of the Invention) (Characteristics of the Invention and Differences from the Prior Art) The present invention is capable of correctly selecting tuples with high probability by changing the attribute permutation and repeatedly applying the conventional search matching recognition system. The goal is to provide a recognition system that can.

ここで属性順列とは、属性をタスクでの処理順に並べた
ときの並べ方を言う。
Here, the attribute permutation refers to the way in which attributes are arranged in the order of processing in a task.

さて、従来の検索照合を行うときの問題点は、一つの属
性に関して正解単語が候補からリジェクトされると、そ
のあとの属性に関して検索を行っても正しいタプルはテ
ンポラリデータベースには残らないことである。
Now, the problem with conventional search matching is that if the correct word for one attribute is rejected from the candidates, the correct tuple will not remain in the temporary database even if you perform a search for the subsequent attribute. .

ここで注意して欲しいのは、従来の検索照合では、第一
の属性に対する認識用辞書が最も大きく、通常用いられ
る5番目までの候補に正しい単語が含まれる確率は例え
ば85%しかないことである。
It should be noted here that in conventional search matching, the recognition dictionary for the first attribute is the largest, and the probability that the correct word will be included in the five candidates that are usually used is only, for example, 85%. be.

これに比べ他の属性の場合はテンポラリな認識辞書の単
語数が著しく少なく、認識単語候補5候補中に正しい単
語が含まれる確率は例えば98%と非常に高い。よって
正しいタプルが認識結果として得られなかった時はほと
んどの場合第一の属性で正しい単語が候補に挙げられな
かったためと見なしてよい。
In contrast, in the case of other attributes, the number of words in the temporary recognition dictionary is significantly smaller, and the probability that a correct word is included in the five recognition word candidates is very high, for example, 98%. Therefore, when a correct tuple is not obtained as a recognition result, it can be assumed that in most cases it is because the correct word was not selected as a candidate for the first attribute.

また逆に、第一の属性に対する認識辞書の単語数が大き
いため、認識候補の数が多くなり、最終的に正解以外に
も複数のタプルが残される場合もある。
Conversely, since the number of words in the recognition dictionary for the first attribute is large, the number of recognition candidates is large, and in the end, multiple tuples may be left in addition to the correct answer.

そこで本発明では、一旦リジェクトされた正解単語を救
済し、正解以外のタプルを排除するために、第一の属性
として異なる属性を用いた検索照合を複数回行う。そし
て各々の検索照合の結果として残ったテンポラリデータ
ベースを比較して、その中に最も多く含まれたタプルを
正解タプルとする。
Therefore, in the present invention, in order to salvage the correct word that was once rejected and eliminate tuples other than the correct answer, search and matching is performed multiple times using different attributes as the first attribute. Then, the temporary databases remaining as a result of each search and verification are compared, and the tuple that is included the most is determined to be the correct tuple.

第1図は、本発明の並列検索照合の原理を説明するため
の図である。
FIG. 1 is a diagram for explaining the principle of parallel search and matching of the present invention.

第1図(a)は、属性順列を第3図(c)と同じく、演
奏者→演奏会場→日付にした場合であるが、今度は第一
の属性で正解単語がリジェクトされたとする。従ってテ
ンポラリデータベースは正しいタプルが残っていない。
FIG. 1(a) shows a case where the attribute order is performer→performance venue→date as in FIG. 3(c), but this time it is assumed that the correct word is rejected for the first attribute. Therefore, there are no correct tuples left in the temporary database.

第1図(b)では属性順列を日付→演奏者→演奏会場と
したため、第二の属性の認識の時、第1図(a)ではリ
ジェクトされた正解単語「森昌×」が、辞書が小さいた
めうまく認識されている。しかし、最終的には他のタプ
ルも一緒に残ってしまった例である。
In Figure 1 (b), the attribute order is date → performer → performance venue, so when recognizing the second attribute, the correct word "Morimasa ×" that was rejected in Figure 1 (a) is changed to It is well recognized because it is small. However, in the end, other tuples also remained together.

第1図(c)では演奏会場→演奏者→日付の属性順列を
用い、正しいタプルが得られている。
In FIG. 1(c), a correct tuple is obtained using the attribute permutation of performance venue→performer→date.

そこで第1図(d)では第1図(a) (b) (c)
の結果を比較し、最も多いタプルとして正解タプルであ
る森昌子の波谷区民会館の20日の公演が選ばれること
になる。
Therefore, in Figure 1 (d), Figure 1 (a) (b) (c)
The results are compared, and the correct tuple, Masako Mori's performance on the 20th at Hatani Civic Hall, is selected as the tuple with the most number of tuples.

この様に並列検索照合では、従来の検索照合で見られた
様な、複数のタプルが残される場合や、正しいタプルが
含まれる場合が解消され、最終候補としてただ一つのタ
プルを挙げることができる。
In this way, parallel search matching eliminates the cases where multiple tuples are left behind or correct tuples are included, as seen in conventional search matching, and only one tuple can be selected as the final candidate. .

また正しいタプルが認識結果から指摘できる確率は、3
回の検索・照合がそれぞれ独立に行われたと仮定すると
、1回の検索照合で正しいタプルが得られる確率82%
より 1−(1−0,82) I 3 =0.99と、非常に
高くなる。但し実際には、3回の検索照合において、各
々の入力に対する認識は独立に行われているとは限らな
いので、確率99%よりは若干低くなる。
Also, the probability that a correct tuple can be pointed out from the recognition result is 3
Assuming that each search and match is performed independently, the probability of obtaining a correct tuple in one search and match is 82%.
1-(1-0,82) I 3 =0.99, which is very high. However, in reality, the recognition for each input is not necessarily performed independently in the three search and verifications, so the probability is slightly lower than 99%.

なお、第1図では、属性の個数を3としたが、本発明の
主旨によれば、2以上の任意の属性個数に対して本発明
を実行できることは言うまでもない。
Although the number of attributes is three in FIG. 1, it goes without saying that according to the gist of the present invention, the present invention can be implemented for any number of attributes greater than or equal to two.

また、上記の場合では、各タスクの属性順列は第一の属
性さえ異なっていればよい。これは第一の属性による検
索照合によって認識辞書の単語数が著しく減少すること
を前提としているためである。従って、第一の属性によ
る検索照合でデータベースが十分に絞り込めない場合は
、第二、あるいは第nの属性が異なる属性順列を用いれ
ばよいことは明らかである。
Furthermore, in the above case, the attribute permutation of each task only needs to be different in the first attribute. This is because it is assumed that the number of words in the recognition dictionary will be significantly reduced by searching and matching based on the first attribute. Therefore, it is clear that if the database cannot be narrowed down sufficiently by searching and matching based on the first attribute, an attribute permutation with a different second or n-th attribute may be used.

一方、各タスクの属性順列として第一あるいは第二、第
三の属性が同じで第nの属性が異なる順列を用いること
も可能である。
On the other hand, as the attribute permutation of each task, it is also possible to use a permutation in which the first, second, or third attribute is the same but the n-th attribute is different.

これは第一〜第n−1の属性に対する入力の認識スコア
が高い場合等に有効である。
This is effective when the recognition score of the input for the first to n-1th attributes is high.

この場合は、第n−1の属性までは1つのタスクとして
行い、第nの属性から異なるタスクとして行えばよい。
In this case, the tasks up to the (n-1)th attribute may be performed as one task, and the tasks starting from the nth attribute may be performed as different tasks.

さらに、これらを組み合せることも可能であり、結局各
タスクの属性順列としては、少なくとも1ケ所以上の属
性が異なるものを用いれば、それに対応して正しいタプ
ルの得られる確率が向上することになる また、以上の説明からも明らかな様に、タスクの数は属
性の数と同じである必要はなく、属性順列の一部だけが
異なる2つ以上のタスクを行えば、本発明の効果が得ら
れる。逆に、様々な属性順列に対して属性の数似上のタ
スクを行うことも可能であり、この場合はより高い確率
で正しいタプルが得られることになる。
Furthermore, it is also possible to combine these, and in the end, if you use attribute permutations for each task that differ in at least one attribute, the probability of obtaining a correct tuple will correspondingly increase. Furthermore, as is clear from the above explanation, the number of tasks does not need to be the same as the number of attributes, and the effects of the present invention can be obtained by performing two or more tasks that differ only in part of the attribute permutation. It will be done. Conversely, it is also possible to perform the task of approximating the number of attributes for various attribute permutations, in which case the correct tuples will be obtained with a higher probability.

さらに、上記の説明では各タスクの結果得られたテンポ
ラリデータベースを比較して、最も多くに含まれるタプ
ルを正解候補としたが、各テンポラリデータベース中の
最も確からしいタプルを選ぶことも可能である。最も確
からしいタプルの選び方としては、各タプルの各属性に
対する入力データの認識スコアを和算もしくは乗算して
最も高い値のタプルを選ぶ等の任意の方法がとれる。
Furthermore, in the above explanation, the temporary databases obtained as a result of each task are compared and the tuple that is included the most is selected as the correct answer candidate, but it is also possible to select the most probable tuple in each temporary database. The most probable tuple can be selected by any method such as adding or multiplying the recognition scores of the input data for each attribute of each tuple and selecting the tuple with the highest value.

(実施例) 実施例1 第2図は本発明の具体的な実施例を説明するための図で
ある。
(Example) Example 1 FIG. 2 is a diagram for explaining a specific example of the present invention.

第2図の並列検索照合型認識システム1は、検索照合型
認識システム2、制御部3、テンポラリデータベース保
管部4、テンポラリデータベース比較部5から構成され
る。
The parallel search and matching recognition system 1 shown in FIG. 2 is comprised of a search and matching recognition system 2, a control section 3, a temporary database storage section 4, and a temporary database comparison section 5.

また、検索照合型認識システム2は、認識処理部6、認
識候補単語記憶部7、認識用入力データ記憶部8、テン
ポラリデータベース作成部9、そして制御部10から構
成される。
Further, the search and matching recognition system 2 includes a recognition processing section 6, a recognition candidate word storage section 7, a recognition input data storage section 8, a temporary database creation section 9, and a control section 10.

認識処理部6は、外部からの音声入力データに従°い、
特徴抽出、バタン照合を行い、複数の候補単語をそのス
コアとともに出力する機能を持つ。
The recognition processing unit 6 follows voice input data from the outside,
It has the ability to extract features, perform slam matching, and output multiple candidate words along with their scores.

本認識処理部6は独立の認識用ハードウェアとして構成
してもよく、また汎用計算機上に実現してもよい。いず
れにせよその構成は当業者には既知の構成でよく、本発
明の主旨とは直接関係はないので詳細は省略する。
The recognition processing unit 6 may be configured as independent recognition hardware, or may be implemented on a general-purpose computer. In any case, the configuration may be a configuration known to those skilled in the art, and since it is not directly related to the gist of the present invention, details will be omitted.

この認識処理部6からの出力は、候補単語データ12と
して認識候補単語記憶部7に送られる。候補単語データ
12は、候補単語とそのスコアからなり、その個数、表
現形式はシステム作成者の任意である。
The output from the recognition processing unit 6 is sent to the recognition candidate word storage unit 7 as candidate word data 12. The candidate word data 12 consists of candidate words and their scores, and the number and expression format are determined by the system creator.

また、認識処理部6は、認識用入力データから特徴抽出
した入力音声特徴データ11を認識用入力データ記憶部
8に送り、また、認識用入力データ記憶部8から入力音
声特徴データ1]を受は取って再度認識処理を行うこと
ができる。ただし、この際、認識用入力データ記憶部8
のメモリ量を削減したいなら、特徴抽出データではなく
、認識結果として得られた辞書中の全単語に対するスコ
アを記憶させておくことも考えられる。
The recognition processing unit 6 also sends the input voice feature data 11 extracted from the recognition input data to the recognition input data storage unit 8, and also receives the input voice feature data 1 from the recognition input data storage unit 8. can be removed and the recognition process can be performed again. However, in this case, the recognition input data storage unit 8
If you want to reduce the amount of memory required, you could consider storing scores for all words in the dictionary obtained as recognition results instead of feature extraction data.

この認識用入力データ記憶部8は、入力音声特徴データ
11を記憶する機能を持ち、専用のハードウェアとして
も、汎用計算機あるいはパソコン上のファイルとして実
現しても良い。
This recognition input data storage section 8 has a function of storing input voice feature data 11, and may be realized as dedicated hardware or as a file on a general-purpose computer or personal computer.

テンポラリデータベース作成部9は、リレーショナルデ
ータベース記憶部20に記憶されたデータベースから検
索条件データ13に従って、新たなテンポラリデータベ
ースを作成し、テンポラリデータベース作成結果データ
14として、制御部10に転送する機能を持つ。
The temporary database creation section 9 has a function of creating a new temporary database from the database stored in the relational database storage section 20 according to the search condition data 13, and transmitting it to the control section 10 as temporary database creation result data 14.

その動作は入力タプルからある属性の値が認識単語候補
に一致するタプルのみを抜き出すものであり、この部分
のみの構成は従来のリレーショナル型データベースによ
る検索処理と同様なものである。
Its operation is to extract from input tuples only those tuples whose attribute value matches a recognized word candidate, and the configuration of only this part is similar to search processing using a conventional relational database.

制御部10では、入力された全ての属性に対して検索が
終了したか否かを判断し、終了していなければ認識処理
部6に次の属性に関する検索を始めるための属性番号指
示データ15を送る。
The control unit 10 determines whether or not the search has been completed for all input attributes, and if the search has not been completed, the control unit 10 sends attribute number instruction data 15 to the recognition processing unit 6 to start the search for the next attribute. send.

属性番号指示データ15とは、予め演奏者、演奏会場、
日付といった属性にそれぞれ属性番号1.2.3を割り
付けておき、属性名を指示する必要があるときは属性名
の代わりに属性番号を用いる。
The attribute number instruction data 15 includes information about the performer, performance venue,
Attribute numbers 1, 2, and 3 are assigned to attributes such as date, respectively, and when it is necessary to specify an attribute name, the attribute number is used instead of the attribute name.

この属性番号はユーザが任意に決めてよい。またこの属
性番号を(123)の様に並べたものを属性順列と呼ぶ
This attribute number may be determined arbitrarily by the user. Furthermore, the arrangement of these attribute numbers like (123) is called an attribute permutation.

更に制御部10は、テンポラリデータベース作成結果デ
ータ14をテンポラリデータベース記憶部21に送り、
次の検索を行う時はテンポラリデータベース記憶部21
に記憶されたテンポラリデータベースから検索条件デー
タ13に従って、新たなテンポラリデータベースを作成
することにする。
Further, the control unit 10 sends the temporary database creation result data 14 to the temporary database storage unit 21,
When performing the next search, the temporary database storage unit 21
A new temporary database will be created according to the search condition data 13 from the temporary database stored in .

さて制御部10は、全ての属性に対して検索照合が終了
した場合は、並列検索照合認識システムの制御部3へあ
る属性順列1についての検索照合が終了したことを知ら
せる検索照合終了信号23を送り、同時にテンポラリデ
ータベース結果データ16をある属性順列1での検索照
合の結果としてテンポラリ−データベース保管部4へ送
る。
Now, when the search and matching has been completed for all attributes, the control unit 10 sends a search and matching end signal 23 to the control unit 3 of the parallel search, matching and recognition system to inform that the search and matching for a certain attribute permutation 1 has been completed. At the same time, temporary database result data 16 is sent to the temporary database storage unit 4 as a result of search and collation using a certain attribute permutation 1.

各属性順列による検索照合の結果は全てこのテンポラリ
データベース保管部に保管される。
All search and collation results based on each attribute permutation are stored in this temporary database storage section.

さて、制御部3では少なくとも一部の属性が異なる属性
順列、例えばI、■、■を用意しており、次なる属性順
列■に対して検索照合を行わせるために検索照合型認識
システムの制御部10に属性順列指示データ19を送る
。この属性順列指示データ19は、(213)という様
な、属性番号のアレイで構成される。
Now, the control unit 3 prepares attribute permutations in which at least some of the attributes are different, for example, I, ■, ■, and controls the search and matching type recognition system in order to perform search and matching on the next attribute permutation ■. The attribute permutation instruction data 19 is sent to the unit 10. This attribute permutation instruction data 19 is composed of an array of attribute numbers such as (213).

制御部3の用意した全ての属性順列に対して各々の検索
照合が終了した時は、テンポラリデータベース保管部4
に保管されたテンポラリデータベースをテンポラリデー
タベース保管データ17としてテンポラリデータベース
比較部5へ転送する。
When each search and collation is completed for all the attribute permutations prepared by the control unit 3, the temporary database storage unit 4
The temporary database stored in is transferred to the temporary database comparison unit 5 as temporary database storage data 17.

テンポラリデータベース比較部では、送られてきたテン
ポラリデータベース中に最も多く含まれたタプルを選ん
で制御部5にテンポラリデータベース比較結果データと
して出力する。
The temporary database comparison section selects the tuple that is included most in the sent temporary database and outputs it to the control section 5 as temporary database comparison result data.

さて、以上の説明では属性順列Iの検索照合が終了して
から属性順列■の検索を始めているが、本発明では、属
性順列I、■、■の検索照合を同時並行に処理できるこ
とは言うまでもない。
Now, in the above explanation, the search for the attribute permutation ■ starts after the search and collation for the attribute permutation I is completed, but it goes without saying that in the present invention, the search and collation for the attribute permutations I, ■, and ■ can be processed in parallel. .

また、該当タプルを絞り込むのに必要な属性の数が例え
ば二つであれば、属性順列I、■の検索照合の結果で該
当タプルが得られず、属性順列■の第二の属性の関する
検索照合を終えた段階でテンポラリデータベースにスコ
アの高いタプルが−つだけ絞り込まれた時は、第三の属
性について検索を行わなくてもそのタプルを系列検索照
合の結果と見なすことができる。つまり現状の検索結果
状況に応じて、属性順列のある属性の検索を省略できる
ことも明らかである。
Furthermore, if the number of attributes required to narrow down the corresponding tuples is, for example, two, the corresponding tuple will not be obtained as a result of the search matching of the attribute permutation I, ■, and the search related to the second attribute of the attribute permutation ■ When the temporary database is narrowed down to only one tuple with a high score at the end of the matching, that tuple can be regarded as the result of the series search matching without performing a search for the third attribute. In other words, it is clear that the search for attributes with attribute permutations can be omitted depending on the current search result situation.

これらの制御部3、テンポラリデータベース保管部4、
テンポラリデータベース比較部5、認識処理部6、認識
候補単語記憶部7、認識用入力データ記憶部8、テンポ
ラリデータベース作成部9、そして制御部10は当業者
であれば本発明の主旨に従って構築できるものであり、
専用ハードウェア、汎用計算機上にプログラムを利用し
て構築する等の任意の構成をとれる。
These control unit 3, temporary database storage unit 4,
The temporary database comparison section 5, the recognition processing section 6, the recognition candidate word storage section 7, the recognition input data storage section 8, the temporary database creation section 9, and the control section 10 can be constructed by a person skilled in the art in accordance with the gist of the present invention. and
Any configuration can be used, such as using dedicated hardware or a program on a general-purpose computer.

実施例2 上記実施例1の様に、テンポラリデータベース保管部に
テンポラリなデータベースの作成結果をそのスコアと共
にテンポラリデータベース結果データ16として送り、
全ての属性順列に対して各々の検索照合が終了したらテ
ンポラリデータベース比較部5にテンポラリデータベー
ス保管データ17を送る。
Example 2 As in Example 1 above, the temporary database creation result is sent to the temporary database storage unit along with its score as temporary database result data 16,
When each search and collation is completed for all attribute permutations, the temporary database storage data 17 is sent to the temporary database comparison section 5.

テンポラリデータベース比較部5では、各属性に対する
スコアをタプル毎に計算し、その結果スコアが最も高い
タプルをテンポラリデータベース比較結果データとして
制御部3に出力する。
The temporary database comparison unit 5 calculates a score for each attribute for each tuple, and outputs the tuple with the highest score to the control unit 3 as temporary database comparison result data.

ここで、タプル毎の各属性に対するスコアの計算方法と
しては、例えば、各属性のスコア全てを和算あるいは乗
算した値、あるいは評価尺度の合計法として一般的な、
値X、Yに対してX十Y−XYで計算される値、あるい
はスコアの最低値、あるいは全スコアの統計的分散等な
どの値を比較する任意の方法を用いることができる。
Here, as a method of calculating the score for each attribute for each tuple, for example, a value obtained by summing or multiplying all the scores of each attribute, or a general method of summing evaluation scales,
Any method of comparing values such as the value calculated by XY-XY for the values X and Y, the lowest value of the scores, or the statistical variance of all scores can be used.

いずれの方法を用いるかは、実際の認識装置を用いたフ
ィールドデータに応じて選択すればよく、これは当業者
にとっては容易に実現可能である。
Which method to use may be selected depending on the field data obtained using the actual recognition device, and this can be easily realized by those skilled in the art.

(発明の効果) 以上述べた様に、本発明では、従来方式の検索照合型認
識処理システムに比較して、正しいタプルを選び出すこ
とができる確率を向上させることができる。
(Effects of the Invention) As described above, the present invention can improve the probability of selecting a correct tuple compared to the conventional search and matching type recognition processing system.

即ち、従来の検索照合においては、入力単語を認識する
際に正解単語がリジェクトされて正しい単語が選ばれな
い場合や、最終的に正解以外にも複数のタプルが選ばれ
てしまう場合があるが、本発明ではこれらの場合でも最
終候補として正しいただ一つのタプルを選べる可能性が
高い。
In other words, in conventional search matching, when recognizing an input word, the correct word may be rejected and the correct word may not be selected, or in the end, multiple tuples may be selected in addition to the correct answer. , in the present invention, there is a high possibility that only one correct tuple can be selected as a final candidate even in these cases.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の並列型検索照合の原理を説明するため
の図、 第2図は本発明の一実施例を説明するための図、第3図
は従来の検索照合の手法を説明する図である。 1 ・・並列検索照合型認識システム、2 ・・・検索
照合型認識システム、 3 ・・・制御部、 4 ・・・テンポラリデータベース保管部、5 ・・・
テンポラリデータベース比較部、6 ・・・認識処理部
、 7・・・認識候補単語記憶部、 8 ・・・認識用入力データ記憶部、 9 ・・・テンポラリデータベース作成部、10・・・
制御部、 11・・・入力音声特徴データ、 12・・・候補単語データ、 13・・・検索条件データ、 14・・・テンポラリデータベース作成結果データ、1
5・・・属性番号指示データ、 16・・・テンポラリデータベース結果データ、17・
・・テンポラリデータベース保管データ、18・・・テ
ンポラリデータベース比較結果データ、19・・・属性
順列支持データ、 20・・・ リレーシミナルデータベース記憶部、21
・・・テンポラリデータベース記憶部、22・・・リレ
ーショナル型データベース読み出し情報、23・・・検
索照合終了信号線。 特許出願人 日本電信電話株式会社 11   人カ#P羽→咲デ゛−り 15°系性@号胤ホテ″−9 16テン、さ゛ラソヂ゛−タベース祁翠テ一り17  
ラン小“ラワデ°−クベ゛−人傷饗デーり19  刀’
cr ’t’s Ill貢ダ・1欠Nオデ゛−り22・
 ソし−11デIし型データベースル乞み畝し1有l吃
23  矛(尤譚&粋1 jら号鼻 第2図
Fig. 1 is a diagram for explaining the principle of parallel search and matching of the present invention, Fig. 2 is a diagram for explaining an embodiment of the present invention, and Fig. 3 is a diagram for explaining the conventional search and matching method. It is a diagram. 1...Parallel search and matching type recognition system, 2...Searching and matching type recognition system, 3...Control unit, 4...Temporary database storage unit, 5...
Temporary database comparison unit, 6... Recognition processing unit, 7... Recognition candidate word storage unit, 8... Recognition input data storage unit, 9... Temporary database creation unit, 10...
Control unit, 11... Input voice feature data, 12... Candidate word data, 13... Search condition data, 14... Temporary database creation result data, 1
5... Attribute number instruction data, 16... Temporary database result data, 17.
... Temporary database storage data, 18... Temporary database comparison result data, 19... Attribute permutation support data, 20... Relay signal database storage unit, 21
. . . Temporary database storage unit, 22 . . . Relational type database read information, 23 . . . Search verification end signal line. Patent Applicant: Nippon Telegraph and Telephone Corporation 11 People #P feathers → Saki diary 15° system @No. Tanehote''-9 16 Ten, Sasara Sodji - Tabase Keisui Teichiri 17
Ran Elementary School “Rawade°-Kube-Human Injury Day 19 Sword”
cr't's Ill contribution・1 missing N order 22・
Soshi-11 De I type database Le begging ridge 1 with 吃 23 Spear (Yutan & Sui 1 Jra No. 2 No. 2)

Claims (2)

【特許請求の範囲】[Claims] (1)認識用データから複数個の認識単語候補を認識ス
コアと共に出力する認識処理部と、検索対象となるデー
タベース情報から検索条件に合致するタプルのみを抜き
出して新たなテンポラリベースを生成するテンポラリデ
ータベース作成部と、そのテンポラリデータベースを記
憶するテンポラリデータベース記憶部から構成され、 前記検索対象データベース中のある第一の属性に関する
被認識用入力データから認識処理部を通して得られる認
識単語候補にもとづいて検索対象データベースを検索し
、認識単語候補と一致する値を当該属性に有するタプル
のみから構成されるテンポラリデータベースを作成し、
当該テンポラリデータベースから他の第二の属性の認識
用辞書を作成して認識処理を行う一連の操作、あるいは
その一連の操作をさらに第三の属性、あるいは第四の属
性と順次複数の属性に対して繰り返す一連の操作を一つ
のタスクとしたとき、そのタスクにおける属性の選択順
次が少なくとも1ヵ所以上で相異なるタスクを2つ以上
実行し、各々のタスクの結果から得られるテンポラリデ
ータベースを比較して、最も多くのテンポラリデータベ
ースに含まれるタプルを抽出することを特徴とする並列
検索照合型認識システム。
(1) A recognition processing unit that outputs multiple recognition word candidates together with recognition scores from recognition data, and a temporary database that extracts only tuples that match the search conditions from the database information to be searched and generates a new temporary base. It is composed of a creation unit and a temporary database storage unit that stores the temporary database, and the search target is searched based on recognition word candidates obtained through the recognition processing unit from input data to be recognized regarding a certain first attribute in the search target database. Search the database and create a temporary database consisting only of tuples whose attribute has a value that matches the recognized word candidate,
A series of operations in which a recognition dictionary for another second attribute is created from the temporary database and recognition processing is performed, or the series of operations is further applied to a third attribute, or a fourth attribute, and sequentially to multiple attributes. When a series of repeated operations is defined as one task, two or more tasks with different attribute selection order in at least one place are executed, and the temporary database obtained from the results of each task is compared. , a parallel search and matching recognition system characterized by extracting the tuples included in the largest number of temporary databases.
(2)各タスクの結果から得られる2つ以上のテンポラ
リデータベースの中で、各タプルの各属性に対する入力
データの認識スコアを用いてタプル毎に計算したそのタ
プル全体のスコアを表す値が最も高いタプルを抽出する
ことを特徴とする特許請求の範囲第(1)項記載の並列
検索照合型認識システム。
(2) Among the two or more temporary databases obtained from the results of each task, the value representing the score of the entire tuple calculated for each tuple using the recognition score of the input data for each attribute of each tuple is the highest. The parallel search and matching recognition system according to claim 1, wherein tuples are extracted.
JP61308659A 1986-12-26 1986-12-26 Parallel retrieval/collation type recognition system Pending JPS63163496A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61308659A JPS63163496A (en) 1986-12-26 1986-12-26 Parallel retrieval/collation type recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61308659A JPS63163496A (en) 1986-12-26 1986-12-26 Parallel retrieval/collation type recognition system

Publications (1)

Publication Number Publication Date
JPS63163496A true JPS63163496A (en) 1988-07-06

Family

ID=17983737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61308659A Pending JPS63163496A (en) 1986-12-26 1986-12-26 Parallel retrieval/collation type recognition system

Country Status (1)

Country Link
JP (1) JPS63163496A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003029784A (en) * 2001-04-20 2003-01-31 Koninkl Philips Electronics Nv Method for determining entry of database
JP2006039954A (en) * 2004-07-27 2006-02-09 Denso Corp Database retrieval system, program, and navigation system
JP2008134502A (en) * 2006-11-29 2008-06-12 Nissan Motor Co Ltd Voice recognition device and voice recognition method
JP2008134503A (en) * 2006-11-29 2008-06-12 Nissan Motor Co Ltd Voice recognition device and voice recognition method
JP2010072507A (en) * 2008-09-22 2010-04-02 Toshiba Corp Speech recognition search system and speech recognition search method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003029784A (en) * 2001-04-20 2003-01-31 Koninkl Philips Electronics Nv Method for determining entry of database
JP2006039954A (en) * 2004-07-27 2006-02-09 Denso Corp Database retrieval system, program, and navigation system
JP2008134502A (en) * 2006-11-29 2008-06-12 Nissan Motor Co Ltd Voice recognition device and voice recognition method
JP2008134503A (en) * 2006-11-29 2008-06-12 Nissan Motor Co Ltd Voice recognition device and voice recognition method
US8108215B2 (en) 2006-11-29 2012-01-31 Nissan Motor Co., Ltd. Speech recognition apparatus and method
JP2010072507A (en) * 2008-09-22 2010-04-02 Toshiba Corp Speech recognition search system and speech recognition search method

Similar Documents

Publication Publication Date Title
US8352266B2 (en) System and methods for improving accuracy of speech recognition utilizing concept to keyword mapping
EP2317507B1 (en) Corpus compilation for language model generation
US7580835B2 (en) Question-answering method, system, and program for answering question input by speech
US11037553B2 (en) Learning-type interactive device
WO2019218818A1 (en) Speech recognition method and apparatus, and computer readable storage medium and computer device
US5127055A (en) Speech recognition apparatus & method having dynamic reference pattern adaptation
US20110231189A1 (en) Methods and apparatus for extracting alternate media titles to facilitate speech recognition
CN101952824A (en) Method and information retrieval system that the document in the database is carried out index and retrieval that computing machine is carried out
KR102639979B1 (en) Keyword extraction apparatus, control method thereof and keyword extraction program
KR102144345B1 (en) Voice recognition processing device for performing a correction process of the voice recognition result based on the user-defined words and operating method thereof
JPS63163496A (en) Parallel retrieval/collation type recognition system
KR102072238B1 (en) question answering system and method based on reliability
JP4244423B2 (en) Proper word string estimation device
CN113539235B (en) Text analysis and speech synthesis method, device, system and storage medium
CA2483805C (en) System and methods for improving accuracy of speech recognition
JP3682958B2 (en) Search device, search method and database for compound nouns input by speech
CN110210034B (en) Information query method, device, terminal and storage medium
US12026632B2 (en) Response phrase selection device and method
JP3846896B2 (en) Search device, search method and database for compound nouns input by speech
CN112735412A (en) Method and system for searching information according to voice instruction
JPS63153597A (en) Search collation type recognition system
JP7434117B2 (en) Dialogue device, method, and program
JP2001067364A (en) Complex media retrievalmethod and medium recording program for complex media retrieval
JPS63152000A (en) Attribute switching type search collation recognition system
JP4056546B2 (en) Search device, search method and database for compound nouns input by speech