JP4703385B2 - Automatic minutes creation system - Google Patents
Automatic minutes creation system Download PDFInfo
- Publication number
- JP4703385B2 JP4703385B2 JP2005346244A JP2005346244A JP4703385B2 JP 4703385 B2 JP4703385 B2 JP 4703385B2 JP 2005346244 A JP2005346244 A JP 2005346244A JP 2005346244 A JP2005346244 A JP 2005346244A JP 4703385 B2 JP4703385 B2 JP 4703385B2
- Authority
- JP
- Japan
- Prior art keywords
- minutes
- task
- voice
- automatic
- desired finish
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000006243 chemical reaction Methods 0.000 claims description 56
- 238000000034 method Methods 0.000 claims description 17
- 238000010586 diagram Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 240000000220 Panda oleosa Species 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は議事録自動作成システムに関し、特に指定した時間以内に音声データから議事録を作成する場合に適用して有用なものである。 The present invention relates to an automatic minutes creation system, and is particularly useful when applied to create minutes from audio data within a designated time.
現在、一般企業において顧客を維持するために種々の経営戦略が検討されており、その一つとして顧客満足度の向上を掲げる企業が増えている。特に顧客と直接に接する企業では、顧客満足度の向上を図ることは重要な課題となっている。 At present, various management strategies are being studied in order to maintain customers in general companies, and as one of them, companies that increase customer satisfaction are increasing. Especially for companies that are in direct contact with customers, improving customer satisfaction is an important issue.
例えば、営業社員が顧客に対して商品説明や苦情処理などのトラブル対応の際に顧客が受ける印象は直接的に顧客満足度に影響する要因となる。したがって、顧客満足度の向上のために企業全体で一貫した接客方針を持つことが望まれている。 For example, the impression that a customer receives when a sales employee deals with a customer, such as product explanations and complaints, directly affects customer satisfaction. Therefore, it is desirable to have a consistent customer service policy across the entire company in order to improve customer satisfaction.
このような接客方針をトップダウン的に決定するだけでなく、現場の営業社員が個別に対応したことを体系化して企業全体で共有することで、接客方針をボトムアップ的に決定することも有効である。具体的には、営業社員と顧客との交渉や議事、苦情処理などを議事録として保存し、その議事録を企業全体で共有して将来の顧客との交渉等に活用することが挙げられる。 In addition to deciding such a customer service policy from the top down, it is also effective to determine the customer service policy in a bottom-up manner by systematizing and sharing the fact that the sales staff on site responded individually. It is. Specifically, it is possible to save the negotiations, proceedings, complaints processing, etc. between sales employees and customers as minutes, and share the minutes throughout the company for use in future negotiations with customers.
しかしながら、営業社員が顧客との対応中に、このような議事録を作成することは難しく、また顧客対応を終えたあとにメモや記憶を基に議事録を作成するのは正確性に欠けるという問題点があった。かかる問題を解決するための議事録自動作成方式がある(特許文献1参照)。 However, it is difficult for sales employees to create such minutes during customer service, and it is not accurate to create minutes based on notes and memories after customer service. There was a problem. There is an automatic minutes creation system for solving such a problem (see Patent Document 1).
ところで、特定の業界の営業所において、顧客から寄せられる苦情には緊急に対処しなければならないものがある。特定の業界として、例えば電力業界があり、停電に関する苦情は緊急性が高い。また、そのような不具合の発生している範囲によっては、同様の苦情を寄せる顧客は多数になることがある。したがって、営業社員の全員が苦情を寄せる顧客に対して統一的に対応するため、顧客対応の参考になるように最初の顧客の対応を速やかに議事録として記録する必要がある。 By the way, in a certain industry sales office, there are some complaints received from customers that must be dealt with urgently. A specific industry is, for example, the power industry, and complaints about power outages are highly urgent. In addition, depending on the extent of such a problem, there may be many customers who make similar complaints. Therefore, in order for all sales employees to respond to customers complaining in a unified manner, it is necessary to promptly record the minutes of the first customer's response as a reference for customer response.
しかしながら、特許文献1にある議事録自動作成方式は、議事録の緊急性に応じて優先的に議事録を作成するものではない。また、特殊なキーワードを発声することで、会議の出席者を特定するものであるため、営業社員が現場で顧客対応をする際に、そのようなキーワードを発声するのは煩わしく、顧客に対してよい印象を与えるものではない。
However, the minutes automatic creation method disclosed in
本発明は、かかる事情に鑑み、顧客等との会話が録音された音声データから、話者毎に区別された漢字仮名混じりの文字情報に変換された議事録を作成すると共に、議事録の精度を考慮した上で緊急に作成すべき議事録を優先的に処理する議事録自動作成システムを提供することを目的とする。 In view of such circumstances, the present invention creates a minutes converted from voice data in which a conversation with a customer or the like is recorded into character information mixed with kana and kana distinguished for each speaker, and the accuracy of the minutes It is an object to provide an automatic minutes creation system that preferentially processes minutes to be urgently taken into account.
上記目的を達成するための本発明の第1の態様は、複数の話者の音声を符号化した音声データを文字情報に変換して議事録を作成する議事録自動作成システムであって、前記音声データと前記議事録の仕上がり希望日からタスクを生成するタスク生成手段と、文字情報への変換を終えた音声データの一部分が全体に占める割合である変換進捗度と前記仕上がり希望日から処理優先度をタスク毎に算出し、前記処理優先度に基づいて処理対象タスクを選出するタスク制御手段と、前記処理対象タスクの音声データから声紋を抽出し、前記声紋に基づいて前記複数の話者毎の発言データを時系列に抽出すると共に、前記発言データを複数の電子辞書に基づいて文字情報に変換して議事録を作成し、データベースに格納する音声変換手段とを具備し、前記複数の電子辞書は、収録語彙数を選択できる特定の分野に特化した語彙を収録した複数の特定分野辞書であって、前記音声変換手段は、前記変換進捗度及び前記処理優先度に基づいて少なくとも1つの前記特定分野辞書とその収録語彙数を選択することで前記議事録の精度を調節することを特徴とする議事録自動作成システムにある。 In order to achieve the above object, a first aspect of the present invention is an automatic minutes creation system for creating minutes by converting voice data obtained by encoding voices of a plurality of speakers into character information. Task generation means for generating a task from the desired finish date of the audio data and the minutes, and processing priority based on the conversion progress and the desired finish date, which is the ratio of a portion of the audio data that has been converted to character information A task control means for calculating a task for each task, selecting a task to be processed based on the processing priority, and extracting a voiceprint from voice data of the task to be processed, and for each of the plurality of speakers based on the voiceprint It extracts the utterance data in time series, and creates the minutes are converted into character information based on the utterance data to a plurality of electronic dictionaries, equipped with a voice conversion means for storing in a database The plurality of electronic dictionaries are a plurality of specific field dictionaries that record vocabulary specialized in a specific field for which the number of recorded vocabularies can be selected, and the speech conversion means is based on the conversion progress and the processing priority. In the system for automatically creating minutes, the accuracy of the minutes is adjusted by selecting at least one specific field dictionary and the number of recorded vocabularies .
かかる第1の態様では、音声データの会話が話者毎に区別されて、漢字仮名混じりの文字情報に変換された議事録を作成すると共に、仕上がり希望日及び変換進捗度に基づいて処理対象タスクを選出することで、直近に作成するべき議事録を優先的に処理することが可能となる。また、処理対象タスクの平仮名の発言データを仮名漢字変換するために用いる電子辞書を選択して、作成される議事録の精度を調整することで、仕上がり希望日までの時間を遵守するように議事録が作成されることが可能となる。 In the first aspect, the conversation of the voice data is distinguished for each speaker, and the minutes converted into character information mixed with kanji characters are created, and the task to be processed is based on the desired finish date and the conversion progress degree. By selecting, it becomes possible to preferentially process the minutes to be created most recently. In addition, by selecting an electronic dictionary to be used for Kana-Kanji conversion of the hiragana text data of the task to be processed, the accuracy of the minutes to be created is adjusted, so that the time until the desired finish date is observed. A record can be created.
本発明の第2の態様は、第1の態様に記載する議事録自動作成システムにおいて、前記タスク生成手段は、タスクの前記仕上がり希望日が所定の期間よりも短い場合は、当該タスクと同一の音声データと当該タスクの仕上がり希望日よりも長い仕上がり希望日からなるタスクを新たに生成して精度の高い議事録を別途作成することを特徴とする議事録自動作成システムにある。 A second aspect of the present invention, Oite the minutes automatic creation system according to the first aspect, the task generating unit, when the task finish dates is less than a predetermined period, and the task The present invention is an automatic minutes creation system characterized in that a task with a desired finish date longer than the desired finish date of the task and the same voice data is newly generated and a highly accurate minutes is separately created.
かかる第2の態様では、仕上がり希望日が所定の期間よりも短い場合は、一方で、その仕上がり希望日を遵守するよう議事録を作成する。他方、同一の音声データと、十分な精度の議事録を作成できる仕上がり希望日とを新たなタスクとして生成することで、精度の高い議事録をも別途作成することが可能となる。 In the second aspect, when the desired finish date is shorter than the predetermined period, on the other hand, the minutes are created so as to comply with the desired finish date. On the other hand, by generating the same voice data and a desired finish date that can create a sufficiently accurate minutes as a new task, it is possible to separately create a highly accurate minutes.
本発明の第3の態様は、第1又は第2の態様に記載する議事録自動作成システムにおいて、前記データベースは、分類名を含む議事録情報と前記議事録を関連付けて記録すると共に、前記分類名を指定することで該当する議事録を検索する議事録検索手段を更に具備することを特徴とする議事録自動作成システムにある。 A third aspect of the present invention, Oite the minutes automatic creation system according to the first or second aspect, wherein the database is adapted to record in association with the minutes and minutes information including the classification name, The automatic minutes creation system further includes a minutes search means for searching for a corresponding minutes by designating the classification name.
かかる第3の態様では、利用者の指定する分類名に関する議事録が検索されることで、蓄積された議事録を体系的に閲覧することが可能となり、利用者は、検索された議事録にある事例を参考にすることで、将来の同様の事例に対応することが容易となる。 In the third aspect, by searching the minutes related to the classification name designated by the user, it is possible to systematically browse the accumulated minutes, and the user can view the minutes that have been searched. By referring to a case, it will be easier to handle similar cases in the future.
本発明の第4の態様は、第1〜3の何れかの態様に記載する議事録自動作成システムにおいて、インターネット又はLANを含む通信手段で接続された複数のコンピュータを更に具備し、前記複数のコンピュータ毎に前記音声変換手段が具備される場合、前記タスク制御手段は、前記処理優先度に基づいてタスクを前記複数のコンピュータ毎の前記音声変換手段に配分することを特徴とする議事録自動作成システムにある。 A fourth aspect of the present invention may further include Oite the minutes automatic generation system according to any one of the aspects of the first through 3 a plurality of computers connected by a communication means, including the Internet or LAN, the When the voice conversion means is provided for each of a plurality of computers, the task control means distributes the task to the voice conversion means for each of the plurality of computers based on the processing priority. In the automatic creation system.
かかる第4の態様では、処理に時間を要する音声変換手段を、複数のコンピュータで具備することで負荷が分散されるため、全体として高い処理能力を有する議事録自動作成システムを提供することが可能となる。 In the fourth aspect, since the load is distributed by providing a plurality of computers with audio conversion means that requires time for processing, it is possible to provide an automatic minutes creation system that has a high processing capacity as a whole. It becomes.
本発明によれば、音声データの会話が話者毎に区別されて、漢字仮名混じりの文字情報に変換された議事録を作成すると共に、議事録の精度を考慮した上で、利用者の指定する仕上がり希望日を遵守するよう、緊急に作成するべき議事録が優先的に作成される。 According to the present invention, the voice data conversation is distinguished for each speaker, and the minutes converted into character information mixed with kanji characters are created, and the user's designation is taken into account in consideration of the accuracy of the minutes. The minutes that should be urgently created are preferentially created so that the desired finish date will be observed.
以下、本発明を実施するための最良の形態について説明する。なお、本実施形態の説明は例示であり、本発明は以下の説明に限定されない。 Hereinafter, the best mode for carrying out the present invention will be described. The description of the present embodiment is an exemplification, and the present invention is not limited to the following description.
<実施形態1>
図1は、本発明の実施の形態に係る議事録自動作成システムのシステム構成図である。なお、本実施形態は、会議での発言や顧客との口頭での対応などを録音したユーザが議事録自動作成システム1を利用して、議事録を作成する場合を想定している。
<
FIG. 1 is a system configuration diagram of an automatic minutes creation system according to an embodiment of the present invention. In the present embodiment, it is assumed that a user who has recorded a statement at a conference or verbal response with a customer creates a minutes using the minutes
図示するように、本実施形態の議事録自動作成システム1は、ユーザ2から送信された音声データ及び議事録の仕上がり希望日を所定のプロセスに従って議事録を作成する議事録自動作成サーバ30を備えており、ユーザ2側に設置されている端末20と議事録自動作成サーバ30がネットワーク3を介してそれぞれ接続されるようになっている。ここで、ユーザ2側に設置される端末20としては、ネットワークに接続可能な一般的なコンピュータの各種機能を備える情報通信機器であればよく、例えば、パーソナルコンピュータ、サーバなどが挙げられる。また、ユーザ2側と議事録自動作成サーバ30は、必ずしもネットワークに接続されていなくても良く、その場合は、例えば、所定の記憶媒体(CD−R(Compact Disk Recordable)やDVD−R(Digital Versatile Disk Recordable)、USBメモリなど)でデータの受け渡しが行われる。
As shown in the figure, the minutes
ここで、議事録自動作成サーバ30は、CPU、メモリ、外部記憶装置、表示部、操作部、及び通信部等(何れも図示せず)を含み構成される情報通信機器であり、ユーザ2側から送信された音声データから議事録を作成する。
Here, the minutes
具体的には、図示するように、議事録自動作成サーバ30は、タスク生成手段31、タスク制御手段32、音声変換手段33、データベース34、議事録検索手段35を含み構成されている。
Specifically, as shown in the figure, the minutes
タスク生成手段31は、ユーザ2に設置されている端末20からネットワーク3を介して音声データと議事録の仕上がり希望日を受信する毎にタスクを生成し、このタスクを主記憶等の記憶領域に記録する。さらに、議事録自動作成サーバ30での処理上、音声データと仕上がり希望日の他に、一連の処理に必要な情報をタスクと関連付ける。すなわち、タスクは、タスク識別子、ユーザ識別子,音声データ、仕上がり希望日、変換進捗度及び処理優先度より構成される。
The
図2は、生成されたタスクの構成を例示する図である。図示するように、3つのタスクがタスク生成手段31によって生成され、記憶されている。例えば、図2のタスク識別子が1の行は、ユーザ識別子「ユーザA」を持つユーザ2によって入力された「X営業所―会議音声.wav」というファイル形式の音声データを24時間後までに議事録を作成するというタスクであることを示している。
FIG. 2 is a diagram illustrating the configuration of the generated task. As shown in the figure, three tasks are generated and stored by the task generation means 31. For example, in the row with the
ここで、音声データとは、話者の音声をPCM(Pulse Code Modulation)、MP3(MPEG audio layer−3)などの規格に基づいたファイルフォーマットで保存した電子データである。議事録とは、音声データに記録された話者の発言内容が仮名や漢字で構成されるテキストデータで表現されたものをいう。また議事録の仕上がり希望日とは、少なくともその日までには議事録の作成が完了していなければならないとする締切日をいう。なお、タスク識別子とは、複数あるタスクから一つのタスクを識別するための一意な数値であり、ユーザ識別子とは、議事録の作成を行ったユーザ2を識別する一意な文字列である。変換進捗度と処理優先度については後述する。
Here, the voice data is electronic data in which a speaker's voice is saved in a file format based on a standard such as PCM (Pulse Code Modulation) or MP3 (MPEG audio layer-3). The minutes are those expressed by text data composed of kana and kanji, which are recorded by the speaker. The desired finish date of the minutes means the deadline that the minutes must be prepared at least by that date. The task identifier is a unique numerical value for identifying one task from a plurality of tasks, and the user identifier is a unique character string for identifying the
タスク制御手段32は、複数あるタスクの中からタスク毎に処理優先度を計算すると共に、処理優先度の値が最も小さい値であるタスクを処理対象タスクとして選出する。 The task control means 32 calculates a processing priority for each task from among a plurality of tasks, and selects a task having the smallest processing priority value as a processing target task.
ここで、処理優先度とは 文字情報への変換を終えた音声データの部分が全体に占める割合である変換進捗度と議事録の仕上がり希望日から算出される値である。例えば変換対象の音声データが10分間の会話であって、最初の3分間の部分が文字情報に変換された場合、変換進捗度は0.3となる(3/10)。この変換進捗度に、現時点から議事録の仕上がり希望日までの残り時間を乗じたものが処理優先度となる。例えば、仕上がり希望日までの残り時間が10時間であって、変換進捗度が0.3である場合、処理優先度は3となる。処理優先度は小さければ小さいほど優先的に変換処理が行われる。 Here, the processing priority is a value calculated from the degree of conversion progress, which is the ratio of the portion of the audio data that has been converted to character information, and the desired finish date of the minutes. For example, when the voice data to be converted is a 10-minute conversation, and the first 3 minutes part is converted into character information, the conversion progress is 0.3 (3/10). The conversion priority is obtained by multiplying the conversion progress by the remaining time from the current time to the desired finishing date of the minutes. For example, if the remaining time until the desired finish date is 10 hours and the conversion progress is 0.3, the processing priority is 3. The conversion processing is preferentially performed as the processing priority is smaller.
これによって、議事録の仕上がり希望日までの時間が少なく、且つ変換進捗度が小さいタスクが処理対象タスクとして選択され、その処理対象タスクが優先的に音声変換手段33によって文字情報に変換され議事録が生成されるようになる。 As a result, a task whose time until the desired finish date of the minutes is small and whose conversion progress is small is selected as a processing target task, and the processing target task is preferentially converted into character information by the voice conversion means 33. Will be generated.
なお、タスク制御手段32は、定期的に処理優先度を計算する。したがって、処理対象タスクが音声変換手段33によって文字情報に変換されていても、他のタスクの処理優先度の値よりも大きくなった場合は、当該処理を中断し、他のタスクを新たに処理対象タスクとして音声変換手段33の処理対象とする。このように処理優先度に基づいて、処理優先度の値の小さいタスクを割り込ませて処理をすることにより、緊急に議事録を作成すべきタスクを優先的に処理することが可能となる。
The
音声変換手段33は、処理対象タスクの音声データから声紋を抽出し、声紋に基づいて複数の話者毎の発言データを時系列に抽出すると共に、発言データを複数の電子辞書に基づいて文字情報に変換して議事録を作成し、データベース34に格納する。これによって、複数の話者の音声を符号化した音声データが、議事録に変換されてデータベース34に格納される。
The voice conversion means 33 extracts a voice print from the voice data of the task to be processed, extracts utterance data for each of a plurality of speakers based on the voice print in time series, and converts the utterance data into character information based on a plurality of electronic dictionaries. The minutes are created by conversion into the database and stored in the
例えば音声データに話者A、話者Bの会話内容が録音されているとする。この場合、話者毎の発言データを時系列に抽出した結果は次のとおりとなる。
・話者A「こんにちはせんじつのといあわせのけんですがどうなっていますか」
・話者B「そのけんについてけんとうしたけっかこのようになりました」
・話者A「りょうかいいたしました」
このように、会話内容が話者毎に対応付けられて、時系列に並んだ平仮名の文字情報となる。さらに、この平仮名の文字情報について、既存の形態素解析などの文法解析システム及び複数の電子辞書を用いて漢字仮名混じり文に変換する。この結果、上述の例で述べた音声データは次のとおりとなる。
・話者A「こんにちは、先日の問い合わせの件ですがどうなっていますか」
・話者B「その件について検討した結果このようになりました」
・話者A「了解いたしました」
For example, it is assumed that the conversation contents of the speaker A and the speaker B are recorded in the voice data. In this case, the result of extracting the utterance data for each speaker in time series is as follows.
· Speaker A "Does it have happened, but is the province of the inquiry Hello the other day."
・ Speaker B "I've got this kind of shit about that ken"
・ Speaker A "I'm happy"
In this way, the conversation content is associated with each speaker, and becomes character information of hiragana arranged in time series. Furthermore, the hiragana character information is converted into a kanji-kana mixed sentence using an existing grammatical analysis system such as morphological analysis and a plurality of electronic dictionaries. As a result, the audio data described in the above example is as follows.
· Speaker A "Hello, do you have what happened but is a matter of recent inquiry."
・ Speaker B: “This is the result of studying the matter.”
・ Speaker A “I understand”
ここで、複数の電子辞書とは、収録語彙数を選択できる特定の分野に特化した語彙を収録した複数の特定分野辞書である。特定分野辞書とは、例えば一般用語のみならず電力業界用語やビジネス用語等の分野でよく用いられる語彙について、読みと漢字との変換対応表を収録したものである。さらに、これらの特定分野辞書毎に収録語彙数が異なるものを複数用意する。例えば、収録語彙数が300,500,1000の特定(例えば電力)業界用語の電子辞書である。他の特定分野辞書についても同様である。これらの複数の電子辞書の使い分けに関しては後述する。 Here, the plurality of electronic dictionaries are a plurality of specific field dictionaries that record vocabulary specialized for a specific field where the number of recorded words can be selected. The specific field dictionary includes, for example, a conversion correspondence table between reading and kanji for vocabulary frequently used in fields such as electric power industry terms and business terms as well as general terms. In addition, a plurality of different vocabulary numbers are prepared for each specific field dictionary. For example, an electronic dictionary of specific (for example, power) industry terms having 300,500,1000 recorded vocabularies. The same applies to other specific field dictionaries. The use of these electronic dictionaries will be described later.
データベース34は、議事録を分類名と関連付けて記録すると共に、ユーザ2が分類名を指定することで、その分類名に該当する議事録を検索することが可能なデータベースである。
The
図3は、議事録に付す分類名とデータベース34に格納された議事録の構成を例示する図である。図3(b)に示すように、議事録には議事録を識別する一意な数値である議事録識別子、作成者のユーザ識別子、作成日、コメントの項目も関連付けられる。
FIG. 3 is a diagram exemplifying the structure of the classification name attached to the minutes and the minutes stored in the
ここで、分類名とはユーザ2が任意に設定できるものであって、その議事録がどのような内容であるかを大別するために用いる一意な識別子である。具体的には、図3の(a)に示すように分類名表が定義され、作成された議事録は、図3の(b)に示すように分類名表からユーザ2によって選択された分類名が付された上でデータベース34に格納される。例えば、図3(b)の議事録識別子が1の行は、ユーザ識別子「ユーザA」をもつユーザ2によって2005年11月10日に作成された議事録が「X営業所―会議音声.txt」というファイル名で保存されており、且つ分類名が「営業所内―打合せ関連」とされていることを示している。
Here, the classification name can be arbitrarily set by the
議事録検索手段35は、ユーザ2が指定する分類名に基づいてデータベース34中の該当する議事録を検索し、該当した議事録をユーザ2に提示する。これによって、ユーザ2は作成した議事録を取得することができるだけでなく、ユーザ2の必要とする分類に関連する議事録を取得することが可能となる。
The minutes search means 35 searches for the relevant minutes in the
このようなシステム構成により、本実施形態では、議事録自動作成サーバ30でユーザ2が保有する音声データより、指定された議事録の仕上がり希望日までに電子化された議事録の自動作成が行われ、ユーザ2の指定する種々の検索条件に応じて、議事録がユーザ2に納品される。また、ユーザ2は他のユーザの議事録を参照することもできるため、議事録自動作成システム1を利用するユーザ同士の間で知識の共有を図ることが可能となる。例えば、ユーザ2は他のユーザのクレーム処理に関する議事録から学習して、将来のクレーム対応に対応するための準備をする等である。
With such a system configuration, in the present embodiment, the automatic creation of electronic minutes by the desired finish date of the designated minutes is performed from the voice data held by the
次に、議事録自動作成システム1の動作手順について説明する。
Next, the operation procedure of the minutes
図4は、本発明の実施の形態に係る議事録自動作成システム1の動作手順を示す図である。
FIG. 4 is a diagram showing an operation procedure of the automatic
まず、ユーザ2に設置されている端末20から議事録自動作成サーバ30に対して、音声データと仕上がり希望日が送信される(S1)。タスク生成手段31は、音声データと仕上がり希望日に基づいてタスクを生成する(S2)。ここでは、例えば、図2に例示したようなタスクが作成される。
First, voice data and a desired finishing date are transmitted from the terminal 20 installed in the
なお、タスク生成手段31は、仕上がり希望日が予め決められた期間よりも短い場合は、同一の音声データと、十分な精度の議事録を作成できる仕上がり希望日とを新たなタスクとして生成してもよい。これにより、精度の高い議事録も別途作成することが可能となる。 When the desired finish date is shorter than a predetermined period, the task generating means 31 generates the same desired audio data and the desired finish date that can create a sufficiently accurate minutes as a new task. Also good. As a result, it is possible to create a high-accuracy minutes separately.
タスク制御手段32は、全てのタスクについて、処理優先度を算出し、最も処理優先度の値が小さいものを処理対象タスクとする(S3)。この処理優先度は数秒に1回程度の間隔で算出され、その都度、処理対象タスクの変更が行われる。
The
音声変換手段33は、処理対象タスクの音声データから声紋を抽出し、声紋に基づいて複数の話者毎の発言データを時系列に抽出する。さらに、仕上がり希望日までに文字情報への変換処理が完了するように、処理対象タスクの処理優先度と変換進捗度に基づいて電子辞書を動的に選択して議事録を作成する。作成が完了した議事録をデータベース34に格納する(S4)。 The voice conversion means 33 extracts a voice print from the voice data of the processing target task, and extracts speech data for each of a plurality of speakers in time series based on the voice print. Furthermore, the electronic dictionary is dynamically selected based on the processing priority of the processing target task and the conversion progress so as to complete the conversion processing to character information by the desired finish date, and the minutes are created. The minutes completed are stored in the database 34 (S4).
また、議事録の作成が完了した場合は、ユーザ2に議事録の作成が完了した旨を電子メールで通知する(S5)。これによって、ユーザ2は、議事録の作成が完了したか否かを確認するために、議事録自動作成サーバ30の処理の進捗状況を頻繁に確認する必要がなくなる。さらに、ユーザ2によって指定された分類名を議事録に付す(S6)。分類名を付することで、議事録がどのような内容であるかが大別され、後の検索時に有用なものとなる。
If the creation of the minutes is completed, the
議事録検索手段35は、ユーザ2によって指定された分類名をキーワードとして検索処理を行い(S7)、該当する議事録を提示する(S8)。
The minutes search means 35 performs a search process using the classification name designated by the
ここで、タスク制御手段32による処理対象タスクの選出処理(S3)について詳説をする。 Here, a process target task selection process (S3) by the task control means 32 will be described in detail.
図5は、タスクの変換進捗度、処理優先度の変化の状況を示す図である。図5の(a)〜(e)のそれぞれは図3に示したものの内、タスク識別子、仕上がり希望日、変換進捗度及び処理優先度を抜粋したものであって、各項目の意味は図3で示したものと同様である。 FIG. 5 is a diagram illustrating a change state of task conversion progress and processing priority. Each of (a) to (e) of FIG. 5 is an excerpt of the task identifier, desired finish date, conversion progress, and processing priority of those shown in FIG. 3, and the meaning of each item is shown in FIG. It is the same as that shown in.
図5の(a)はそれぞれの進捗度が0.2と0.5であるタスク識別子2のタスク(以下、単に「タスク識別子2」のように表す。)とタスク識別子3がある時に、タスク生成手段31でタスク識別子1が生成された直後の状態を示している。
FIG. 5A shows a task with a task identifier 2 (hereinafter simply represented as “
この状態において、タスク識別子1〜3のそれぞれについて処理優先度を計算すると、それぞれ0,0.4,0.3となる。したがって、最も小さい値であるタスク識別子1が緊急に処理する必要がある処理対象タスクとなり、音声変換手段33によって音声データが議事録に変換される。
In this state, when the processing priorities are calculated for each of the
図5の(b)は、(a)の状態から0.2時間経過したときのタスクである。ここでは(a)の処理対象であったタスク識別子1の変換進捗度が0から0.6まで増加している。この段階でタスク識別子1〜3のそれぞれについて処理優先度を計算すると、それぞれ0.48,0.36,0.2となる。したがって、タスク識別子1の処理を中断して、新たにタスク識別子3が処理対象タスクとなる。
FIG. 5B is a task when 0.2 hours have elapsed from the state of FIG. Here, the conversion progress degree of
同様に、図5の(c)においてもタスク識別子3が処理対象タスクとなり、変換処理を進めた結果、図5の(d)に示すようにタスク識別子3の変換処理が全て完了すると、図5の(e)に示すように、タスク識別子3の情報が削除される。 Similarly, in FIG. 5C, the task identifier 3 becomes the processing target task, and as a result of proceeding with the conversion process, as shown in FIG. As shown in (e) of the above, the information of the task identifier 3 is deleted.
上記の処理のように、仕上がり希望日と変換進捗度を常時監視して、処理優先度を算出し、適切に処理対象タスクを選出することで、処理すべきタスクを優先的に文字情報に変換することが可能となる。 As in the above processing, the desired finish date and conversion progress are constantly monitored, the processing priority is calculated, and the task to be processed is preferentially converted into character information by selecting the task to be processed appropriately. It becomes possible to do.
次に、音声変換手段33による議事録の作成処理(S4)について詳説する。議事録の作成処理は発言データから平仮名の文字情報を抽出し、仮名漢字混じりの文字情報に変換して議事録を作成する。この平仮名の文字情報に仮名漢字変換を適用する際は、特定分野辞書の数やその収録語彙数が多ければ多いほど、平仮名が適切に漢字に変換されて、精度の高い議事録が作成される。しかしながら、精度の高い議事録を作成するためには、より多くの収録語彙数を含んだ特定分野辞書用いるため、文字情報への変換に要する時間も増加する。 Next, the minutes creation process (S4) by the voice conversion means 33 will be described in detail. The minutes creation process extracts the hiragana character information from the utterance data and converts it into character information mixed with kana and kanji to create the minutes. When Kana-Kanji conversion is applied to this Hiragana character information, the higher the number of specific field dictionaries and the number of recorded vocabularies, the more appropriately Hiragana is converted to Kanji and the more accurate minutes are created. . However, in order to create a highly accurate minutes, a specific field dictionary including a larger number of recorded vocabularies is used, so the time required for conversion to character information also increases.
したがって、処理対象タスクの変換進捗度及び処理優先度から判断して、ユーザ2の指定する仕上がり希望日までには完了しないことが予想される場合は、仮名漢字変換に用いる特定分野辞書を削減したり、収録語彙数の少ない特定分野辞書を用いることで変換に要する時間を低減させる。一方、仕上がり希望日までに完了することが予想される場合は、用いる特定分野辞書を増やし、且つ収録語彙数の多いものを選択することで議事録の精度を向上させる。
Therefore, if it is predicted that the completion will not be completed by the desired finishing date designated by the
図6は、変換進捗度及び処理優先度と用いる特定分野辞書の対応を示す図である。具体的には図6に示す表を基に、用いる特定分野辞書を決定する。図示するように変換進捗度を0以上0.3未満、0.3以上0.7未満、0.7以上1未満の3つの区分に、処理優先度は0以上10未満、10以上20未満、20以上の3つの区分に分割し、変換進捗度と処理優先度の値が属する区分に応じて、用いる特定分野辞書を決定する。 FIG. 6 is a diagram illustrating the correspondence between the conversion progress degree and the processing priority and the specific field dictionary to be used. Specifically, the specific field dictionary to be used is determined based on the table shown in FIG. As shown in the figure, the conversion progress is classified into three categories of 0 or more and less than 0.3, 0.3 or more and less than 0.7, and 0.7 or more and less than 1. The specific field dictionary to be used is determined according to the category to which the values of conversion progress and processing priority belong.
例えば、変換進捗度が0.2、処理優先度が8である場合は、一般用語(300)を用いる。カッコ内の数字は収録語彙数が300語あることを示している。この場合は、変換進捗度が小さく、処理優先度も小さい場合は、用いる特定分野辞書の種類や収録語彙数を下げて議事録の精度を下げることで、仕上がり希望日に議事録の作成が完了するようにする。 For example, when the conversion progress is 0.2 and the processing priority is 8, the general term (300) is used. The numbers in parentheses indicate that there are 300 words recorded. In this case, if the conversion progress is low and the processing priority is low, the minutes are completed on the desired date by reducing the type of specific field dictionary and the number of recorded vocabularies to reduce the accuracy of the minutes. To do.
また、このように精度を落とす場合は、同一の音声データについて、仕上がり希望日を十分に先に設定したタスクを新たに生成してもよい。これによって、精度は低いが当初の仕上がり希望日に間に合うように議事録が作成され、且つ、当初の仕上がり希望日よりも先に完成するものの精度の高い議事録が別途作成されることとなる。 When the accuracy is reduced in this way, a task in which the desired finish date is set sufficiently earlier may be generated for the same audio data. As a result, the minutes are created so as to be in time for the initial desired finish date, although the accuracy is low, and the highly accurate minutes that are completed before the desired finish date are separately created.
なお、議事録自動作成サーバ30とインターネット又はLAN等の通信手段で接続されると共に、音声変換手段33を具備するコンピュータを複数台用意し、議事録自動作成サーバ30のタスク制御手段32によって選出された処理対象タスクを、通信手段を介してこれらのコンピュータに送信し、各コンピュータの音声変換手段33で議事録を作成するよう構成してもよい。これによって、大量のタスクを分散して処理することが可能となり、より処理時間の早い議事録自動作成システムを実現できる。
The minutes
以上に説明したように、本実施形態の議事録自動作成システム1によれば、タスクの処理優先度に基づいて議事録の作成処理を行い、また処理優先度及び変換進捗度に基づいて用いる特定分野辞書を決定するため、仕上がり希望日を遵守して議事録を作成することが可能となる。
As described above, according to the automatic
本発明は音声データから議事録を自動作成する場合に関連する産業に利用できる。 The present invention can be used in industries related to the case of automatically creating minutes from audio data.
1 議事録自動作成システム
2 ユーザ
3 ネットワーク
20 端末
30 議事録自動作成サーバ
31 タスク生成手段
32 タスク制御手段
33 音声変換手段
34 データベース
35 議事録検索手段
DESCRIPTION OF
Claims (4)
前記音声データと前記議事録の仕上がり希望日からタスクを生成するタスク生成手段と、
文字情報への変換を終えた音声データの一部分が全体に占める割合である変換進捗度と前記仕上がり希望日から処理優先度をタスク毎に算出し、前記処理優先度に基づいて処理対象タスクを選出するタスク制御手段と、
前記処理対象タスクの音声データから声紋を抽出し、前記声紋に基づいて前記複数の話者毎の発言データを時系列に抽出すると共に、前記発言データを複数の電子辞書に基づいて文字情報に変換して議事録を作成し、データベースに格納する音声変換手段とを具備し、
前記複数の電子辞書は、収録語彙数を選択できる特定の分野に特化した語彙を収録した複数の特定分野辞書であって、
前記音声変換手段は、前記変換進捗度及び前記処理優先度に基づいて少なくとも1つの前記特定分野辞書とその収録語彙数を選択することで前記議事録の精度を調節する
ことを特徴とする議事録自動作成システム。 A system for automatically creating minutes by converting voice data obtained by encoding the voices of multiple speakers into text information,
Task generation means for generating a task from the desired finish date of the audio data and the minutes;
Processing priority is calculated for each task from the conversion progress, which is the ratio of a portion of the audio data that has been converted to character information, and the desired finish date, and the task to be processed is selected based on the processing priority Task control means,
A voice print is extracted from the voice data of the processing target task, and the voice data for each of the plurality of speakers is extracted in time series based on the voice print, and the voice data is converted into character information based on a plurality of electronic dictionaries. Voice recording means for creating minutes and storing them in a database ,
The plurality of electronic dictionaries are a plurality of specific field dictionaries that include vocabulary specialized for a specific field in which the number of recorded vocabularies can be selected,
The voice conversion means adjusts the accuracy of the minutes by selecting at least one specific field dictionary and the number of recorded vocabulary based on the conversion progress and the processing priority. A system for automatically creating minutes.
前記タスク生成手段は、タスクの前記仕上がり希望日が所定の期間よりも短い場合は、当該タスクと同一の音声データと当該タスクの仕上がり希望日よりも長い仕上がり希望日からなるタスクを新たに生成して精度の高い議事録を別途作成することを特徴とする議事録自動作成システム。 In the automatic minutes creation system according to claim 1,
When the desired finish date of the task is shorter than a predetermined period, the task generation means newly generates a task having the same audio data as the task and a desired finish date longer than the desired finish date of the task. Automatic system for creating minutes, which is characterized by creating separate and highly accurate minutes.
前記データベースは、分類名を含む議事録情報と前記議事録を関連付けて記録すると共に、
前記分類名を指定することで該当する議事録を検索する議事録検索手段を更に具備することを特徴とする議事録自動作成システム。 In the system for automatically creating minutes according to claim 1 or claim 2 ,
The database records the minutes information including the classification name in association with the minutes,
An automatic minutes creation system, further comprising a minutes search means for searching for a corresponding minutes by designating the classification name.
インターネット又はLANを含む通信手段で接続された複数のコンピュータを更に具備し、
前記複数のコンピュータ毎に前記音声変換手段が具備される場合、
前記タスク制御手段は、前記処理優先度に基づいてタスクを前記複数のコンピュータ毎の前記音声変換手段に配分することを特徴とする議事録自動作成システム。 In the automatic minutes creation system according to any one of claims 1 to 3 ,
A plurality of computers connected by communication means including the Internet or LAN;
When the voice conversion means is provided for each of the plurality of computers,
The said task control means distributes a task to the said audio | voice conversion means for every said some computer based on the said process priority, The minutes automatic creation system characterized by the above-mentioned.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005346244A JP4703385B2 (en) | 2005-11-30 | 2005-11-30 | Automatic minutes creation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005346244A JP4703385B2 (en) | 2005-11-30 | 2005-11-30 | Automatic minutes creation system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007149034A JP2007149034A (en) | 2007-06-14 |
JP4703385B2 true JP4703385B2 (en) | 2011-06-15 |
Family
ID=38210341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005346244A Expired - Fee Related JP4703385B2 (en) | 2005-11-30 | 2005-11-30 | Automatic minutes creation system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4703385B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4854704B2 (en) * | 2008-05-15 | 2012-01-18 | コニカミノルタビジネステクノロジーズ株式会社 | Data processing apparatus, voice conversion method, and voice conversion program |
JP5361781B2 (en) * | 2010-03-31 | 2013-12-04 | アルパイン株式会社 | On-vehicle electronic device and voice data dictionary generation method for music data |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1178136A (en) * | 1997-09-16 | 1999-03-23 | Ricoh Co Ltd | Printer |
JP2002182875A (en) * | 2000-12-19 | 2002-06-28 | Dainippon Screen Mfg Co Ltd | Printing controller, printing control method and recording medium |
JP2002344636A (en) * | 2001-05-14 | 2002-11-29 | Fujitsu I-Network Systems Ltd | Agenda automatic generating system in voice conference |
JP2005197867A (en) * | 2004-01-05 | 2005-07-21 | Fuji Photo Film Co Ltd | System and method for conference progress support and utterance input apparatus |
JP2005308950A (en) * | 2004-04-20 | 2005-11-04 | Sony Corp | Speech processors and speech processing system |
-
2005
- 2005-11-30 JP JP2005346244A patent/JP4703385B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1178136A (en) * | 1997-09-16 | 1999-03-23 | Ricoh Co Ltd | Printer |
JP2002182875A (en) * | 2000-12-19 | 2002-06-28 | Dainippon Screen Mfg Co Ltd | Printing controller, printing control method and recording medium |
JP2002344636A (en) * | 2001-05-14 | 2002-11-29 | Fujitsu I-Network Systems Ltd | Agenda automatic generating system in voice conference |
JP2005197867A (en) * | 2004-01-05 | 2005-07-21 | Fuji Photo Film Co Ltd | System and method for conference progress support and utterance input apparatus |
JP2005308950A (en) * | 2004-04-20 | 2005-11-04 | Sony Corp | Speech processors and speech processing system |
Also Published As
Publication number | Publication date |
---|---|
JP2007149034A (en) | 2007-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11004013B2 (en) | Training of chatbots from corpus of human-to-human chats | |
US11676067B2 (en) | System and method for creating data to train a conversational bot | |
US8145482B2 (en) | Enhancing analysis of test key phrases from acoustic sources with key phrase training models | |
US8996371B2 (en) | Method and system for automatic domain adaptation in speech recognition applications | |
US9575936B2 (en) | Word cloud display | |
US7299181B2 (en) | Homonym processing in the context of voice-activated command systems | |
US11954140B2 (en) | Labeling/names of themes | |
US20100070276A1 (en) | Method and apparatus for interaction or discourse analytics | |
US10860566B1 (en) | Themes surfacing for communication data analysis | |
US11514897B2 (en) | Systems and methods relating to bot authoring by mining intents from natural language conversations | |
US10078689B2 (en) | Labeling/naming of themes | |
JP2007058863A (en) | Text categorization system | |
US20200137224A1 (en) | Comprehensive log derivation using a cognitive system | |
US20090049006A1 (en) | Method and system for processing knowledge | |
WO2021046517A2 (en) | Method and system of natural language processing in an enterprise environment | |
JP4703385B2 (en) | Automatic minutes creation system | |
Lackovic et al. | Prediction of user request and complaint in spoken customer-agent conversations | |
US20230163988A1 (en) | Computer-implemented system and method for providing an artificial intelligence powered digital meeting assistant | |
JP2005192024A (en) | Communication voice data management system in call center and operator terminal using the same | |
Brunello et al. | A combined approach to the analysis of speech conversations in a contact center domain | |
JP2006235952A (en) | Business model about information analysis and utilization | |
CN114202203A (en) | Complaint work order processing method and device, storage medium and electronic equipment | |
WO2012098838A1 (en) | Report document creation assistance system, report document creation assistance method, and report document creation assistance program | |
JP2016189510A (en) | Audio information storage device, audio information storage method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080617 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110302 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4703385 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140318 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |