JP7205684B2 - minutes generation system and minutes generation program - Google Patents

minutes generation system and minutes generation program Download PDF

Info

Publication number
JP7205684B2
JP7205684B2 JP2018171569A JP2018171569A JP7205684B2 JP 7205684 B2 JP7205684 B2 JP 7205684B2 JP 2018171569 A JP2018171569 A JP 2018171569A JP 2018171569 A JP2018171569 A JP 2018171569A JP 7205684 B2 JP7205684 B2 JP 7205684B2
Authority
JP
Japan
Prior art keywords
importance
minutes
term
terms
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018171569A
Other languages
Japanese (ja)
Other versions
JP2020042229A (en
Inventor
夏子 宮端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2018171569A priority Critical patent/JP7205684B2/en
Publication of JP2020042229A publication Critical patent/JP2020042229A/en
Application granted granted Critical
Publication of JP7205684B2 publication Critical patent/JP7205684B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、音声データから音声認識によって文字データとしての議事録を生成する議事録生成システムおよび議事録生成プログラムに関する。 BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a minutes generation system and a minutes generation program for generating minutes as text data from voice data by speech recognition.

従来、音声データから音声認識によって文字データとしての議事録を生成する議事録生成システムが知られている(例えば、特許文献1-3参照。)。 2. Description of the Related Art Conventionally, there has been known a minutes generation system that generates minutes as text data from voice data by speech recognition (see Patent Documents 1 to 3, for example).

特開2000-352995号公報JP-A-2000-352995 特開2006-267934号公報JP 2006-267934 A 特開2014-178934号公報JP 2014-178934 A

しかしながら、従来の議事録生成システムにおいては、議事録における重要な内容を利用者に容易に理解させることが困難であるという問題がある。 However, in the conventional minutes generation system, there is a problem that it is difficult for the user to easily understand the important contents of the minutes.

そこで、本発明は、議事録における重要な内容を利用者に容易に理解させることができる議事録生成システムおよび議事録生成プログラムを提供することを目的とする。 SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide a minutes generation system and a minutes generation program that enable a user to easily understand the important contents of the minutes.

本発明の議事録生成システムは、音声データから音声認識によって文字データとしての議事録を生成する議事録生成部と、前記議事録に含まれる用語の重要度を判定する重要度判定部と、前記重要度に基づいた出力内容で前記用語を出力する用語出力部とを備え、前記重要度判定部は、前記音声データにおける音声の音調の変化と、前記音声データにおける音声の音量の変化と、前記音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて前記音声データにおける重要な期間を特定し、前記重要な期間に含まれる前記用語の前記重要度を、前記重要な期間に含まれない前記用語の前記重要度より高く判定することを特徴とする。 The minutes generation system of the present invention includes a minutes generation unit that generates minutes as character data by speech recognition from voice data, an importance determination unit that determines the importance of terms included in the minutes, and a term output unit for outputting the term with output content based on the degree of importance, wherein the degree of importance determination unit controls changes in tone of voice in the voice data, changes in volume of voice in the voice data, and identifying important time periods in the audio data based on at least one of existence of an endorsement term indicating endorsement in the audio data, and including the importance of the terms included in the important time periods in the important time periods. It is characterized in that the importance is determined higher than the importance of the term that is not included in the term.

この構成により、本発明の議事録生成システムは、音声データにおける音声の音調の変化と、音声データにおける音声の音量の変化と、音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて音声データにおける重要な期間を特定し、重要な期間に含まれる用語の重要度を、重要な期間に含まれない用語の重要度より高く判定し、重要度に基づいた出力内容で用語を出力するので、議事録における重要な用語を利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。 With this configuration, the minutes generation system of the present invention is based on at least one of a change in the tone of the voice in the voice data, a change in the volume of the voice in the voice data, and the presence of an approval term indicating approval in the voice data. to identify important periods in the speech data, determine the importance of terms included in the important period to be higher than the importance of terms not included in the important period, and output the terms based on the importance Therefore, the user can easily understand the important terms in the minutes, and as a result, the user can easily understand the important contents in the minutes.

本発明の議事録生成システムにおいて、前記用語出力部は、前記重要度が特定の程度以上である前記用語を強調した状態で前記議事録を出力しても良い。 In the minutes generating system of the present invention, the term output unit may output the minutes while emphasizing the term whose importance is equal to or higher than a specific level.

この構成により、本発明の議事録生成システムは、議事録における重要な用語を議事録上で利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。 With this configuration, the minutes generation system of the present invention can make the user easily understand the important terms in the minutes on the minutes, so that the user can easily understand the important contents in the minutes. be able to.

本発明の議事録生成システムにおいて、前記用語出力部は、前記重要度の大きさ順に、または、前記重要度が特定の程度以上である前記用語を強調した状態で、前記用語の一覧を出力しても良い。 In the minutes generation system of the present invention, the term output unit outputs the list of terms in order of importance or in a state in which the terms having a specific degree of importance or higher are emphasized. can be

この構成により、本発明の議事録生成システムは、議事録における重要な用語を用語の一覧上で利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。 With this configuration, the minutes generation system of the present invention can allow the user to easily understand the important terms in the minutes on the list of terms, so that the user can easily understand the important contents in the minutes. can be made

本発明の議事録生成システムにおいて、前記用語出力部は、前記音声データにおける音声の音調の変化に基づいた値を示す軸と、前記音声データにおける音声の音量の変化に基づいた値を示す軸と、前記音声データにおける前記賛同用語の存在に基づいた値を示す軸とのうち、少なくとも2軸によって構成される空間上に、前記重要度が特定の程度以上である前記用語を配置したマップを出力しても良い。 In the minutes generating system of the present invention, the term output unit has an axis indicating values based on changes in tone of speech in the audio data, and an axis indicating values based on changes in volume of speech in the audio data. and an axis indicating a value based on the presence of the agreeing term in the voice data, and outputting a map in which the terms having the degree of importance equal to or higher than a specific level are arranged on a space formed by at least two axes. You can

この構成により、本発明の議事録生成システムは、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸とのうち、少なくとも2軸によって構成される空間上に用語を配置したマップ上で、議事録における重要な用語の重要度の詳細な内容を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。 With this configuration, the minutes generation system of the present invention has an axis indicating a value based on a change in the tone of the voice in the voice data, an axis indicating a value based on the change in the volume of the voice in the voice data, and an axis indicating the value based on the change in the volume of the voice in the voice data. Users can see the detailed content of the importance of important terms in the minutes on a map that arranges terms on a space composed of at least two axes, one of which indicates the value based on the existence of agreeing terms. Since the content can be easily understood, the user can easily understand the important contents of the minutes.

本発明の議事録生成システムにおいて、前記用語出力部は、前記重要度が特定の程度以上である前記用語同士の相互の関係を示す相互関係図を出力し、前記相互関係図は、前記音声データにおいて同一の前記重要な期間に含まれる前記用語同士が相互に関係があることを示しても良い。 In the minutes generation system of the present invention, the term output unit outputs a correlation diagram showing a mutual relationship between the terms having the degree of importance equal to or higher than a specific level, and the correlation diagram is based on the speech data. may indicate that the terms included in the same significant period are related to each other.

この構成により、本発明の議事録生成システムは、用語同士の相互の関係を示す相互関係図上で、議事録における重要な用語同士の相互の関係を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。 With this configuration, the minutes generation system of the present invention can allow the user to easily understand the mutual relationship between important terms in the minutes on the mutual relationship diagram showing the mutual relationship between terms. , the user can easily understand the important contents in the minutes.

本発明の議事録生成システムにおいて、前記用語出力部は、前記重要度が特定の程度以上である前記用語が含まれるフレーズまたは文を前記議事録から抽出して出力しても良い。 In the minutes generation system of the present invention, the term output unit may extract and output from the minutes a phrase or sentence containing the term having a specific level of importance or higher.

この構成により、本発明の議事録生成システムは、重要度が特定の程度以上である用語が含まれるフレーズまたは文を議事録から抽出して出力するので、議事録における重要なフレーズまたは文を利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。 With this configuration, the minutes generation system of the present invention extracts and outputs phrases or sentences containing terms whose importance is above a certain degree from the minutes, so that important phrases or sentences in the minutes can be used. As a result, the user can easily understand the important contents of the minutes.

本発明の議事録生成プログラムは、音声データから音声認識によって文字データとしての議事録を生成する議事録生成部と、前記議事録に含まれる用語の重要度を判定する重要度判定部と、前記重要度に基づいた出力内容で前記用語を出力する用語出力部とをコンピューターに実現させ、前記重要度判定部は、前記音声データにおける音声の音調の変化と、前記音声データにおける音声の音量の変化と、前記音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて前記音声データにおける重要な期間を特定し、前記重要な期間に含まれる前記用語の前記重要度を、前記重要な期間に含まれない前記用語の前記重要度より高く判定することを特徴とする。 A program for generating minutes of the present invention includes: a minutes generating unit for generating minutes as character data by speech recognition from voice data; an importance determining unit for determining the importance of terms included in the minutes; A term output unit for outputting the term with output content based on the degree of importance is implemented in a computer, and the degree of importance determination unit changes the tone of the voice in the voice data and changes the volume of the voice in the voice data. and presence of an endorsement term indicating endorsement in the voice data; It is characterized in that the importance of the term that is not included in the period is determined to be higher than that of the term.

この構成により、本発明の議事録生成プログラムを実行するコンピューターは、音声データにおける音声の音調の変化と、音声データにおける音声の音量の変化と、音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて音声データにおける重要な期間を特定し、重要な期間に含まれる用語の重要度を、重要な期間に含まれない用語の重要度より高く判定し、重要度に基づいた出力内容で用語を出力するので、議事録における重要な用語を利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。 With this configuration, the computer that executes the program for generating minutes of the present invention detects at least changes in tone of voice in the voice data, changes in volume of voice in the voice data, and presence of approval terms indicating approval in the voice data. Identify important periods in speech data based on one, determine the importance of terms included in the important period higher than the importance of terms not included in the important period, and output content based on the importance Since the terms are output in , the user can easily understand the important terms in the minutes, and as a result, the user can easily understand the important contents in the minutes.

本発明の議事録生成システムおよび議事録生成プログラムは、議事録における重要な内容を利用者に容易に理解させることができる。 INDUSTRIAL APPLICABILITY The minutes generation system and minutes generation program of the present invention can allow the user to easily understand the important contents of the minutes.

本発明の一実施の形態に係る議事録生成システムのブロック図である。1 is a block diagram of a minutes generation system according to an embodiment of the present invention; FIG. 会議の音声データに基づいて議事録を生成する場合の図1に示す議事録生成システムの動作のフローチャートである。FIG. 2 is a flowchart of the operation of the minutes generation system shown in FIG. 1 when minutes are generated based on audio data of a conference; FIG. 図2に示す音調式重要度判定処理のフローチャートである。FIG. 3 is a flowchart of a tonal formula importance determination process shown in FIG. 2; FIG. 図2に示す音量式重要度判定処理のフローチャートである。FIG. 3 is a flowchart of volume-based importance determination processing shown in FIG. 2 ; FIG. 図2に示す賛同用語式重要度判定処理のフローチャートである。FIG. 3 is a flowchart of approval terminology importance degree determination processing shown in FIG. 2 ; FIG. 議事録を出力する場合の図1に示す議事録生成システムの動作のフローチャートである。FIG. 3 is a flowchart of the operation of the minutes generation system shown in FIG. 1 when outputting minutes; FIG. 図1に示す表示部に表示される2次元マップの一例である。2 is an example of a two-dimensional map displayed on the display unit shown in FIG. 1; 図1に示す表示部に表示される相互関係図の一例である。FIG. 2 is an example of an interrelationship diagram displayed on the display unit shown in FIG. 1; FIG.

以下、本発明の実施の形態について、図面を用いて説明する。 BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described with reference to the drawings.

まず、本発明の一実施の形態に係る議事録生成システムの構成について説明する。 First, the configuration of the minutes generation system according to one embodiment of the present invention will be described.

図1は、本実施の形態に係る議事録生成システム10のブロック図である。 FIG. 1 is a block diagram of minutes generation system 10 according to the present embodiment.

図1に示すように、議事録生成システム10は、種々の操作が入力される例えばキーボード、マウスなどの操作デバイスである操作部11と、種々の情報を表示する例えばLCD(Liquid Crystal Display)などの表示デバイスである表示部12と、LAN(Local Area Network)、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部13と、各種の情報を記憶する例えば半導体メモリー、HDD(Hard Disk Drive)などの不揮発性の記憶デバイスである記憶部14と、議事録生成システム10全体を制御する制御部15とを備えている。議事録生成システム10は、PC(Personal Computer)などのコンピューターによって構成されている。 As shown in FIG. 1, the minutes generation system 10 includes an operation unit 11, which is an operation device such as a keyboard and a mouse for inputting various operations, and an LCD (Liquid Crystal Display) for displaying various information. and a communication device that communicates with an external device via a network such as a LAN (Local Area Network) or the Internet, or directly by wire or wirelessly without a network. 13, a storage unit 14 which is a non-volatile storage device such as a semiconductor memory or HDD (Hard Disk Drive) that stores various information, and a control unit 15 that controls the entire minutes generation system 10. there is The minutes generation system 10 is configured by a computer such as a PC (Personal Computer).

記憶部14は、議事録を生成するための議事録生成プログラム14aを記憶している。議事録生成プログラム14aは、例えば、議事録生成システム10の製造段階で議事録生成システム10にインストールされていても良いし、CD(Compact Disk)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリーなどの外部の記憶媒体から議事録生成システム10に追加でインストールされても良いし、ネットワーク上から議事録生成システム10に追加でインストールされても良い。 The storage unit 14 stores a minutes generation program 14a for generating minutes. For example, the minutes generation program 14a may be installed in the minutes generation system 10 at the manufacturing stage of the minutes generation system 10, or may be installed on a CD (Compact Disk), a DVD (Digital Versatile Disk), or a USB (Universal Serial Bus). ) It may be additionally installed in the minutes generation system 10 from an external storage medium such as a memory, or may be additionally installed in the minutes generation system 10 from the network.

記憶部14は、議事録のデータ(以下「議事録データ」という。)14bを記憶可能である。記憶部14は、議事録データ14b以外にも、議事録データを少なくとも1つ記憶可能である。 The storage unit 14 can store minutes data (hereinafter referred to as "minutes data") 14b. The storage unit 14 can store at least one piece of minutes data in addition to the minutes data 14b.

記憶部14は、例えば「なるほど」、「いいね」などの賛同を示す用語(以下「賛同用語」という。)が登録される賛同用語データベース14cを記憶している。 The storage unit 14 stores an agreement terminology database 14c in which terms indicating agreement (hereinafter referred to as “agreement terms”) such as “I see” and “like” are registered.

記憶部14は、会議に参加する可能性がある者の音声の特徴を発声者毎に示す音声特徴情報14dを記憶可能である。 The storage unit 14 can store voice feature information 14d indicating voice features of persons who are likely to participate in the conference for each speaker.

制御部15は、例えば、CPU(Central Processing Unit)と、プログラムおよび各種のデータを記憶しているROM(Read Only Memory)と、制御部15のCPUの作業領域として用いられるメモリーとしてのRAM(Random Access Memory)とを備えている。制御部15のCPUは、記憶部14または制御部15のROMに記憶されているプログラムを実行する。 The control unit 15 includes, for example, a CPU (Central Processing Unit), a ROM (Read Only Memory) storing programs and various data, and a RAM (Random Access Memory). The CPU of the control unit 15 executes programs stored in the storage unit 14 or the ROM of the control unit 15 .

制御部15は、議事録生成プログラム14aを実行することによって、音声データから音声認識によって文字データとしての議事録を生成する議事録生成部15aと、議事録に含まれる用語の重要度を判定する重要度判定部15bと、重要度に基づいた出力内容で用語を出力する用語出力部15cとを実現する。 By executing the minutes generation program 14a, the control unit 15 determines the minutes generation unit 15a that generates the minutes as character data by speech recognition from voice data and the importance of terms included in the minutes. An importance determination unit 15b and a term output unit 15c for outputting terms based on the importance are realized.

次に、議事録生成システム10の動作について説明する。 Next, the operation of the minutes generation system 10 will be described.

まず、会議の音声データに基づいて議事録を生成する場合の議事録生成システム10の動作について説明する。 First, the operation of the minutes generation system 10 when generating minutes based on audio data of a conference will be described.

図2は、会議の音声データに基づいて議事録を生成する場合の議事録生成システム10の動作のフローチャートである。 FIG. 2 is a flow chart of the operation of minutes generation system 10 when minutes are generated based on audio data of a conference.

利用者は、議事録の生成の基になる音声データ(以下「対象音声データ」という。)を操作部11を介して指定して、議事録生成システム10に議事録の生成を操作部11を介して指示することができる。議事録生成システム10の議事録生成部15aは、議事録の生成が指示されると、図2に示す動作を実行する。 The user designates the audio data on which the minutes are to be generated (hereinafter referred to as "target audio data") through the operation unit 11, and instructs the minutes generation system 10 to generate the minutes. can be directed through When the minutes generation unit 15a of the minutes generation system 10 is instructed to generate the minutes, it performs the operation shown in FIG.

図2に示すように、議事録生成部15aは、音声特徴情報14dを利用して対象音声データに対して音声認識を実行することによって、対象音声データに含まれる音声の発声者を全て検出する(S51)。 As shown in FIG. 2, the minutes generating unit 15a detects all speakers of the speech contained in the target speech data by executing speech recognition on the target speech data using the speech feature information 14d. (S51).

次いで、議事録生成部15aは、対象音声データに対して音声認識を実行することによって、対象音声データから文字データを生成する(S52)。ここで、議事録生成部15aは、対象音声データから文字データを生成する場合、対象音声データから生成した文字データにおけるいずれの文字が、S51において検出したいずれの発声者による発言に基づいた文字であるかも特定する。 Next, the minutes generating unit 15a generates character data from the target voice data by performing voice recognition on the target voice data (S52). Here, when the minutes generating unit 15a generates character data from the target voice data, any character in the character data generated from the target voice data is a character based on an utterance by any speaker detected in S51. Identify if there is.

次いで、重要度判定部15bは、S52において生成した文字データに含まれる用語を抽出する(S53)。重要度判定部15bは、S53において、重複がないように用語を抽出する。 Next, the importance determination unit 15b extracts terms included in the character data generated in S52 (S53). In S53, the importance determination unit 15b extracts terms so that there is no duplication.

次いで、重要度判定部15bは、音声データにおける音調の変化に基づいて用語の重要度を判定する音調式重要度判定処理を実行する(S54)。 Next, the importance determination unit 15b executes tone-based importance determination processing for determining the importance of a term based on changes in tone in the voice data (S54).

図3は、音調式重要度判定処理のフローチャートである。 FIG. 3 is a flow chart of the tone formula importance determination process.

図3に示すように、重要度判定部15bは、S51において検出された全ての発声者のうち、今回の音調式重要度判定処理において未だ対象にしていない1人の発声者のみを対象とする(S61)。 As shown in FIG. 3, the importance determination unit 15b selects only one speaker, which has not yet been targeted in the current tone-type importance determination process, among all the speakers detected in S51. (S61).

次いで、重要度判定部15bは、対象音声データにおいて現在の対象の発声者の音声の音調が特定の高さ超になる時点を検索する(S62)。ここで、特定の高さは、対象音声データにおける現在の対象の発声者の音声に基づいて設定されても良いし、音声特徴情報14dにおける現在の対象の発声者の音声に基づいて設定されても良い。例えば、特定の高さは、対象音声データにおける現在の対象の発声者の最初の音声の高さでも良いし、対象音声データにおける現在の対象の発声者の全ての音声の高さの平均でも良い。 Next, the importance determination unit 15b searches for a point in time when the tone of the current target speaker's voice exceeds a specific pitch in the target voice data (S62). Here, the specific height may be set based on the current target speaker's voice in the target voice data, or may be set based on the current target speaker's voice in the voice feature information 14d. Also good. For example, the specific pitch may be the first pitch of the current target speaker in the target speech data, or the average of all pitches of the current target speaker in the target speech data. .

次いで、重要度判定部15bは、S62における検索において現在の対象の発声者の音声の音調が特定の高さ超になる時点が抽出されたか否かを判断する(S63)。 Next, the importance determination unit 15b determines whether or not the point in time when the tone of the voice of the current target speaker exceeds a specific pitch has been extracted in the search in S62 (S63).

重要度判定部15bは、現在の対象の発声者の音声の音調が特定の高さ超になる時点が抽出されたとS63において判断すると、S62における検索において抽出された時点のうち、今回の音調式重要度判定処理において未だ対象にしていない1つの時点のみを対象とする(S64)。 If the importance determination unit 15b determines in S63 that the time point at which the tone of the voice of the current target speaker exceeds a specific pitch has been extracted, the current tone formula Only one time point that has not yet been targeted in the importance determination process is targeted (S64).

重要度判定部15bは、S64の処理の後、対象音声データにおいて現在の対象の時点を含む特定の期間を重要な期間として特定する(S65)。ここで、現在の対象の時点を含む特定の期間とは、例えば、現在の対象の時点を基準として前の10秒と、後ろの10秒との合計20秒間である。 After the processing of S64, the importance determination unit 15b identifies a specific period including the current target time point in the target audio data as an important period (S65). Here, the specific period including the current target time is, for example, a total of 20 seconds including 10 seconds before and 10 seconds after the current target time.

重要度判定部15bは、S65の処理の後、S53において抽出された用語のうち、対象音声データにおいてS65において特定した期間に含まれる用語の重要度に特定の値を加算する(S66)。ここで、重要度判定部15bは、S65において特定した期間に対象の用語が1回存在する場合には対象の用語の重要度に1ポイントを加算し、2回存在する場合には対象の用語の重要度に2ポイントを加算し、3回存在する場合には対象の用語の重要度に3ポイントを加算するなど、S65において特定した期間に対象の用語が存在する回数に応じたポイントを対象の用語の重要度にS66において加算する。また、重要度判定部15bは、S65において特定した期間に用語の後端が含まれる場合にのみ、S65において特定した期間に、この用語が含まれるとS66において判定する。 After the process of S65, the importance determination unit 15b adds a specific value to the importance of the terms included in the period specified in S65 in the target speech data among the terms extracted in S53 (S66). Here, the importance determination unit 15b adds 1 point to the importance of the target term when the target term exists once in the period specified in S65, and adds 1 point to the target term when it exists twice. 2 points are added to the importance of the term, and if it exists 3 times, 3 points are added to the importance of the target term. is added in S66 to the importance of the term. Further, only when the period specified in S65 includes the trailing end of the term, the importance determination unit 15b determines in S66 that the term is included in the period specified in S65.

重要度判定部15bは、S66の処理の後、S62における検索において抽出された全ての時点を今回の音調式重要度判定処理において対象にしたか否かを判断する(S67)。 After the process of S66, the importance determination unit 15b determines whether or not all the time points extracted in the search in S62 are targeted in the current tone-type importance determination process (S67).

重要度判定部15bは、S62における検索において抽出された少なくとも1つの時点を未だ対象にしていないとS67において判断すると、S64の処理を実行する。 When the importance determination unit 15b determines in S67 that at least one time point extracted in the search in S62 is not yet targeted, it executes the process of S64.

重要度判定部15bは、現在の対象の発声者の音声の音調が特定の高さ超になる時点が抽出されなかったとS63において判断するか、S62における検索において抽出された全ての時点を対象にしたとS67において判断すると、S51において検出された全ての発声者を今回の音調式重要度判定処理において対象にしたか否かを判断する(S68)。 The importance determination unit 15b determines in S63 that no point in time when the tone of the voice of the current target speaker exceeds a specific pitch has been extracted, or determines in S62 that all the points in time extracted in the search in S62 are targeted. If it is determined in S67 that it has, it is determined whether or not all the speakers detected in S51 have been targeted in the current tone formula importance determination process (S68).

重要度判定部15bは、S51において検出された少なくとも1人の発声者を未だ対象にしていないとS68において判断すると、S61の処理を実行する。 If the importance determination unit 15b determines in S68 that at least one speaker detected in S51 is not yet targeted, it executes the process of S61.

重要度判定部15bは、S51において検出された全ての発声者を対象にしたとS68において判断すると、図3に示す音調式重要度判定処理を終了する。 When the importance determination unit 15b determines in S68 that all the speakers detected in S51 have been targeted, it terminates the tone-based importance determination process shown in FIG.

図2に示すように、重要度判定部15bは、S54の音調式重要度判定処理の後、音声データにおける音量の変化に基づいて用語の重要度を判定する音量式重要度判定処理を実行する(S55)。 As shown in FIG. 2, after the tone-based importance determination process in S54, the importance determination unit 15b executes a volume-based importance determination process that determines the importance of a term based on changes in volume in the voice data. (S55).

図4は、音量式重要度判定処理のフローチャートである。 FIG. 4 is a flowchart of volume-based importance determination processing.

図4に示すように、重要度判定部15bは、S51において検出された全ての発声者のうち、今回の音量式重要度判定処理において未だ対象にしていない1人の発声者のみを対象とする(S71)。 As shown in FIG. 4, the importance determination unit 15b selects only one speaker, which has not yet been targeted in the current volume-based importance determination process, among all the speakers detected in S51. (S71).

次いで、重要度判定部15bは、対象音声データにおいて現在の対象の発声者の音声の音量が特定の大きさ超になる時点を検索する(S72)。ここで、特定の大きさは、対象音声データにおける現在の対象の発声者の音声に基づいて設定されても良いし、音声特徴情報14dにおける現在の対象の発声者の音声に基づいて設定されても良い。例えば、特定の大きさは、対象音声データにおける現在の対象の発声者の最初の音声の大きさでも良いし、対象音声データにおける現在の対象の発声者の全ての音声の大きさの平均でも良い。 Next, the importance determination unit 15b searches for a point in time when the volume of the current target speaker's voice exceeds a specific level in the target voice data (S72). Here, the specific magnitude may be set based on the current target speaker's voice in the target voice data, or may be set based on the current target speaker's voice in the voice feature information 14d. Also good. For example, the specific loudness may be the initial loudness of the current target speaker in the target speech data, or the average loudness of all the voices of the current target speaker in the target speech data. .

次いで、重要度判定部15bは、S72における検索において現在の対象の発声者の音声の音量が特定の大きさ超になる時点が抽出されたか否かを判断する(S73)。 Next, the importance determination unit 15b determines whether or not the time point at which the sound volume of the voice of the current target speaker exceeds a specific level has been extracted in the search in S72 (S73).

重要度判定部15bは、現在の対象の発声者の音声の音量が特定の大きさ超になる時点が抽出されたとS73において判断すると、S72における検索において抽出された時点のうち、今回の音量式重要度判定処理において未だ対象にしていない1つの時点のみを対象とする(S74)。 If the importance level determination unit 15b determines in S73 that a time point at which the volume of the voice of the current target speaker exceeds a specific level has been extracted, the current volume formula Only one time point that has not yet been targeted in the importance determination process is targeted (S74).

重要度判定部15bは、S74の処理の後、対象音声データにおいて現在の対象の時点を含む特定の期間を重要な期間として特定する(S75)。ここで、現在の対象の時点を含む特定の期間とは、例えば、現在の対象の時点を基準として前の10秒と、後ろの10秒との合計20秒間である。 After the process of S74, the importance determination unit 15b identifies a specific period including the current target time point in the target audio data as an important period (S75). Here, the specific period including the current target time is, for example, a total of 20 seconds including 10 seconds before and 10 seconds after the current target time.

重要度判定部15bは、S75の処理の後、S53において抽出された用語のうち、対象音声データにおいてS75において特定した期間に含まれる用語の重要度に特定の値を加算する(S76)。ここで、重要度判定部15bは、S75において特定した期間に対象の用語が存在する回数に応じたポイントを対象の用語の重要度にS76において加算する。また、重要度判定部15bは、S75において特定した期間に用語の後端が含まれる場合にのみ、S75において特定した期間に、この用語が含まれるとS76において判定する。 After the process of S75, the importance determination unit 15b adds a specific value to the importance of the terms included in the period specified in S75 in the target speech data among the terms extracted in S53 (S76). Here, in S76, the importance determination unit 15b adds points corresponding to the number of times the target term exists during the period specified in S75 to the importance of the target term. Further, only when the period specified in S75 includes the trailing end of the term, the importance determination unit 15b determines in S76 that the term is included in the period specified in S75.

重要度判定部15bは、S76の処理の後、S72における検索において抽出された全ての時点を今回の音量式重要度判定処理において対象にしたか否かを判断する(S77)。 After the processing of S76, the importance determination unit 15b determines whether or not all time points extracted in the search in S72 are targeted in the current volume-based importance determination processing (S77).

重要度判定部15bは、S72における検索において抽出された少なくとも1つの時点を未だ対象にしていないとS77において判断すると、S74の処理を実行する。 When the importance determination unit 15b determines in S77 that at least one time point extracted in the search in S72 is not yet targeted, it executes the process of S74.

重要度判定部15bは、現在の対象の発声者の音声の音量が特定の大きさ超になる時点が抽出されなかったとS73において判断するか、S72における検索において抽出された全ての時点を対象にしたとS77において判断すると、S51において検出された全ての発声者を今回の音量式重要度判定処理において対象にしたか否かを判断する(S78)。 The importance determination unit 15b determines in S73 that no time point at which the volume of the voice of the current target speaker exceeds a specific level has been extracted, or all time points extracted in the search in S72 are targeted. If it is determined in S77 that it has, it is determined whether or not all the speakers detected in S51 have been targeted in the current volume-based importance determination process (S78).

重要度判定部15bは、S51において検出された少なくとも1人の発声者を未だ対象にしていないとS78において判断すると、S71の処理を実行する。 If the importance determination unit 15b determines in S78 that at least one speaker detected in S51 is not yet targeted, it executes the process of S71.

重要度判定部15bは、S51において検出された全ての発声者を対象にしたとS78において判断すると、図4に示す音量式重要度判定処理を終了する。 When the importance determination unit 15b determines in S78 that all the speakers detected in S51 have been targeted, the volume-based importance determination process shown in FIG. 4 ends.

図2に示すように、重要度判定部15bは、S55の音量式重要度判定処理の後、音声データにおける賛同用語の存在に基づいて用語の重要度を判定する賛同用語式重要度判定処理を実行する(S56)。 As shown in FIG. 2, after the volume level importance determination process in S55, the importance determination unit 15b performs the approval term type importance level determination process for determining the importance of terms based on the existence of the approval terms in the voice data. Execute (S56).

図5は、賛同用語式重要度判定処理のフローチャートである。 FIG. 5 is a flow chart of the approval term expression importance determination process.

図5に示すように、重要度判定部15bは、S51において検出された全ての発声者のうち、今回の賛同用語式重要度判定処理において未だ対象にしていない1人の発声者のみを対象とする(S81)。 As shown in FIG. 5, the importance determination unit 15b selects only one speaker, which has not yet been targeted in this approval term expression importance determination process, among all the speakers detected in S51. (S81).

次いで、重要度判定部15bは、S52において生成した文字データと、賛同用語データベース14cとに基づいて、対象音声データにおいて現在の対象の発声者によって賛同用語が発声された時点を検索する(S82)。ここで、重要度判定部15bは、対象音声データにおける賛同用語の後端に対応する時点を、賛同用語が発声された時点として扱う。 Next, the importance determination unit 15b searches for the point in time at which the current target speaker uttered an approval term in the target voice data based on the character data generated in S52 and the approval term database 14c (S82). . Here, the importance determination unit 15b treats the point of time corresponding to the trailing end of the approving term in the target voice data as the point of time when the approving term is uttered.

次いで、重要度判定部15bは、S82における検索において現在の対象の発声者によって賛同用語が発声された時点が抽出されたか否かを判断する(S83)。 Next, the importance determination unit 15b determines whether or not the point in time at which the current target speaker uttered an approving term was extracted in the search in S82 (S83).

重要度判定部15bは、現在の対象の発声者によって賛同用語が発声された時点が抽出されたとS83において判断すると、S82における検索において抽出された時点のうち、今回の賛同用語式重要度判定処理において未だ対象にしていない1つの時点のみを対象とする(S84)。 If the importance determination unit 15b determines in S83 that the time point at which the current target speaker uttered an approving term was extracted, the importance determination unit 15b selects the time points extracted in the search in S82 for the current approving term expression importance determination process. Only one point in time that has not yet been targeted is targeted (S84).

重要度判定部15bは、S84の処理の後、対象音声データにおいて現在の対象の時点を含む特定の期間を重要な期間として特定する(S85)。ここで、現在の対象の時点を含む特定の期間とは、例えば、現在の対象の時点を基準として前の10秒と、後ろの10秒との合計20秒間である。 After the processing of S84, the importance determination unit 15b identifies a specific period including the current target time point in the target audio data as an important period (S85). Here, the specific period including the current target time is, for example, a total of 20 seconds including 10 seconds before and 10 seconds after the current target time.

重要度判定部15bは、S85の処理の後、S53において抽出された用語のうち、対象音声データにおいてS85において特定した期間に含まれる用語の重要度に特定の値を加算する(S86)。ここで、重要度判定部15bは、S85において特定した期間に対象の用語が存在する回数に応じたポイントを対象の用語の重要度にS86において加算する。また、重要度判定部15bは、S85において特定した期間に用語の後端が含まれる場合にのみ、S85において特定した期間に、この用語が含まれるとS86において判定する。 After the process of S85, the importance determination unit 15b adds a specific value to the importance of terms included in the period specified in S85 in the target speech data among the terms extracted in S53 (S86). Here, in S86, the importance determination unit 15b adds points according to the number of times the target term exists during the period specified in S85 to the importance of the target term. Also, only when the period specified in S85 includes the trailing end of the term, the importance determination unit 15b determines in S86 that the term is included in the period specified in S85.

重要度判定部15bは、S86の処理の後、S82における検索において抽出された全ての時点を今回の賛同用語式重要度判定処理において対象にしたか否かを判断する(S87)。 After the process of S86, the importance determination unit 15b determines whether or not all the time points extracted in the search in S82 have been targeted in the current approval term expression importance determination process (S87).

重要度判定部15bは、S82における検索において抽出された少なくとも1つの時点を未だ対象にしていないとS87において判断すると、S84の処理を実行する。 If the importance determination unit 15b determines in S87 that at least one time point extracted in the search in S82 is not yet targeted, it executes the process of S84.

重要度判定部15bは、現在の対象の発声者によって賛同用語が発声された時点が抽出されなかったとS83において判断するか、S82における検索において抽出された全ての時点を対象にしたとS87において判断すると、S51において検出された全ての発声者を今回の賛同用語式重要度判定処理において対象にしたか否かを判断する(S88)。 The importance determination unit 15b determines in S83 that the time point at which the current target speaker uttered the term of agreement was not extracted, or determines in S87 that all the time points extracted in the search in S82 were targeted. Then, it is determined whether or not all the speakers detected in S51 have been targeted in the current approval term expression importance determination process (S88).

重要度判定部15bは、S51において検出された少なくとも1人の発声者を未だ対象にしていないとS88において判断すると、S81の処理を実行する。 If the importance determination unit 15b determines in S88 that at least one speaker detected in S51 is not yet targeted, it executes the process of S81.

重要度判定部15bは、S51において検出された全ての発声者を対象にしたとS88において判断すると、図5に示す賛同用語式重要度判定処理を終了する。 When the importance determination unit 15b determines in S88 that all the speakers detected in S51 have been targeted, the approval terminology expression importance determination process shown in FIG. 5 ends.

図2に示すように、重要度判定部15bは、S56の賛同用語式重要度判定処理の後、S54~S56の処理によって用語毎に判定された重要度を示す用語重要度情報を生成する(S57)。 As shown in FIG. 2, the importance determination unit 15b generates term importance information indicating the importance determined for each term by the processing of S54 to S56 after the approval terminology importance determination processing of S56 ( S57).

次いで、議事録生成部15aは、S52において生成した文字データと、S57において生成した用語重要度情報とを含む議事録データを生成する(S58)。 Next, the minutes generating unit 15a generates minutes data including the character data generated in S52 and the term importance information generated in S57 (S58).

次いで、議事録生成部15aは、S58において生成した議事録データを記憶部14に記憶して(S59)、図2に示す動作を終了する。 Next, the minutes generation unit 15a stores the minutes data generated in S58 in the storage unit 14 (S59), and ends the operation shown in FIG.

次に、議事録を出力する場合の議事録生成システム10の動作について説明する。 Next, the operation of the minutes generation system 10 when outputting minutes will be described.

図6は、議事録を出力する場合の議事録生成システム10の動作のフローチャートである。 FIG. 6 is a flowchart of the operation of the minutes generation system 10 when outputting minutes.

利用者は、記憶部14に記憶されているいずれかの議事録データを操作部11を介して指定して、議事録生成システム10に議事録の出力を操作部11を介して指示することができる。議事録生成システム10の用語出力部15cは、議事録の出力が指示されると、図6に示す動作を実行する。 The user can specify any of the minutes data stored in the storage unit 14 via the operation unit 11 and instruct the minutes generation system 10 to output the minutes via the operation unit 11. can. When instructed to output the minutes, the term output unit 15c of the minutes generation system 10 performs the operation shown in FIG.

図6に示すように、用語出力部15cは、議事録データの用語重要度情報に基づいて、特定の程度、すなわち、特定のポイント以上の重要度が付されている用語を抽出する(S91)。 As shown in FIG. 6, the term output unit 15c extracts terms given a specific degree of importance, ie, a specific point or more, based on the term importance information of the minutes data (S91). .

次いで、用語出力部15cは、S91において抽出した用語を強調した状態で、議事録データに含まれる文字データ、すなわち、議事録を表示部12への表示によって出力して(S92)、図6に示す動作を終了する。ここで、S92における強調の方法としては、種々の方法を採用することが可能である。例えば、用語出力部15cは、S91において抽出した用語を、S91において抽出していない用語より太字にしたり、S91において抽出していない用語よりフォントサイズを大きくしたり、S91において抽出していない用語とはフォントの種類を変えたりすることによって強調することができる。 Next, the term output unit 15c outputs the character data included in the minutes data, that is, the minutes by displaying them on the display unit 12 with the terms extracted in S91 emphasized (S92). Terminate the indicated operation. Here, various methods can be adopted as the method of emphasis in S92. For example, the term output unit 15c makes the terms extracted in S91 bolder than the terms not extracted in S91, makes the font size larger than the terms not extracted in S91, or makes the terms not extracted in S91 bolder. can be emphasized by changing the type of font.

議事録生成システム10は、重要度が特定の程度以上である用語を強調した状態で議事録を出力する(S92)ので、議事録における重要な用語を議事録上で利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。 The minutes generation system 10 outputs the minutes in a state in which terms having a degree of importance above a certain level are emphasized (S92), so that the user can easily understand the important terms in the minutes. As a result, the user can easily understand the important contents of the minutes.

なお、用語出力部15cは、対象音声データに含まれる用語の出力方法として、図6に示す出力方法以外の方法を採用しても良い。例えば、用語出力部15cは、対象音声データに含まれる用語の出力方法として、以下に説明する種々の方法を採用しても良い。用語出力部15cは、対象音声データに含まれる用語の出力方法を、操作部11を介した指示に応じて切り替えても良い。 Note that the term output unit 15c may employ a method other than the output method shown in FIG. 6 as a method for outputting terms included in the target speech data. For example, the term output unit 15c may adopt various methods described below as a method of outputting terms included in the target speech data. The term output unit 15 c may switch the method of outputting terms included in the target speech data according to an instruction via the operation unit 11 .

例えば、用語出力部15cは、対象音声データに含まれる用語の一覧を表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。なお、用語出力部15cは、対象音声データに含まれる用語の全てではなく、対象音声データに含まれる用語の一部の一覧を表示しても良い。例えば、用語出力部15cは、対象音声データに含まれる用語のうち、議事録データの用語重要度情報における重要度が1ポイント以上である用語の一覧を表示しても良い。用語出力部15cは、議事録データの用語重要度情報における重要度の大きさ順に用語の一覧を表示部12に表示しても良い。また、用語出力部15cは、用語の一覧を表示部12に表示する場合に、議事録データの用語重要度情報における重要度が特定の程度以上である用語を強調した状態で表示しても良い。ここで、強調の方法としては、種々の方法を採用することが可能である。例えば、用語出力部15cは、議事録データの用語重要度情報における重要度が特定の程度以上である用語を、議事録データの用語重要度情報における重要度が特定の程度未満である用語より太字にしたり、議事録データの用語重要度情報における重要度が特定の程度未満である用語よりフォントサイズを大きくしたり、議事録データの用語重要度情報における重要度が特定の程度未満である用語とはフォントの種類を変えたりすることによって強調することができるし、議事録データの用語重要度情報における重要度が特定の程度以上である用語を、議事録データの用語重要度情報における重要度が特定の程度未満である用語より上位に配置することによって強調することができる。 For example, the term output unit 15c may output terms included in the target voice data by displaying a list of terms included in the target voice data on the display unit 12 . Note that the term output unit 15c may display a list of some of the terms included in the target voice data instead of all the terms included in the target voice data. For example, the term output unit 15c may display a list of terms whose importance in the term importance information of the minutes data is 1 point or more, among the terms included in the target voice data. The term output unit 15c may display a list of terms on the display unit 12 in order of importance in the term importance information of the minutes data. In addition, when displaying a list of terms on the display unit 12, the term output unit 15c may display terms in a state in which terms having a specific degree of importance or more in the term importance information of the minutes data are emphasized. . Here, various methods can be adopted as the method of emphasis. For example, the term output unit 15c puts terms whose importance in the term importance information of the minutes data is above a specific level in bolder than terms whose importance in the term importance information of the minutes data is less than a specific level. , the font size is made larger than the terms whose importance in the term importance information of the minutes data is less than a certain degree, and the terms whose importance in the term importance information of the minutes data is less than a certain degree can be emphasized by changing the font type. Emphasis can be given by prioritizing terms that are less than a certain degree.

議事録生成システム10は、重要度の大きさ順に、または、重要度が特定の程度以上である用語を強調した状態で、用語の一覧を出力する場合、議事録における重要な用語を用語の一覧上で利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。 When the minutes generation system 10 outputs a list of terms in order of degree of importance or in a state in which terms with a degree of importance above a certain level are emphasized, the important terms in the minutes are displayed in the list of terms. Since the user can easily understand the above, it is possible to make the user easily understand the important contents of the minutes.

例えば、用語出力部15cは、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸とのうち、いずれか2軸によって構成される2次元空間上に用語を配置した2次元マップを表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。例えば、用語出力部15cは、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸とのうち、利用者によって選択された2軸によって構成される2次元空間上に用語を配置した2次元マップを表示部12に表示しても良い。 For example, the term output unit 15c has an axis indicating values based on changes in the tone of the voice in the voice data, an axis indicating values based on changes in the volume of the voice in the voice data, and an axis indicating the values based on changes in the volume of the voice in the voice data. By displaying on the display unit 12 a two-dimensional map in which the terms are arranged in a two-dimensional space constituted by any two of the axes indicating the values based on the data, the terms contained in the target speech data are output. can be For example, the term output unit 15c has an axis indicating values based on changes in the tone of the voice in the voice data, an axis indicating values based on changes in the volume of the voice in the voice data, and an axis indicating the values based on changes in the volume of the voice in the voice data. The display unit 12 may display a two-dimensional map in which the terms are arranged in a two-dimensional space configured by two axes selected by the user from among the axes indicating the values based on the values.

ここで、音声データにおける音声の音調の変化に基づいた値としては、例えば、音調式重要度判定処理において用語毎に加算した重要度や、音調式重要度判定処理において重要度を加算した要因になった発声者の、用語毎の人数が採用されることができる。音声データにおける音声の音量の変化に基づいた値としては、例えば、音量式重要度判定処理において用語毎に加算した重要度や、音量式重要度判定処理において重要度を加算した要因になった発声者の、用語毎の人数が採用されることができる。音声データにおける賛同用語の存在に基づいた値としては、例えば、賛同用語式重要度判定処理において用語毎に加算した重要度や、賛同用語式重要度判定処理において重要度を加算した要因になった発声者の、用語毎の人数が採用されることができる。 Here, values based on changes in the tone of speech in speech data include, for example, the importance added to each term in the tone-based importance determination process, and the factor added to the importance in the tone-based importance determination process. The number of different speakers per term can be taken. Values based on changes in voice volume in voice data include, for example, the importance added for each term in the volume-based importance determination process, and the utterance that was the factor for adding the importance in the volume-based importance determination process. of persons per term can be employed. Values based on the presence of agreeing terms in voice data include, for example, the importance added for each term in the agreeing term expression importance determination process, and the factor added to the importance in the agreeing term expression importance determination process. The number of speakers per term can be employed.

なお、用語出力部15cは、対象音声データに含まれる用語の全てではなく、対象音声データに含まれる用語の一部を2次元マップ上に表示しても良い。例えば、用語出力部15cは、対象音声データに含まれる用語のうち、議事録データの用語重要度情報における重要度が特定の程度以上である用語のみを2次元マップ上に表示しても良い。 Note that the term output unit 15c may display some of the terms included in the target voice data on the two-dimensional map instead of all the terms included in the target voice data. For example, the term output unit 15c may display, on the two-dimensional map, only terms whose importance in the term importance information of the minutes data is equal to or higher than a specific level, among the terms included in the target audio data.

図7は、音声データにおける音声の音調の変化に基づいた値として、音調式重要度判定処理において用語毎に加算した重要度を示す軸と、音声データにおける賛同用語の存在に基づいた値として、賛同用語式重要度判定処理において用語毎に加算した重要度を示す軸との2軸によって構成される2次元空間上に用語を配置した2次元マップ20の一例である。2次元マップ20には、用語21~25が配置されている。例えば、2次元マップ20において、用語21は、音調が高くなった時点を含む特定の期間に発声されていることと、賛同用語が発声された時点を含む特定の期間に発声されていることとの両方が多く、非常に重要な用語である可能性が高い。また、2次元マップ20において、用語22は、賛同用語が発声された時点を含む特定の期間に発声されていることが多いが、音調が高くなった時点を含む特定の期間に発声されていることが少ないので、用語21よりは重要ではない可能性が高い。また、2次元マップ20において、用語24は、音調が高くなった時点を含む特定の期間に発声されていることが多いが、賛同用語が発声された時点を含む特定の期間に発声されていることが少ないので、用語21よりは重要ではない可能性が高い。また、2次元マップ20において、用語25は、音調が高くなった時点を含む特定の期間に発声されていることと、賛同用語が発声された時点を含む特定の期間に発声されていることとの両方が少なく、用語21~24よりは重要ではない可能性が高い。 FIG. 7 shows, as values based on changes in the tone of speech in speech data, an axis indicating the degree of importance added for each term in the tone-based importance determination process, and values based on the presence of agreeing terms in speech data, It is an example of a two-dimensional map 20 in which terms are arranged in a two-dimensional space formed by two axes, one being an axis indicating the degree of importance added to each term in the approval term expression importance determination process. Terms 21 to 25 are arranged on the two-dimensional map 20 . For example, in the two-dimensional map 20, the term 21 is uttered in a specific period including the point in time when the tone became high, and uttered in a specific period including the point in time when the agreeing term is uttered. Both are likely to be many and very important terms. Also, in the two-dimensional map 20, the term 22 is often uttered in a specific period including the point in time when the approving term is uttered, but it is uttered in a specific period including the point in time when the tone becomes high. It is likely to be less important than term 21 because it is less relevant. Also, in the two-dimensional map 20, the term 24 is often uttered in a specific period including the point in time when the tone becomes high, but it is uttered in a specific period including the point in time when the agreeing term is uttered. It is likely to be less important than term 21 because it is less relevant. Also, in the two-dimensional map 20, the term 25 is uttered in a specific period including the point in time when the tone becomes high, and uttered in a specific period including the point in time when the agreeing term is uttered. are both minor and likely less important than terms 21-24.

なお、用語出力部15cは、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸との3軸によって構成される3次元空間上に用語を配置した3次元マップを表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。 Note that the term output unit 15c has an axis indicating a value based on a change in the tone of the voice in the voice data, an axis indicating a value based on the change in the volume of the voice in the voice data, and an axis indicating the value based on the change in the volume of the voice in the voice data. The terms contained in the target speech data may be output by displaying on the display unit 12 a three-dimensional map in which the terms are arranged in a three-dimensional space constituted by three axes, one indicating the base value and the other.

議事録生成システム10は、音声データにおける音声の音調の変化に基づいた値を示す軸と、音声データにおける音声の音量の変化に基づいた値を示す軸と、音声データにおける賛同用語の存在に基づいた値を示す軸とのうち、少なくとも2軸によって構成される空間上に、重要度が特定の程度以上である用語を配置したマップを出力する場合、このマップ上で、議事録における重要な用語の重要度の詳細な内容を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。 The minutes generation system 10 has an axis indicating values based on changes in tone of speech in the audio data, an axis indicating values based on changes in the volume of speech in the audio data, and an axis indicating values based on changes in the volume of the audio in the audio data. When outputting a map in which terms with a certain degree of importance or higher are arranged on a space composed of at least two axes, the important terms in the minutes can be displayed on this map. Since the user can easily understand the detailed content of the importance of the meeting, the user can easily understand the important content in the minutes.

例えば、用語出力部15cは、用語同士の相互の関係を示す相互関係図を表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。なお、用語出力部15cは、対象音声データに含まれる用語の全てではなく、対象音声データに含まれる用語の一部を相互関係図上に表示しても良い。例えば、用語出力部15cは、対象音声データに含まれる用語のうち、議事録データの用語重要度情報における重要度が特定の程度以上である用語のみを相互関係図上に表示しても良い。 For example, the term output unit 15c may output the terms contained in the target speech data by displaying on the display unit 12 a correlation diagram showing mutual relationships between terms. Note that the term output unit 15c may display some of the terms included in the target voice data on the interrelation diagram instead of all the terms included in the target voice data. For example, the term output unit 15c may display, on the interrelationship diagram, only terms whose importance in the term importance information of the minutes data is equal to or higher than a specific level, among the terms included in the target voice data.

図8は、用語同士の相互の関係を示す相互関係図30の一例である。相互関係図30には、用語31~36が配置されている。相互関係図30において、S66、S76またはS86において同一の特定の期間に含まれていた用語同士は、相互に関係があることを示す矢印37a~矢印37gによって接続されている。矢印37a~矢印37gは、S66、S76またはS86において同一の特定の期間に含まれていた回数が多いほど、太く表示される。また、用語31~36は、議事録データの用語重要度情報において付されている重要度が大きいほど、大きく表示される。 FIG. 8 is an example of an interrelationship diagram 30 showing interrelationships between terms. Terms 31 to 36 are arranged in the interrelationship diagram 30 . In the interrelationship diagram 30, the terms included in the same specific period in S66, S76 or S86 are connected by arrows 37a to 37g indicating mutual relationships. Arrows 37a to 37g are displayed thicker as the number of times included in the same specific period in S66, S76 or S86 increases. Also, the terms 31 to 36 are displayed larger as the degree of importance given in the term importance information of the minutes data increases.

議事録生成システム10は、重要度が特定の程度以上である用語同士の相互の関係を示す相互関係図を出力する場合、この相互関係図上で、議事録における重要な用語同士の相互の関係を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。 When the minutes generation system 10 outputs a correlation diagram showing the mutual relationship between terms having a degree of importance equal to or higher than a certain level, the mutual relationship between important terms in the minutes is displayed on the correlation diagram. can be easily understood by the user, it is possible to make the user easily understand the important contents in the minutes.

例えば、用語出力部15cは、議事録データの用語重要度情報における重要度が特定の程度以上である用語が含まれるフレーズを、議事録データに含まれる文字データから抽出して表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。また、用語出力部15cは、議事録データの用語重要度情報における重要度が特定の程度以上である用語が含まれる文を、議事録データに含まれる文字データから抽出して表示部12に表示することによって、対象音声データに含まれる用語を出力しても良い。 For example, the term output unit 15c extracts from the character data included in the minutes data, and displays on the display unit 12 phrases including terms whose importance in the term importance information of the minutes data is equal to or higher than a specific level. By doing so, the terms included in the target speech data may be output. Further, the term output unit 15c extracts from the character data included in the minutes data, and displays on the display unit 12 sentences including terms whose importance in the term importance information of the minutes data is equal to or higher than a specific level. By doing so, the terms included in the target speech data may be output.

議事録生成システム10は、重要度が特定の程度以上である用語が含まれるフレーズまたは文を、議事録データに含まれる文字データ、すなわち、議事録から抽出して出力する場合、議事録における重要なフレーズまたは文を利用者に容易に理解させることができるので、議事録における重要な内容を利用者に容易に理解させることができる。 When the minutes generation system 10 extracts and outputs a phrase or sentence containing a term having a specific degree of importance or higher from the character data included in the minutes data, that is, from the minutes, the minutes generation system 10 extracts and outputs Since the user can easily understand such phrases or sentences, the user can easily understand the important contents of the minutes.

以上に説明したように、議事録生成システム10は、音声データにおける音声の音調の変化と、音声データにおける音声の音量の変化と、音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて音声データにおける重要な期間を特定し(S65、S75またはS85)、重要な期間に含まれる用語の重要度を、重要な期間に含まれない用語の重要度より高く判定し(S66、S76またはS86)、重要度に基づいた出力内容で用語を出力する(S92)ので、議事録における重要な用語を利用者に容易に理解させることができ、その結果、議事録における重要な内容を利用者に容易に理解させることができる。 As described above, the minutes generation system 10 detects at least one of changes in tone of voice in voice data, changes in volume of voice in voice data, and presence of approval terms indicating approval in voice data. (S65, S75 or S85), and the importance of terms included in the important period is determined higher than the importance of terms not included in the important period (S66, S76 or S86), and the terms are output according to the output contents based on the degree of importance (S92), so that the user can easily understand the important terms in the minutes, and as a result, the important contents in the minutes can be used. can be easily understood by

議事録生成システム10は、上述のS51において、音声特徴情報14dを利用して対象音声データに対して音声認識を実行することによって、対象音声データに含まれる音声の発声者を全て検出する。しかしながら、議事録生成システム10は、S51において、音声特徴情報14dを利用せずに対象音声データに対して音声認識を実行することによって、対象音声データに含まれる音声の発声者を全て検出しても良い。議事録生成システム10は、音声特徴情報14dを利用せずに対象音声データに対して音声認識を実行する場合、対象音声データに含まれる音声の発声者を音声特徴情報14dに登録されている特定の人物として識別することはできないが、対象音声データに複数の発声者の音声が含まれるときに、対象音声データに含まれる音声の発声者同士を識別することは可能である。 In the above S51, the minutes generation system 10 detects all the speakers of the voices included in the target voice data by executing voice recognition on the target voice data using the voice feature information 14d. However, in S51, the minutes generation system 10 executes speech recognition on the target speech data without using the speech feature information 14d, thereby detecting all the speakers of the speech included in the target speech data. Also good. When the minutes generation system 10 executes speech recognition on the target speech data without using the speech feature information 14d, the speaker of the speech included in the target speech data is identified as registered in the speech feature information 14d. However, when the target voice data includes voices of a plurality of speakers, it is possible to identify the speakers of the voices included in the target voice data.

議事録生成システム10は、上述のS66、S76およびS86において、S65、S75またはS85において特定した期間に対象の用語が存在する回数に応じたポイントを対象の用語の重要度に加算する。しかしながら、議事録生成システム10は、S66、S76およびS86において、上述の方法以外の方法によってポイントを対象の用語の重要度に加算しても良い。例えば、議事録生成システム10は、S65、S75またはS85において特定した期間に対象の用語が存在する回数にかかわらず、S66、S76およびS86において1ポイントのみを対象の用語の重要度に加算しても良い。 In S66, S76 and S86 described above, the minutes creation system 10 adds points according to the number of times the target term exists during the period specified in S65, S75 or S85 to the importance of the target term. However, in S66, S76 and S86, the minutes creation system 10 may add points to the importance of the target term by a method other than the method described above. For example, the minutes generation system 10 adds only 1 point to the importance of the target term in S66, S76, and S86 regardless of the number of times the target term exists in the period specified in S65, S75, or S85. Also good.

議事録生成システム10は、S65、S75またはS85において特定した期間に用語の後端が含まれる場合にのみ、S65、S75またはS85において特定した期間に、この用語が含まれると、上述のS66、S76およびS86において判定する。しかしながら、議事録生成システム10は、S66、S76およびS86において、上述の方法以外の方法によって、S65、S75またはS85において特定した期間に、この用語が含まれると判定しても良い。例えば、議事録生成システム10は、S65、S75またはS85において特定した期間に用語の少なくとも一部が含まれる場合に、S65、S75またはS85において特定した期間に、この用語が含まれると、S66、S76およびS86において判定しても良い。 Only when the term specified in S65, S75, or S85 includes the trailing end of the term, the minutes generation system 10, when the term is included in the period specified in S65, S75, or S85, S66, Decisions are made in S76 and S86. However, in S66, S76 and S86, the minutes creation system 10 may determine that the term is included in the period specified in S65, S75 or S85 by a method other than the above method. For example, when at least a part of the term is included in the period specified in S65, S75 or S85, the minutes generation system 10, when the term is included in the period specified in S65, S75 or S85, S66, You may judge in S76 and S86.

議事録生成システム10は、上述のS82において、対象音声データにおける賛同用語の後端に対応する時点を、賛同用語が発声された時点として扱う。しかしながら、議事録生成システム10は、S82において、対象音声データにおける賛同用語の後端に対応する時点以外の時点を、賛同用語が発声された時点として扱っても良い。例えば、議事録生成システム10は、S82において、対象音声データにおける賛同用語の前端に対応する時点を、賛同用語が発声された時点として扱っても良い。 The minutes generation system 10 treats the point of time corresponding to the trailing end of the approving term in the target voice data as the point of time when the approving term was uttered in S82 described above. However, the minutes generation system 10 may treat, in S82, a point in time other than the point corresponding to the end of the endorsement term in the target voice data as the point in time at which the approval term was uttered. For example, the minutes generation system 10 may treat the time corresponding to the front end of the approving term in the target voice data as the time when the approving term was uttered in S82.

議事録生成システム10は、本実施の形態において、議事録や用語の出力方法として、表示を採用している。しかしながら、議事録生成システム10は、表示以外の方法によって議事録や用語を出力しても良い。例えば、議事録生成システム10は、印刷によって議事録や用語を出力しても良い。 In the present embodiment, the minutes generation system 10 employs display as a method of outputting minutes and terms. However, the minutes generation system 10 may output the minutes and terms by a method other than display. For example, the minutes generation system 10 may output the minutes and terms by printing.

議事録生成システム10は、本実施の形態において、1台のコンピューターによって構成されている。しかしながら、議事録生成システム10は、複数台のコンピューターによって構成されても良い。 Minutes generation system 10 is configured by one computer in the present embodiment. However, the minutes generation system 10 may be composed of a plurality of computers.

10 議事録生成システム(コンピューター)
14a 議事録生成プログラム
15a 議事録生成部
15b 重要度判定部
15c 用語出力部
20 2次元マップ(マップ)
21~25 用語
30 相互関係図
31~36 用語
37a~37g 矢印(用語同士の相互の関係を示す矢印)
10 minutes generation system (computer)
14a minutes generation program 15a minutes generation unit 15b importance determination unit 15c term output unit 20 two-dimensional map (map)
21-25 Terms 30 Correlation Diagrams 31-36 Terms 37a-37g Arrows (Arrows showing mutual relationships between terms)

Claims (2)

音声データから音声認識によって文字データとしての議事録を生成する議事録生成部と、
前記議事録に含まれる用語の重要度を判定する重要度判定部と、
前記重要度に基づいた出力内容で前記用語を出力する用語出力部と
を備え、
前記重要度判定部は、前記音声データにおける音声の音調の変化と、前記音声データにおける音声の音量の変化と、前記音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて前記音声データにおける重要な期間を特定し、前記重要な期間に含まれる前記用語の前記重要度を、前記重要な期間に含まれない前記用語の前記重要度より高く判定し、
前記用語出力部は、前記音声データにおける音声の音調の変化に基づいた値を示す軸と、前記音声データにおける音声の音量の変化に基づいた値を示す軸と、前記音声データにおける前記賛同用語の存在に基づいた値を示す軸とのうち、少なくとも2軸によって構成される空間上に、前記重要度が特定の程度以上である前記用語を配置したマップを出力することを特徴とする議事録生成システム。
a minutes generation unit that generates minutes as character data by speech recognition from voice data;
an importance determination unit that determines the importance of terms included in the minutes;
a term output unit that outputs the term with output content based on the degree of importance;
The importance determination unit determines whether the voice data is based on at least one of a change in tone of voice in the voice data, a change in volume of voice in the voice data, and the presence of an approval term indicating approval in the voice data. identifying important time periods in the data, determining the importance of the terms included in the important time periods to be higher than the importance of the terms not included in the important time periods ;
The term output unit has an axis indicating values based on changes in tone of voice in the voice data, an axis indicating values based on changes in volume of voice in the voice data, and an axis indicating values based on changes in volume of voice in the voice data. outputting a map in which the terms having a specific degree of importance or higher are arranged in a space formed by at least two of the axes representing values based on existence; system.
音声データから音声認識によって文字データとしての議事録を生成する議事録生成部と、 a minutes generation unit that generates minutes as character data by speech recognition from voice data;
前記議事録に含まれる用語の重要度を判定する重要度判定部と、 an importance determination unit that determines the importance of terms included in the minutes;
前記重要度に基づいた出力内容で前記用語を出力する用語出力部と a term output unit configured to output the term with output content based on the degree of importance;
をコンピューターに実現させ、 is realized on a computer,
前記重要度判定部は、前記音声データにおける音声の音調の変化と、前記音声データにおける音声の音量の変化と、前記音声データにおける賛同を示す賛同用語の存在との少なくとも1つに基づいて前記音声データにおける重要な期間を特定し、前記重要な期間に含まれる前記用語の前記重要度を、前記重要な期間に含まれない前記用語の前記重要度より高く判定し、 The importance determination unit determines whether the voice data is based on at least one of a change in tone of voice in the voice data, a change in volume of voice in the voice data, and the presence of an approval term indicating approval in the voice data. identifying important time periods in the data, determining the importance of the terms included in the important time periods to be higher than the importance of the terms not included in the important time periods;
前記用語出力部は、前記音声データにおける音声の音調の変化に基づいた値を示す軸と、前記音声データにおける音声の音量の変化に基づいた値を示す軸と、前記音声データにおける前記賛同用語の存在に基づいた値を示す軸とのうち、少なくとも2軸によって構成される空間上に、前記重要度が特定の程度以上である前記用語を配置したマップを出力することを特徴とする議事録生成プログラム。 The term output unit has an axis indicating values based on changes in tone of voice in the voice data, an axis indicating values based on changes in volume of voice in the voice data, and an axis indicating values based on changes in volume of voice in the voice data. outputting a map in which the terms having a specific degree of importance or higher are arranged in a space formed by at least two of the axes representing values based on existence; program.
JP2018171569A 2018-09-13 2018-09-13 minutes generation system and minutes generation program Active JP7205684B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018171569A JP7205684B2 (en) 2018-09-13 2018-09-13 minutes generation system and minutes generation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018171569A JP7205684B2 (en) 2018-09-13 2018-09-13 minutes generation system and minutes generation program

Publications (2)

Publication Number Publication Date
JP2020042229A JP2020042229A (en) 2020-03-19
JP7205684B2 true JP7205684B2 (en) 2023-01-17

Family

ID=69798520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018171569A Active JP7205684B2 (en) 2018-09-13 2018-09-13 minutes generation system and minutes generation program

Country Status (1)

Country Link
JP (1) JP7205684B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111797226B (en) * 2020-06-30 2024-04-05 北京百度网讯科技有限公司 Conference summary generation method and device, electronic equipment and readable storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005025571A (en) 2003-07-03 2005-01-27 Ns Solutions Corp Business support device, business support method, and its program
JP2013109635A (en) 2011-11-22 2013-06-06 Nippon Telegr & Teleph Corp <Ntt> Word importance calculation device and method and program thereof
JP2014085998A (en) 2012-10-26 2014-05-12 Univ Of Yamanashi Electronic note creation support device and program for electronic note creation support device
JP2015082087A (en) 2013-10-24 2015-04-27 富士通株式会社 Information processing device, program, and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005025571A (en) 2003-07-03 2005-01-27 Ns Solutions Corp Business support device, business support method, and its program
JP2013109635A (en) 2011-11-22 2013-06-06 Nippon Telegr & Teleph Corp <Ntt> Word importance calculation device and method and program thereof
JP2014085998A (en) 2012-10-26 2014-05-12 Univ Of Yamanashi Electronic note creation support device and program for electronic note creation support device
JP2015082087A (en) 2013-10-24 2015-04-27 富士通株式会社 Information processing device, program, and method

Also Published As

Publication number Publication date
JP2020042229A (en) 2020-03-19

Similar Documents

Publication Publication Date Title
CN108288468B (en) Audio recognition method and device
WO2020177190A1 (en) Processing method, apparatus and device
JP4825800B2 (en) Music classification method
JP6541673B2 (en) Real time voice evaluation system and method in mobile device
JP6556575B2 (en) Audio processing apparatus, audio processing method, and audio processing program
JP6884947B2 (en) Dialogue system and computer programs for it
JP2007206317A (en) Authoring method and apparatus, and program
JP2008134475A (en) Technique for recognizing accent of input voice
JP2018146715A (en) Voice interactive device, processing method of the same and program
US20190371305A1 (en) Voice interaction system, its processing method, and program therefor
JP2020003535A (en) Program, information processing method, electronic apparatus and learnt model
JP2020077159A (en) Interactive system, interactive device, interactive method, and program
EP3779814A1 (en) Method and device for training adaptation level evaluation model, and method and device for evaluating adaptation level
JP2013109061A (en) Voice data retrieval system and program for the same
JP2018084627A (en) Language model learning device and program thereof
JP2010160608A (en) Interaction device, interaction program, and interaction method
JP7205684B2 (en) minutes generation system and minutes generation program
Bosker et al. Both native and non-native disfluencies trigger listeners' attention
JP6728116B2 (en) Speech recognition device, speech recognition method and program
JP6709558B2 (en) Conversation processor
CN116127003A (en) Text processing method, device, electronic equipment and storage medium
JP2011170622A (en) Content providing system, content providing method, and content providing program
CN113436629A (en) Voice control method and device, electronic equipment and storage medium
WO2023199895A1 (en) Presentation evaluation device
JP2019078924A (en) Utterance contents evaluation system and utterance contents evaluation program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210831

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221213

R150 Certificate of patent or registration of utility model

Ref document number: 7205684

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150