JP2008129475A - Voice text - Google Patents

Voice text Download PDF

Info

Publication number
JP2008129475A
JP2008129475A JP2006316391A JP2006316391A JP2008129475A JP 2008129475 A JP2008129475 A JP 2008129475A JP 2006316391 A JP2006316391 A JP 2006316391A JP 2006316391 A JP2006316391 A JP 2006316391A JP 2008129475 A JP2008129475 A JP 2008129475A
Authority
JP
Japan
Prior art keywords
audio
data
keyword
teaching material
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006316391A
Other languages
Japanese (ja)
Inventor
Osamu Asai
治 浅井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2006316391A priority Critical patent/JP2008129475A/en
Publication of JP2008129475A publication Critical patent/JP2008129475A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a voice text in which a learning text of mainly a text data is converted to voice, and only content which a learner desires to learn is suitably extracted to create own specified text, so that the leaner may repeatedly learn any time and anywhere by a portable reproduction device. <P>SOLUTION: The text data included in a learning text 3 which is to be learned, is converted to voice data 6 for each unit 4 which is divided according to a predetermined dividing rule, and a plurality of voice files 2 in which the voice data 6 is recorded is stored in a portable storing medium 5, and thereby, the voice text 1 is provided. The voice text 1 includes index information 7 for storing a keyword included in the voice data 6 of each voice file 2, by relating it to each voice file. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

テキストデータを主体とする教材を音声データに変換した音声教材に関する。 The present invention relates to an audio teaching material obtained by converting a text teaching material into audio data.

音声のデジタル録音、配布、再生のための環境が普及している現在、音声メディアを学習教材に活用することがさかんに行われている。音声を使った教材は、語学学習に見られるように、気軽に場所を選ばず、繰り返し反復学習ができる。また、可搬型装置を用いて音声を再生して聴くようにすれば、両手がふさがった状態や、通勤電車の中などでも、繰り返して学習ができる。
このような音声教材は、例えば、特開2004−151379号公報記載の「携帯型語学学習装置」、特開2006−133672号公報記載の「携帯型語学学習装置及び携帯型語学学習システム」など多数提案されている。
特開2004−151379号公報 特開2006−133672号公報
Now that the environment for digital recording, distribution, and playback of audio is widespread, audio media is used as a learning material. As is the case with language learning, audio-based teaching materials can be used repeatedly and repeatedly to learn anywhere. In addition, if a portable device is used to reproduce and listen to sound, it is possible to repeatedly learn even when both hands are occupied or in a commuter train.
Such audio teaching materials include, for example, “portable language learning device” described in Japanese Patent Application Laid-Open No. 2004-151379, “portable language learning device and portable language learning system” described in Japanese Patent Application Laid-Open No. 2006-133672, and the like. Proposed.
JP 2004-151379 A JP 2006-133672 A

しかしながら、音声教材は従来の紙を媒体とする教材と比較し、必ずしもメリットばかりではない。学習者は、教材の最初から最後まで満遍なく学習するわけではない。当該科目にとって重要と考えられる箇所、理解が不十分であると自覚している箇所などを重点的に学習することが効率的である。このような箇所は、学習者ごとに異なるものである。紙媒体の教材であれば、自分が学習したいと思う箇所にしおりを挟んだり、付箋を貼り付けたりすることで、教材を自分専用に使いやすくすることができる。 However, the audio teaching materials are not always advantageous compared to the conventional paper teaching materials. The learner does not study all the way from the beginning to the end of the material. It is efficient to focus on the points that are considered important for the subject and the points that are known to be insufficiently understood. Such a place is different for each learner. If it is a paper-based teaching material, you can make it easier for yourself to use the teaching material by putting a bookmark or sticking a sticky note at the place you want to learn.

これに対し音声教材では、自分が学習したいと思う箇所のみを抽出することは難しい。例えば、特許文献1に開示されている発明は、LL端末を使わなくてはできなかった多彩な語学学習をいつでもどこでも簡単に行えるようにしたものであるが、個々の学習者が自分のペースで学習するという視点に欠けている。
また、特許文献2に開示されている発明は、学習者のスケジュール帳に記憶されたイベントに基づいて、その学習者にとって適切な学習データを提供するものであるが、当の学習者の意思にかかわらず、システムが自動的に音声教材を用意する。
したがって、特許文献1および特許文献2に記載のいずれの発明も、音声教材全体から学習者自身が必要と判断する箇所のみを効率的に学習するという点で適当ではない。
しかし、章や節などから構成されている大量の情報を収容している紙媒体の教材を音声化した教材において、必要な箇所のみを聴きたい、学習したいという要望は切実である。
On the other hand, with audio teaching materials, it is difficult to extract only the parts that you want to learn. For example, the invention disclosed in Patent Document 1 is designed to make it easy to perform various language learning anywhere and anytime, which was impossible without using an LL terminal. It lacks the viewpoint of learning.
Further, the invention disclosed in Patent Document 2 provides appropriate learning data for a learner based on an event stored in the learner's schedule book. Regardless, the system automatically prepares audio teaching materials.
Accordingly, neither of the inventions described in Patent Document 1 and Patent Document 2 is appropriate in that it efficiently learns only the part that the learner himself determines is necessary from the entire audio teaching material.
However, there is an urgent desire to listen to and learn only the necessary parts in a teaching material that is a paper-based teaching material containing a large amount of information composed of chapters and sections.

本発明は、このような問題点を解決するために、所定のテーマに基づいて関連箇所を容易に取り出せるような仕組みを音声教材に持たせることで、以上のような問題点を解決しようと考えたものである。 In order to solve such a problem, the present invention intends to solve the above problems by providing the audio teaching material with a mechanism that can easily extract the related parts based on a predetermined theme. It is a thing.

上記の目的を達成するために、本発明は、学習対象となる教材に含まれるテキストデータを、所定の分割ルールに従って分割した単位ごとに音声データに変換し、この音声データが収録された複数の音声ファイルを可搬性ある記憶媒体に格納して提供される音声教材であって、各音声ファイルの音声データ部に含まれるキーワードと該音声ファイルとを対応付けて記憶するインデックス情報を有することを特徴とする。利用者への配布は、記憶媒体に格納して提供する形態に限らず、通信ネットワークを介して提供するものであってもよい。 In order to achieve the above object, the present invention converts text data included in a learning material to be learned into audio data for each unit divided according to a predetermined division rule, and a plurality of audio data recorded therein. An audio teaching material provided by storing an audio file in a portable storage medium, and having index information for storing a keyword included in an audio data portion of each audio file and the audio file in association with each other And Distribution to a user is not limited to a form provided by being stored in a storage medium, but may be provided via a communication network.

このように、音声ファイルごとに、収録内容に含まれるキーワードを検索用のインデックスとして付与することにより、自分の聴きたい内容のファイルのみを取り出して聴くことが簡便かつ容易にできる。なお、検索用のインデックスとなりうるものはキーワードだけではなく、ファイル名やファイルの連番でもよい。しかし、本発明では、テーマに沿った学習を効率よく行う、という観点から収録内容の中で重要と考えられる単語群(キーワード群)をインデックスキーとして用いることとする。 In this way, by assigning a keyword included in the recorded content as a search index for each audio file, it is possible to easily and easily listen to the file having the content that the user wants to listen to. A search index may be a file name or a file serial number, not just a keyword. However, in the present invention, a word group (keyword group) considered to be important in the recorded contents is used as an index key from the viewpoint of efficiently performing learning according to the theme.

「教材」とは、各種資格試験、入学試験用の教科書参考書、語学教材のみならず、あらゆる学習に利用される書籍類をいう。また、教科書参考書だけではなく、学習者が参照する法律の条文なども含めるものとする。
「音声データ」とは、音声ファイルのフォーマットがMP3(MPEG1 Audio Layer3)である場合は、MP3オーディオデータのことであり、この音声データが音声再生装置によって再生される。
“Teaching materials” refers to books used for all kinds of learning, as well as various qualification tests, textbook reference books for entrance examinations, and language teaching materials. In addition to textbook reference books, the texts of laws that are referred to by learners shall be included.
“Audio data” refers to MP3 audio data when the audio file format is MP3 (MPEG1 Audio Layer 3), and this audio data is reproduced by the audio reproducing apparatus.

また、上記の目的を達成するために、本発明は、インデックス情報は、音声ファイル内の音声データに付加されている補助情報部に書き込まれていることを特徴とする。
これにより、特殊な装置やソフトウェアを準備しなくとも、現在普及しているMP3フォーマット、並びに近年普及の著しいiTunes(登録商標)のようなソフトウェアを活用することで、本発明の音声教材を作成したり、利用したりすることができる。
In order to achieve the above object, the present invention is characterized in that the index information is written in the auxiliary information part added to the audio data in the audio file.
As a result, the audio teaching material of the present invention can be created by utilizing the currently popular MP3 format and software such as iTunes (registered trademark), which has been popular recently, without preparing special devices and software. Can be used.

さらに、インデックス情報は、音声ファイルに付加するのではなく、別途データベースを音声教材に含め、このデータベースにキーワードと音声ファイルとの対応を記録してもよい。 Further, the index information may not be added to the audio file, but a separate database may be included in the audio teaching material, and the correspondence between the keyword and the audio file may be recorded in this database.

適当な位置によって分割録音した音声データのそれぞれにキーワードを対応づけて記憶させることにより、このキーワードを検索のためのインデックス情報(インデックスキー)として、音声データの検索と抽出が可能となる。そのため、学習しようとするテーマに沿った内容が含まれる音声データのみを抽出できる。これにより、テーマ毎に効果的な学習が可能となり、分量の多い教材であっても効率よく学習できるようになる。また、テーマ毎に抽出された音声情報のみを収容すればよいので、容量的な制約の厳しい可搬型の再生装置を用いることができる。   By storing a keyword in association with each piece of voice data divided and recorded at an appropriate position, it is possible to search and extract voice data using the keyword as index information (index key) for search. Therefore, it is possible to extract only audio data that includes content in accordance with the theme to be learned. As a result, effective learning can be performed for each theme, and even a teaching material with a large amount can be efficiently learned. Further, since only the audio information extracted for each theme needs to be accommodated, a portable playback device with severe capacity restrictions can be used.

〔1.第1の実施形態〕
本実施形態による音声教材について、図面を参照しながら説明する。
[1. First Embodiment]
The audio teaching material according to the present embodiment will be described with reference to the drawings.

〔1−1.第1の実施形態:音声教材の構成〕
図1に示すように、音声教材1は、複数の音声ファイル2から構成される。各音声ファイル2は、対象となる紙媒体の教材3が適宜分割された各区分4に含まれるテキストデータを音声に変換した音声データを格納するものである。
これらの複数の音声ファイル2を可搬性ある媒体5に格納し、流通配布に供するのが本実施形態の音声教材1である。可搬性ある媒体5としては、CD(Compact Disk)やDVD(Digital Video Disk)などがある。
[1-1. First Embodiment: Configuration of Audio Teaching Material]
As shown in FIG. 1, the audio teaching material 1 includes a plurality of audio files 2. Each sound file 2 stores sound data obtained by converting text data included in each section 4 into which the teaching material 3 of the target paper medium is appropriately divided into sound.
The audio teaching material 1 of this embodiment stores these plural audio files 2 in a portable medium 5 and provides them for distribution. Examples of the portable medium 5 include a CD (Compact Disk) and a DVD (Digital Video Disk).

各音声ファイル2は、音声データ部6と、補助情報部7とから構成される。音声データ部6は、適宜分割された教材3の1個の区分4に含まれるテキストデータを音声に変換した音声データを記録する部分である。補助情報部7は、音声データ部6の先頭あるいは末尾に付加されるものであり、音声データ部6に含まれるキーワードを検索用のインデックス情報(インデックスキー)として記憶するものである。
本実施形態では、MP3を前提としているが、MP3ファイルでは、その先頭あるいは末尾に所定のバイト長のデータ領域を付加し、この領域に、曲名、アルバム名、アーティスト名等の付属文字情報を埋め込み可能にしたフォーマットが考案されている。このフォーマットは、ID3と呼ばれ、ID3に対応したMP3プレーヤーでは、上記の付加情報(ID3タグ情報)の表示や編集を行うことができる。そのため、本実施形態では、ID3タグを補助情報部7として活用する。
補助情報部7に記憶されるインデックス情報については、後に詳しく説明する。
Each audio file 2 includes an audio data part 6 and an auxiliary information part 7. The voice data unit 6 is a part for recording voice data obtained by converting text data included in one section 4 of the teaching material 3 appropriately divided into voice. The auxiliary information section 7 is added to the beginning or end of the voice data section 6 and stores the keywords included in the voice data section 6 as search index information (index key).
In this embodiment, MP3 is assumed. However, in a MP3 file, a data area having a predetermined byte length is added to the beginning or end thereof, and attached character information such as a song name, album name, artist name, etc. is embedded in this area. A possible format has been devised. This format is called ID3, and an MP3 player corresponding to ID3 can display and edit the additional information (ID3 tag information). Therefore, in the present embodiment, the ID3 tag is used as the auxiliary information unit 7.
The index information stored in the auxiliary information unit 7 will be described in detail later.

〔1−2.第1の実施形態:音声教材の作成方法〕
続いて、本実施形態の音声教材1を、コンピュータを備えたシステムによって作成する場合の作成方法について説明する。
[1-2. First Embodiment: Method for Creating Audio Teaching Materials]
Next, a creation method in the case where the audio teaching material 1 of the present embodiment is created by a system including a computer will be described.

図2に従い、本実施形態の音声教材1を作成するためのコンピュータシステム例を説明する。
本システム8は、処理手段9,RAM、ROM、あるいは補助記憶媒体などの記憶手段10、マウスやキーボードなどの入力手段11、マイクロフォン、スピーカ、あるいはヘッドセットなどの音声入出力手段12、ディスプレイなどの出力手段13などを備えている。
An example of a computer system for creating the audio teaching material 1 of the present embodiment will be described with reference to FIG.
The system 8 includes a processing unit 9, a storage unit 10 such as a RAM, a ROM, or an auxiliary storage medium, an input unit 11 such as a mouse and a keyboard, a voice input / output unit 12 such as a microphone, a speaker, or a headset, a display, and the like. Output means 13 and the like are provided.

処理手段9は、音声教材を作成するための一連の処理を実行し制御するものであり、専ら図示しないCPUがソフトウェアを実行することによって実現されるが、その一部の機能はハードウェアによって実現されることもある。 The processing means 9 executes and controls a series of processes for creating the audio teaching material, and is realized only by executing software by a CPU (not shown), but some of the functions are realized by hardware. Sometimes it is done.

記憶手段10には、教材テキストデータ記憶手段14、テキスト分割ルール記憶手段15、朗読用原稿記憶手段16、音声データ記憶手段17、キーワード候補抽出ルール記憶手段18、除外リスト記憶手段19、キーワード候補記憶手段20、キーワード記憶手段21、出力音声ファイル記憶手段22が含まれ、図示しない処理途中の中間データを格納する手段なども含まれる。 The storage means 10 includes teaching material text data storage means 14, text division rule storage means 15, recitation manuscript storage means 16, audio data storage means 17, keyword candidate extraction rule storage means 18, exclusion list storage means 19, keyword candidate storage. Means 20, keyword storage means 21, output audio file storage means 22 are included, and means for storing intermediate data in the middle of processing (not shown) is also included.

教材テキストデータ記憶手段14は、対象となる教材データ3を記憶する手段である。
テキスト分割ルール記憶手段15は、教材データ3を複数の部分4に分割して音声データに変換する際の区切り位置を決めるための分割ルールを記憶する手段である。
朗読用原稿記憶手段16は、処理手段9が分割ルールに基づいて教材データ3を分割し、その分割位置に区切りを示す記号を付加した朗読用原稿を記憶する手段である。
朗読者は出力手段に表示された朗読用原稿を朗読し、この朗読音声が音声入出力手段12を介して、音声データ記憶手段17に記憶されることになる。
The teaching material text data storage unit 14 is a unit for storing the target teaching material data 3.
The text division rule storage means 15 is a means for storing a division rule for determining a separation position when the teaching material data 3 is divided into a plurality of portions 4 and converted into audio data.
The reading document storage unit 16 is a unit that stores the reading document in which the processing unit 9 divides the teaching material data 3 based on the division rule and adds a symbol indicating a delimiter to the division position.
The reading reader reads the reading manuscript displayed on the output means, and the reading voice is stored in the voice data storage means 17 via the voice input / output means 12.

キーワード候補抽出ルール記憶手段18は、教材データ3からキーワード候補を抽出するためのキーワード候補抽出ルールを記憶する手段である。
除外リスト記憶手段19は、キーワードとして登録すべきでない除外文字列リストを記憶する手段である。
キーワード候補記憶手段20は、処理手段9によってキーワード候補として自動的に抽出された文字列を記憶する手段である。
キーワード記憶手段21は、キーワード候補記憶手段20に登録されているキーワード候補の中から、選択されたキーワードを記憶する手段である。
出力音声ファイル記憶手段22は、音声データ部6にインデックス情報が書き込まれた補助情報部7を付加した音声ファイル2を記憶する手段である。
The keyword candidate extraction rule storage means 18 is a means for storing keyword candidate extraction rules for extracting keyword candidates from the teaching material data 3.
The exclusion list storage means 19 is a means for storing an exclusion character string list that should not be registered as a keyword.
The keyword candidate storage means 20 is a means for storing the character strings automatically extracted as keyword candidates by the processing means 9.
The keyword storage unit 21 is a unit that stores a keyword selected from the keyword candidates registered in the keyword candidate storage unit 20.
The output audio file storage means 22 is a means for storing the audio file 2 to which the auxiliary information section 7 in which index information is written in the audio data section 6 is added.

以下、処理手段9により、音声教材1が作成される一連の処理の流れについて図3を参照しながら説明する。 Hereinafter, a flow of a series of processes in which the audio teaching material 1 is created by the processing means 9 will be described with reference to FIG.

まず、対象教材3のテキストデータを教材テキストデータ記憶手段14に格納する(ステップS1)。テキストデータの入力方法は、教材となる白書などを公開しているウェブサイトからダウンロードする方法、スキャナなどの入力手段11によって紙媒体から読み込む方法などがある。
続いて、処理手段9は、読み込まれた教材データ3をテキスト分割ルール記憶手段15から読み込んだ分割ルールに従って分割位置を決定し、朗読用原稿を作成する(ステップS2)。
First, the text data of the target teaching material 3 is stored in the teaching material text data storage means 14 (step S1). As text data input methods, there are a method of downloading a white paper or the like as a teaching material from a public website, a method of reading from a paper medium by an input means 11 such as a scanner, and the like.
Subsequently, the processing means 9 determines the division position of the read teaching material data 3 according to the division rule read from the text division rule storage means 15, and creates a recitation document (step S2).

ここで、教材データ3の分割について説明する。
この実施形態では、対象となるテキスト教材3を予め操作し、部、章、節及び、テーマの切れ目に区切りを挿入した朗読用原稿を作成し、この区切り単位に朗読し、音声ファイル2に格納する。
この区切りの数が少なければ、余分な箇所まで収録するので利用者にとって使い勝手がよくないが、多すぎても収録単位間の意味的繋がりが薄れてしまうおそれがある。そのため、分割位置は教材の部、章、節、段落など明示的な文書の切れ目や構成単位に加え、朗読の際の朗読者の息継ぎ休憩を考慮して分割位置を決める。白書などの定型的な文書であれば、部、章、節及びテーマの切れ目には特徴的な記号や項番が与えられているので、これらを分割ルールとして用いて分割位置を決めたり、これらの組み合わせにより分割位置を決めたりしてもよい。
なお、分割ルールには、細分化だけではなく、細分化した上で隣接した複数の分割単位を1つの分割単位にまとめる際のルールも含むものとする。たとえば、『同一の段落(テキスト全体が、章、節、段落からなる階層構造をとる場合の最下位の構造)に属する隣接区分の文字数の和が閾値以下のときは1区分にまとめる』等のルールである。収録単位が細かすぎても、ユーザである学習者にとって煩わしいからである。
Here, the division of the teaching material data 3 will be described.
In this embodiment, the text material 3 to be processed is operated in advance, and a reading manuscript is created in which a section, chapter, section, and theme break is inserted, read in units of this break, and stored in the audio file 2. To do.
If the number of divisions is small, extra portions are recorded, which is not convenient for the user. However, if the number is too large, the semantic connection between the recording units may be lost. For this reason, the division position is determined in consideration of breaks and constituent units of explicit documents such as parts, chapters, sections, and paragraphs of teaching materials, as well as the breathing break of the reader at the time of reading. For typical documents such as white papers, distinctive symbols and item numbers are given to divisions, chapters, sections, and theme breaks. Use these as division rules to determine division positions, The division position may be determined by a combination of.
Note that the division rule includes not only a subdivision but also a rule for grouping a plurality of subdivided division units into one division unit. For example, “If the sum of the number of characters in the adjacent sections belonging to the same paragraph (the whole text is the lowest structure in the case of a hierarchical structure consisting of chapters, sections, and paragraphs) is less than a threshold, combine them into one section”. It is a rule. This is because even if the recording unit is too small, it is troublesome for the learner who is the user.

ステップS2の処理の詳細な内容を図4に従い説明する。
処理手段9は、デジタル化されたテキストデータをメモリ上に読み出す(ステップS100)。ポインタを初期化し、テキストデータの先頭にセットする(ステップS101)。ポインタが置かれている位置の文字をメモリから読み出す(ステップS102)とともに、その文字をメモリ上の中間ファイルに出力する(S103)。テキスト分割ルール記憶手段15から分割ルールを読み込み(S104)、現在ポインタが置かれている文字が分割ルールに合致しているかを判定し、合致しているならば(S105でYes)、区切りをあらわす記号を中間ファイルに出力する(S106)。現在のポインタ位置の処理が終わったならばポインタを次に進める(S107)。ポインタがテキストの終端に来るまでは、ステップS102からS107までの処理を繰り返す(S108でNo)。ポインタがテキストの終端に至れば(S108でYes)、テキストデータの全範囲について分割処理が終了したことになるので、中間ファイルに出力された内容を朗読用原稿として記憶させる(S109)。
Detailed contents of the processing in step S2 will be described with reference to FIG.
The processing means 9 reads the digitized text data onto the memory (step S100). The pointer is initialized and set at the beginning of the text data (step S101). The character at the position where the pointer is placed is read from the memory (step S102), and the character is output to an intermediate file on the memory (S103). The division rule is read from the text division rule storage unit 15 (S104), and it is determined whether the character on which the pointer is currently positioned matches the division rule. If the character matches (Yes in S105), the division is represented. The symbol is output to an intermediate file (S106). If the processing of the current pointer position is completed, the pointer is advanced (S107). Until the pointer reaches the end of the text, the processing from step S102 to S107 is repeated (No in S108). If the pointer reaches the end of the text (Yes in S108), the division process has been completed for the entire range of text data, so the content output to the intermediate file is stored as a reading manuscript (S109).

以上で、ステップS2の分割処理が終了し、朗読用原稿の区切り位置で分割された各部分ごとに音声データに変換する(S3)。
変換の仕方としては、音声入出力手段12を介して入力された朗読音声を取り込んでもよいが、図示しない音声合成手段によってテキストデータを音声化してもよい。つまり、本発明の「朗読」には、朗読者による音読だけでなく、音声合成による変換も含まれる。人が朗読する場合は、区切り位置で息継ぎをしたり、録音担当スタッフが音声データに区切りを入れたりすることは言うまでもない。また、音声合成を利用する場合は、ソフトウェアが、区切り位置でポーズを入れ、処理手段9に音声データの区切りを通知したりすればよい。
なお、ステップS2で朗読用原稿を作成する際、区切り記号を挿入するだけではなく、読み方の難しい文字(例えば、「瑕疵」)にふりがなを挿入(例えば、「瑕疵(カシ)」)したりすると朗読者等にとっての利便性が増す。そのためには、記憶手段10は、難解な単語の辞書を適宜備えているものとする。
Thus, the division process in step S2 is completed, and each portion divided at the separation position of the reading document is converted into audio data (S3).
As a method of conversion, the reading voice input through the voice input / output unit 12 may be taken in, or the text data may be converted into voice by a voice synthesis unit (not shown). That is, “recitation” of the present invention includes not only reading aloud by a reader but also conversion by speech synthesis. Needless to say, when people read aloud, they breathe at the breaks, and the recording staff puts breaks in the audio data. Further, when using speech synthesis, the software may pause at the delimiter position and notify the processing means 9 of the delimiter of the voice data.
It should be noted that when creating a reading manuscript in step S2, not only inserting a delimiter but also inserting furigana (for example, “瑕疵”) into characters that are difficult to read (for example, “瑕疵”). Convenience for readers increases. For this purpose, the storage means 10 is appropriately provided with a dictionary of difficult words.

ステップS3で生成した音声データにインデックス情報を付与して分割単位ごとの音声ファイル2を作成することになるが、インデックス情報として付与されるキーワードをあらかじめ登録しておかなくてはならない。
登録されるキーワードは、キーワード候補の中から選択するので、まず、テキストデータからキーワード候補を自動的に抽出しておく(ステップS4)。
Index information is added to the audio data generated in step S3 to create the audio file 2 for each division unit. However, keywords to be added as index information must be registered in advance.
Since the keyword to be registered is selected from the keyword candidates, first, the keyword candidates are automatically extracted from the text data (step S4).

本実施形態では、キーワードを登録する前に、キーワード候補を登録するのは、次の理由による。
キーワードとは、教材のユーザにとって、適切な学習を進めるために重要な情報であるため、何をキーワードとして選択するかは、専門知識のある人でなければ難しい。つまり、適切な選択には人手の介在が不可欠である。しかし、教材は、一般に分量が多いので、必要なキーワードをもれなく取り出すことはたいへん手間がかかる。この手間を軽減するために、本実施形態では、キーワード候補を自動的に抽出し、この自動抽出された中から人手により必要なキーワードを選択することにした。
In the present embodiment, the keyword candidates are registered before the keywords are registered for the following reason.
Since the keyword is important information for the user of the teaching material in order to advance appropriate learning, it is difficult for a person with specialized knowledge to select what is selected as the keyword. In other words, human intervention is essential for proper selection. However, since teaching materials are generally large in quantity, it is very troublesome to extract all necessary keywords. In order to reduce this effort, in the present embodiment, keyword candidates are automatically extracted, and necessary keywords are selected manually from the automatically extracted.

このキーワード候補抽出処理について、図5に従い、詳細に説明する。
まず、テキストデータを読み込む(ステップS200)。
キーワード抽出ルールに従い、文脈候補を抽出する(S201)。
それぞれの教材が有する性格から、その教材に特定の文脈が多用されている可能性が高い。図6に例示したのは、白書類に多い文脈である。そのため、対象教材に高い頻度であらわれる複数の文脈をあらかじめキーワード抽出ルールとして登録しておき、テキスト本文と比較することにより、キーワードの候補を含む文を抽出する。
図6のルールに従えば、図7に例示するような文が抽出できる。
The keyword candidate extraction process will be described in detail with reference to FIG.
First, text data is read (step S200).
In accordance with the keyword extraction rule, context candidates are extracted (S201).
Due to the nature of each teaching material, there is a high possibility that a specific context is frequently used in the teaching material. The example illustrated in FIG. 6 is a context often found in white documents. Therefore, a plurality of contexts appearing frequently in the target learning material are registered in advance as keyword extraction rules, and sentences containing keyword candidates are extracted by comparing with a text body.
If the rule of FIG. 6 is followed, the sentence illustrated in FIG. 7 can be extracted.

次は、抽出された文を品詞分析し、名詞を抽出する(S202)。
図7に例示した文に含まれる単語の品詞を調べ、その単語が名詞であればキーワード候補とする。抽出されたキーワード候補を図8に示す。
続いて、除外リスト記憶手段19を参照し、その単語が除外リストには載っていないならばキーワード候補記憶手段20に登録する(S203)。除外リストには、図9に例示するように、名詞であっても、年号や数字などのように、キーワードとして適当でない単語が載っている。
図7に例示する文からは、図10に例示するようなキーワード候補が抽出できる。
なお、キーワード候補の抽出は、朗読用原稿の作成(図3のS2)と平行して行ってもよい。
Next, part-of-speech analysis is performed on the extracted sentence to extract nouns (S202).
The part of speech of the word included in the sentence illustrated in FIG. 7 is examined, and if the word is a noun, it is determined as a keyword candidate. The extracted keyword candidates are shown in FIG.
Subsequently, the exclusion list storage unit 19 is referred to, and if the word is not on the exclusion list, it is registered in the keyword candidate storage unit 20 (S203). As illustrated in FIG. 9, the exclusion list includes words that are not suitable as keywords, such as year and numbers, even if they are nouns.
Keyword candidates as illustrated in FIG. 10 can be extracted from the sentence illustrated in FIG.
The extraction of the keyword candidates may be performed in parallel with the creation of the reading original (S2 in FIG. 3).

以上のように、キーワード候補が抽出されたなら、ディスプレイ13などに表示し、キーボードなどの入力手段11を介して、人手によりキーワード候補の中からキーワード記憶手段21に登録するべきキーワードを選択する(図3のS5)。ここで、キーワード候補を画面13などに表示する際、該当部、章、節、段落の見出し語に含まれるか否かといった情報、あるいは全テキスト中における出現頻度も合わせて表示すると適切な判断をするうえで便利である。
なお、キーワード候補をそのままキーワード記憶手段21に登録してもよい。この場合は、キーワードは自動抽出され、人手による作業は発生しない。
キーワードの登録を終えると、ステップS3で生成した音声データにインデックス情報が書き込まれた補助情報部7が付加されてMP3フォーマットの音声ファイル2が作成される(S6)。
As described above, when keyword candidates are extracted, they are displayed on the display 13 or the like, and a keyword to be registered in the keyword storage means 21 is selected from the keyword candidates manually via the input means 11 such as a keyboard ( S5 in FIG. Here, when displaying keyword candidates on the screen 13 or the like, it is appropriate to display information such as whether or not they are included in headwords of relevant parts, chapters, sections, paragraphs, or appearance frequencies in all texts. Convenient to do.
The keyword candidates may be registered in the keyword storage unit 21 as they are. In this case, keywords are automatically extracted and no manual work is required.
When the keyword registration is completed, the auxiliary information section 7 in which index information is written is added to the audio data generated in step S3, and the MP3 format audio file 2 is created (S6).

インデックス情報付与の処理は、図11のフローに示すとおりである。
朗読用原稿の区切り記号で分割された単位ごとにテキストデータを読み込む(S300)。
キーワード記憶手段21からキーワードを読み込む(S301)。テキストデータ中にキーワードと合致する文字列があるかを検索し、合致するものがあれば(S302でYes),そのキーワードを、ID3タグに書き込み、これを音声データにインデックス情報として付加する(S303)。登録されているキーワードについてS301以降の処理を繰り返し、終了すれば(S304でYes),次の区分についてのS300以降のインデックス情報付与処理を行う(S305でNo)。全区分についての処理を終了すれば(S305でYes),インデックス付与処理(図3のS6)は終了する。
なお、各音声データへのインデックス情報の付与は、音声入出力手段12から流れる音声データを確認しながら人手で行ってもよいことは言うまでもない。
The index information adding process is as shown in the flow of FIG.
Text data is read for each unit divided by the delimiter of the reading document (S300).
A keyword is read from the keyword storage means 21 (S301). It is searched whether there is a character string that matches the keyword in the text data. If there is a matching character string (Yes in S302), the keyword is written in the ID3 tag and added to the audio data as index information (S303). ). If the process after S301 is repeated for the registered keyword and the process is completed (Yes in S304), the index information giving process after S300 for the next category is performed (No in S305). If the process for all the sections is finished (Yes in S305), the index assignment process (S6 in FIG. 3) is finished.
Needless to say, the index information may be assigned to each piece of audio data manually while checking the audio data flowing from the audio input / output unit 12.

ここで、本システムの大きな特徴であるインデックスの付与について意義を説明する。
白書などの刊行物では、各部、章、節の名称は、殆どの場合、記述内容を反映した内容となっており、これらをファイル名称としても、記述内容を推測することが可能である。しかし、これらのファイル名称は、限られた情報であり、ファイル内容の一部を表現するにすぎず、これを基に検索していくのは冗長であり、かつ誤検索をもたらす。また、学習の過程では、部、章、節の単位ではなく、部、章、節にまたがった学習テーマを連続的に取り出し、テーマ毎のキーワードに関連性をもたせた形で学習を行う場合がある。複数のファイルは共通のキーワードを含んでおり、従って、各ファイルの識別が可能なようにファイルに名称を付けるのは困難である。つまり、ファイル名称による検索には限界があり、使い勝手が悪い。
このような不都合を解消するために、上記の区切りの単位で、テーマとなっている話題や、文章に含まれるキーワードを1個以上任意個数抽出して音声データに付与し、これらをファイル検索のためのインデックス情報とすることとした。
Here, the significance of index assignment, which is a major feature of this system, will be described.
In publications such as white papers, the names of the parts, chapters, and sections almost always reflect the contents of the description, and it is possible to infer the contents of the description using these as file names. However, these file names are limited information and represent only a part of the file contents, and it is redundant to perform a search based on this information and cause an erroneous search. In the course of learning, there are cases in which learning is not performed in units of chapters, chapters, or sections, but is continuously performed with learning themes across divisions, chapters, and sections, and learning is performed in such a way that the keywords for each theme are related. is there. Multiple files contain common keywords, so it is difficult to name the files so that each file can be identified. In other words, the search by the file name has a limit and is not convenient.
In order to eliminate such inconveniences, one or more arbitrary topics or keywords included in the text are extracted and assigned to the voice data in the unit of the above-mentioned division, and these are added to the file search. It was decided to use it as index information.

ところで、音声情報の標準的なフォーマットであるMP3の場合、「アーティスト」「アルバム」「コメント」を含める目的でID3タグの領域が確保されている。そのため、この領域に、楽曲名称や演奏者名などの、該当楽曲固有の付帯情報を保持することにより、該当楽曲が識別でき、これらを使って、検索、分類、抽出を行っている。本発明では、上記の楽曲の識別と同様に、音声情報のファイル毎に、オリジナルの教材が持つキーワードをインデックス情報として付与し、この情報を活用して、音声情報の検索、分類、抽出を容易にしようとする。インデックス情報の付与された音声データの例を、図12に示す。
なお、キーワードには法律、経済などのカテゴリーがあり、さらに民法、民事訴訟法、貿易、金融などのサブカテゴリーがあるので、これを、アーティスト、アルバム、ジャンルに相当する領域に振り分け、キーワードを階層化してもよい。
By the way, in the case of MP3 which is a standard format of audio information, an ID3 tag area is reserved for the purpose of including “artist”, “album”, and “comment”. For this reason, in this area, by holding incidental information unique to the corresponding music such as the name of the music and the name of the player, the corresponding music can be identified, and these are used for searching, classification, and extraction. In the present invention, as in the above-described music identification, the keywords of the original teaching materials are assigned as index information for each audio information file, and the information can be used to easily search, classify, and extract the audio information. Try to. An example of audio data to which index information is added is shown in FIG.
Keywords include categories such as law and economy, and subcategories such as civil law, civil litigation law, trade, and finance. These are divided into areas corresponding to artists, albums, and genres, and keywords are hierarchized. May be used.

コンテンツの提供者がキーワードを登録し、利用者がそのキーワードを検索するのは一般の楽曲と同じであって、一見するとオリジナルCDを作る場合と異ならないようにもみえる。
しかし、楽曲の場合は、アーティスト名などによって、どのような楽曲であるかの見当がつく。これに対し、本発明のような教材では、キーワードによって各部分を識別させることは難しい。その教材がカバーする科目によって重要なキーワードというものは、ある程度数が絞られ、それらのキーワードは教材全般にわたり出現しうるからである。したがって、その部分から抽出されたキーワードをファイル名とすることは適当でない。そのため、教材全体を区切り、各区切りにキーワードを付与することで、オリジナル教材の作成を助けることとする。つまり、ID3タグを補助情報の書き込み箇所とする点で同じとはいえ、楽曲と本発明とでは似て非なるものである。
The content provider registers a keyword and the user searches for the keyword in the same way as a general music piece. At first glance, it seems that it is not different from the case of making an original CD.
However, in the case of music, the artist knows what kind of music it is. On the other hand, in a teaching material like the present invention, it is difficult to identify each part by a keyword. This is because the number of keywords that are important depending on the subjects covered by the teaching materials is limited to some extent, and these keywords can appear throughout the teaching materials. Therefore, it is not appropriate to use a keyword extracted from that portion as a file name. For this reason, the entire teaching material is divided and a keyword is assigned to each division to help create an original teaching material. In other words, although it is the same in that the ID3 tag is used as the auxiliary information writing location, the music is similar to the present invention.

以上の図3のS1からS6までの処理により、各分割単位に対応した音声ファイル2が生成された。処理手段9は、これらの音声ファイル2を出力音声ファイル記憶手段22に記憶させる(S7)。直接配布用の媒体5を作成する場合は、出力音声ファイル記憶手段22はCDなどの記憶媒体5そのものであるが、出力音声ファイル記憶手段22はRAMやハードディスクなどで構成し、必要に応じて記憶媒体5にその記憶内容を転送してもよい。記憶媒体5としては、CDの他に、DVD、フラッシュメモリを使ったSDカードなど種々が考えられる。このようにして、本実施形態の音声教材1が作成された。なお、この音声教材1は、単独で配布してもよく、紙ベースの印刷教材3に添付する形態で配布してもよい。 Through the processes from S1 to S6 in FIG. 3, the audio file 2 corresponding to each division unit is generated. The processing unit 9 stores these audio files 2 in the output audio file storage unit 22 (S7). When the medium 5 for direct distribution is created, the output audio file storage means 22 is the storage medium 5 itself such as a CD, but the output audio file storage means 22 is composed of a RAM, a hard disk or the like, and is stored as necessary. The stored contents may be transferred to the medium 5. As the storage medium 5, in addition to the CD, various types such as a DVD and an SD card using a flash memory are conceivable. In this way, the audio teaching material 1 of the present embodiment is created. The audio teaching material 1 may be distributed alone or in a form attached to the paper-based printed teaching material 3.

〔1−3.第1の実施形態:音声教材の利用方法〕
本実施形態の音声教材1を利用するためには、利用者側は、音声教材1を格納した記憶媒体5を読み取る手段、音声データ再生装置との接続手段を備えたパソコンを利用できることが前提である。
音声データ再生装置としては、携帯MP3プレーヤーが代表的であるが、携帯電話やPDAを利用することも可能である。
[1-3. First Embodiment: Method for Using Audio Teaching Materials]
In order to use the audio teaching material 1 of the present embodiment, it is assumed that the user can use a personal computer provided with means for reading the storage medium 5 storing the audio teaching material 1 and connection means with the audio data reproducing apparatus. is there.
A portable MP3 player is a typical audio data playback device, but a mobile phone or PDA can also be used.

以下、図13に従い、利用者側の処理フローを説明する。
利用者は、可搬型記憶媒体5を直接再生装置にセットし、音声化された教材1を聞くことができる。しかし、付与されたインデックス情報を有効に活用するため、一旦パソコンに格納し、パソコン上で汎用の音声ファイル編集ソフトウェア(例えば、iTunes)を使って、自分専用の教材を編集することが好ましい。
音声教材1をパソコンのメモリ上に展開する(ステップS400)。自分専用に編集する必要がなければ(S401でNo),パソコン上で再生してもよく、全音声ファイルを再生装置に収容してもよい。しかし、編集するならば(S401でYes)、検索キーワードを入力する(S403)。音声ファイル編集ソフトウェアは、入力されたキーワードに合致するものを、音声データ部6に付加された補助情報部7から探し、合致するものがあれば(S404でYes)、その音声データをパソコンに接続された音声再生装置(例えば、MP3プレーヤー)に収容する(S405)。このS404以降の処理を音声ファイル2について繰り返す(S406でNo)。
Hereinafter, the processing flow on the user side will be described with reference to FIG.
The user can directly set the portable storage medium 5 in the playback device and listen to the voiced teaching material 1. However, in order to make effective use of the assigned index information, it is preferable to store the index information once in a personal computer and edit the personalized teaching material using general-purpose audio file editing software (for example, iTunes) on the personal computer.
The audio teaching material 1 is expanded on the memory of the personal computer (step S400). If it is not necessary to edit for own use (No in S401), it may be played back on a personal computer or all audio files may be stored in the playback device. However, if editing is to be performed (Yes in S401), a search keyword is input (S403). The audio file editing software searches the auxiliary information unit 7 added to the audio data unit 6 for a match with the input keyword, and if there is a match (Yes in S404), connects the audio data to the personal computer. The voice playback device (for example, MP3 player) is accommodated (S405). The processes after S404 are repeated for the audio file 2 (No in S406).

このように、自分の学習進度などの都合にあわせて編集することにより、次のようなメリットがある。
例えば、分量の多い白書のような教材を使って「温暖化」に関するテーマを学習する場合、国際的なレベル、国家レベル及び市町村レベルの取り組みが教材に記述されているものとする。これらの取り組みが、別々の章に分散して記載されているならば、「温暖化」に関するテーマを学習する場合、それぞれの章を先頭から聴取し、所望のテーマが含まれるか否かを検索しながら、聴取する必要がある。この検索するという行為は、内容の理解にかかわるものではない。学習の本筋とは異なることに集中するのでは、学習効率が低下する。そのため、本発明では、各章の「温暖化」というキーワードを含む音声ファイル2だけを予め抽出してそれらを連続して聴くことにより、教材自体の章、節による区分けに捉われず、「温暖化」というテーマを基軸とした効果的な学習が可能となる。
In this way, editing according to the circumstances of one's own learning progress, etc. has the following advantages.
For example, when learning a theme related to “warming” using educational materials such as white papers with a large volume, it is assumed that efforts at the international, national and municipal levels are described in the educational materials. If these efforts are described separately in separate chapters, when learning themes related to “warming”, listen to each chapter from the beginning and search for whether the desired theme is included. However, it is necessary to listen. This act of searching is not related to the understanding of the contents. Concentrating on something different from the main line of learning reduces learning efficiency. For this reason, in the present invention, only the audio file 2 including the keyword “warming” in each chapter is extracted in advance and listened to continuously, so that it is not limited by the chapter or section of the teaching material itself. Effective learning is possible based on the theme of “reform”.

ところで、テーマに関連した箇所のみを効果的に学習するということならば、コンピュータを用いて机上で学習してもよい。
しかし、コンピュータを利用して、検索しながら聞くのでは、ある箇所を聞いた後、次の箇所へ移るまでの検索に要する時間が発生する。そのため、コンピュータに向かっている時間の一部が学習以外に費やされることになる。しかも、わずかとはいえ時間的な間隔があくことによって集中力がとぎれるという問題もある。
これに対し、必要な箇所のみを携行するならば、いつでもどこでも聴覚により関連あるテーマを連続的に集中して学習できる。したがって、この音声教材1は、学習テーマ毎に抽出した音声情報を携帯可能な再生装置に格納し再生する、つまりオリジナルな教材を携行して聴くという利用方法のもとでその真価を発揮する。
By the way, if it is effective to learn only the part related to the theme, it may be learned on a desk using a computer.
However, when listening while searching using a computer, the time required for the search after listening to a certain part and moving to the next part occurs. Therefore, a part of time toward the computer is spent other than learning. Moreover, there is a problem that concentration is interrupted by the time interval, although it is slight.
On the other hand, if you carry only the necessary parts, you can always concentrate and learn related topics anytime and anywhere. Therefore, the audio teaching material 1 exhibits its true value under a usage method in which the audio information extracted for each learning theme is stored and reproduced in a portable playback device, that is, the original teaching material is carried and listened.

〔第2の実施形態〕
第1の実施形態では、インデックス情報の付与のためには、ID3タグを利用した。しかし、各音声ファイルとともに、キーワードと、これを含む音声ファイルを識別する情報との対応を記述したインデックス情報データベースを記憶媒体5に格納して配布してもさしつかえない。ただし、このインデックス情報データベースを検索し、所定のキーワードを含む音声データを抽出するためのコンピュータプログラムも配布用の媒体5に格納する必要がある。
[Second Embodiment]
In the first embodiment, an ID3 tag is used for providing index information. However, along with each audio file, an index information database describing the correspondence between the keyword and information for identifying the audio file including the keyword may be stored in the storage medium 5 and distributed. However, it is also necessary to store the computer program for searching the index information database and extracting voice data including a predetermined keyword in the distribution medium 5.

図14は、インデックス情報データベースのフォーマット例である。
この例では、ファイル識別情報欄には、キーワード欄のキーワードを含む音声ファイル2のファイル名が記述されているが、ファイルを識別しうるものであればどのような名称でもよい。この音声教材では、ファイル名よりもむしろキーワードによってファイルを検索することを想定しているからである。
FIG. 14 is a format example of the index information database.
In this example, in the file identification information column, the file name of the audio file 2 including the keyword in the keyword column is described, but any name can be used as long as the file can be identified. This is because this audio teaching material assumes that a file is searched by a keyword rather than a file name.

〔第3の実施形態〕
第1の実施形態および第2の実施形態のいずれにおいても、音声教材を可搬性ある記憶媒体に格納して利用者に提供するものであった。しかし、通信ネットワークを介して利用者にダウンロードさせるようにしても差し支えない。音声教材の提供者(製作者、販売者も含む)は、サーバを管理し、購入希望者側の端末からのアクセスに応じて販売する。
このように、ネットワークを利用した配布方法は、教材の内容に改訂があったときに過年度の利用者に対し通知をしたり、内容に誤植があったときに利用者に訂正を通知したりする際に便利である。
[Third Embodiment]
In both the first embodiment and the second embodiment, the audio teaching material is stored in a portable storage medium and provided to the user. However, the user may be allowed to download via the communication network. A provider of audio teaching materials (including producers and sellers) manages the server and sells it according to access from the terminal of the purchase applicant.
In this way, the distribution method using the network notifies users of previous years when the contents of the teaching materials are revised, or notifies the users of corrections if the contents are typographical. It is convenient in some cases.

ただし、通信ネットワークを利用した販売では、不正な方法での入手を試みる者が出現しかねない。これを防止するために、コンテンツそのものに暗号化を施し、復号用の鍵を有償で販売する等の公知の技術を取り入れることも考慮する必要がある。 However, in the sale using the communication network, there may be a person who tries to obtain it by an unauthorized method. In order to prevent this, it is necessary to consider incorporating known techniques such as encrypting the content itself and selling a decryption key for a fee.

〔その他の実施形態〕
上記の実施形態では、MP3フォーマットを前提として説明したが、必ずしもMP3に限定するものではない。本発明は、大量のテキストデータを分割して録音し、各分割部分の抽出に便利なようにインデックス情報を付与した点に特徴があるのであって、この特徴は、音声データファイルのフォーマットとは無関係だからである。
[Other Embodiments]
The above embodiment has been described on the premise of the MP3 format, but is not necessarily limited to MP3. The present invention is characterized in that a large amount of text data is divided and recorded, and index information is added so as to be convenient for extraction of each divided portion. This feature is different from the format of an audio data file. Because it is irrelevant.

上記の実施形態では、iTunesのような既存のソフトウェアを利用するものとして説明した。確かに、iTunesを標準インストールすれば、少なくとも次のことが実現できる。すなわち、アーティスト、アルバム欄にキーワードを登録すること、登録したキーワードで検索すること、アーティストとアルバムをまたがった検索をすること等である。
しかし、iTunesによらず、これらの機能を最低限備えた専用のソフトウェアを用いてもよい。たとえば、音声再生装置に収容した区分と日付とをログファイルに書き込んだり、朗読を聴きながら文字情報を画面表示し、画面上のキーワードをクリックすることにより、関連情報の説明箇所にジャンプしたりといった専用ソフトウェアならではの機能を付加することもできる。
In the above embodiment, it has been described that existing software such as iTunes is used. Certainly, if iTunes is installed as standard, at least the following can be realized. That is, registering a keyword in the artist / album column, searching with the registered keyword, searching across artists and albums, and the like.
However, it is also possible to use dedicated software having at least these functions regardless of iTunes. For example, writing the category and date stored in the audio playback device to a log file, displaying text information on the screen while listening to readings, and jumping to the explanation location of related information by clicking a keyword on the screen Functions unique to dedicated software can also be added.

上記の第1の実施形態では、コンピュータプログラムを実行する処理手段9によって音声教材1の作成作業のほとんどが行われていた。これは、人手による負担を軽減し、短期間での音声教材1の作成のためである。
しかし、作成作業のほとんどを人手で行っても差し支えない。つまり、朗読用原稿の作成、キーワード候補の抽出などを省略し、人手で紙媒体の教材3に分割位置を挿入し、分割ブロックごとに朗読して録音をし、録音後に、MP3対応のソフトウェアでキーワードをID3タグに書き込むわけである。これならば、音声教材作成のための専用のソフトウェアを準備しなくても済むという利点がある。
In the first embodiment, most of the creation work of the audio teaching material 1 is performed by the processing means 9 that executes the computer program. This is for reducing the burden on manpower and creating the audio teaching material 1 in a short period of time.
However, most of the creation work can be done manually. In other words, the creation of a reading manuscript, the extraction of keyword candidates, etc. are omitted, the division position is manually inserted into the teaching material 3 of the paper medium, the reading is recorded for each divided block, and the recording is performed with MP3-compatible software. The keyword is written in the ID3 tag. This has the advantage that it is not necessary to prepare dedicated software for creating audio teaching materials.

各種の学習教材が音声データとして提供され、かつ、自分専用に編集して携行できるので、学習時間が十分に確保できない社会人などに最適である。そのため、例えば、資格試験の予備校などで紙媒体の教材に添付して配布すれば、利用者に利便性をもたらすことができる。
Various learning materials are provided as audio data, and can be edited and carried for your own use, making it ideal for members of society who do not have enough learning time. For this reason, for example, if it is distributed attached to a paper-based teaching material at a preliminary school for qualification examinations, it is possible to bring convenience to the user.

第1の実施形態の音声教材を説明する図である。It is a figure explaining the audio teaching material of 1st Embodiment. 第1の実施形態の音声教材を作成するシステムのブロック図である。It is a block diagram of the system which produces the audio teaching material of 1st Embodiment. 第1の実施形態の音声教材を作成する処理の流れ図である。It is a flowchart of the process which creates the audio teaching material of 1st Embodiment. 第1の実施形態の音声教材を作成するために、元になるテキストデータを分割する処理の流れ図である。It is a flowchart of the process which divides | segments the original text data in order to create the audio teaching material of 1st Embodiment. 第1の実施形態の音声教材を作成するために、キーワード候補を抽出する処理の流れ図である。It is a flowchart of the process which extracts a keyword candidate in order to produce the audio teaching material of 1st Embodiment. 第1の実施形態のキーワード候補抽出ルールを例示する図である。It is a figure which illustrates the keyword candidate extraction rule of 1st Embodiment. 第1の実施形態のキーワード候補の抽出の前段階として抽出されたセンテンス例を示す図である。It is a figure which shows the example of a sentence extracted as a front | former stage of extraction of the keyword candidate of 1st Embodiment. 第1の実施形態のキーワード候補の抽出の前段階として抽出された名詞を示す図である。It is a figure which shows the noun extracted as a front | former stage of extraction of the keyword candidate of 1st Embodiment. 第1の実施形態のキーワード候補抽出から除外する単語を列挙した除外リストを例示する図である。It is a figure which illustrates the exclusion list which enumerated the word excluded from keyword candidate extraction of 1st Embodiment. 第1の実施形態のキーワード候補抽出処理によって抽出されたキーワード候補を例示する図である。It is a figure which illustrates the keyword candidate extracted by the keyword candidate extraction process of 1st Embodiment. 第1の実施形態の音声教材を作成するために、インデックス情報を付与する処理の流れ図である。It is a flowchart of the process which provides index information in order to produce the audio teaching material of 1st Embodiment. 第1の実施形態の音声データに付与されたインデックス情報を例示する図である。It is a figure which illustrates the index information provided to the audio | voice data of 1st Embodiment. 第1の実施形態の音声教材を利用する処理の流れ図である。It is a flowchart of a process using the audio teaching material of 1st Embodiment. 第2の実施形態の音声教材に添付されたインデックス情報データベースを説明する図である。It is a figure explaining the index information database attached to the audio teaching material of 2nd Embodiment.

符号の説明Explanation of symbols

1 音声教材
2 音声ファイル
3 (テキストベースの)教材
4 (教材3の)分割部分
5 記憶媒体
6 (音声ファイル2の)音声データ部
7 (音声ファイル2の)補助情報部
DESCRIPTION OF SYMBOLS 1 Audio teaching material 2 Audio file 3 (Text base) Teaching material 4 (Part of teaching material 3) Divided part 5 Storage medium 6 Audio data part 7 (audio file 2) Auxiliary information part

Claims (4)

学習対象となる教材に含まれるテキストデータを、所定の分割ルールに従って分割した単位ごとに音声データに変換し、この音声データが収録された複数の音声ファイルを可搬性ある記憶媒体に格納して提供される音声教材であって、
各音声ファイルの音声データに含まれるキーワードと該音声ファイルとを対応付けて記憶するインデックス情報を有することを特徴とする音声教材。
Text data contained in learning materials to be learned is converted into audio data for each unit divided according to a predetermined division rule, and multiple audio files containing this audio data are stored in a portable storage medium and provided Audio teaching material,
An audio teaching material comprising index information for storing a keyword included in audio data of each audio file and the audio file in association with each other.
学習対象となる教材に含まれるテキストデータを、所定の分割ルールに従って分割した単位ごとに音声データに変換し、この音声データが収録された複数の音声ファイルが、通信ネットワークを介して提供される音声教材であって、
各音声ファイルの音声データに含まれるキーワードと該音声ファイルとを対応付けて記憶するインデックス情報を有することを特徴とする音声教材。
Text data included in the learning material to be learned is converted into audio data for each unit divided according to a predetermined division rule, and multiple audio files containing this audio data are provided via a communication network. Teaching materials,
An audio teaching material comprising index information for storing a keyword included in audio data of each audio file and the audio file in association with each other.
前記インデックス情報は、音声ファイル内の音声データに付加されている補助情報部に書き込まれていることを特徴とする請求項1または請求項2のいずれかに記載の音声教材。 The audio teaching material according to claim 1 or 2, wherein the index information is written in an auxiliary information part added to audio data in an audio file. 前記インデックス情報を格納したインデックス情報データベースを含むとともに、該インデックス情報データベースを検索し、検索条件に合致する音声ファイルを抽出するコンピュータプログラムを含むことを特徴とする請求項1または請求項2のいずれかに記載の音声教材。 3. The computer program product according to claim 1, further comprising a computer program that includes an index information database that stores the index information, and that searches the index information database and extracts an audio file that matches the search condition. Audio teaching materials described in.
JP2006316391A 2006-11-23 2006-11-23 Voice text Pending JP2008129475A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006316391A JP2008129475A (en) 2006-11-23 2006-11-23 Voice text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006316391A JP2008129475A (en) 2006-11-23 2006-11-23 Voice text

Publications (1)

Publication Number Publication Date
JP2008129475A true JP2008129475A (en) 2008-06-05

Family

ID=39555307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006316391A Pending JP2008129475A (en) 2006-11-23 2006-11-23 Voice text

Country Status (1)

Country Link
JP (1) JP2008129475A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017084238A1 (en) * 2015-11-20 2017-05-26 Chrysus Intellectual Properties Limited A method and system for analyzing a piece of text

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5735972U (en) * 1980-08-11 1982-02-25
JP2000331467A (en) * 1999-05-21 2000-11-30 Kanaasu Data Kk Portable type voice-reproducing device for learning use and reproducing method of learning use voice
JP2004280911A (en) * 2003-03-13 2004-10-07 Alpine Electronics Inc Audio reproducing device with inter-music dj
JP2005352361A (en) * 2004-06-14 2005-12-22 Japan Research Institute Ltd Education system and program capable of selecting teaching material whose contents of low intelligibility by viewer have been explained
JP2006133672A (en) * 2004-11-09 2006-05-25 Matsushita Electric Ind Co Ltd Portable device and system for learning language

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5735972U (en) * 1980-08-11 1982-02-25
JP2000331467A (en) * 1999-05-21 2000-11-30 Kanaasu Data Kk Portable type voice-reproducing device for learning use and reproducing method of learning use voice
JP2004280911A (en) * 2003-03-13 2004-10-07 Alpine Electronics Inc Audio reproducing device with inter-music dj
JP2005352361A (en) * 2004-06-14 2005-12-22 Japan Research Institute Ltd Education system and program capable of selecting teaching material whose contents of low intelligibility by viewer have been explained
JP2006133672A (en) * 2004-11-09 2006-05-25 Matsushita Electric Ind Co Ltd Portable device and system for learning language

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017084238A1 (en) * 2015-11-20 2017-05-26 Chrysus Intellectual Properties Limited A method and system for analyzing a piece of text
US10755594B2 (en) 2015-11-20 2020-08-25 Chrysus Intellectual Properties Limited Method and system for analyzing a piece of text

Similar Documents

Publication Publication Date Title
Cresti et al. C-ORAL-ROM: integrated reference corpora for spoken romance languages
Paquot et al. A practical handbook of corpus linguistics
Bowern Linguistic fieldwork: A practical guide
Burnard What is the Text Encoding Initiative?: How to add intelligent markup to digital resources
Kjeldsen Rhetorical audience studies and reception of rhetoric: Exploring audiences empirically
Chafe et al. Towards a new corpus of spoken American English
JP2013072957A (en) Document read-aloud support device, method and program
Plassard Functional Requirements for Bibliographic Records (1998)
Ädel Corpus compilation
JP2009140466A (en) Method and system for providing conversation dictionary services based on user created dialog data
Durand Corpus phonology
JP4558680B2 (en) Application document information creation device, explanation information extraction device, application document information creation method, explanation information extraction method
Newcomer et al. Music discovery requirements: A guide to optimizing interfaces
Belford Evaluating library discovery tools through a music lens
JP4697432B2 (en) Music playback apparatus, music playback method, and music playback program
US20070280438A1 (en) Method and apparatus for converting a daisy format file into a digital streaming media file
US20060248105A1 (en) Interactive system for building and sharing databank
JP2008129475A (en) Voice text
Boves et al. Spontaneous speech in the spoken dutch corpus
Smiraglia Describing Music Materials: A Manual for Resource Description of Printed and Recorded Music and Music Videos
JP5382965B2 (en) Application document information creation apparatus, application document information creation method, and program
JP4579281B2 (en) Application document information creation apparatus, application document information creation method, and program
Falk et al. A New Take on Cataloging Popular Music Recordings
Encelle et al. BMML: braille music markup language
Yáñez-Bouza Historiographical methods

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091118

A521 Written amendment

Effective date: 20100313

Free format text: JAPANESE INTERMEDIATE CODE: A523

A871 Explanation of circumstances concerning accelerated examination

Effective date: 20100313

Free format text: JAPANESE INTERMEDIATE CODE: A871

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20100401

A131 Notification of reasons for refusal

Effective date: 20100408

Free format text: JAPANESE INTERMEDIATE CODE: A131

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100512

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100518

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100604

A02 Decision of refusal

Effective date: 20100630

Free format text: JAPANESE INTERMEDIATE CODE: A02