JP2000172289A - 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 - Google Patents

自然言語処理方法,自然言語処理用記録媒体および音声合成装置

Info

Publication number
JP2000172289A
JP2000172289A JP10342992A JP34299298A JP2000172289A JP 2000172289 A JP2000172289 A JP 2000172289A JP 10342992 A JP10342992 A JP 10342992A JP 34299298 A JP34299298 A JP 34299298A JP 2000172289 A JP2000172289 A JP 2000172289A
Authority
JP
Japan
Prior art keywords
word
text
pronunciation
words
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10342992A
Other languages
English (en)
Other versions
JP3706758B2 (ja
Inventor
Katsuyoshi Yamagami
勝義 山上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP34299298A priority Critical patent/JP3706758B2/ja
Publication of JP2000172289A publication Critical patent/JP2000172289A/ja
Application granted granted Critical
Publication of JP3706758B2 publication Critical patent/JP3706758B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 単語,複合語を問わず、聞き取りにくい
表現を音声による読み上げに適した表現に変換し得る自
然言語処理方法を提供すること。 【解決手段】 テキスト変換部103の発音パターン抽
出部104は、発音規則テーブル111内に該当する発
音パターンが存在するかをサーチし、読み上げた際に聞
きづらいと推定される部分を抽出する。次に、テキスト
変換処理部105が、テキスト変換規則テーブル112
を用いて、抽出された部分を、読み上げを前提としたテ
キストに変換する。文書を音読する際の音の組み合わせ
という、新規な観点から広く聞きづらい表現をサーチす
るので、複合語単位の表現でも適切な表現に置換するこ
とが可能である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然言語処理方
法,自然言語処理用記録媒体および音声合成装置に関す
る。
【0002】
【従来の技術】インターネットなどの普及により、さま
ざまなテキスト情報を容易に得ることができるが、まと
まった量のテキスト情報を画面上で閲覧するのは、ユー
ザにとって負担となることがある。そこで、テキストを
音声化するテキスト音声合成技術が開発され、最近で
は、テキスト読み上げ機能を備えるパソコンやワープロ
も発売されるようになった。
【0003】但し、テキスト情報は読まれることを前提
として記述されているのが普通なので、忠実に音声とし
て再現するだけでは、ユーザーにわかりやすい読み上げ
にならない場合が多い。この不都合を軽減する技術は、
いろいろと提案されている。
【0004】例えば、次のようなものがある。特開平3
−35296号公報(従来例),特開平10−171
485号公報(従来例),特開平7−121543号
公報(従来例),特開平7−325595号公報(従
来例),特開平10−228471号公報(従来例
)。
【0005】従来例は、入力テキストの難意語や紛ら
わしい同音異義語を平易な単語に置き換える機能を音声
合成装置に付与したものである。従来例は、語義テー
ブルを用いて構文を解析し、単語の置き換えを行う音声
合成装置である。従来例は、会話文辞書を用いて構文
を解析する構文解析装置である。従来例は、文節関係
規則にしたがってポーズを挿入する音声合成装置であ
る。従来例は、単語辞書を用いて単語を同定してポー
ズを挿入する音声合成システムである。
【0006】
【発明が解決しようとする課題】上述の従来例は、「単
語を単位」とした「構文解析」を行う点で共通する。
【0007】この場合、「単語を単位」とした処理を行
うと、以下のような点で十分な対応ができない。
【0008】すなわち、書き言葉のテキストには複数の
単語で構成される複合語が多用されるが、複合語を構成
するそれぞれの単語を聞き取ることは容易であっても、
連続して読み上げた場合に、聞き取りにくい発音となる
場合がある。したがって、単語単位の処理では、このよ
うな連続して単語を読み上げていく場合に生じる聞き取
りにくさを改善するには不十分である。複合語を一つの
単位として置き換えることも考えられるが、複合語は、
任意の単語の組み合わせによって無限に存在するので、
事実上、複合語単位での規則を網羅することは不可能で
ある。
【0009】また、「構文解析」は、単語に分割した
後、文節や、かかり結び等の文章構造を解析するもので
あり、上述の単語単位の処理(単語の置き換え等)は、こ
のような文章の解析処理と不可分の関係となっていて、
構文解析の方式やその精度による影響を受ける。
【0010】本発明は、このような検討に基づいてなさ
れたものであり、上述した従来の自然言語処理の不都合
を解消し得る、新規な自然言語処理方法を提供すること
を目的とする。
【0011】
【課題を解決するための手段】本発明は、文書の構造で
はなく、「文書を音読する際の音の組み合わせ」という
新規な観点から分析するようにしたものである。すなわ
ち、発音の組み合わせで聞きづらいものを予め発音パタ
ーン規則として登録しておき、テキストが入力される
と、まず、その発音パターン規則に該当する音のパター
ンが存在するかをサーチして、聞きづらいと推定される
部分を拾い出す(第1段階の処理)。次に、この拾い出さ
れた部分に、読み上げを前提とした文体に変換するため
のテキスト変換規則を適用する(第2段階の処理)。
【0012】変換処理の内容は、状況に応じて柔軟に変
化する。すなわち、単語を別の単語で置換するか、単語
を複合語に置換するか、単語と単語の間にポーズを挿入
するか、単語と単語の間に助詞を挿入するか、といった
判断が個別的になされ、最適な変換処理が選択されるこ
とになる。
【0013】本発明では、従来例のように文章の字面に
着目するのではなく、音の組み合わせのパターンという
新規な観点から問題となりそうな箇所を拾い出すので、
一つの単語が特殊な発音で聞きづらい場合やその単語に
同音異義語があることによって聞きづらい場合、といっ
た一つの単語に起因する場合のみならず、単語を連続し
て読み上げる際に生じる、複合語に起因して聞きづらさ
が生じる場合も含めて、該当箇所を抽出することができ
る。
【0014】そして、抽出された部分に対して変換規則
を適用して、聞きづらさが生じる態様毎に適切な処理を
ほどこすので、テキストを読み上げる際の聞きやすさが
向上する。
【0015】また、発音パターンによる問題箇所の絞り
込みがなされており、かつ、発音パターンによる問題箇
所の絞り込みの規則が既知であるので、テキスト変換規
則の構築も、それほど複雑とはならない。
【0016】また、発音パターン規則による問題箇所の
絞り込み処理は、入力された文書を単語列に分割した段
階で行うことができ、構文解析処理とは独立に実行でき
るというメリットがある。
【0017】
【発明の実施の形態】本発明の自然言語処理方法の第1
の態様は、入力されたテキストを、所定の発音パターン
が発音規則として登録されている第1のテーブルと照合
して、前記入力されたテキストから前記所定の発音パタ
ーンを含む部分を抽出する第1のステップと、第2のテ
ーブルに登録されている変換規則に基づき、抽出された
前記部分に含まれる単語または複合語を他の単語または
他の複合語に置換する処理、あるいは前記複合語を構成
する単語間に助詞またはポーズを挿入する処理を実行す
る第2のステップと、を含む。
【0018】この態様では、第1のステップにおいて、
音の組み合わせの観点から問題となる箇所を拾い出し、
第2のステップにおいて、変換規則テーブルとの照合に
よって聴きづらさが生じる原因に応じた適切なテキスト
変換処理(読み上げを前提とした文章への変換処理)を
選択する。これにより、単語単位で聞きづらさが生じる
場合のみならず、複合語を単位とする聞きづらい態様に
ついても、テキスト変換を行うことができるようにな
る。
【0019】また、本発明の自然言語処理方法の第2の
態様では、第1の態様において、前記所定の発音パター
ンは、母音,子音,拗音または撥音を組み合わせた一つ
の発音を単位として、その単位の組み合わせによって表
現されるようにした。
【0020】発音記号による分類を単位として聞きづら
い発音パターンを含んでいる文章を特定するので、文章
の意味内容等とは無関係に、発音パターンとのマッチン
グだけで問題となりそうな箇所を抽出することが可能と
なる。
【0021】また、本発明の自然言語処理方法の第3の
態様では、第2の態様において、前記所定の発音パター
ンは、(子音・拗音)からなる発音が連続するパターン
を含むようにした。
【0022】聞き取りにくい発音パターンの例を明らか
としたものである。
【0023】また、本発明の自然言語処理方法の第4の
態様は、第2の態様において、前記所定の発音パターン
は、(子音・拗音)(子音・母音)(子音・拗音)の組
み合わせからなるパターンを含むようにした。
【0024】聞き取りにくい発音パターンの他の例を明
らかとしたものである。
【0025】また、本発明の第5の態様は、第1〜第4
の態様において、前記複合語を構成する、隣接する2つ
の単語の隣接部分に前記聞き取りにくい発音パターンが
存在し、かつ、前記2つの単語が共に名詞である場合
に、前記2つの単語間に助詞またはポーズを挿入するよ
うにした。
【0026】複数の単語で構成する複合語の場合、それ
ぞれの単語を単独で聞き取ることは容易であっても、連
続して読み上げた場合に聞き取りにくい発音となる場合
がある。このような場合にも、聞き取りやすいように助
詞やポーズの挿入処理を可能としたものである。従来の
構文解析に基づく単語単位の処理では、連続読み上げに
起因して生じる発音の聞き取りにくさには対処すること
ができない。この場合、複合語単位の辞書と規則により
対応することも考えられるが、複合語は無限に合成可能
であるので、複合語単位のテキスト処理は事実上、実現
不可能ということになる。本発明の態様では、従来不可
能であった、隣接する2つの単語の隣接部分に前記聞き
取りにくい発音パターンが存在する場合も、第1のステ
ップで問題箇所として抽出でき、続いて、第2のステッ
プにおいて、例えば、名詞と名詞との連結の場合には助
詞やポーズを挿入するという規則を適用することによ
り、聞き取り容易な文体に変換することが可能となる。
【0027】また、本発明の自然言語処理方法の第6の
態様では、第1〜第5の態様において、前記第1のテー
ブルに登録されている前記発音規則または前記第2のテ
ーブルに登録されている前記変換規則を、外部に提示可
能とした。
【0028】これにより、ユーザーが、発音規則または
変換規則を確認できるようになる。
【0029】また、本発明の自然言語処理方法の第7の
態様は、第1の態様〜第6の態様において、前記第1の
テーブルに登録されている前記発音規則または前記第2
のテーブルに登録されている前記変換規則を外部から補
正することができるようにした。
【0030】これにより、ユーザーがテーブルの構築に
参画できるようになる。これによって、各々のユーザー
に特有な発音規則または変換規則を追加することがで
き、また、テーブル構築の負担も軽減される。
【0031】また、本発明の自然言語処理用記録媒体の
第1の態様では、自然言語処理装置に、入力されたテキ
ストを、所定の発音パターンが発音規則として登録され
ている第1のテーブルと照合して、前記入力されたテキ
ストから前記所定の発音パターンを含む部分を抽出する
第1のステップと、第2のテーブルに登録されている変
換規則に基づき、抽出された前記部分に含まれる単語ま
たは複合語を他の単語または他の複合語に置換する処
理、あるいは前記複合語を構成する単語間に助詞または
ポーズを挿入する処理を実行し、前記入力されたテキス
トを読み上げることを前提としたテキストに変換する第
2のステップと、を実行させるためのプログラムが記録
されている。
【0032】新規な自然言語処理プログラムを記録し
た、コンピュータが読み取り可能な記録媒体が得られ
る。
【0033】また、本発明の自然言語処理用記録媒体の
第2の態様は、自然言語処理装置に、入力されたテキス
トを、所定の発音パターンが発音規則として登録されて
いる第1のテーブルと照合して、前記入力されたテキス
トから前記所定の発音パターンを含む部分を抽出する第
1のステップと、第2のテーブルに登録されている変換
規則に基づき、抽出された前記部分に含まれる単語また
は複合語を他の単語または他の複合語に置換する処理、
あるいは前記複合語を構成する単語間に助詞またはポー
ズを挿入する処理を実行し、前記入力されたテキストを
読み上げることを前提としたテキストに変換する第2の
ステップと、を実行させる場合の、前記第1のテーブル
および前記第2のテーブルを記録している。
【0034】新規な自然言語処理に用いられる辞書ベー
ス(知識ベース)を記録した、コンピュータが読み取り
可能な記録媒体が得られる。
【0035】また、本発明の自然言語処理用記録媒体の
第3の態様は、第1または第2の態様において、前記第
1のテーブルまたは前記第2のテーブルを、読み出し/
書き込み可能としたものである。
【0036】これにより、テーブルの参照/テーブルへ
の書き込みが可能となる。
【0037】また、本発明の音声合成装置の第1の態様
では、日本語の入力テキストを単語列に分割し、単語列
の各単語に対して読み、品詞などの言語情報を付与する
言語処理手段と、母音,子音,拗音または撥音を組み合
わせた一つの発音を単位とし、その単位の組み合わせに
よって表現される、音声化した場合に聞き取りにくいと
される発音パターンが登録されている発音規則テーブル
と、前記発音規則テーブルに登録されている前記発音パ
ターンに該当する、前記言語処理手段から出力される単
語列を、音声読み上げに適した単語列に変換するための
テキスト変換規則が登録されているテキスト変換規則テ
ーブルと、前記言語処理手段から出力される単語列を前
記発音規則テーブルと照合し、前記発音パターンに該当
する単語または複数の単語からなる複合語を抽出し、抽
出された前記単語または複合語に対して、前記テキスト
変換規則テーブルに格納されている前記テキスト変換規
則を適用して聞き取りやすい単語または複合語に置換す
る処理、あるいは前記複合語を構成する単語間に助詞ま
たはポーズを挿入する処理を実行するテキスト変換手段
と、前記テキスト変換手段から出力される単語列に付与
された言語情報から音声波形を合成するのに必要な発音
系列、ピッチ、パワーなどの韻律情報を生成する韻律情
報生成手段と、前記韻律情報生成手段の出力する韻律情
報に従って音声波形を合成する音声波形合成手段と、を
有する構成とした。
【0038】これにより、複合語に起因して聞き取りに
くさが生じるような場合にも、読み上げやすい文体に変
換して読み上げ音声として出力できる、音声合成装置が
得られる。
【0039】また、本発明の音声合成装置の第2の態様
では、第1の態様において、前記テキスト変換規則テー
ブルに保持されている前記テキスト変換規則について、
ユーザからの検索、追加、修正、削除などの指示にした
がって編集,管理を行うテキスト変換規則管理手段を、
さらに具備する構成とした。
【0040】これにより、テーブルにユーザー独自の規
則を追加することができ、また、テーブルの構築コスト
を低減できる。
【0041】(実施の形態1)以下、本発明の音声合成
装置(自然言語処理装置を含む)について図面を参照し
て、具体的に説明する。
【0042】図1は、本発明の実施の形態1にかかる音
声合成装置の構成を示すブロック図である。
【0043】図示されるとおり、音声合成装置は、テキ
スト入力部101と、言語処理部102と、テキスト変
換部103(発音パターン抽出部104,テキスト変換
処理部105,構文解析部106を有する)と、韻律情
報生成部107と、音声波形合成部108と、音声出力
部109と、表示部110と、発音規則テーブル111
と、テキスト変換規則テーブル112と、テキスト変換
規則管理部113と、テキスト変換規則入出力部114
と、を具備する。
【0044】テキスト入力部101は、処理するべきテ
キストデータを受付ける。言語処理部102は、入力さ
れたテキストデータを形態素解析して、品詞などの言語
情報付与した単語列に分割する。
【0045】テキスト変換部103の発音パターン抽出
部104は、言語処理部102から出力される「単語列
の読み情報」を走査し、発音規則テーブル111に登録
されている発音パターンとの照合(マッチング)を行う
ことで、その発音パターンが含まれる部分(連続した読
み上げの場合に聞き取りにくいと判断される部分)を抽
出する。
【0046】また、テキスト変換部103のテキスト変
換処理部105は、発音パターン抽出部104により抽
出された部分について、その部分に含まれる単語列をテ
キスト変換規則にしたがって単語列に置き換える、ある
いは単語間に助詞やポーズを挿入する、といったテキス
ト変換処理を実行し、入力テキストを、音声による読み
上げに適したテキストに変換する処理を行う。
【0047】また、構文解析部106は、言語処理部1
02から送られてくる単語列を文節列にまとめて文章の
係り結びを明らかとする。この構文解析部106は、読
み上げに適したテキストへの変換処理には必須とされる
ものではないが、韻律情報生成部107でイントネーシ
ョンの付与等のために必要となる情報を提供するべく設
けられている。
【0048】韻律情報生成部107は、テキスト変換処
理部105において変換された単語列の読みや品詞など
の言語情報から、発音系列,イントネーション,ピッチ
やパワーなどの韻律情報を生成する。
【0049】音声波形合成部108は、韻律情報生成部
107が生成した、発音系列や韻律情報に基づいて音声
波形素片を接続し、音声合成データを得るものである。
合成された音声は、音声出力部109から出力される。
【0050】表示部110は、テキスト変換によって得
られた、読み上げに適したテキストを文字情報として表
示する表示手段(モニター)であり、変換された文書
を、ユーザーが自ら読み上げる場合において使用するも
のである。
【0051】また、発音規則テーブル111には、聞き
取りにくいと判断される音声パターンが、複数登録され
ている。テキスト変換規則テーブル112には、発音パ
ターン抽出部104により抽出された単語列に対して、
置き換え等の処理をするためのテキスト変換規則が登録
されている。
【0052】また、テキスト変換規則管理部113は、
テキスト変換規則テーブル112に対するユーザーイン
タフェースとして機能するものであり、テキスト変換規
則テーブル112に登録されているテキスト変換規則を
テキスト変換規則入出力部114を介してユーザーに提
示したり、あるいは、ユーザが追加/修正した規則をテ
キスト変換規則テーブル112に書き込む働きをする。
【0053】このような音声合成装置は、例えば、図7
に示すようなコンピュータシステム上に構築されるもの
である。このコンピュータシステムは、本体部601
と、キーボード602と、ディスプレイ603と、入力
装置(マウス)604を含む、音声出力可能なシステムで
ある。図1の発音規則テーブル111およびテキスト変
換規則テーブル112は、本体部601にセットされる
CD−ROM607内,本体部601が内蔵するディス
ク(メモリ)606内,あるいは回線608で接続され
た他のシステムのディスク605内に格納される。
【0054】なお、図1の音声合成装置における表示部
110は、図7のシステムにおけるディスプレイ603
に該当し、図1のテキスト変換規則入出力部114は、
図7のシステムにおけるディスプレイ603および入力
装置604に該当する。
【0055】このような本実施の形態の音声合成装置で
は、音声合成前の自然言語処理過程において、図2に示
されるように、大別して2段階の処理が行われる。
【0056】すなわち、第1の段階の処理として、テキ
スト変換部103の発音パターン抽出部104が、入力
されたテキストの単語列(言語処理部102において分
割された単語列)を発音規則テーブル111と照合し、
所定の発音パターンに該当する部分を抽出する(ステッ
プ120)。
【0057】次に、第2段階の処理として、テキスト変
換処理部105が、テキスト変換規則テーブル112に
登録されている変換規則にしたがって、抽出された部分
に含まれる単語または複合語を他の単語または複合語に
置換する処理,あるいは複合語を構成する単語間に助詞
またはポーズを挿入する処理を行って、入力されたテキ
ストを読み上げることを前提としたテキストに変換する
(ステップ121)。
【0058】第1段階のステップでは、文章の係り結び
(文章の意味内容や文章の構造)に着目するのではな
く、音の組み合わせのパターンという新規な観点から問
題となりそうな箇所を拾い出すので、一つの単語が特殊
な発音で聞きづらい場合やその単語に同音異義語がある
ことによって聞きづらい場合、といった一つの単語に起
因する場合のみならず、単語を連続して読み上げる際に
生じる、複合語に起因して聞きづらさが生じる場合も含
めて、該当箇所を広く抽出することができる。
【0059】そして、第2段階のステップにおいて、抽
出された部分に対して変換規則を適用して、聞きづらさ
が生じる態様毎に適切な処理をほどこすので、入力テキ
ストを読み上げる際の聞きやすさが向上する。
【0060】また、発音パターンによる問題箇所の絞り
込みがなされており、かつ、発音パターンによる問題箇
所の絞り込みの規則が既知であるので、テキスト変換規
則の構築も、それほど複雑とはならない。
【0061】また、発音パターン規則による問題箇所の
絞り込み処理は、入力された文書を単語列に分割した段
階で行うことができ、構文解析処理とは独立に実行でき
る。例えば、構文解析と並列に「テキスト変換処理」を
行い、この「テキスト変換処理」の結果を「構文解析処
理」を補強する形で活用することにより、聞き取りやす
い音声を出力可能な音声合成装置が得られる。
【0062】以下、発音規則テーブル111およびテキ
スト変換規則テーブル112の具体的な内容例と、これ
らの規則を用いたテキスト変換の具体例について説明す
る。
【0063】図3は、言語処理部102による、入力テ
キストから単語列への分割例を示している。
【0064】すなわち、「橋本首相は競技者表彰会に出
席した。」という入力テキスト201は、「橋本」,
「首相」,「は」,「競技者」,「表彰」,「会場」,
「に」,「出席」,「し」,「た」,「。」という単語
列202に分割される。
【0065】分割された各単語には、図3に示されるよ
うに、「単語表記 読み 品詞名」の3つの言語情報が
付与される。読点「、」や句点「。」などの読みのない
ものについては、読みの情報は「*」と記述している。
【0066】図4(a)は、発音規則テーブル111に
登録されている、聞き取りにくい発音の組み合わせのパ
ターン例を示す図であり、図4図(b)は、母音,子
音,拗音,撥音の内容を示す図である。
【0067】図4(a)には2つの発音パターン例が記
載されている。発音パターン例301は、(子音・拗
音)(子音・拗音)の組み合わせパターンであり、発音
パターン例302は、(子音・拗音)(子音・母音)
(子音・拗音)の組み合わせパターンである。
【0068】括弧で囲んだ単位(例えば(子音・拗
音))が、一つの読みのパターンを表わす。また、「母
音」,「子音」,「拗音」,「撥音」は、日本語の読み
を発音記号列として表現した場合の発音記号のグループ
である。
【0069】図4(b)は、発音記号をローマ字表記で
表わした場合の発音記号のグループ分けを示している。
つまり、母音は「a,i,u,e,o」からなるグルー
プであり、子音は「k,s,t,n,h,m,y,r,
w,g,z,d,b,p」からなるグループであり、拗
音は「ya,yu,yo」からなるグループであり、撥
音は、「nn」からなるグループである。
【0070】例えば、「(子音・拗音)」という読み
は、「子音」のグループに含まれる任意の発音記号と
「拗音」のグループに含まれる任意の発音記号のすべて
の組み合わせとして得られる読みを意味する。例えば、
「シャ(sya)」、「ギョ(gyo)」などの読み
は、この読みとして含まれる。「車種(syasy
u)」,「授受(zyuzyu)」といった単語や「民
主主義(minsyusyugi)」といった複合語は
(子音・拗音)の組み合わせを含んでおり、したがっ
て、これらの単語,複合語は、図1の発音パターン抽出
部104による抽出対象となる。
【0071】また、「客車(kyakusya)」とい
う単語は、発音パターン例302の、(子音・拗音),
(子音・拗音),(子音・拗音)の組み合わせに該当し
て、抽出の対象となる。
【0072】図5は、テキスト変換規則テーブル112
に保持されている変換規則(聞き取りにくいとして抽出
された単語列を他の単語に置き換える等の処理を行うた
めの規則)の一例を示す図である。
【0073】参照符号401,402,403はそれぞ
れ、一つのテキスト変換規則の単位を示している。図示
されるように、各単位の規則は、原則として、上段に示
される変換前の単語列のパターンと、下段に示される変
換後の単語列パターンとの組み合わせによって規定され
ている。
【0074】なお、単語列パターン中の(表記 読み
品詞)という単位が、1つの単語の情報を表わす。
【0075】テキスト変換規則401は、「首相(シュ
ショー)」という単語を「総理大臣(ソーリダイジ
ン)」という単語に置換する規則である。また、テキス
ト変換規則402は、「授受(ジュジュ)」という単語
を「受け渡し(ウケワタシ)」という単語に置換する規
則である。
【0076】テキスト変換規則403は、名詞と名詞と
の間に助詞を挿入するという規則である。この変換規則
403では、変換前の単語列のパターンにおいて、「表
記」および「読み」の部分を「?」としているが、これ
は任意の表記、読みと照合可能であることを示す。つま
り、聞き取りにくい発音パターンを含むとして抽出され
た単語列の中の、任意の連続する名詞に対して、本規則
が適用されることになる。
【0077】また、テキスト変換規則403における、
変換後の単語列パターンの中の、「(1)」,
「(2)」の番号は、変換前の単語列パターンに現れた
2つの「(?? 名詞)」の左からの順序に対応してい
る。つまり、名詞が連続する複合語が規則403に該当
すると、各名詞に分解して、(1)および(2)を、各
単語に置き換え、かつ、各名詞間に助詞を挿入すること
になる。例えば、「競技者表彰」がテキスト変換規則4
03と照合した場合は、「(1)」は「競技者」」と置
き換えられ、「(2)」は「表彰」と置き換えられ、結
果的に、「競技者の表彰」という、助詞が挿入された文
章に変換されることになる。なお、ここでは、助詞を挿
入することにしているが、同様の構造の規則によって、
名詞と名詞の間,あるいは特定の単語間にポーズを挿入
することも可能である。
【0078】このような規則を用いてテキスト変換を実
施した場合の例を、図6に示す。図6の上側に示される
単語列501は、入力テキストを図1の言語処理部10
2で解析した結果得られる、変換前の単語列である。
【0079】この変換前の単語列501の中で、図4
(a)の発音パターン301((子音・拗音)(子音・
拗音)の組み合わせ)に該当するのは、単語列501a
の「首相(シュショー)」と、単語列501bの「競技
者(キョーギシャ)および表彰(ヒョウショー)」であ
る。よって、図1の発音パターン抽出部104による発
音規則テーブル111を用いた検索の結果として、単語
列501a,501bが抽出される。
【0080】次に、図1のテキスト変換処理部105
は、抽出された単語列501aおよび単語列501bに
適用すべきテキスト変換規則を、テキスト変換規則テー
ブル112を検索して見つけ出す。すなわち、単語列5
01aは、図5に示されるテキスト変換規則401に該
当する。また、単語列501bは、テキスト変換規則4
03に該当する。そこで、テキスト変換処理部105
は、単語列501aを別の単語502aに置換し、単語
列501bの連続する名詞間に助詞を挿入する処理を行
う。
【0081】このようにして、音声による読み上げに適
したテキスト502が得られる。音声波形合成前の自然
言語処理によって、入力テキストが読み上げを考慮した
テキストに変換されているので、聞き取りやすい明快な
音声の出力が可能となる。
【0082】なお、テキスト変換の結果は、原則として
音声による読み上げに反映されるものであるが、必ずし
もこれに限定されるものではなく、読み上げは行わず
に、図1の表示部110(図7のディスプレイ603)
に表示させるだけでもよい。
【0083】例えば、放送局のなどの放送現場では、書
き言葉で書かれた記事原稿をニュース放送で読み上げる
のに適した文章表現に修正し、アナウンサーが読み上げ
るという手順でニュース放送が行われるのが一般的であ
る。しかし、突発的に発生した事件などの場合は、記事
原稿をニュース原稿に書き換えるための十分な時間が確
保できないことも多い。
【0084】このような場合には、アナウンサーの負担
軽減のために、書き言葉で書かれた記事原稿のテキスト
の中で、聞き取りにくい個所を自動的に判断し、置き換
えるべき話し言葉の表現例を、読み上げ前に提示するよ
うなシステムがあると便利である。本発明は、このよう
な用途にも使用できるものである。
【0085】また、図1の音声合成装置では、発音規則
テーブル111およびテキスト変換規則テーブル112
は書き換えが可能なテーブルである。つまり、テキスト
変換規則入出力部114およびテキスト変換規則管理部
113を用いて、発音規則テーブル111やテキスト変
換規則テーブル112をユーザーに提示でき、また、ユ
ーザー自らが、規則を追加,修正等することができる。
【0086】したがって、各規則テーブルを構築する労
力が軽減されると共に、ユーザーのニーズに合致した規
則を効率的に蓄積して、ユーザーが使いやすい規則テー
ブルを構築していくことができる。すなわち、原稿を書
きかえる作業者が持っている、書き言葉から話し言葉へ
の変換に関するノウハウを効率的にシステムに蓄積でき
る。
【0087】以上説明したように、本実施の形態の音声
合成装置(自然言語処理装置)によれば、発音規則テー
ブル111に登録した聞き取りにくい発音のパターンを
用いて、単語単位だけではなく、複合語を構成する連続
する単語の読みに関しても聞き取りにくさを判定するこ
とができる。そして、テキスト変換規則テーブル112
に登録されている変換規則を用いてテキスト変換を実行
して、単語単位では置き換えが不可能であった複合語に
関しても、より聞き取りやすい表現に置き換えることが
できる。
【0088】また、例えば、抽出された単語列に対して
変換規則を適用して変換すべき表現の候補をユーザーに
提示し、また、その候補をユーザー自身が更新すること
もできできる。これによって、ユーザの現実のニーズに
対応した話し言葉への変換規則を、効率的に蓄積でき
る。
【0089】
【発明の効果】以上説明したように本発明によれば、書
き言葉で書かれた入力のテキストに含まれる聞き取りに
くい表現を、聞き取りやすい表現に置き換えて、分かり
やすい読み上げ音声として提供することが可能である。
また、ユーザーの現実のニーズに合致した発音規則や変
換規則を効率的に蓄積することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1にかかる音声合成装置
(自然言語処理装置を含む)のブロック図
【図2】実施の形態1にかかる音声合成装置におけるテ
キスト変換処理の手順を示すフロー図
【図3】入力テキストの単語列への分割の一例を示す図
【図4】(a) 発音規則の内容の一例を示す図 (b) 発音記号の分類を説明するための図
【図5】テキスト変換規則の内容の一例を示す図
【図6】テキスト変換の一例を示す図
【図7】本発明を実施するためのコンピュータシステム
の一例を示す図
【符号の説明】
101 テキスト入力部 102 言語処理部 103 テキスト変換部 104 発音パターン抽出部 105 テキスト変換処理部 106 構文解析部 107 韻律情報生成部 108 音声波形合成部 109 音声出力部 111 発音規則テーブル 112 テキスト変換規則テーブル 113 テキスト変換規則管理部 114 テキスト変換規則入出力部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 入力されたテキストを、所定の発音パタ
    ーンが発音規則として登録されている第1のテーブルと
    照合して、前記入力されたテキストから前記所定の発音
    パターンを含む部分を抽出する第1のステップと、 第2のテーブルに登録されている変換規則に基づき、抽
    出された前記部分に含まれる単語または複合語を他の単
    語または他の複合語に置換する処理、あるいは前記複合
    語を構成する単語間に助詞またはポーズを挿入する処理
    を実行する第2のステップと、を含むことを特徴とする
    自然言語処理方法。
  2. 【請求項2】 前記所定の発音パターンは、母音,子
    音,拗音または撥音を組み合わせた一つの発音を単位と
    して、その単位の組み合わせによって表現されることを
    特徴とする請求項1記載の自然言語処理方法。
  3. 【請求項3】 前記所定の発音パターンは、(子音・拗
    音)からなる発音が連続するパターンを含むことを特徴
    とする請求項2記載の自然言語処理方法。
  4. 【請求項4】 前記所定の発音パターンは、(子音・拗
    音)(子音・母音)(子音・拗音)の組み合わせからな
    るパターンを含むことを特徴とする請求項2記載の自然
    言語処理方法。
  5. 【請求項5】 前記複合語を構成する、隣接する2つの
    単語の隣接部分に前記聞き取りにくい発音パターンが存
    在し、かつ、前記2つの単語が共に名詞である場合に、
    前記2つの単語間に助詞またはポーズを挿入することを
    特徴とする請求項1〜請求項4のいずれかに記載の自然
    言語処理方法。
  6. 【請求項6】 前記第1のテーブルに登録されている前
    記発音規則または前記第2のテーブルに登録されている
    前記変換規則を、外部に提示可能としたことを特徴とす
    る請求項1〜請求項5のいずれかに記載の自然言語処理
    方法。
  7. 【請求項7】 前記第1のテーブルに登録されている前
    記発音規則または前記第2のテーブルに登録されている
    前記変換規則を、外部から補正することができるように
    したことを特徴とする請求項1〜請求項6のいずれかに
    記載の自然言語処理方法。
  8. 【請求項8】 自然言語処理装置に、 入力されたテキストを、所定の発音パターンが発音規則
    として登録されている第1のテーブルと照合して、前記
    入力されたテキストから前記所定の発音パターンを含む
    部分を抽出する第1のステップと、 第2のテーブルに登録されている変換規則に基づき、抽
    出された前記部分に含まれる単語または複合語を他の単
    語または他の複合語に置換する処理、あるいは前記複合
    語を構成する単語間に助詞またはポーズを挿入する処理
    を実行し、前記入力されたテキストを読み上げることを
    前提としたテキストに変換する第2のステップと、を実
    行させるためのプログラムを記録したことを特徴とする
    コンピュータが読み取り可能な自然言語処理用記録媒
    体。
  9. 【請求項9】 自然言語処理装置に、 入力されたテキストを、所定の発音パターンが発音規則
    として登録されている第1のテーブルと照合して、前記
    入力されたテキストから前記所定の発音パターンを含む
    部分を抽出する第1のステップと、 第2のテーブルに登録されている変換規則に基づき、抽
    出された前記部分に含まれる単語または複合語を他の単
    語または他の複合語に置換する処理、あるいは前記複合
    語を構成する単語間に助詞またはポーズを挿入する処理
    を実行し、前記入力されたテキストを読み上げることを
    前提としたテキストに変換する第2のステップと、を実
    行させる場合の、前記第1のテーブルおよび前記第2の
    テーブルを記録していることを特徴とするコンピュータ
    が読み取り可能な自然言語処理用記録媒体。
  10. 【請求項10】 前記第1のテーブルまたは前記第2の
    テーブルは、読み出し/書き込みが可能であることを特
    徴とする請求項8または請求項9記載の自然言語処理用
    記録媒体。
  11. 【請求項11】 日本語の入力テキストを単語列に分割
    し、単語列の各単語に対して読み、品詞などの言語情報
    を付与する言語処理手段と、 母音,子音,拗音または撥音を組み合わせた一つの発音
    を単位とし、その単位の組み合わせによって表現され
    る、音声化した場合に聞き取りにくいとされる発音パタ
    ーンが登録されている発音規則テーブルと、 前記発音規則テーブルに登録されている前記発音パター
    ンに該当する、前記言語処理手段から出力される単語列
    を、音声読み上げに適した単語列に変換するためのテキ
    スト変換規則が登録されているテキスト変換規則テーブ
    ルと、 前記言語処理手段から出力される単語列を前記発音規則
    テーブルと照合し、前記発音パターンに該当する単語ま
    たは複数の単語からなる複合語を抽出し、抽出された前
    記単語または複合語に対して、前記テキスト変換規則テ
    ーブルに格納されている前記テキスト変換規則を適用し
    て聞き取りやすい単語または複合語に置換する処理、あ
    るいは前記複合語を構成する単語間に助詞またはポーズ
    を挿入する処理を実行するテキスト変換手段と、 前記テキスト変換手段から出力される単語列に付与され
    た言語情報から音声波形を合成するのに必要な発音系
    列、ピッチ、パワーなどの韻律情報を生成する韻律情報
    生成手段と、 前記韻律情報生成手段の出力する韻律情報に従って音声
    波形を合成する音声波形合成手段と、を有することを特
    徴とする音声合成装置。
  12. 【請求項12】 前記テキスト変換規則テーブルに保持
    されている前記テキスト変換規則について、ユーザから
    の検索、追加、修正、削除などの指示にしたがって編
    集,管理を行うテキスト変換規則管理手段を、さらに具
    備することを特徴とする請求項11記載の音声合成装
    置。
JP34299298A 1998-12-02 1998-12-02 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 Expired - Lifetime JP3706758B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34299298A JP3706758B2 (ja) 1998-12-02 1998-12-02 自然言語処理方法,自然言語処理用記録媒体および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34299298A JP3706758B2 (ja) 1998-12-02 1998-12-02 自然言語処理方法,自然言語処理用記録媒体および音声合成装置

Publications (2)

Publication Number Publication Date
JP2000172289A true JP2000172289A (ja) 2000-06-23
JP3706758B2 JP3706758B2 (ja) 2005-10-19

Family

ID=18358109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34299298A Expired - Lifetime JP3706758B2 (ja) 1998-12-02 1998-12-02 自然言語処理方法,自然言語処理用記録媒体および音声合成装置

Country Status (1)

Country Link
JP (1) JP3706758B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149180A (ja) * 2000-11-16 2002-05-24 Matsushita Electric Ind Co Ltd 音声合成装置および音声合成方法
JP2004525412A (ja) * 2001-03-08 2004-08-19 松下電器産業株式会社 合成された音声の了解度を改善するためのランタイム合成装置適合方法およびシステム
JP2006227425A (ja) * 2005-02-18 2006-08-31 National Institute Of Information & Communication Technology 音声再生装置及び発話支援装置
JP2006284645A (ja) * 2005-03-31 2006-10-19 Nec Corp 音声再生装置およびその再生プログラムならびにその再生方法
US7809572B2 (en) 2005-07-20 2010-10-05 Panasonic Corporation Voice quality change portion locating apparatus
JP2011027971A (ja) * 2009-07-24 2011-02-10 Fujitsu Ltd 音声認識装置、音声認識方法及びそのプログラム
WO2015159363A1 (ja) * 2014-04-15 2015-10-22 三菱電機株式会社 情報提供装置および情報提供方法
JP2017517028A (ja) * 2014-04-17 2017-06-22 ソフトバンク・ロボティクス・ヨーロッパSoftbank Robotics Europe ロボットとの対話を取り扱う方法とシステム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60208799A (ja) * 1984-04-02 1985-10-21 松下電器産業株式会社 音声分析合成装置
JPH0335296A (ja) * 1989-06-30 1991-02-15 Sharp Corp テキスト音声合成装置
JPH05210482A (ja) * 1991-12-26 1993-08-20 Oki Electric Ind Co Ltd 発音辞書管理方法
JPH08123459A (ja) * 1994-10-26 1996-05-17 Sony Corp 自然言語処理方法および音声合成装置
JPH1078795A (ja) * 1996-09-04 1998-03-24 Secom Co Ltd 音声合成装置
JPH10171485A (ja) * 1996-12-12 1998-06-26 Matsushita Electric Ind Co Ltd 音声合成装置
JPH10187179A (ja) * 1996-12-26 1998-07-14 Canon Inc 音声合成方法および装置
JPH10228471A (ja) * 1996-12-10 1998-08-25 Fujitsu Ltd 音声合成システム,音声用テキスト生成システム及び記録媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60208799A (ja) * 1984-04-02 1985-10-21 松下電器産業株式会社 音声分析合成装置
JPH0335296A (ja) * 1989-06-30 1991-02-15 Sharp Corp テキスト音声合成装置
JPH05210482A (ja) * 1991-12-26 1993-08-20 Oki Electric Ind Co Ltd 発音辞書管理方法
JPH08123459A (ja) * 1994-10-26 1996-05-17 Sony Corp 自然言語処理方法および音声合成装置
JPH1078795A (ja) * 1996-09-04 1998-03-24 Secom Co Ltd 音声合成装置
JPH10228471A (ja) * 1996-12-10 1998-08-25 Fujitsu Ltd 音声合成システム,音声用テキスト生成システム及び記録媒体
JPH10171485A (ja) * 1996-12-12 1998-06-26 Matsushita Electric Ind Co Ltd 音声合成装置
JPH10187179A (ja) * 1996-12-26 1998-07-14 Canon Inc 音声合成方法および装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149180A (ja) * 2000-11-16 2002-05-24 Matsushita Electric Ind Co Ltd 音声合成装置および音声合成方法
JP2004525412A (ja) * 2001-03-08 2004-08-19 松下電器産業株式会社 合成された音声の了解度を改善するためのランタイム合成装置適合方法およびシステム
JP2006227425A (ja) * 2005-02-18 2006-08-31 National Institute Of Information & Communication Technology 音声再生装置及び発話支援装置
JP2006284645A (ja) * 2005-03-31 2006-10-19 Nec Corp 音声再生装置およびその再生プログラムならびにその再生方法
US7809572B2 (en) 2005-07-20 2010-10-05 Panasonic Corporation Voice quality change portion locating apparatus
JP2011027971A (ja) * 2009-07-24 2011-02-10 Fujitsu Ltd 音声認識装置、音声認識方法及びそのプログラム
WO2015159363A1 (ja) * 2014-04-15 2015-10-22 三菱電機株式会社 情報提供装置および情報提供方法
JP5976255B2 (ja) * 2014-04-15 2016-08-23 三菱電機株式会社 情報提供装置および情報提供方法
US9734818B2 (en) 2014-04-15 2017-08-15 Mitsubishi Electric Corporation Information providing device and information providing method
JP2017517028A (ja) * 2014-04-17 2017-06-22 ソフトバンク・ロボティクス・ヨーロッパSoftbank Robotics Europe ロボットとの対話を取り扱う方法とシステム
US10008196B2 (en) 2014-04-17 2018-06-26 Softbank Robotics Europe Methods and systems of handling a dialog with a robot

Also Published As

Publication number Publication date
JP3706758B2 (ja) 2005-10-19

Similar Documents

Publication Publication Date Title
US6823309B1 (en) Speech synthesizing system and method for modifying prosody based on match to database
US7454345B2 (en) Word or collocation emphasizing voice synthesizer
US20040193398A1 (en) Front-end architecture for a multi-lingual text-to-speech system
JP2000081892A (ja) 効果音付加装置および効果音付加方法
Macchi Issues in text-to-speech synthesis
WO2009021183A1 (en) System-effected text annotation for expressive prosody in speech synthesis and recognition
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
JP4811557B2 (ja) 音声再生装置及び発話支援装置
JP3085631B2 (ja) 音声合成方法及びシステム
JP2006243673A (ja) データ検索装置および方法
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP5334716B2 (ja) 文字情報提示制御装置及びプログラム
Raghavendra et al. A multilingual screen reader in Indian languages
Labied et al. Moroccan dialect “Darija” automatic speech recognition: a survey
Kolář Automatic segmentation of speech into sentence-like units
El-Imam et al. Rules and algorithms for phonetic transcription of standard Malay
JP3279261B2 (ja) 定型文コーパス作成装置、方法及び記録媒体
KR100959494B1 (ko) 미등록어 합성 기능을 이용한 음성합성기 및 그 방법
Gardini Data preparation and improvement of NLP software modules for parametric speech synthesis
JP2004138661A (ja) 音声素片データベース作成方法、音声合成方法、音声素片データベース作成装置、音声合成装置、音声データベース作成プログラム、音声合成プログラム
Mihkla et al. Development of a unit selection TTS system for Estonian
Alabbad An Investigation into Approaches to Text-to-Speech Synthesis for Modern Standard Arabic
JP2001249678A (ja) 音声出力装置,音声出力方法および音声出力のためのプログラム記録媒体
JPH10161847A (ja) 文章データ音声変換システム
Brenier The automatic prediction of prosodic prominence from text

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050801

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080805

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080805

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080805

Year of fee payment: 3

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100805

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110805

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110805

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120805

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130805

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130805

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term