JP2580568B2 - 発音辞書更新装置 - Google Patents

発音辞書更新装置

Info

Publication number
JP2580568B2
JP2580568B2 JP61105926A JP10592686A JP2580568B2 JP 2580568 B2 JP2580568 B2 JP 2580568B2 JP 61105926 A JP61105926 A JP 61105926A JP 10592686 A JP10592686 A JP 10592686A JP 2580568 B2 JP2580568 B2 JP 2580568B2
Authority
JP
Japan
Prior art keywords
accent
pronunciation dictionary
character string
phoneme
unregistered word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61105926A
Other languages
English (en)
Other versions
JPS62262099A (ja
Inventor
昌子 市川
勝信 伏木田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP61105926A priority Critical patent/JP2580568B2/ja
Publication of JPS62262099A publication Critical patent/JPS62262099A/ja
Application granted granted Critical
Publication of JP2580568B2 publication Critical patent/JP2580568B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字列を音声に変換する規則型音声合成シス
テムあるいは、音声を文字列に変換する音声認識システ
ム等に用いる発音辞書の更新装置に関するものである。
(従来の技術) 従来、日本語の文字−音声変換システムあるいは、音
声−文字変換システムに用いる辞書として漢字かな混じ
りの文字列で表わされた単語に対する音素記号、アクセ
ント記号を記憶する第3図に示すような発音辞書が知ら
れている。
第3図では、漢字かなまじり文字列である見出し語の
各々に対して、アクセント記号(第3図では*で示して
いる)が付加された音素記号列が格納されている。
従来の辞書更新技術としては、ギーボード入力によっ
て更新するエディタが一般的に知られている。発音辞書
を更新するためには、まず登録しようとする語のアクセ
ント型を認識し、アクセント核の位置を指定しなければ
ならない。キーボードからの入力は、このようにアクセ
ント核の位置を指定してからアクセント核の位置を示す
記号の混ざった音素記号列を入力するのが一般的であ
る。
〔発明が解決しようとする問題点〕
しかしながら、アクセント型の指定を正確に行なうこ
とは、容易ではない。従来の技術では、アクセント型の
指定は、経験に頼るところが多く、アクセント型に詳し
い者であってもアクセント核の位置を明示するのに誤る
ことがある。まして、アクセント型というものに、なじ
みのない一般ユーザには特に難しい。しかし、実際には
アクセント型の詳しい知識を有しない、一般のユーザが
アクセント型の指定をし、辞書に登録することが多い。
また、辞書に登録するときも、従来の技術では、アクセ
ント核の位置を意識しながら、キーボードを叩かなけれ
ばならず、音素系列のみを入力するのに比べて、非能率
的であり、アクセントデータの誤りが生じ易いというよ
うな欠点があった。
本発明の目的は、音声辞書に未登録な単語を自動的に
抽出することにより専門的知識がなくても自動的にアク
セント型を指定し、発音辞書の更新作業を容易にかつ効
率良く、行なうことができる発音辞書更新装置を提供す
ることにある。
〔発明の構成〕
本発明による発音辞書更新装置は形態素解析と音声合
成に必要な情報を持った発音辞書を持ち、漢字かな混じ
り文字列であるテキストを入力とする形態素解析部と、
形態素解析の結果、検出された発音辞書の未登録語を一
時蓄える未登録語メモリと、未登録語に対して、音素記
号列と音素記号列に対応する音声を入力として前記音素
記号列にアクセント核を表わす記号を付与するアクセン
ト型認識部とから構成される。
(作用) 本発明では、漢字かな混じりの文字列であるテキスト
が入力され、形態素解析が行われる。次に入力されたテ
キストを形態素に分割し、形態素の文字列か一致する発
音辞書の見出し語を求める。既存の発音辞書に登録され
ていない文字列があると、その文字列は未登録語として
自動的に検出することができる。形態素解析の手法とし
ては、例えば「自然言語処理研究会資料38」(1983年7
月15日)に「日本語形態素解析の基本設計」と題して発
表された論文に示された形態素分割の方法を用いること
ができる。一方、アクセント型の検出は、特願昭60-108
637号明細書「音声合成用テキスト作成装置」に示され
た方法を用いることができる。ここで、このアクセント
型の検出方法について簡単に説明する。
日本語音声のアクセントはピッチアクセントであり、
アクセント核のある音節の後では、ピッチ周波数が急激
に低くなることが良く知られている。よって、ピッチ周
波数が急激に下降している時間区間が、アクセントの核
の直後に対応していると考えられる。これと、セグメン
テーションの結果得られる音節の時間区間の情報とをあ
わせることにより、アクセントの核がどの音節にあるか
を決定することができる。第2図(a)は、音節単位へ
のセグメンテーションの結果を表わしている。セグメン
テーションは、たとえば、「電子通信学会論文誌」Vo1.
J67-DNo.6(1984年6月)693〜700ページに「Top-down
的音韻認識に基づく単語音声認識」と題して発表された
論文に示された方法によって行なうことができる。縦軸
は入力音声のエネルギーであり、横軸は時間軸である。
点線はセグメンテーションによって求められる音節境界
である。第2図(b)は、検出されたピッチ周波数の急
激に下降している区間を表わしている。縦軸は入力音声
のピッチ周波数であり、横軸は時間軸である。このピッ
チ周波数の時系列は、たとえば、「日本音響学会講演論
文集」(1977年10月)35〜36ページに「ピッチ周期系列
最適選択の一方式」と題して発表された論文に述べられ
た方法によって得ることができる。また、第2図(b)
のアクセントフォールの区間は、例えば、ピッチ周波数
の第1次差分値がθp以下で、継続時間がθd以上であ
るような区間として検出される。これら第2図(b)の
ピッチ周波数の急激に下降している時間区間の情報と、
第2図(a)の対応する時間区間に位置する音節の情報
によりアクセントの核が音素テキスト中のどの音節にあ
るかが決定される。第2図(c)は、決定されたアクセ
ント核を表わす記号を含む音素テキストを表わす。ま
た、決定されたアクセント核は、この他にも、音素テキ
スト中のアクセント核の位置を表わす番号としても指定
可能である。
本発明では、前記、形態素解析により、入力テキスト
の中に、辞書に未登録の語があれば、その文字列を切り
だして、未登録語メモリに蓄えておき、表記漢字かな混
じり文字列は、そのまま辞書へそして発音データは、前
記アクセント形検出により、追加できる。このように、
発音辞書更新のための入力は音声と音素系列のみで良
く、またアクセント核の位置を意識しなくて良いので、
素人でも能率的に未登録語の発音データを追加すること
ができるようになり、発音辞書の更新を効率良く行うこ
とができる。
(実施例) 次に図面を用いて、本発明の実施例を説明する。第1
図は本発明の一実施例を示すブロック図である。入力さ
れた漢字かな混じり文字列のテキスト1を形態素解析部
2が形態素の文字列に分解する。その結果、形態素文字
列が発音辞書3に存在しないものがあれば、その文字列
は発音辞書の未登録語として検出し、未登録語メモリ4
に一時記憶した後、未登録語リスト5をディスプレイ、
または紙に出力する。文字列が全て発音辞書3に存在す
れば、正常終了として処理を終わるか、または音声合成
等の次の処理に移る。
未登録語リスト5があれば、そのリストをもとに、未
登録語を発音する。音声8を入力するとともに、キーボ
ード7より前記音声に対応する音素記号列を入力する。
キーボード6より入力された音素記号列は、テキスト
バッファ7に保存される。ピッチ抽出部10は、入力され
た音声8よりピッチ周波数の時系列を求め、アクセント
フォール検出部11に出力する。アクセントフォール検出
部11は、入力されたピッチ周波数の時系列中で、ピッチ
周波数が急激に下降している時間区間の情報をアクセン
ト付加部12へ出力する。セグメンテーション部9はテキ
ストバッファ7より入力された音素テキストを用いて入
力音声3を音節単位に分割し、各音節の時間区間の情報
をアクセント付加部12へ出力する。アクセント付加部7
はピッチ周波数下降時間区間に存在する音節を求め、ア
クセント核の位置を決定し、テキストバッファより入力
される音素記号列にアクセント核をあらわす記号を付加
する。このアクセント核を表わす記号を付加された音素
記号列13が処理結果として出力される。
この音素記号列13を発音辞書3に登録する。未登録語
の表記の文字列は、信号線14によって未登録語メモリ4
より発音辞書3に登録される。
また、前記音素記号列13を音声合成回路部15に入力
し、前記、未登録語の表記の文字列に対応する音声が出
力される。
(発明の効果) 本発明によれば、形態素解析により発音辞書に未登録
な単語を自動的に抽出するとともに専門的知識がなくて
も、自動的に単語のアクセント型を指定することができ
るようになるので、単語に対応する音声と音素系列の入
力のみで、一般ユーザが発音辞書の更新を容易に効率よ
く行うことができる。また、本願の音声辞書更新装置に
音声合成回路を付加することによって、音声で更新結果
を容易に確認することもできる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図
(a),(b),(c)は本発明の原理を説明するため
の図、第3図は発音辞書の構成の例を示す図である。 図において、 2……形態素解析部 3……発音辞書 4……未登録語メモリ 6……キーボード 7……テキストバッファ 8……音声分析回路 9……セグメンテーション部 10……ピッチ抽出部 11……アクセントフォール検出部 12……アクセント付加部 15……音声合成回路部 をそれぞれ示す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字列に対して、音素記号が格納される発
    音辞書の更新装置であって、漢字かな混じり文字列であ
    るテキストが入力され、形態素の文字列に分解し、前記
    形態素文字列が、前記発音辞書内に登録済であるか否か
    を検出する形態素解析部と、登録済でない形態素文字列
    を一時記憶するとともに表示する未登録語メモリと、前
    記表示された未登録語に対応する音素記号列と音声を入
    力する手段と前記音声よりアクセント位置を検出する手
    段と、前記アクセント位置検出結果にしたがって前記未
    登録語に対応する音素記号列にアクセント核を表わす記
    号を付与するアクセント型認識部とを備えており、前記
    未登録語メモリの内容と前記アクセント型認識部の出力
    とを前記発音辞書に格納することを特徴とする発音辞書
    更新装置。
JP61105926A 1986-05-08 1986-05-08 発音辞書更新装置 Expired - Lifetime JP2580568B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61105926A JP2580568B2 (ja) 1986-05-08 1986-05-08 発音辞書更新装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61105926A JP2580568B2 (ja) 1986-05-08 1986-05-08 発音辞書更新装置

Publications (2)

Publication Number Publication Date
JPS62262099A JPS62262099A (ja) 1987-11-14
JP2580568B2 true JP2580568B2 (ja) 1997-02-12

Family

ID=14420462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61105926A Expired - Lifetime JP2580568B2 (ja) 1986-05-08 1986-05-08 発音辞書更新装置

Country Status (1)

Country Link
JP (1) JP2580568B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS649499A (en) * 1987-07-01 1989-01-12 Hitachi Ltd Accent type input system for rule voice synchronization
CN102119412B (zh) * 2008-08-11 2013-01-02 旭化成株式会社 例外语辞典制作装置、例外语辞典制作方法、和声音识别装置和声音识别方法
CN111583961A (zh) * 2020-05-07 2020-08-25 北京一起教育信息咨询有限责任公司 一种重音评价方法、装置及电子设备

Also Published As

Publication number Publication date
JPS62262099A (ja) 1987-11-14

Similar Documents

Publication Publication Date Title
US6490563B2 (en) Proofreading with text to speech feedback
JP2580568B2 (ja) 発音辞書更新装置
JP5088109B2 (ja) 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置
JPH06282290A (ja) 自然言語処理装置およびその方法
JPS634206B2 (ja)
JP6197523B2 (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP3366253B2 (ja) 音声合成装置
CN111968619A (zh) 控制语音合成发音的方法及装置
JPS58123129A (ja) 仮名漢字変換装置
JP2580565B2 (ja) 音声情報辞書作成装置
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
JPH07210185A (ja) 朗読情報作成装置および朗読装置
JPH06119144A (ja) 文書読み上げ装置
JP5125404B2 (ja) 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JPH0634175B2 (ja) 文章読上げ装置
JP2000276189A (ja) 日本語ディクテーションシステム
JP2728440B2 (ja) 音声出力装置
JP2003005776A (ja) 音声合成装置
JP2798931B2 (ja) 中国語の語音区切方式および語音漢字変換方式
JP2996978B2 (ja) テキスト音声合成装置
JP2997151B2 (ja) 漢字変換装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term