JPS60105037A - 音声入力文章作成方式 - Google Patents

音声入力文章作成方式

Info

Publication number
JPS60105037A
JPS60105037A JP58212019A JP21201983A JPS60105037A JP S60105037 A JPS60105037 A JP S60105037A JP 58212019 A JP58212019 A JP 58212019A JP 21201983 A JP21201983 A JP 21201983A JP S60105037 A JPS60105037 A JP S60105037A
Authority
JP
Japan
Prior art keywords
kana
candidates
kanji
candidate
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58212019A
Other languages
English (en)
Inventor
Yutaka Kamiyanagi
上柳 裕
Takahiko Ogita
荻田 隆彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58212019A priority Critical patent/JPS60105037A/ja
Publication of JPS60105037A publication Critical patent/JPS60105037A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (a) 発明の技術分野 本発明はデータ処理システムにおける音声入力による文
章作成方式に関する。
(bl 技術の背景 近年データ処理技術の発展と普及に伴いデータ処理シス
テムにおける人出カ手段の一端として、半導体特に集積
化技術の進展に支えられ音声認識アルゴリズムのための
複雑局度な論理回路および高速大容量金製する手段がよ
り小形且低コストの高集積回路素子(LSI)によって
実現さnるに従い、日本語音声によるデータ処理が対話
形式に適し、操作者に特別の習熟訓練音節すことなく容
易に利用出来る特徴ケ生かしてマンマシンインタフェー
スの理想目標とする音声タイプライタが実用化されるよ
うになった〇 (c) 従来技術と問題点 第1図は従来および本発明の一実施例における音声入力
文章作成方式の概念図を示す。図においてlOは音声認
識部、20はカナ漢字変換部、40は文書編集部、50
は出方制御部+ 608はフ゛リンタ、60bはディス
プレイ+ 70aはマイクロフォンおよび70.bは操
作具である。
従来においては操作者の発声による音声入力をマイクロ
ホン60aより音声認識部1oに入力せしめその分析結
果による音声パターン會音声辞書との照合によりその類
仰1度に従い該音声入力に対応する単数または複敬の候
補からなるカナ金ディスプレイ60bの画面に表示し、
操作者は該候補の中力1ら逐次正解のカナを確定しっ\
カナ列葡作成し日本人に最も理解し易い漢字カナ混り文
を作成する方式によっている。このため音声入力による
文章作成方式は特別の習熟を必要としないが操作者は常
時カナを確認する作業が必要になり、操作者の発声が疲
労等によりて状態が震ったりするとディスプレイ60b
に表示される候補の選択が適正に得ら扛なかったり、候
補数が多過ぎたりする事態が発生し、他の一意的な打鍵
入力によるワードプロセッサの処理に比較して却ってカ
ナ列を確定する工程が増加し処理が煩わしくなり処理速
度が上らない欠点1有している。
fdl 本発明の目的 本発明の目的は上記の欠点全除去するため、音声入力を
音声辞書に比較して得る類似度に従って抽出した各候補
について、次工程において複数候補の組合せからなるカ
ナ列における接続可能性全前方接続、後方接続の統計テ
ーブルと照合する以前に各候補自身がその認識における
類似度に対応して他のカナと誤る可能性の出現率順位を
配列する統計テーブルと照合して音声パターンを統計的
な面からも吟味再評価する手段を挿入し、その照合結果
によってはより候補数を削減したり、あるいは優先順位
の見直し全行いより正解が得ら牡以後のカナ列ルートの
切出し、カナ漢字変換における試行繰返しの負担全削減
すると共に操作の従来におけるカナの逐次選択における
煩わしさ全除去して処理速度全向上する手段を提供しよ
うとするものである。
(el 発明の構成 未知入力音声を予め音声辞書に登録した特徴量標準バタ
ンと照合する音声認識部に得られる音声バタンデータを
カナ漢字変換部により漢字カナ混り文章として出力せし
める音声入力文章作成システムにおいて、入力音声をス
ペクトラム時系列により分析してその特徴量全標準バタ
ンと逐一比較して類似度kni出する分析照合手段、分
析照合手段に得られる類似度に従いその上位より単数ま
たは複数の候補を選択保持する手段、各候補句:にその
類似度に対応して該候補が他のカナに誤る可能fトの出
現率順位?配列する第1M、計テーブルと照合し候補の
順位配列または重み付けを再評価する手段、候補毎に先
行接続および後続する他のカナ文字との接続についてそ
れぞf′L第2.第3統計テーブルと比較し“Cその接
続性を評価する手段、接続性評価手段により抽出選択さ
B7’(上位候補の組合せによるカナ列候補を形態素抜
りは/およびその組合せ毎に切出す手段、文法ケ参照し
単語、漢字辞@i照合しつ\切出し長欠評価してカナ列
全漢字に変換する手段および切出し巣位の組合せルート
を評価する手段を具備しでなり、制御部は音声認識部の
分析照合手段に入力音声音印加して音声データの候補毎
に類似度ケ算出せしめ、−選択保持手段をして選択配列
せしめた候補について再評価手段による臥補数、順位の
削減または/および補正を実行せしめると共に該候補に
ついて接続評価手段をして候補の配列組合せ力)らなる
カナ列におけるその接続妥当性から上位候補を選択して
第1手順全英行せしめ、更にカナ漢字変換部において該
上位候補の組合せからなるカナ列ルートについて切出し
手段、カナ漢字変換手段およびルート評価手段またはそ
の相互繰返しにより最優先カナ列ルートに得る第2手段
を実行せしめて、漢字カナ混り文章音出力せしめること
全特徴とする音声入力文章作成方式?提供することによ
って達成することができる。
げ)発明の実施例 以下図面を参照しつ\本発明の一実施例について説明す
る。
第2図は本発明の一実施例における音声入力文章作成方
式のブロック図、第3図はその処理手順例図および第4
図は音声入力文章作成方式における第一統計テーブルの
データ例図を示す。図において0は制御部、10は音声
認識部、11は分析照合手段、12は候補選択保持手段
、13は候補再評価手段、14は接続性評価手段、20
はカナ漢字変換部、21はカナ列切出手段、22はカナ
漢字変換手段、23はルート評価手段、30は記憶部、
31は制御プログラム、32は制御データ。
33は音声辞書、33a=n標準バタン、34は第1統
計テーブル、35は第2統計テーブル、36は第3統計
テーブル、37は単語辞書および38は漢字辞書である
本発明の一実施例では第2図における制御部Oは記憶部
30の制御プログラム31.制御データ32に従って構
成各部を制御し、第3図に示す手順に従って入力音声を
音声認識し且その内容ヶカナ混り漢字文に変換して出力
する。記憶部30は制御プログラム31.制御データ3
2の他、不特定話者に対応する単音節標準パターン″l
J:たは/および特定話者の学習モードにおいて得られ
るカナ1文字毎に〜10個程0訓練サンプルから平均的
な標準バタンtl−登録蓄積する音声辞書、ある入力音
声が分析照合手段の分析機能によりスペクトラムは系列
による特微量分析出力會得て照合機能に保持され、音声
辞書33の標準バタン33a=nと比較照合さし最も類
似度が高いものから順に複数のカナ候補が得られる。勿
論類似度が0.99あるいは0.95と高い場合は単一
の候補として問題ないが他にも大差ない類似度例えば0
.61 、0.5B 。
0.57.0.53 、0.51 、0.48のような
候補が得ら扛た場合従来は上位4候補場合によりでは全
候補について接続性評価手段14に送出し、これ等のす
べての組合せについて逐一評価作業を施していたが、本
実施例では次の候補再評価手段により類似度に対応して
該候補が他のカナと誤る割合を統計的に配列した第1統
計テーブル34と照合して吟味する。尚第1〜3統計テ
ーブルは第2図に単一ブロックとして表示したがその内
容は標準バタンと同様各カナに対して第4図の第1統計
テーブルにおけるデータ例図のようにそnぞれ用意され
ているものとする。
第4図の例では候補Aの類似度が50のときはBはAに
対し17/ 、Dは15/ 、Cは107.。
50 50 の割合で誤る可能性のあることを示す。従ってテーブル
にも表示さルないA50に対し工と誤る可能性はOであ
る。勿論有意差が少なければ類似度対応をある範囲の類
似度について共通データ1使っても良い。
第1例として候補選択保持手段に得られた候補順位では
第5順位でも第1統計テーブル34における第1候補例
えばA50に対する誤り易い可能性の出現率が第3jw
−の例えばCよりも高い第■順位にあり、同様に図示省
略したが第2候補例えばB48に対する誤り率が第3順
位のCよりも高い第■順位に共通して存在する場合は第
3順位のC會下げ第5順位のIIJ上げて順位を補整す
る。第2例として第1候補例えばE80があって第1統
計テーブル34におけるE80に第2候補F75だけが
第■順位に存在し、その他の可能性がO′f、Xは操作
者の設定したしきい値例えば5以下であり、またF75
に第1候補E80だけが例えばE70として第■順位に
存在し補完状態にあるときは第3候補以降を削除する。
また第3例として前述の大差ない類似度例えば0.61
〜0.48と多数の候補が得られたときでも第1統計テ
ーブルに得られる情報で第2順位および第3順位のみに
補完が得ら扛その他の候補相互組合せでしきい値以下に
あるような場合は第2順位の0.58と第3順位の0.
57だけ44して第1順位仙全削除する。このように従
来は分析照合手段11に得らnる類似度だけに従って候
補を選択していたが候補再評価手段13において第1統
計テーブルケ照合し、候補数の削減またGVおよび順位
調整會実行して接続性評価手段14に候補情報を送出す
る。以上は複数の候補より削除する方向で説明したが場
合によっては候補が少なくて候補再評価手段13によっ
て類似度が低〈従来なら対象外となるものを逆に追加す
ることもある。次に接続性評価手段14は各候補の前後
2文字のカナ組合せについて、第2統計テーブルにより
先行接続する候補xl l ’j2 + xsと照合し
て例えば該候補が「あ」であればX、ア、x2ア+X3
ア・・・・・の出現率を評価して先行候補を削減し、第
3統計テーブルにより後続接続する候補)’++Yt+
y3 ・・と照合してアン1.アYtrアy、・・・・
の出現率全評価して後続候補を削減する。更に前後から
の接続評価におけるアンド条件または/およびオア条件
により候補は追加削減される。このようにして得られた
候補を組合せて出来るカナ例の候補をカナ漢字変換部2
0に送出する。
カナ漢字変換部20におけるカナ列切出手段21は音節
スペース間または数字、記号等による大きい切出しケ施
して変換処理単位會得た後、カナ列全構成する各候補間
の近似度情報の評価に従い各候補の組合せによる配列ル
ートとその優先順位を与え複数のルーif設定する。
各ルートについて逐一カナ列候補を単語辞書37にアク
セスしつ\形態素または/およびその組合せ毎に文法的
な接続チェック會単語辞書37の接続情報と照合評価し
つ\、形態素とその組合せ長の確からしさ會チェックす
る。
他のカナ列ルートについても同様に処理上繰返して評価
し、例えば最小形態素数等により最も確からしい優先カ
ナル−1決定してカナ漢字変換手段22に送出する。カ
ナ漢字変換手段22は該優先カナルート候補全受信しカ
ナ文字列ケ漢字辞誓38にアクセスし漢字カナ混り文章
に変換して出力する、ルート評価手段23はカナ列切換
手段21、カナ漢字変換手段22に有効形態素が得らn
ないとき別の配列ルートによるフォーマルバック処理を
行う機能である。
本実施例では以上のように構成さ牡カナ接続性評価手段
14に入力するカナ候補の状態で候補再評価手段13に
より他と誤る可能性についての統計的なデータにより評
価を施し、候補数の削減や順位補正を行うので、従来分
析照合手段に得らnる音声パタンの類似度比較だけによ
る候補の決定に対し合理的な見直しによって適切な候補
の選択が得ら几、接続性評価手段14食含めた後続する
各機能の処理全軽減することが出来る。
<g) 発明の詳細 な説明したように本発明によ几ば従央における分析出力
による類似度比較だけでは見落しとなっていた候補選択
について統計的手法を加味したことにより不必要な候補
を効果的に削減したり、過った候補の設定を除去出来る
ので以後の処理機能における負担上軽減し処理速度を向
上せしめ誤変換率の少い音声入力文章作成方式が得られ
る。
【図面の簡単な説明】
第1図は従来および本発明の一実施例における音声入力
文章作成方式の概念図、第2図は本発明の一実施例にお
ける音声入力文章作成方式のブロック図、第3図はその
処理手順例図および第4図は音声入力文章作成方式にお
ける第1統計テーブルのデータ例図金示す。図において
Oは制御部。 10は音声認識部、11は分析照合手段、12は候補選
択保持手段、13は候補再評価手段、14は接続性評価
手段、20はカナ漢字変換部、30は記憶部、31は制
御ブロクラム、32は制御データ、33は音声辞書、3
3a”−nは標準バタン。 34は第1統計テーブル、35は第2統絹テーブル、3
6は第3統計テーブル、40は文書編集部。 50は出力開側1部、60aはプリンタおよび60bは
ディスプレイである。 寮1lfI 寮?呵 I− Y−3唄 許4酊

Claims (1)

    【特許請求の範囲】
  1. 未知入力音声を予め音声辞書に登録した特徴量標準バタ
    ンと照合する音声認識部に得らnる音声バタンデータ全
    カナ漢字変換部により漢字カナ混り文章として出力せし
    める音声入力文章作成システムにおいて、入力音声をス
    ペクトラム時系列により分析してその特徴量を標準バタ
    ンと逐一比較して類似度會算出する分析照合手段、分析
    照合手段に得ら36a似度に従いその上位より単数また
    は複数の候補全選択保持する手段、各候補毎にその類、
    低度に対応して該候補が他のカナに誤る可能性の出現率
    順位音配列する第1統計テーブルと照合し候補の順位配
    列または重み付はケ再評価する手段、候補毎に先行接続
    および後続する他のカナ文字との接続についてそれぞれ
    第2.第3統計テーブルと比較してその接続性を評価す
    る手段、接合せによるカナ列候補を形態素または/およ
    びその組合せ毎に切出す手段、文法を参照し単語、漢字
    辞書上照合しつ\切出し長を評価してカナ列を漢字に変
    換する手段および切出し単位の組合せル−トを針側する
    手段全具備してなり、制御部は音声認識部の分析照合手
    段に入力音声を印加して音声データの候補毎に類似度を
    算出せしめ、選択保持手段上して選択配列せしめた候補
    について再評価手段による候補数、順位の削減まkは/
    および補正を実行せしめると共に該候補について接続評
    価手段上して候補の配列組合せからなるカナ列における
    その接続妥当性から上位候補を選択して第1手順を実行
    せしめ、更にカナ漢字変換部において該上位候補の組合
    せからなるカナ列ルートについて切出し手段、カナ漢字
    変換手段およびル−ト評価手段またはその相互繰返しに
    より最優先カナ列ルーt−V得る第2手段に実行せしめ
    て、漢字カナ混り文章音出力せしめることを特徴とする
    音声入力文章作成方式。
JP58212019A 1983-11-11 1983-11-11 音声入力文章作成方式 Pending JPS60105037A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58212019A JPS60105037A (ja) 1983-11-11 1983-11-11 音声入力文章作成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58212019A JPS60105037A (ja) 1983-11-11 1983-11-11 音声入力文章作成方式

Publications (1)

Publication Number Publication Date
JPS60105037A true JPS60105037A (ja) 1985-06-10

Family

ID=16615527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58212019A Pending JPS60105037A (ja) 1983-11-11 1983-11-11 音声入力文章作成方式

Country Status (1)

Country Link
JP (1) JPS60105037A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61294591A (ja) * 1985-06-21 1986-12-25 Toshiba Corp 情報入力装置
GB2403370B (en) * 2003-06-17 2007-04-25 Ash Technologies Res Ltd A viewing device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61294591A (ja) * 1985-06-21 1986-12-25 Toshiba Corp 情報入力装置
JPH0469960B2 (ja) * 1985-06-21 1992-11-09 Tokyo Shibaura Electric Co
GB2403370B (en) * 2003-06-17 2007-04-25 Ash Technologies Res Ltd A viewing device

Similar Documents

Publication Publication Date Title
US8352266B2 (en) System and methods for improving accuracy of speech recognition utilizing concept to keyword mapping
US5878390A (en) Speech recognition apparatus equipped with means for removing erroneous candidate of speech recognition
EP1800294B1 (en) System and methods for improving accuracy of speech recognition
KR100853173B1 (ko) 통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및그에 적용되는 번역 처리 방법 및 그 훈련방법
KR100669241B1 (ko) 화행 정보를 이용한 대화체 음성합성 시스템 및 방법
CN111898342A (zh) 一种基于编辑距离的中文发音校验方法
JPS60105037A (ja) 音声入力文章作成方式
JP4220151B2 (ja) 音声対話装置
CN111429886B (zh) 一种语音识别方法及***
CA2880554C (en) System and methods for improving accuracy of speech recognition
JPS62165267A (ja) 音声ワ−ドプロセツサ装置
KR20210020294A (ko) 단어 또는 문장 단위 음성 인식 방법 및 장치
JPS6229796B2 (ja)
JP2001013992A (ja) 音声理解装置
JP2002189490A (ja) ピンイン音声入力の方法
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JPS6039238A (ja) 音声入力文章作成方式
JP4140248B2 (ja) データベース検索装置
CN114333788A (zh) 基于用户意图分析的语音识别矫正方法及其***
Chen et al. A New Prosodic Phrasing Model for Chinese TTS Systems.
JP2000214881A (ja) 音声認識言語モデル生成装置及び音声認識言語モデル生成方法
JPS6132167A (ja) カナ漢字変換処理装置
JPH02255941A (ja) かな漢字変換方式
JPH1185749A (ja) 日本語省略要素補完装置
JPH11327871A (ja) 音声合成装置