JP5956913B2 - 言語モデル生成装置、言語モデル生成方法、プログラム、記録媒体 - Google Patents
言語モデル生成装置、言語モデル生成方法、プログラム、記録媒体 Download PDFInfo
- Publication number
- JP5956913B2 JP5956913B2 JP2012250107A JP2012250107A JP5956913B2 JP 5956913 B2 JP5956913 B2 JP 5956913B2 JP 2012250107 A JP2012250107 A JP 2012250107A JP 2012250107 A JP2012250107 A JP 2012250107A JP 5956913 B2 JP5956913 B2 JP 5956913B2
- Authority
- JP
- Japan
- Prior art keywords
- language model
- participant
- model generation
- probability
- personal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
近年スマートフォンの普及が進み、個人情報端末として多く利用されるようになった。個人情報端末上には、メールや検索履歴といった、ユーザの関心のあるトピックや、ユーザがよく使用する単語など、個人に特化したテキスト(言語)情報が多く含まれる。そこで、本発明では会議参加者の個人情報端末等に記録された情報(参加者毎に蓄積された言語リソース)を用いて、会議参加者と関係が深いトピックや語彙を反映した言語モデル(個人言語モデル)を学習・構築することができる点に着目した。本発明において、個人言語モデルは単語毎のn−gram確率Pを定義したものである。
A)メール送(受)信量(多い参加者は影響力が大きいと考えられる)
B)メールの(被)reply量/率:(高い参加者は影響力が大きいと考えられる)
C)宛先(TO/CC)の量:(多い参加者は影響力が大きいと考えられる)
D)時間情報(会議開始時刻直近は影響力が大きいと考えられる)
上述のように考える根拠は、メール量、(被)reply量/率、宛先(TO/CC)の量が多い参加者は、その会議において連絡、幹事役、もしくは発起人である可能性が高いためである。推定精度を高めるためには、上述のように時間情報を加味して(会議開始時刻直近に限り)各参加者のメール量、メールの(被)reply量/率、宛先(TO/CC)の量を計測して外部情報パラメータとして記憶しておく。
E)上司・部下の関係、役職名(役職が上位の参加者は影響力が大きいと考えられる)
F)所属部・課情報(所属部・課によって参加者の影響力が異なると考えられる)
上述のように考える根拠は、役職が上位の参加者はその会議において連絡、幹事役、もしくは発起人である可能性が高いためである。役職情報を外部情報パラメータとして活用するためには、役職情報を数値化しておく必要がある。簡単には係長クラスに1ポイント、課長クラスに2ポイント等を付与すればよい。また、例えば会議の発起人となりやすい課(例えば、営業課、研究開発課、商品企画課など)に大きな係数を与えておき、会議の発起人となりにくい課(例えば、総務課、経理課など)に小さな係数を与えておき、前述した役職情報の外部情報パラメータに対して係数を乗算することとしてもよい。これらの外部情報パラメータを組み合わせて利用してもよい。
Wx=Mx/ΣMx
また、外部リソースとしてメールや資料などの時間情報(例えば作成日時)などを活用して単語毎に重みを変えてもよい。例えば、直近のメールや資料などに含まれる単語・トピックには大きい重みをあたえる。逆に過去にはよく話されていたが、最近はあまり話されていないようなものには重みを小さくする。重み付けの手段としては以下の日時情報などの外部情報パラメータを利用してもよい。
例えば、外部リソースとしてメールや資料などがあった時に、それらの日時情報(例えば作成日時)などをもとに、直近のメールや資料などに含まれる単語・トピックには大きい重みをあたえる。逆に過去にはよく話されていたが、最近はあまり話されていないようなものには重みを小さくする。
Claims (6)
- 会議録自動作成システムに用いられる言語モデル生成装置であって、
単語毎のn−gram確率を定義した個人言語モデルであって、会議の参加者毎に蓄積された各言語リソースから予め生成した参加者毎の個人言語モデルを記憶する個人言語モデル記憶部と、
単語毎に、全ての参加者のn−gram確率を和算して和算確率値を計算するn−gram確率和算部と、
前記和算確率値の合計が1になるように正規化した正規化確率値を計算し、当該正規化確率値を適応言語モデルとする正規化部と、
を備える言語モデル生成装置。 - 会議録自動作成システムに用いられる言語モデル生成装置であって、
単語毎のn−gram確率を定義した個人言語モデルであって、会議の参加者毎に蓄積された各言語リソースから予め生成した参加者毎の個人言語モデルを記憶する個人言語モデル記憶部と、
前記参加者の前記会議に対する影響力を表す外部情報パラメータが記憶された外部情報記憶部と、
前記外部情報パラメータを用いて参加者重みを計算する参加者重み計算部と、
参加者毎のn−gram確率に参加者重みを乗算して重みつき確率値を生成する重み付け部と、
重みつき確率値を単語毎に和算して正規化確率値を計算し、当該正規化確率値を適応言語モデルとする重み付け確率和算部と、
を備える言語モデル生成装置。 - 会議録自動作成システムに用いられる言語モデル生成装置が実行する言語モデル生成方法であって、
前記言語モデル生成装置は、個人言語モデル記憶部を備え、
前記個人言語モデル記憶部には、単語毎のn−gram確率を定義した個人言語モデルであって、会議の参加者毎に蓄積された各言語リソースから予め生成した参加者毎の個人言語モデルが記憶され、
前記言語モデル生成装置は、
単語毎に、全ての参加者のn−gram確率を和算して和算確率値を計算するn−gram確率和算ステップと、
前記和算確率値の合計が1になるように正規化した正規化確率値を計算し、当該正規化確率値を適応言語モデルとする正規化ステップと、
を実行する言語モデル生成方法。 - 会議録自動作成システムに用いられる言語モデル生成装置が実行する言語モデル生成方法であって、
前記言語モデル生成装置は、個人言語モデル記憶部と、外部情報記憶部とを備え、
前記個人言語モデル記憶部には、単語毎のn−gram確率を定義した個人言語モデルであって、会議の参加者毎に蓄積された各言語リソースから予め生成した参加者毎の個人言語モデルが記憶され
前記外部情報記憶部には、前記参加者の前記会議に対する影響力を表す外部情報パラメータが記憶され、
前記言語モデル生成装置は、
前記外部情報パラメータを用いて参加者重みを計算する参加者重み計算ステップと、
参加者毎のn−gram確率に参加者重みを乗算して重みつき確率値を生成する重み付けステップと、
重みつき確率値を単語毎に和算して正規化確率値を計算し、当該正規化確率値を適応言語モデルとする重み付け確率和算ステップと、
を実行する言語モデル生成方法。 - 請求項3、または4に記載された言語モデル生成方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項3、または4に記載された言語モデル生成方法の各ステップをコンピュータに実行させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012250107A JP5956913B2 (ja) | 2012-11-14 | 2012-11-14 | 言語モデル生成装置、言語モデル生成方法、プログラム、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012250107A JP5956913B2 (ja) | 2012-11-14 | 2012-11-14 | 言語モデル生成装置、言語モデル生成方法、プログラム、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014098785A JP2014098785A (ja) | 2014-05-29 |
JP5956913B2 true JP5956913B2 (ja) | 2016-07-27 |
Family
ID=50940840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012250107A Expired - Fee Related JP5956913B2 (ja) | 2012-11-14 | 2012-11-14 | 言語モデル生成装置、言語モデル生成方法、プログラム、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5956913B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6230987B2 (ja) * | 2014-12-01 | 2017-11-15 | 日本電信電話株式会社 | 言語モデル作成装置、言語モデル作成方法、プログラム、および記録媒体 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014693A (ja) * | 2000-06-30 | 2002-01-18 | Mitsubishi Electric Corp | 音声認識システム用辞書提供方法、および音声認識インタフェース |
JP3621686B2 (ja) * | 2002-03-06 | 2005-02-16 | 日本電信電話株式会社 | データ編集方法、データ編集装置、データ編集プログラム |
JP5558284B2 (ja) * | 2010-09-15 | 2014-07-23 | 株式会社Nttドコモ | 音声認識システム、音声認識方法、および音声認識プログラム |
JP5478478B2 (ja) * | 2010-12-15 | 2014-04-23 | 日本放送協会 | テキスト修正装置およびプログラム |
-
2012
- 2012-11-14 JP JP2012250107A patent/JP5956913B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014098785A (ja) | 2014-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10623573B2 (en) | Personalized support routing based on paralinguistic information | |
KR101634086B1 (ko) | 감정 분석을 통한 스티커 추천 방법 및 시스템 | |
US8996371B2 (en) | Method and system for automatic domain adaptation in speech recognition applications | |
US9305553B2 (en) | Speech recognition accuracy improvement through speaker categories | |
CN112530408A (zh) | 用于识别语音的方法、装置、电子设备和介质 | |
JP5223673B2 (ja) | 音声処理装置およびプログラム、並びに、音声処理方法 | |
JP2004355003A (ja) | 名前付きエンティティ認識を機能強化するユーザモデル化のシステムおよび方法。 | |
JP2006039575A (ja) | 信頼性スコアを使用した自然言語コール・ルーティングのための方法および装置 | |
CN111145733B (zh) | 语音识别方法、装置、计算机设备和计算机可读存储介质 | |
JP2015075706A (ja) | 誤り修正モデル学習装置、及びプログラム | |
US11354754B2 (en) | Generating self-support metrics based on paralinguistic information | |
JP7230806B2 (ja) | 情報処理装置、及び情報処理方法 | |
KR102120751B1 (ko) | 대화 이해 ai 시스템에 의하여, 머신러닝을 대화 관리 기술에 적용한 하이브리드 계층적 대화 흐름 모델을 기초로 답변을 제공하는 방법 및 컴퓨터 판독가능 기록 매체 | |
KR102100214B1 (ko) | 음성 인식 기반의 세일즈 대화 분석 방법 및 장치 | |
KR101891498B1 (ko) | 대화형 ai 에이전트 시스템에서 멀티 도메인 인텐트의 혼재성을 해소하는 멀티 도메인 서비스를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체 | |
CN112863489B (zh) | 语音识别方法、装置、设备及介质 | |
US20140236597A1 (en) | System and method for supervised creation of personalized speech samples libraries in real-time for text-to-speech synthesis | |
CN114416989A (zh) | 一种文本分类模型优化方法和装置 | |
KR101950387B1 (ko) | 학습 데이터 중 식별 가능하지만 학습 가능성이 없는 데이터의 레이블화를 통한, 대화형 ai 에이전트 시스템을 위한 지식베이스 모델의 구축 또는 갱신 방법, 컴퓨터 장치, 및 컴퓨터 판독 가능 기록 매체 | |
CN111508497B (zh) | 语音识别方法、装置、电子设备及存储介质 | |
Nasr et al. | End-to-end speech recognition for arabic dialects | |
US11615787B2 (en) | Dialogue system and method of controlling the same | |
KR20190103951A (ko) | 학습 데이터 중 식별 가능하지만 학습 가능성이 없는 데이터의 레이블화를 통한, 대화형 ai 에이전트 시스템을 위한 지식베이스 모델의 구축 또는 갱신 방법, 컴퓨터 장치, 및 컴퓨터 판독 가능 기록 매체 | |
JP5956913B2 (ja) | 言語モデル生成装置、言語モデル生成方法、プログラム、記録媒体 | |
JP7028203B2 (ja) | 音声認識装置、音声認識方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160617 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5956913 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |