JP2003058538A - 文章解析方法とその方法を利用可能な文章解析装置 - Google Patents

文章解析方法とその方法を利用可能な文章解析装置

Info

Publication number
JP2003058538A
JP2003058538A JP2001249535A JP2001249535A JP2003058538A JP 2003058538 A JP2003058538 A JP 2003058538A JP 2001249535 A JP2001249535 A JP 2001249535A JP 2001249535 A JP2001249535 A JP 2001249535A JP 2003058538 A JP2003058538 A JP 2003058538A
Authority
JP
Japan
Prior art keywords
sentence
theme
words
block
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001249535A
Other languages
English (en)
Other versions
JP3691773B2 (ja
Inventor
Hiroki Tanioka
広樹 谷岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2001249535A priority Critical patent/JP3691773B2/ja
Publication of JP2003058538A publication Critical patent/JP2003058538A/ja
Application granted granted Critical
Publication of JP3691773B2 publication Critical patent/JP3691773B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 従来の話題同定技術においては、あらゆる文
章パターンや対話パターンを登録しておく必要があり、
処理としても効率的でなかった。 【解決手段】 文章処理システム10において、ユーザ
が入力した文章を文章受付部26が取得し、これを対象
設定部28が注目ブロックとして設定し、その注目ブロ
ックから文字列解析部34が一つ以上の語句を抽出し、
その語句の集合を用いて過去に抽出された語句の集合を
更新することによってテーマ特定部42が文章のテーマ
を特定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文章解析方法お
よび装置に関する。この発明は特に、対話における話題
同定技術に関する。
【0002】
【従来の技術】一般社会において高度情報化が進展し、
パーソナルコンピュータ(以下、「PC」という。)な
どの電子端末に向かって文章を入力することは多くの人
々にとって生活の一部となっている。かつてはビジネス
書類や学術論文などをワードプロセッサで作成する場合
の文章入力が主な利用形態であったが、今日ではインタ
ーネットの普及によってあらゆる人々のコミュニケーシ
ョンに電子メールなどのツールが欠かせない。最近では
携帯電話にも電子メール機能が標準的に搭載されてい
る。これにより、人間が入力する文章をコンピュータが
処理する機会は益々増加することが予測される。
【0003】
【発明が解決しようとする課題】ここで、コンピュータ
が文章を処理するに当たり、その文章を単なるテキスト
データとしてではなく意味のある文字列として扱うため
に必要な技術の研究が数多くなされている。その一つに
文章の話題を同定する技術の研究がある。こうした技術
によって文章内容や文章作成者の意図をコンピュータが
より正確に理解できるようになれば、コンピュータの知
的エージェント化も飛躍的に高まると思われる。
【0004】しかしながら、従来の話題同定におけるア
プローチには、対象となる文章の構文解析や意味解析そ
のものに頼ることが多い。この場合、一定の精度を保つ
ためには考えられるあらゆる文章パターンや対話パター
ンをデータベース化しておく必要があり、複雑にならざ
るを得ない。例えば、特開昭63−106042号公報
においては、代名詞や前置詞がもつ意味に着目して話題
の切れ目を探す技術を開示しているが、この場合あらゆ
る代名詞や前置詞に基づいた文章パターンを条件に登録
しておく必要があり、その検索処理に関しても効率的と
は言い難い。文章処理機能が携帯電話などPC以外の簡
易な機器でも多くとりいれられている現実からすれば、
汎用的でしかも処理効率の高い文章解析技術の確立に対
する期待は大きい。
【0005】本発明者は以上の認識に基づき本発明をな
したもので、その目的は、効率よく文章のテーマを特定
する技術の提供にある。
【0006】
【課題を解決するための手段】本発明のある態様は、文
章解析方法に関する。この方法は、時間の経過とともに
次々に入力される文章を取得し、入力があるごとに新た
に取得した文章のブロックを注目ブロックとして設定
し、注目ブロックを分解して少なくとも一つ以上の語句
を抽出し、抽出された語句と過去に抽出された語句との
間における時間的要素を含む変化に基づいて注目ブロッ
クとして設定された文章のテーマを特定する。
【0007】「時間の経過とともに次々に入力される文
章」は、例えばPCのユーザが文書作成時に入力し続け
る文章、複数のユーザがネットワークを介して相互に対
話形式で送信し合う文章、音声認識の結果として生成さ
れる文章など、解析対象として現在本装置に入力され続
けている文字列を示す。「新たに取得した文章のブロッ
ク」は、例えば一連の文章に含まれるひとつひとつの段
落をブロックの単位としたり、いわゆるチャットなどの
対話において一度に送信される発話内容をブロックの単
位とするなど、一つ以上の語句が有意なひとかたまりを
形成する文字列である。
【0008】「時間的要素を含む変化」は、話題の変化
が単なる人間の思考の変化だけに左右されるのではな
く、時間の経過にも左右されることに着目したものであ
る。例えば、完全に話題が変わってしまう場合を除け
ば、人間は少し前の会話内容を記憶に留めながら会話を
進めており、その記憶は時間の経過とともに薄れていく
と言える。逆に言えば、しばらく遡った過去の会話内容
まである程度記憶に留めながら会話を進めるのであっ
て、必ずしも直前の会話内容だけを記憶に留めているの
ではない。この点を話題同定のアルゴリズムに取り入れ
ることによって、人間の意識へより近づいた技術を実現
できる。
【0009】「文章のテーマ」は、例えば会話における
発言ごとの話題、論文における段落ごとの論題、文書フ
ァイルにおける一文ごとの主題など、その文章のブロッ
クが入力された時点における文章の作成者の意識を想定
したその文章の要点を示す。
【0010】本発明の別の態様は、文章解析装置であ
る。本装置は、文章の入力を受け付ける文章受付部と、
入力があるごとに新たに入力された文章のブロックを注
目ブロックとして設定する対象設定部と、注目ブロック
を分解して少なくとも一つ以上の語句を抽出する文字列
解析部と、抽出された語句に基づいて文章のテーマを特
定するテーマ特定部と、を有し、テーマ特定部は、注目
ブロックとして設定された文章のテーマを、過去に入力
された文章のテーマとの間における時間的要素を含む変
化に基づいて特定する。
【0011】ここでいう「過去に入力された」は、主に
「前回入力された」を意味するが、その「前回入力され
た文章のテーマ」には「さらに前回入力された文章のテ
ーマ」が反映されている場合があり、それを含めた意味
で「過去」と表現している。
【0012】本発明のさらに別の態様は、コンピュータ
プログラムである。このプログラムは、時間の経過とと
もに次々に入力される文章を取得する処理と、入力があ
るごとに新たに取得した文章のブロックを注目ブロック
として設定する処理と、注目ブロックを分解して少なく
とも一つ以上の語句を抽出する処理と、抽出された語句
と過去に抽出された語句との間における時間的要素を含
む変化に基づいて注目ブロックとして設定された文章の
テーマを特定する処理と、をコンピュータに実行させ
る。
【0013】なお、以上の構成要素の任意の組合せや、
本発明の構成要素や表現を方法、装置、システム、コン
ピュータプログラム、コンピュータプログラムを格納し
た記録媒体などの間で相互に置換したものもまた、本発
明の態様として有効である。
【0014】
【発明の実施の形態】本実施形態においては、入力され
た文章のブロックを分解して複数の語句を抽出し、これ
らを用いてその文章のテーマとなる語句の集合を決定す
る。複数の語句のそれぞれには重み付けとして重要度が
付与され、その重要度を時間経過に応じて下げていく。
この重要度は、会話中の人間の意識においてその語句が
もつ印象の大きさにも相当し、時間経過とともに意識ま
たは記憶が薄れていくのに合わせられている。このよう
な語句と重要度の集合を、文章が入力されるたびに更新
することによって、最新の「テーマ」を効率よくリアル
タイムに決定しながら対話の処理を進めることができ
る。
【0015】図1は、本実施形態における文章処理シス
テムの構成を示す機能ブロック図である。文章処理シス
テム10は、入出力ユニット12と文章解析ユニット1
4を有する。入出力ユニット12は、ユーザとの間で文
章の入出力を処理し、またはインターネットを介して文
章の入出力を処理する。文章解析ユニット14は、入出
力ユニット12によって入力された文章を解析して結果
を入出力ユニット12に出力する。文章処理システム1
0は、ハードウエア的には、コンピュータのCPUをは
じめとする素子で実現でき、ソフトウエア的にはデータ
処理機能のあるプログラムなどによって実現されるが、
本図ではそれらの連携によって実現される機能ブロック
を描いている。したがって、これらの機能ブロックはハ
ードウエア、ソフトウエアの組合せによっていろいろな
かたちで実現できる。この文章処理システム10は、P
C、携帯電話、PDAなどの他、テキスト処理機能を有
するあらゆる電子機器や家庭電化製品としても実現でき
る。
【0016】入出力ユニット12は、通信部20、表示
部22、対話処理部24、言語入力処理部30、および
応用処理部40を有する。言語入力処理部30は、ユー
ザからキーボード入力または音声認識入力によって文章
の入力を受け付け、その文章をテキストデータの形で対
話処理部24に送る。通信部20は、インターネット経
由で他のユーザから文章を受け付ける。対話処理部24
は、複数のユーザ間でやりとりされる文章を対話形式で
表示部22に表示させるとともに、本装置のユーザが入
力した文章を通信部20を介して他のユーザに送信す
る。応用処理部40に関しては後述する。
【0017】文章解析ユニット14は、文章受付部2
6、対象設定部28、尤度判定部32、文字列解析部3
4、およびテーマ特定部42を有する。文章受付部26
は、対話処理部24から文章の入力を受け付ける。この
文章は、対話の形式で対話処理部24に入力されるテキ
ストデータである。対象設定部28は、入力があるごと
に新たに入力された文章のブロックを注目ブロックとし
て設定する。
【0018】文字列解析部34は、語句抽出部36およ
び重要度設定部38を含む。語句抽出部36は、注目ブ
ロックを分解して少なくとも一つ以上の語句を抽出す
る。語句の抽出は、一般的な形態素解析方法によりなさ
れてもよい。例えば、「昨日は晴れてましたよね。」と
いう文章から「昨日」「晴れ」の語句を抽出するが如く
である。
【0019】重要度設定部38は、抽出された語句のそ
れぞれに対してその文章における語句の重要度を対応付
ける。この重要度は、各語句に対する重み付けとして作
用する。例えば、「昨日」「晴れ」の語句にそれぞれ重
要度として「5」を付与する。この重要度は、言語的尤
度および認識尤度のうち少なくともいずれかに基づいて
設定されてもよい。言語的尤度は、例えば語句抽出部3
6による形態素解析における各語句の言語的な確からし
さであり、係り受けや語句間の共起などによって判断し
てもよい。言語的尤度は、言語入力処理部30による音
声認識時のテキスト変換やかな漢字変換におけるその変
換結果の言語的な確からしさであってもよい。認識尤度
は、例えば言語入力処理部30による音声認識における
その認識の確からしさを示し、音声の音量や雑音が影響
する場合もある。言語的尤度および認識尤度を尤度判定
部32が判定してもよい。
【0020】テーマ特定部42は、文字列解析部34に
よって抽出された語句に基づいて文章のテーマを特定す
るブロックであり、類似度決定部44、重要度更新部4
6、テーマ決定部48、およびテーマ保持部50を含
む。このテーマは、一つ以上の語句とその重要度の集合
がテーマに反映されることを前提とした上で、過去に入
力された文章のテーマとの間における時間的要素を含む
変化に基づいて特定される。テーマに反映させる各語句
は、対話における文章ごとの話題同定に寄与する。例え
ば、{昨日(5)、晴れ(5)}のような語句とその重
要度の集合が「昨日は晴れてましたよね。」の文章のテ
ーマとして位置づけられる。
【0021】テーマ保持部50には、新たに特定された
最新のテーマが格納され、次に文章が入力されたときに
新たなテーマを特定する際には「前回のテーマ」として
参照される。このテーマ保持部50は、最新のテーマだ
けを記憶するメモリとして構成されてもよいし、過去の
テーマを累積的に保持するデータベースとして構成され
てもよい。そのデータベースに各テーマがそれぞれひと
つのレコードとして記録されてもよい。
【0022】類似度決定部44は、注目ブロックにおけ
る語句の集合と前回のテーマに含まれる語句の集合との
間で類似度を判断する。この類似度は、語句の集合間に
おける概念的な近さであり、例えば対話においては話題
の変化の大きさに相当する。従って、類似度が大きけれ
ば話題が継続していると判断でき、類似度が小さければ
話題が大きく変わったと判断できる。
【0023】類似度としては、2つの集合間における積
集合の数を用いてもよい。この場合、2つの集合AとB
の類似度は、|A∩B|/|A∪B|=|A∩B|/
{|A|+|B|−|A∩B|}の式で求められる。ま
た、類似度としてレーベンシュタイン距離を用いてもよ
い。この場合、2つの集合AとBの類似度は、max
{|A|,|B|}−|A∩B|の式で求められる。類
似度として2つの集合の平均ベクトル間の距離を用いて
もよい。このベクトルは、n個の語句を要素とする集合
に対してn次元の空間ベクトルで表現してもよい。
【0024】類似度が所定の基準値を下回った場合、重
要度更新部46が注目ブロックにおける語句の集合で前
回のテーマに含まれる語句を置き換えることによってテ
ーマの更新をなす。すなわち、文章のテーマが大きく変
わった場合には語句の集合が全て入れ替わる。
【0025】類似度が所定の基準値以上である場合、重
要度更新部46は、注目ブロックにおける語句とその重
要度の集合を用いて前回のテーマに含まれる語句とその
重要度の集合を更新することにより最新のテーマを特定
する。具体的には、注目ブロックにおける語句と前回の
テーマに含まれる語句を併合するとともに、共通の語句
が含まれる場合はその重要度として高い方を用いる。例
えば、注目ブロックにおける語句とその重要度が{昨日
(5)、晴れ(5)}であり、過去における語句と重要
度が{今日(3)、晴れ(3)}である場合、これらを
併合した更新後の集合は{昨日(5)、晴れ(5)、今
日(3)}となる。
【0026】重要度更新部46は、語句と重要度の更新
時に、更新までの時間経過に応じて語句の重要度を減衰
させる。例えば、新たに特定されたテーマが{昨日
(5)、晴れ(5)}の場合、次回のテーマ特定時には
{昨日(3)、晴れ(3)}のように重要度が下がり、
この集合が上記の「前回のテーマに含まれる語句とその
重要度の集合」として扱われる。この重要度が所定の最
低値を下回った場合にはその語句は集合から除外され
る。例えば、{昨日(3)、晴れ(1)}となった場合
に、条件として「重要度1以下は除外」と定めていた場
合には「晴れ(1)」が除外される。すなわち、現実の
対話においては、話者の意識には「晴れ」の印象がほぼ
消えていると判断される。なお、減衰の度合いは任意で
ある。
【0027】テーマ決定部48は、重要度更新部46に
よって更新された語句と重要度の集合を、注目ブロック
として設定された文章に対するテーマに決定し、これを
テーマ保持部50に記録する。
【0028】応用処理部40は、新たに特定されたテー
マを言語入力処理部30によるかな漢字変換における変
換候補の優先順位に反映させる。応用処理部40は、新
たに特定されたテーマを言語入力処理部30による音声
認識処理における認識候補の優先順位に反映させる。
【0029】以上の構成による動作を以下説明する。図
2は、本実施形態における文章処理システム10の動作
を示すフローチャートである。まず、新たな文章を入力
し(S10)、その文章を注目ブロックとして設定する
(S12)。注目ブロックから語句を抽出し(S1
4)、それぞれの重要度を設定する(S16)。注目ブ
ロックにおける語句の集合と、前回のテーマにおける語
句の集合との間で類似度を決定する(S18)。類似度
が所定の基準値を下回った場合(S20N)、集合の語
句を全て入れ替える(S26)。類似度が所定の基準値
以上の場合(S20Y)、前回のテーマにおける語句の
重要度を減衰させた上で(S22)、各集合の語句を併
合することにより更新する(S24)。
【0030】更新された語句と重要度の集合を注目ブロ
ックとして設定された文章に対するテーマに決定し、こ
れを記録する(S28)。新しいテーマを対話処理など
に利用する(S30)。こうした対話を終了するまで、
S10〜S30の処理を繰り返す(S32N)。
【0031】図3は、対話における注目ブロック、語
句、重要度、および類似度の対応関係を示す。図におい
ては、「Aさん」と「Bさん」の対話形式で表現する。
文字60は、「Aさん」の発言として入力された文章で
あり、入力された時点での注目ブロックとして設定され
る。文字64は、テーマとして特定された集合の要素と
なる語句であり、数字66はその重要度である。数字6
2は、一つ前の発言におけるテーマとの間で決定される
類似度である。
【0032】発言(2)の注目ブロックからは「こんに
ちは」の語句が抽出され、発言(1)のテーマとの間で
語句が共通するため、併合後も、テーマとなる集合の要
素は「こんにちは」のみである。その重要度は、発言
(1)から発言(2)へ推移したときに本来は「5」か
ら「3」に減衰するところ、発言(2)にも同じ語句が
含まれていたことから「5」のままになる。
【0033】発言(3)のテーマには「こんにちは」の
語句が含まれているが、重要度は減衰して「3」になっ
ている。この「こんにちは」の語句の重要度は、発言
(4)ではさらに「1」まで下がり、発言(5)では除
外されている。なお、発言(5)はAB双方が沈黙して
いる間にも語句の重要度が下がることを示すために図示
しているが、実際のPC画面などでは表示することを要
しない。
【0034】発言(6)では、発言(5)との間で類似
度が「0」と判断されたため、テーマにおける語句が全
て入れ替わっている。同様に、発言(14)においても
発言(13)との間で類似度が所定値を下回ったとして
語句が全て入れ替わっている。このようなテーマの転換
に基づき、各テーマの上位概念として上位テーマを判定
してもよい。図に示す通り、線70で囲まれた対話の上
位テーマを「挨拶」に、線72で囲まれた対話の上位テ
ーマを「天気」に、線74で囲まれた対話の上位テーマ
を「テレビ」にそれぞれ決定し、こうした上位テーマを
かな漢字変換や音声認識処理に応用してもよい。
【0035】図4は、語句と重要度の更新過程を示す。
テーブル80は、前回のテーマにおける語句と重要度の
対応を示す。テーブル82は、前回のテーマにおける各
語句の重要度を減衰させた後の語句と重要度の対応を示
す。例えば、「雨」の重要度は「5」から「3」へと減
衰している。テーブル84は、注目ブロックにおける語
句と重要度の対応を示す。テーブル86は、前回のテー
マにおける語句および重要度の集合と、注目ブロックに
おける語句および重要度の集合を併合した後の語句と重
要度の対応を示す。各語句は重要度の高い順に並び替え
られている。「天気」「予報」「雨」は双方の集合に共
通する語句であり、重要度にはより高い値が採用されて
いる。例えば、「天気」と「予報」は注目ブロックにお
ける語句の方が重要度が大きいためそれぞれ「5」
「4」で更新され、「雨」は前回のテーマにおける語句
の方が重要度が大きいため「3」のまま更新されない。
「暗い」「確率」の重要度は「1」であり、所定の最低
値を下回ったとして除外される。この除外がなされた後
の語句と重要度の集合が最新のテーマとして決定され、
テーブル88に示される。除外のための最低値や、最新
のテーマとして決定すべき語句の数は、それぞれ任意で
ある。
【0036】図5は、かな漢字変換にテーマを反映させ
た結果を示す。例えば(a)においては、直前に入力し
た文章のテーマが「今日、晴れ、天気」などの語句で構
成されるときに、このテーマから推測し、図示する入力
例を「雨」に変換する処理をしてもよい。例えば(b)
においては、直前に入力した文章のテーマが「今日、ガ
ム、菓子」などの語句で構成されるときに、このテーマ
から推測し、図示する入力例を「飴」に変換する処理を
してもよい。同様の変換を音声認識に反映させてもよ
い。
【0037】(第2実施形態)図6は、対話システムの
画面を示す。本実施形態においては、対話システムがユ
ーザから発言を受け取って、これに対する返答を自動生
成して表示する。このとき、対話システムによる返答の
生成においてユーザの発言のテーマが反映される。この
システムにおいては、直前の話題に沿った対話を高速か
つ円滑に処理できる。
【0038】以上、本発明を実施の形態をもとに説明し
た。この実施の形態は例示であり、それらの各構成要素
や各処理プロセスの組合せにいろいろな変形が可能なこ
と、またそうした変形例も本発明の範囲にあることは当
業者に理解されるところである。以下、変形例を挙げ
る。
【0039】語句抽出部36は、注目ブロックから語句
を抽出する際に、同義語や統制語を一定の語句に統一し
てもよい。また、語句を語幹の形に変換してもよいし、
その語句の上位概念をさらに抽出して追加してもよい。
【0040】テーマ決定部48は、重要度更新部46に
よって更新された語句の集合に対し、それらの語句の上
位概念を追加してもよい。
【発明の効果】本発明によれば、比較的効率よく文章の
テーマを特定できる。
【図面の簡単な説明】
【図1】 本実施形態における文章処理システムの構成
を示す機能ブロック図である。
【図2】 本実施形態における文章処理システムの動作
を示すフローチャートである
【図3】 対話における注目ブロック、語句、重要度、
および類似度の対応関係を示す図である。
【図4】 語句と重要度の更新過程を示す図である。
【図5】 かな漢字変換にテーマを反映させた結果を示
す図である。
【図6】 対話システムの画面を示す図である。
【符号の説明】
26 文章受付部、 28 対象設定部、 34 文字
列解析部、 40 応用処理部、 42 テーマ特定
部。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 時間の経過とともに次々に入力される文
    章を取得し、 前記入力があるごとに新たに取得した文章のブロックを
    注目ブロックとして設定し、 前記注目ブロックを分解して少なくとも一つ以上の語句
    を抽出し、 前記抽出された語句と過去に抽出された語句との間にお
    ける時間的要素を含む変化に基づいて前記注目ブロック
    として設定された文章のテーマを特定することを特徴と
    する文章解析方法。
  2. 【請求項2】 文章の入力を受け付ける文章受付部と、 前記入力があるごとに新たに入力された文章のブロック
    を注目ブロックとして設定する対象設定部と、 前記注目ブロックを分解して少なくとも一つ以上の語句
    を抽出する文字列解析部と、 前記抽出された語句に基づいて前記文章のテーマを特定
    するテーマ特定部と、 を有し、 前記テーマ特定部は、前記注目ブロックとして設定され
    た文章のテーマを、過去に入力された文章のテーマとの
    間における時間的要素を含む変化に基づいて特定するこ
    とを特徴とする文章解析装置。
  3. 【請求項3】 前記文章受付部は、対話の形式で入力さ
    れる文章を受け付け、 前記テーマ特定部は、前記対話における文章ごとの話題
    同定に寄与する語句に基づいて前記テーマを特定するこ
    とを特徴とする請求項2に記載の文章解析装置。
  4. 【請求項4】 前記テーマ特定部は、前記抽出された語
    句の集合を前記テーマに反映させることを前提とした上
    で、前記注目ブロックにおける語句の集合を用いて過去
    における語句の集合を更新することにより最新のテーマ
    を特定することを特徴とする請求項2または3に記載の
    文章解析装置。
  5. 【請求項5】 前記文字列解析部は、前記抽出された語
    句のそれぞれに対してその文章における前記語句の重要
    度を対応付け、 前記テーマ特定部は、前記抽出された語句とその重要度
    の集合を前記テーマに反映させることを前提とした上
    で、前記注目ブロックにおける語句とその重要度を用い
    て過去における語句とその重要度を更新することによ
    り、最新のテーマを特定することを特徴とする請求項2
    または3に記載の文章解析装置。
  6. 【請求項6】 前記テーマ特定部は、前記語句と重要度
    の更新時に、更新までの時間経過に応じて語句の重要度
    を減衰させるとともに、重要度が所定の最低値を下回っ
    た場合にはその語句を前記集合から除外することを特徴
    とする請求項5に記載の文章解析装置。
  7. 【請求項7】 前記テーマ特定部は、前記注目ブロック
    における語句の集合と過去における語句の集合との類似
    度を判断し、前記類似度が所定の基準値を下回った場合
    は、これらの集合を置き換えることによって前記更新を
    なすことを特徴とする請求項4から6のいずれかに記載
    の文章解析装置。
  8. 【請求項8】 前記特定されたテーマをかな漢字変換に
    おける変換候補の優先順位に反映させる応用処理部をさ
    らに有することを特徴とする請求項2から7のいずれか
    に記載の文章解析装置。
  9. 【請求項9】 前記特定されたテーマを音声認識処理に
    おける認識候補の優先順位に反映させる応用処理部をさ
    らに有することを特徴とする請求項2から7のいずれか
    に記載の文章解析装置。
  10. 【請求項10】 時間の経過とともに次々に入力される
    文章を取得する処理と、 前記入力があるごとに新たに取得した文章のブロックを
    注目ブロックとして設定する処理と、 前記注目ブロックを分解して少なくとも一つ以上の語句
    を抽出する処理と、 前記抽出された語句と過去に抽出された語句との間にお
    ける時間的要素を含む変化に基づいて前記注目ブロック
    として設定された文章のテーマを特定する処理と、 をコンピュータに実行させることを特徴とするコンピュ
    ータプログラム。
JP2001249535A 2001-08-20 2001-08-20 文章解析方法とその方法を利用可能な文章解析装置 Expired - Fee Related JP3691773B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001249535A JP3691773B2 (ja) 2001-08-20 2001-08-20 文章解析方法とその方法を利用可能な文章解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001249535A JP3691773B2 (ja) 2001-08-20 2001-08-20 文章解析方法とその方法を利用可能な文章解析装置

Publications (2)

Publication Number Publication Date
JP2003058538A true JP2003058538A (ja) 2003-02-28
JP3691773B2 JP3691773B2 (ja) 2005-09-07

Family

ID=19078524

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001249535A Expired - Fee Related JP3691773B2 (ja) 2001-08-20 2001-08-20 文章解析方法とその方法を利用可能な文章解析装置

Country Status (1)

Country Link
JP (1) JP3691773B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018113064A (ja) * 2012-07-20 2018-07-19 ベベオ, インコーポレイテッド 会話型相互作用システムの検索入力におけるユーザ意図を推定する方法およびそのためのシステム
US10540387B2 (en) 2014-12-23 2020-01-21 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US10572520B2 (en) 2012-07-31 2020-02-25 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
US10896184B2 (en) 2013-05-10 2021-01-19 Veveo, Inc. Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system
US10978094B2 (en) 2013-05-07 2021-04-13 Veveo, Inc. Method of and system for real time feedback in an incremental speech input interface
US11811889B2 (en) 2015-01-30 2023-11-07 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms based on media asset schedule

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018113064A (ja) * 2012-07-20 2018-07-19 ベベオ, インコーポレイテッド 会話型相互作用システムの検索入力におけるユーザ意図を推定する方法およびそのためのシステム
US12032643B2 (en) 2012-07-20 2024-07-09 Veveo, Inc. Method of and system for inferring user intent in search input in a conversational interaction system
US11436296B2 (en) 2012-07-20 2022-09-06 Veveo, Inc. Method of and system for inferring user intent in search input in a conversational interaction system
US10592575B2 (en) 2012-07-20 2020-03-17 Veveo, Inc. Method of and system for inferring user intent in search input in a conversational interaction system
US11093538B2 (en) 2012-07-31 2021-08-17 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
US10572520B2 (en) 2012-07-31 2020-02-25 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
US11847151B2 (en) 2012-07-31 2023-12-19 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
US10978094B2 (en) 2013-05-07 2021-04-13 Veveo, Inc. Method of and system for real time feedback in an incremental speech input interface
US10896184B2 (en) 2013-05-10 2021-01-19 Veveo, Inc. Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system
US10540387B2 (en) 2014-12-23 2020-01-21 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US11811889B2 (en) 2015-01-30 2023-11-07 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms based on media asset schedule
US11843676B2 (en) 2015-01-30 2023-12-12 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms based on user input
US11991257B2 (en) 2015-01-30 2024-05-21 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms based on media asset chronology

Also Published As

Publication number Publication date
JP3691773B2 (ja) 2005-09-07

Similar Documents

Publication Publication Date Title
US10997226B2 (en) Crafting a response based on sentiment identification
US7010490B2 (en) Method, system, and apparatus for limiting available selections in a speech recognition system
RU2571608C2 (ru) Создание заметок с использованием голосового потока
EP1089193A2 (en) Translating apparatus and method, and recording medium used therewith
US11586689B2 (en) Electronic apparatus and controlling method thereof
WO2005101235A1 (ja) 対話支援装置
JP2002082945A (ja) 自然言語処理システム用トークナイザ
CN110268472B (zh) 用于自动化对话***的检测机构
Kristensson et al. A design engineering approach for quantitatively exploring context-aware sentence retrieval for nonspeaking individuals with motor disabilities
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
JP2013167666A (ja) 音声認識装置、音声認識方法、及びプログラム
WO2022134779A1 (zh) 人物动作相关数据的提取方法、装置、设备及存储介质
JPH07222248A (ja) 携帯型情報端末における音声情報の利用方式
EP4187463A1 (en) An artificial intelligence powered digital meeting assistant
WO2011067463A1 (en) Weight-ordered enumeration of referents and cutting off lengthy enumerations
KR20190074508A (ko) 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법
KR20210051523A (ko) 도메인 자동 분류 대화 시스템
JP3691773B2 (ja) 文章解析方法とその方法を利用可能な文章解析装置
US10282417B2 (en) Conversational list management
Manojkumar et al. AI-based virtual assistant using python: a systematic review
CN112149403A (zh) 一种确定涉密文本的方法和装置
JP5293607B2 (ja) 略語生成装置およびプログラム、並びに、略語生成方法
CN111506701A (zh) 一种智能查询方法及相关装置
JP2004220226A (ja) 検索文書のための文書分類方法及び装置
KR20020032835A (ko) 자연어 처리와 음성 인식 병합에 의거한 음성 언어 이해기술 및 그 비즈니스 모델

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20031226

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040323

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040324

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050616

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110624

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees