JP2004145541A - Chat system - Google Patents

Chat system Download PDF

Info

Publication number
JP2004145541A
JP2004145541A JP2002308487A JP2002308487A JP2004145541A JP 2004145541 A JP2004145541 A JP 2004145541A JP 2002308487 A JP2002308487 A JP 2002308487A JP 2002308487 A JP2002308487 A JP 2002308487A JP 2004145541 A JP2004145541 A JP 2004145541A
Authority
JP
Japan
Prior art keywords
sentence
keyword
conversation
response
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002308487A
Other languages
Japanese (ja)
Inventor
Masakatsu Morii
森井 昌克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
COLLABO 21 KK
INOSU KK
Original Assignee
COLLABO 21 KK
INOSU KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by COLLABO 21 KK, INOSU KK filed Critical COLLABO 21 KK
Priority to JP2002308487A priority Critical patent/JP2004145541A/en
Publication of JP2004145541A publication Critical patent/JP2004145541A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a chat system allowing a chat using the Internet to develop into arbitrary conversation in addition to previously prepared conversation, and capable of executing promotion of a commodity/service to a consumer, or collection of needs or taste of the consumer in development of the commodity, sales or the like in the chat without imparting incongruity to a user of the chat. <P>SOLUTION: This chat system has a keyword retrieval means executing keyword retrieval by use of a DB storing even information collected from a Web of the Internet in real time in addition to general-purpose information when a keyword cannot be extracted, and a query sentence generation means generating a query sentence transmitted to the user when the keyword cannot be extracted even by the keyword retrieval means, in addition to a character speech content decision means extracting a reply sentence from a conversation DB by the keyword extracted by morpheme analysis of a conversation sentence inputted by the user. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明はインターネットを利用したチャットシステムに関し、特に、コンピュータに会話の相手をさせるための会話プログラム(“人工無能”とも呼ばれている)を利用し、商品の開発、販売、等における消費者の嗜好、ニーズなどの情報の収集、消費者への商品・サービスのプロモーションを、インターネットを利用したチャット(複数の者が書き込みによって行う会話、オンライン・トーク、リアルタイム会議)を介して自然に行うことを可能にするチャットシステムに関する。
【0002】
【従来の技術】
インターネットを利用したチャットシステムにおいて、従来から自動会話システム、いわゆる自動応答のチャットシステムが人工知能の一応用として開発されている。
【0003】
この自動応答のチャットシステムのアルゴリズムとしては、例えば、次のようなものがある。インターネットを介してユーザ端末から取得した会話文を解析し、会話文中に含まれているキーワードを抽出する(図1の例では、キーワードは、word1、word2である)。そして、会話用データベース(DB)中に、当該キーワードに対応させて登録されている応答文を抽出し、これを前記のユーザ端末へ送信するものである。図1の場合、ユーザ端末から取得した会話文にキーワードであるword2が含まれており、会話用DB中にこのword2に対応させて登録されている複数の応答文res4、5、・・・の中から抽出した応答文が前記のユーザ端末に送信されることになる。
【0004】
【特許文献1】
特開2001−60204号公報
【0005】
【発明により解決しようとする課題】
前述した従来の自動応答のチャットシステムにおいては、以下に述べるように種々の問題点があった。例えば、会話用DB中にあらかじめ準備されていない話題に関しては会話不能になるという問題点があった。すなわち、未知の話題に対応できないということである。これは、大量のデータを人手で作成することが困難であり、あらゆる会話パターンを想定してデータを作成することが難しいことに起因している。
【0006】
本発明は、自動応答の会話の自律性、発展性、結束性を向上させることにより、インターネットを利用したチャットがあらかじめ準備されている話題、会話だけでなく、任意の会話に発展でき、更に、チャットの中で、商品の開発、販売、等における消費者の嗜好、ニーズなどの情報の収集、消費者への商品・サービスのプロモーションを行うことができる、しかも、チャットのユーザに違和感なく、自然に行えるようにすることを目的としている。
【0007】
【課題を解決するための手段】
前記課題を解決するため、この発明が提案するインターネットを利用したチャットシステムは、ユーザ端末から取得した発言文章を形態素解析して、発言文章に含まれているあらかじめ定められているキーワードを抽出し、当該抽出したキーワードを利用して、前記あらかじめ定められているキーワードに対応する一乃至複数の応答文が登録されている会話用DBを用いて前記ユーザ端末に送信する応答文を決定するキャラクタ発言内容決定手段と、ユーザ端末から取得した発言文章を形態素解析して前記あらかじめ定められているキーワードを抽出できない場合に、キーワード検索用DBを用いてキーワードを検索するキーワード検索手段と、当該キーワード検索手段でキーワードを抽出できない場合にユーザ端末に送信する質問文を作成する質問文作成手段と、あらかじめ定められているキーワードに基づいてインターネットのWeb上から情報を収集し、収集した情報を前記会話用DB及び/又はキーワード検索用DBに登録する情報収集手段とを備えていることを特徴としている。
【0008】
前記において、キャラクタ発言内容決定手段は、ユーザ端末から取得した会話文を、例えば、シソーラスを用いたフィルタリングによって形態素解析し、会話文中に含まれているキーワードを抽出し、会話用DB中に当該キーワードに対応させて登録されている応答文中から応答文を抽出し、前記のユーザ端末へ送信する応答文として決定するコンピュータの処理動作部である。
【0009】
また、前記において、キーワード検索手段は、ユーザ端末から取得した発言文章を前記のようにして形態素解析したところ前記のあらかじめ定められているキーワードを抽出できない場合、キーワード検索用DBを用いてキーワードを検索するコンピュータの処理動作部である。
【0010】
キーワード検索用DBは、市販の百科事典に収容されている情報、等の汎用DBの他、後述する情報収集手段によってWeb上からリアルタイムで収集されてきた情報が格納されているデータベースである。
【0011】
このキーワード検索手段は、ユーザ端末から取得した発言文章を前記のようにして形態素解析して抽出された品詞(例えば、名詞)を用い、前記のキーワード検索用DBを用いて検索し、当該品詞を含んでいる文章を抽出した後、当該文章を形態素解析して前記のキャラクタ発言内容決定手段による応答文抽出・決定に用いるキーワードを決定するコンピュータの処理動作部である。
【0012】
前記のように、キーワード検索用DBが、市販の百科事典に収容されている情報、等だけでなく、Web上からリアルタイムに収集してきた情報をも含むものであるため、新聞記事、ニュース、時事情報のようなものから、いわゆる口コミ情報、ウワサ話しの類まで含めた種々の情報の中からキーワード検索が行われる。そこで、あらかじめ定められて会話用DBに登録されているキーワードがユーザ端末から取得した発言文章に含まれていなければ会話が続くなくなるといった事態が解消される。
【0013】
また、前記において、質問文作成手段は、前記のキーワード検索手段でキーワードを抽出できない場合に、ユーザ端末に送信する質問文を作成するコンピュータの処理動作部である。
【0014】
ユーザ端末から取得した発言文章を前記のようにして形態素解析したところ前記のあらかじめ定められているキーワードを抽出できない、この上で更に、キーワード検索手段でキーワードを抽出できない場合であっても、この質問文作成手段が作成した質問文をユーザ端末に送信することによって、会話を継続することができる。
【0015】
質問文作成手段で作成する質問文は、例えば、ユーザ端末から取得した発言文章を前記のようにして形態素解析し、当該発言文に含まれている品詞(例えば、名詞)の意味をユーザに尋ねる質問文にすることができる。
【0016】
また、前記において、情報収集手段は、あらかじめ定められているキーワードに基づいてインターネットのWeb上から情報を収集し、収集した情報を前記会話用DB及び/又はキーワード検索用DBに登録するコンピュータの処理動作部である。
【0017】
インターネットのWeb上には、新聞記事、ニュース、時事情報のようなものから、いわゆる口コミ情報、ウワサ話しの類まで含めた種々の情報が存在しているので、これを、収集してきて会話用DB、あるいはキーワード検索用DB、あるいは会話用DBとキーワード検索用DBとの双方に登録しておくことによりユーザとの会話の内容を常に豊富化することができる。
【0018】
例えば、チャットシステムでユーザと会話するものを、疑似人格を持った特定の歌手とした場合、この歌手の名前や愛称をキーワードとして情報収集手段がインターネットのWeb上から情報を収集してくることにより、当該歌手に関してインターネットのWeb上に存在している口コミ情報、ウワサ話しの類まで会話用DB、キーワード検索用DBに格納し、ユーザと会話できるようになる。
【0019】
前述したチャットシステムにおいて、キャラクタ発言内容決定手段は、更に、発言文章に含まれているあらかじめ定められているキーワードを複数抽出した場合、前記会話用DBを用いてユーザ端末に送信する応答文を決定する際に用いるキーワードを、当該複数のキーワードの中から無作為的に選択する処理動作を行うようにできる。
【0020】
このようにすれば、ユーザとの会話中に、同一の複数のキーワード(例えば、word1とword2と)が含まれている文章が複数回あったとしても、そのたびごとに同一のキーワード(例えば、word1)のみが選択されて、応答文が決定されるようになるので、単調な発展性のない会話に終わってしまうことを防止できる。
【0021】
また、前述したいずれのチャットシステムにおいても、キャラクタ発言内容決定手段は、更に、応答文の決定に用いるキーワードに対応する応答文が前記会話用DB中に複数存在する場合、当該複数の応答文の中から、無作為的に抽出した応答文を前記ユーザ端末に送信する応答文として決定する処理動作を行うようにできる。
【0022】
このようにすれば、ユーザとの会話中に、同一のキーワード(例えば、word1)が含まれている文章が複数回あったとしても、そのたびごとに、応答文としてres1がユーザに返されることにならず、word1に対応する応答文として会話用DB中に複数登録されている複数の応答文(例えば、res1、res2、res3)の中から無作為的に選択された応答文が前記ユーザ端末に送信する応答文として決定されるので、単調な発展性のない会話に終わってしまうことを防止できる。
【0023】
また、前述したいずれのチャットシステムにおいても、インターネットのWeb上から取得したチャットのログを利用して、前記あらかじめ定められているキーワードと対応する応答文を抽出し、当該抽出された応答文を前記会話用DBに登録する応答文作成手段を更に備えているようにできる。
【0024】
この応答文作成手段は、例えば、Aの発言に対するBの発言といった異なる発言者の連続した会話をインターネットのWeb上から取得し、Aの発言文章、Bの発言文章それぞれについて形態素解析し、Aの発言文章とBの発言文章とに共通する名詞がキーワードとして登場している場合に、後者のBの発言文章を当該キーワードに対応する応答文として会話用DBに登録する処理動作を行うコンピュータの処理部である。
【0025】
これによって、ユーザ端末から寄せられたユーザの発言に対する応答文の種類、内容が豊富化され、より自然な会話を行えるようになる。
【0026】
更に、前述したいずれのチャットシステムにおいても、ユーザ端末から取得した発言文章、又は、前記情報収集手段で収集した情報、若しくは、前記応答文作成手段で抽出した応答文を形態素解析して前記あらかじめ定められているキーワードを決定するキーワード決定手段を更に備えているようにできる。
【0027】
このキーワード決定手段は、ユーザ端末から取得した発言文章、又は、前記の情報収集手段で収集した情報、若しくは、前記の応答文作成手段で抽出した応答文を形態素解析して、前記のキャラクタ発言内容決定手段でユーザ端末に送信する応答文を決定する際に用いるキーワードを決定するコンピュータの処理動作部である。
【0028】
例えば、前記の発言文章、情報、応答文に登場する回数の多い品詞(例えば、名詞)をキーワードとして決定する処理を行うようにすることができる。
【0029】
このキーワード決定手段は、更に、ユーザ端末から取得した発言文章、又は、前記情報収集手段で収集した情報、若しくは、前記応答文作成手段で抽出した応答文についての形態素解析に基づいてキーワードの順位付を行うようにすることもできる。
【0030】
これによって、例えば、頻出する品詞(例えば、名詞)を新たなキーワードとして登録し、一方、ほとんど登場しなくなったキーワードを、あらかじめ定められているキーワードから削除する等して、常にユーザの興味、関心に答えられる会話を行うようにすることができる。
【0031】
更に、前述したいずれのチャットシステムにおいても、キャラクタ発言内容決定手段は、更に、ユーザ端末から取得した発言文章を形態素解析し、あらかじめ定めてある条件に該当した場合に、あらかじめ定められている話題転換用、又は、ユーザ情報収集用、若しくは、ユーザへの情報提供用にあらかじめ定められている複数の会話文の中から抽出した会話文を前記ユーザ端末に送信する応答文として決定する処理動作を行うようにすることができる。
【0032】
これは、例えば、ユーザが相槌を打つ文章を入力してきた場合や、短い文章を入力してきた場合、等のあらかじめ定めてある条件に該当した場合、あらかじめ定められている会話文をユーザ端末へ送信するようにすることによって、会話を続け、あるいは、本発明のチャットシステムを運営しているシステム運営者が、ユーザへ提供したいと考えている情報、ユーザに質問・アンケートしたいと考えている事項を会話文として挿入できるようにするものである。
【0033】
前述したいずれのチャットシステムにおいても、更に、ユーザ端末から取得した発言文章を各ユーザごとに登録するユーザ情報登録手段を備えている構成にすることができる。このユーザ情報登録手段は、ユーザ端末から取得した発言文章を各ユーザごとに登録するコンピュータの処理動作部である。
【0034】
ユーザ端末から取得した発言文章を各ユーザごとに、例えば、利用者DBのようなデータベースに登録しておくことによって、この発言文を検索することにより、各ユーザに関する情報、例えば、年齢、性別、職業、趣味、嗜好、などを把握できる。
【0035】
そこで、チャットの会話を通じて、いかなる年齢、性別の人、いかなる職業の人、いかなる趣味、嗜好を持っている人は、いなかる要求、ニーズを持っているのかを効率よく把握できたり、また、前述した利用者DBを検索することにより、特定の年齢、性別、職業の人、特定の趣味、嗜好をもっている人を抽出して、このような人を対称にしたチャットの会話を通じて、特定の商品、サービスに関するプロモーション、等の特定の情報を提供すること等が可能になる。
【0036】
以上説明した本発明のチャットシステムにおいては、会話文を形態素解析し、会話文中に含まれているキーワードを抽出する手段として、用語間の関係を用いた連想辞書であるシソーラス(thesaurus=分類語事典、類義語事典、情報検索用の索引)を用いて会話文をフィルタリングして前記あらかじめ定められているキーワード(図1いえば、例えば、word2)を抽出するキーワード抽出手段が備えられている。
【0037】
こうしてシソーラスを用いて、会話文とは異なるキーワードが抽出され、会話を行っているユーザに違和感のない応答文(例えば、ユーザ端末から取得した会話文にキーワードであるword2が含まれている図1の場合、会話用DB中にこのword2に対応させて登録されている複数の応答文res4、5、・・・の中から無作為に抽出した応答文)が抽出されて、会話が続行される。
【0038】
【発明の実施の形態】
以下、添付図面を参照して本発明の好ましい実施形態を説明する。
【0039】
図2は、本発明の基本的な構成を説明するものである。本発明のチャットシステム1はインターネット2に接続され、インターネット2を介して、パーソナルコンピュータ、携帯電話、等のユーザ端末3a、3b、3c、・・・と双方向通信可能に接続されるサーバコンピュータによって実現されている。
【0040】
このサーバコンピュータはユーザインターフェース部4と、データベース制御部5、データベース部6を備えている。
【0041】
データベース制御部5は、後述するキャラクタ発言内容決定手段、キーワード抽出手段、キーワード検索手段、質問文作成手段、情報収集手段、応答文作成手段、キーワード決定手段、ユーザ情報登録手段としての処理動作を行うコンピュータの処理動作部である。
【0042】
データベース部6には、図3図示のように、後述する会話用DB7、キーワード検索用DB8、利用者DB9、キャラクタ定義DB10、シソーラスDB11が備えられている。
【0043】
キャラクタ定義DB10は、本発明のチャットシステムがユーザから入力された会話文との間で会話を行う疑似人格を定義付ける情報が格納されているデータベースである。
【0044】
本発明のチャットシステムは、商品の開発、販売、等における消費者の嗜好、ニーズなどの情報を収集したり、消費者への商品・サービスのプロモーションを行うことに用いると有効なものである。
【0045】
例えば、ユーザから入力された会話文との間で会話を行う疑似人格を、プロモーションを行おうとする歌手、タレントなどとして、ユーザがこの歌手、タレントとチャットで会話する中で、当該ユーザの嗜好、ニーズなどに関する情報を収集し、また、この歌手、タレントのプロモーションに関する情報、例えば、新しく発売するCDに関する情報、今後のコンサート、等の企画の案内などをユーザに伝えることが可能になるものである。
【0046】
そこで、このようなプロモーションを行おうとする商品・サービス、歌手、タレントなどに関する情報、すなわち疑似人格を定義付ける情報を蓄積しておくキャラクタ定義DB10を備え、ユーザから入力された会話文との間で会話を行う疑似人格を歌手Aとするときには、歌手Aに関する年齢、性別、趣味、発表してきた楽曲、今後発表する楽曲、当面の予定、歌手Aに関して新聞、マスコミ、いわゆる口コミ、等で流れている情報など、種々の情報が備えられているキャラクタ定義DB10を利用して、チャットにおける応答文の選択・決定に用いられるキーワードと当該キーワードに対応付けられている応答文が保持されている会話用DB7が、あたかも当該歌手Aがユーザとの間でチャットによる会話を行うもののように構築される。
【0047】
キャラクタ発言内容決定手段は、図4図示のように、ユーザ端末3aから会話文を取得し(ステップ101)、この会話文を形態素解析し(ステップ102)、会話文中に含まれているキーワードを抽出し(ステップ103)、会話用DB7中に当該キーワードに対応させて登録されている応答文中から応答文を抽出し(ステップ104)、前記のユーザ端末3aへ送信する(ステップ105)応答文として決定する処理を行うコンピュータの処理動作部である。
【0048】
このキャラクタ発言内容決定手段が前記のステップ2、ステップ3で行う会話文の形態素解析、会話文中に含まれているキーワードの抽出は、キーワード抽出手段によって行われる。
【0049】
キーワード抽出手段は、用語間の関係を用いた連想辞書であるシソーラス(thesaurus=分類語辞典、類義語辞典、情報検索用の索引)が格納されているシソーラスDB11を用い、シソーラスを用いて会話文をフィルタリングし、あらかじめ定められているキーワード(例えば、図1中におけるword1、word2など)を抽出するコンピュータの処理動作部である。
【0050】
前記キャラクタ発言内容決定手段は、更に、ユーザ端末3aから取得した発言文章中からキーワードを複数抽出した場合、会話用DB7を用いてユーザ端末3aに送信する応答文を決定する際に用いるキーワードを、当該複数のキーワードの中から無作為的に選択する処理動作を行う。
【0051】
これによって、ユーザとの会話中に、同一の複数のキーワード(例えば、word1とword2と)が含まれている文章が複数回登場したとしても、そのたびごとに同一のキーワード(例えば、word1)のみが選択されて応答文が決定されてしまって単調な、発展性のない会話に終わってしまうことなどがなくなる。
【0052】
また、キャラクタ発言内容決定手段は、更に、応答文の決定に用いるキーワードに対応する応答文が会話用DB7中に複数存在する場合、当該複数の応答文の中から、無作為的に抽出した応答文をユーザ端末3aに送信する応答文として決定する処理動作を行う。
【0053】
これによって、ユーザとの会話中に、同一のキーワード(例えば、word1)が含まれている文章が複数回登場したとしても、そのたびごとに、応答文としてres1がユーザに返されることにならず、word1に対応する応答文として会話用DB中に複数登録されている複数の応答文(例えば、res1、res2、res3)の中から無作為的に選択された応答文がユーザ端末3aに送信する応答文として決定され、単調な発展性のない会話に終わってしまうことが防止される。
【0054】
更に、キャラクタ発言内容決定手段は、図5図示のように、ユーザ端末から取得した発言文章を形態素解析し(ステップ201)、あらかじめ定めてある条件に該当した場合(ステップ202)に、話題転換用、又は、ユーザ情報収集用、若しくは、ユーザへの情報提供用に、あらかじめ定められている複数の会話文の中から抽出した会話文を前記ユーザ端末に送信する(ステップ203)応答文として決定する処理動作を行う。
【0055】
前記の「あらかじめ定めてある条件」とは、例えば、ユーザが相槌を打つ文章を入力してきた場合や、短い文章を入力してきた場合、等のことをいい、ユーザが現在の会話内容に飽きてきたことが窺われる状態にあることをいう。
【0056】
このような場合に、あらかじめ準備している話題転換用の会話文や、プロモーション用の会話文、ユーザ情報獲得用の会話文を、ユーザ端末3aへ送信するようにすることによって、飽きさせずに会話を続ける、あるいは、本発明のチャットシステムを運営しているシステム運営者が、ユーザへ提供したいと考えている情報(今後発売するCDに関する情報、今後行われるコンサート、等の企画に関する情報など)や、ユーザに質問・アンケートしたいと考えている事項(近頃発売されたCDに対する感想、近頃行われたコンサートに関する感想、等)を会話文として挿入できるようにするものである。
【0057】
キーワード検索手段は、図6図示のように、ユーザ端末3aから発言文章を取得し(ステップ301)、これを、例えば、シソーラスを用いてフィルタリングする等して形態素解析したところ(ステップ302)、あらかじめ定められていて会話用DB7に保持されているキーワードを抽出できない場合(ステップ303)、このキーワード検索手段によりキーワード検索用DB8を用いてキーワードを検索する(ステップ304)コンピュータの処理動作部である。こうしてキーワードが抽出されたならば(ステップ305)、このキーワードを利用し、キャラクタ発言内容決定手段により、会話用DB7中に当該キーワードに対応させて登録されている応答文中から応答文を抽出し(ステップ306)、前記のユーザ端末3aへ送信する(ステップ307)応答文として決定する処理動作が行われる。
【0058】
キーワード検索用DB8は、市販の百科事典に収容されている情報、等の汎用DBの他、後述する情報収集手段によってWeb上からリアルタイムで収集されてきた情報が格納されているデータベースである。
【0059】
このキーワード検索手段は、図7図示のように、ユーザ端末から取得した発言文章を前記のようにして形態素解析し(ステップ401)、品詞(例えば、名詞)を抽出し(ステップ402)、この抽出された品詞を用いキーワード検索用DB8を用いて検索し(ステップ403)、当該品詞を含んでいる文章を抽出し(ステップ404)、当該文章を形態素解析し(ステップ405)、こうして前記のキャラクタ発言内容決定手段による応答文抽出・決定に用いるキーワードを抽出・決定する(ステップ406)コンピュータの処理動作部である。
【0060】
本発明のチャットシステムでは、前記のように、キーワード検索用DB8が、市販の百科事典に収容されている情報、等だけでなく、Web上からリアルタイムに収集してきた情報をも含むものであるため、新聞記事、ニュース、時事情報のようなものから、いわゆる口コミ情報、ウワサ話しの類まで含めた種々の情報の中からキーワード検索が行われる。そこで、あらかじめ定められていて会話用DB7に登録されているキーワードがユーザ端末3a、等から取得した発言文章に含まれていなければ会話が続くなくなるといった事態が解消される。
【0061】
質問文作成手段は、前記のキーワード検索手段でキーワードを抽出できない場合に、ユーザ端末3a、等に送信する質問文を作成するコンピュータの処理動作部である。
【0062】
図8図示のように、ユーザ端末3a、等から発言文章を取得し(ステップ501)、これを前記のようにして形態素解析したところ(ステップ502)、あらかじめ定められていて会話用DB7に保持されているキーワードを抽出できない場合(ステップ503)、前記のように、キーワード検索手段でキーワード検索が行われるが(ステップ504)、これでもキーワードを抽出できない場合(ステップ505)、この質問文作成手段が質問文を作成し(ステップ506)、ユーザ端末に送信する(ステップ507)。
【0063】
質問文作成手段で作成する質問文は、例えば、ユーザ端末3a、等から取得した発言文章を形態素解析し、当該発言文に含まれている品詞(例えば、名詞)の意味をユーザに尋ねる質問文にすることができる。例えば、「○○○」という品詞が含まれていて、この意味が分からない場合に、「○○○って何?」と質問するのである。
【0064】
質問文作成手段によるかかる処理動作によって、会話を違和感なく継続することができる。
【0065】
情報収集手段は、あらかじめ定められていて会話用DB7に保持されているキーワードに基づいてインターネットのWeb上から情報を収集し、収集した情報を会話用DB7又はキーワード検索用DB8、若しくは、会話用DB7とキーワード検索用DB8との双方に登録するコンピュータの処理動作部である。
【0066】
インターネットのWeb上には、新聞記事、ニュース、時事情報のようなものから、いわゆる口コミ情報、ウワサ話しの類まで含めた種々の情報が存在しているので、これらを収集してきて会話用DB7、あるいはキーワード検索用DB8、あるいは会話用DB7とキーワード検索用DB8との双方に登録しておくことによりユーザとの会話の内容を常に豊富化することができる。
【0067】
更に、チャットでユーザと会話しているタレント、歌手、等のキャラクタに関するキーワードで検索されてきた情報については、キャラクタ定義DB10にも登録しておくようにすることができる。
【0068】
そこで、例えば、本発明のチャットシステムでユーザと会話するものを、疑似人格を持った特定の歌手とした場合、この歌手の名前や愛称をキーワードとして情報収集手段がインターネットのWeb上から情報を収集してくることにより、当該歌手に関してインターネットのWeb上に存在している口コミ情報、ウワサ話しの類まで会話用DB7、キーワード検索用DB8、キャラクタ定義DB10に格納してユーザとの会話に利用できるようになる。
【0069】
応答文作成手段は、インターネットのWeb上から取得したチャットのログを利用して、あらかじめ定められていて会話用DB7に保持されているキーワードと対応する応答文を抽出し、当該抽出された応答文を会話用DB7に登録するコンピュータの処理動作部である。
【0070】
この応答文作成手段は、例えば、図9図示のように、Aの発言に対するBの発言といった異なる発言者の連続した会話をインターネットのWeb上から取得し(ステップ601)、Aの発言文章、Bの発言文章それぞれについて形態素解析し(ステップ602)、Aの発言文章とBの発言文章とに共通する名詞がキーワードとして登場している場合(ステップ603)、後者のBの発言文章を当該キーワードに対応する応答文として会話用DBに登録する(ステップ604)処理動作を行うものである。
【0071】
これによって、ユーザ端末3a、等から寄せられたユーザの発言に対する応答文の種類、内容が豊富化され、より自然な会話を行えるようになる。
【0072】
なお、この応答文作成手段は、更に、前記のようにして登録する応答文を形態素解析し、内輪の人名が登場している文章や、明らかにつじつまの合わない文章を削除する処理動作をも行うものとすることができる。
【0073】
キーワード決定手段は、ユーザ端末3a、等から取得した発言文章、又は、前記の情報収集手段で収集した情報、若しくは、前記の応答文作成手段で抽出した応答文などの文章を形態素解析し、あらかじめ定められていて会話用DB7に保持されているキーワードを決定するコンピュータの処理動作部である。
【0074】
このキーワード決定手段は、例えば、ユーザ端末から取得した発言文章、又は、前記の情報収集手段で収集した情報、若しくは、前記の応答文作成手段で抽出した応答文、等の文章を、図10図示のように、形態素解析し(ステップ701)、前記の発言文章、情報、応答文に登場する品詞(例えば、名詞)の登場回数を確認し(ステップ702)、登場回数の多い品詞をキーワードに決定し(ステップ703)、決定したキーワードを会話用DB7に登録して(ステップ704)前記のキャラクタ発言内容決定手段でユーザ端末に送信する応答文を決定する際に用いるキーワードとし、一方、登場回数の少ないキーワードを会話用DB7から削除する(ステップ705)処理動作を行うものである。
【0075】
このように、キーワード決定手段が、ユーザ端末3a、等から取得した発言文章、又は、前記情報収集手段で収集した情報、若しくは、前記応答文作成手段で抽出した応答文についての形態素解析に基づいてキーワードの順位付を行うことにより、例えば、頻出する品詞を新たなキーワードとして登録し、一方、ほとんど登場しなくなったキーワードを、あらかじめ定められているキーワードから削除する等して、常にユーザの興味、関心に答えられる会話を行うチャットシステムを構築することができる。
【0076】
ユーザ情報登録手段は、図11図示のように、ユーザ端末3a、等から発言文章を取得し(ステップ801)、これを形態素解析し(ステップ802)、発言文章を各ユーザごとに利用者DB9に登録する(ステップ802)コンピュータの処理動作部である。
【0077】
ユーザ端末3a、等から取得した発言文章を各ユーザごとに、利用者DB9に登録しておき、この発言文を検索することにより、各ユーザに関する情報、例えば、年齢、性別、職業、趣味、嗜好、などを把握できる。
【0078】
そこで、チャットの会話を通じて、いかなる年齢、性別の人、いかなる職業の人、いかなる趣味、嗜好を持っている人は、いなかる要求、ニーズを持っているのかを効率よく把握できたり、また、特定の年齢、性別、職業の人、特定の趣味、嗜好をもっている人に特定の情報を提供すること等が可能になる。
【0079】
例えば、特定のジャンルの映画に興味を持っているユーザを利用者DB9を用いて検索し、この検索で確認できたユーザとのチャットによる会話の中に、当該ジャンルの新作映画に関する話題を盛り込む、等々のプロモーション活動に利用することが可能になる。
【0080】
以上説明したキャラクタ発言内容決定手段、キーワード検索手段、質問文作成手段、情報収集手段、応答文作成手段、キーワード決定手段、ユーザ情報登録手段は、前述した各処理動作をコンピュータに行わせるコンピュータプログラムの指示による処理がコンピュータで実行されることにより、それぞれ、行われるものである。
【0081】
【発明の効果】
本発明によれば、インターネットを利用したチャットがあらかじめ準備されている話題、会話だけでなく、任意の会話に発展でき、更に、チャットの中で、商品の開発、販売、等における消費者の嗜好、ニーズなどの情報の収集、消費者への商品・サービスのプロモーションを行うことができ、しかも、これをチャットのユーザに違和感なく、自然に行うことができる。
【図面の簡単な説明】
【図1】自動応答のチャットシステムのアルゴリズムを説明する図。
【図2】本発明のチャットシステムの基本的な構成を説明する図。
【図3】本発明のチャットシステムにおけるデータベース部の構成を説明する図。
【図4】キャラクタ発言内容決定手段の処理動作を説明するフロー図。
【図5】キャラクタ発言内容決定手段における他の処理動作を説明するフロー図。
【図6】キーワード検索手段での処理が行われて応答文が決定される場合を説明するフロー図。
【図7】キーワード検索手段の処理動作を説明するフロー図。
【図8】質問文作成手段での処理が行われて質問文が作成される場合を説明するフロー図。
【図9】応答文作成手段の処理動作を説明するフロー図。
【図10】キーワード決定手段の処理動作を説明するフロー図。
【図11】ユーザ情報登録手段の処理動作を説明するフロー図。
【符号の説明】
1 チャットシステム
2 インターネット
3a、3b、3c ユーザ端末
4 インターフェース部
5 データベース制御部
6 データベース部
7 会話用データベース
8 キーワード検索用データベース
9 利用者データベース
10 キャラクタ定義データベース
11 シソーラスデータベース
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a chat system using the Internet, and more particularly to a conversation program (also referred to as "artificial incompetence") for causing a computer to engage in a conversation with a consumer to develop or sell a product. Gathering information such as preferences and needs, and promoting products and services to consumers naturally through chats using the Internet (conversations written by multiple people, online talks, real-time meetings) Regarding the chat system that enables.
[0002]
[Prior art]
2. Description of the Related Art In a chat system using the Internet, an automatic conversation system, a so-called automatic response chat system, has been conventionally developed as one application of artificial intelligence.
[0003]
As an algorithm of the automatic response chat system, for example, the following is available. The conversation sentence obtained from the user terminal via the Internet is analyzed, and the keywords included in the conversation are extracted (in the example of FIG. 1, the keywords are word1 and word2). Then, a response sentence registered in the conversation database (DB) corresponding to the keyword is extracted and transmitted to the user terminal. In the case of FIG. 1, the conversation sentence acquired from the user terminal includes word2, which is a keyword, and a plurality of response sentences res4, 5, ..., registered in the conversation DB in correspondence with the word2. The response sentence extracted from the inside is transmitted to the user terminal.
[0004]
[Patent Document 1]
JP 2001-60204 A
[0005]
Problems to be solved by the present invention
The above-described conventional automatic response chat system has various problems as described below. For example, there has been a problem that conversations cannot be made on topics that are not prepared in advance in the conversation DB. That is, it is impossible to deal with unknown topics. This is because it is difficult to create a large amount of data manually, and it is difficult to create data assuming various conversation patterns.
[0006]
The present invention improves the autonomy, development, and cohesion of the conversation of the automatic response, so that the chat using the Internet can be developed not only into topics and conversations prepared in advance, but also into arbitrary conversations. In the chat, it is possible to collect information such as consumer preferences and needs in product development, sales, etc., and to promote products and services to consumers. The purpose is to be able to do.
[0007]
[Means for Solving the Problems]
In order to solve the above problem, a chat system using the Internet proposed by the present invention performs a morphological analysis of a sentence sentence acquired from a user terminal, and extracts a predetermined keyword included in the sentence sentence, Character utterance contents for determining a response sentence to be transmitted to the user terminal using a conversation DB in which one or more response sentences corresponding to the predetermined keyword are registered using the extracted keyword. Determining means, morphological analysis of the sentence sentence obtained from the user terminal to extract the predetermined keyword, and a keyword search means for searching a keyword using a keyword search DB; Create a question sent to the user terminal when a keyword cannot be extracted And a data collecting means for collecting information from the Internet Web based on predetermined keywords and registering the collected information in the conversation DB and / or the keyword search DB. It is characterized by having.
[0008]
In the above, the character utterance content determining means performs a morphological analysis of the conversation sentence acquired from the user terminal by, for example, filtering using a thesaurus, extracts a keyword included in the conversation sentence, and stores the keyword in the conversation DB. A processing operation unit of a computer that extracts a response sentence from a response sentence registered corresponding to the above and determines the response sentence to be transmitted to the user terminal.
[0009]
Further, in the above, the keyword search means searches the keyword using the keyword search DB when the utterance sentence obtained from the user terminal is morphologically analyzed as described above and the predetermined keyword cannot be extracted. It is a processing operation unit of a computer that performs processing.
[0010]
The keyword search DB is a database in which information collected in real time from the Web by information collection means described later is stored in addition to a general-purpose DB such as information contained in a commercially available encyclopedia.
[0011]
The keyword search means uses the part of speech (for example, a noun) extracted by morphological analysis of the sentence sentence obtained from the user terminal as described above, and searches using the keyword search DB, and searches the part of speech. A processing operation unit of a computer for extracting a contained sentence, morphologically analyzing the sentence, and determining a keyword to be used for extracting and determining a response sentence by the character utterance content determining means.
[0012]
As described above, since the keyword search DB includes not only information contained in a commercial encyclopedia, etc., but also information collected in real time from the Web, newspaper articles, news, current affairs information, etc. From such information, a keyword search is performed from various types of information including so-called word-of-mouth information and rumors. Therefore, the situation in which the conversation does not continue unless a keyword that is predetermined and registered in the conversation DB is included in the statement sentence acquired from the user terminal is solved.
[0013]
Further, in the above, the question sentence creating means is a processing operation unit of a computer for creating a question sentence to be transmitted to the user terminal when a keyword cannot be extracted by the keyword search means.
[0014]
When the utterance sentence obtained from the user terminal is subjected to the morphological analysis as described above, the predetermined keyword cannot be extracted. By transmitting the question sentence created by the sentence creating means to the user terminal, the conversation can be continued.
[0015]
The question sentence created by the question sentence creating means is, for example, a morphological analysis of the sentence sentence acquired from the user terminal as described above, and asks the user about the meaning of the part of speech (for example, a noun) included in the sentence sentence. Can be a question sentence.
[0016]
Further, in the above, the information collecting means collects information from a Web on the Internet based on a predetermined keyword, and a computer process for registering the collected information in the conversation DB and / or the keyword search DB. It is an operation unit.
[0017]
There are various kinds of information on the Web of the Internet, such as newspaper articles, news, current affairs information, so-called word-of-mouth information, and rumor stories. Alternatively, by registering in the keyword search DB or in both the conversation DB and the keyword search DB, the content of the conversation with the user can always be enriched.
[0018]
For example, if the person who talks with the user in the chat system is a specific singer with a pseudo-personality, the information collecting means collects information from the Internet Web using the singer's name or nickname as a keyword. In addition, word-of-mouth information and rumors of the singer on the Internet can be stored in the conversation DB and the keyword search DB, so that the singer can talk with the user.
[0019]
In the chat system described above, the character utterance content determining means further determines a response sentence to be transmitted to the user terminal using the conversation DB when a plurality of predetermined keywords included in the utterance sentence are extracted. It is possible to perform a processing operation of randomly selecting a keyword to be used at the time from the plurality of keywords.
[0020]
In this way, even if a sentence including the same plurality of keywords (for example, word1 and word2) occurs more than once during a conversation with the user, the same keyword (for example, Since only the word 1) is selected and the response sentence is determined, it is possible to prevent a conversation that is monotonous and has no development.
[0021]
Further, in any of the chat systems described above, the character utterance content determining means further includes, when a plurality of response sentences corresponding to the keyword used for determining the response sentence exist in the conversation DB, the plurality of response sentences. A processing operation for determining a response sentence randomly extracted from the response sentence to be transmitted to the user terminal can be performed.
[0022]
With this configuration, even if a sentence including the same keyword (for example, word1) is included a plurality of times during a conversation with the user, res1 is returned to the user as a response sentence each time. And a response sentence randomly selected from a plurality of response sentences (for example, res1, res2, res3) registered in the conversation DB as a response sentence corresponding to word1. Is determined as a response sentence, and it is possible to prevent the conversation from being a monotonous and non-developing conversation.
[0023]
Further, in any of the above-described chat systems, a response sentence corresponding to the predetermined keyword is extracted by using a chat log acquired from the Internet web, and the extracted response sentence is extracted by the aforementioned A response sentence creating means to be registered in the conversation DB may be further provided.
[0024]
The response sentence creating means acquires, for example, continuous conversations of different speakers such as A's utterance from B's utterance on the Internet, performs morphological analysis on each of the A's utterance sentence and the B's utterance sentence. When a noun common to a comment sentence and a comment sentence of B appears as a keyword, a computer process that performs a processing operation of registering the latter sentence of B in a conversation DB as a response sentence corresponding to the keyword Department.
[0025]
As a result, the types and contents of the response sentence to the user's statement sent from the user terminal are enriched, and a more natural conversation can be performed.
[0026]
Further, in any of the above-mentioned chat systems, the utterance sentence obtained from the user terminal, the information collected by the information collecting means, or the response sentence extracted by the response sentence creating means is subjected to morphological analysis and the predetermined Keyword determining means for determining a keyword that has been set.
[0027]
The keyword deciding means morphologically analyzes the comment sentence obtained from the user terminal, or the information collected by the information collecting means, or the response sentence extracted by the response sentence creating means, and performs the character comment content. It is a processing operation unit of a computer that determines a keyword used when determining a response sentence to be transmitted to the user terminal by the determining unit.
[0028]
For example, it is possible to perform a process of determining a part of speech (for example, a noun) having a large number of appearances in the statement, information, and response sentence as a keyword.
[0029]
The keyword determining means further ranks the keywords based on morphological analysis of the statement sentence obtained from the user terminal, the information collected by the information collecting means, or the response sentence extracted by the response sentence creating means. Can be performed.
[0030]
Thereby, for example, frequently occurring parts of speech (for example, nouns) are registered as new keywords, while keywords that have hardly appeared are deleted from predetermined keywords, and the user's interests and interests are always kept constant. The conversation can be answered.
[0031]
Further, in any of the chat systems described above, the character comment content determination means further performs a morphological analysis on the comment text acquired from the user terminal, and when a predetermined condition is satisfied, a predetermined topic conversion. Or a process of determining a conversation sentence extracted from a plurality of conversation sentences determined in advance for user information collection or for providing information to the user as a response sentence to be transmitted to the user terminal. You can do so.
[0032]
This is, for example, when a user enters a sentence that strikes, or when a short sentence is input, or when a predetermined condition such as is satisfied, a predetermined conversation sentence is transmitted to the user terminal. By continuing the conversation, or the system operator who operates the chat system of the present invention, the information that the user wants to provide, the items that the user wants to ask questions and questionnaire It is intended to be inserted as a conversation sentence.
[0033]
Any of the chat systems described above can be configured to further include a user information registration unit that registers a statement sentence acquired from a user terminal for each user. The user information registration means is a processing operation unit of a computer for registering a statement sentence acquired from a user terminal for each user.
[0034]
By registering the statement sentence obtained from the user terminal for each user in, for example, a database such as a user DB, by searching for this statement, information on each user, such as age, gender, Understand occupations, hobbies, preferences, etc.
[0035]
Therefore, through chat conversations, people of any age and gender, people of any occupation, people with any hobbies and preferences, can efficiently grasp whether they have any requests or needs. By searching the user DB, specific persons, persons of specific age, gender, occupation, specific hobbies, and preferences are extracted, and a specific product, It is possible to provide specific information such as a promotion related to the service.
[0036]
In the chat system of the present invention described above, as a means for morphologically analyzing a conversation sentence and extracting a keyword included in the conversation sentence, a thesaurus (thesaurus = classified term dictionary) which is an associative dictionary using the relation between terms is used. , A keyword extraction means for extracting the predetermined keyword (for example, word2 in FIG. 1) by filtering the conversation sentence using a synonym dictionary and an index for information search.
[0037]
In this way, a keyword different from the conversation sentence is extracted using the thesaurus, and a response sentence that does not make the conversation user feel uncomfortable (for example, the conversation sentence obtained from the user terminal includes the keyword word2 in FIG. 1) In the case of, the response sentences (response sentences randomly extracted from the plurality of response sentences res4, 5,... Registered in correspondence with this word2) in the conversation DB are extracted, and the conversation is continued. .
[0038]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings.
[0039]
FIG. 2 illustrates the basic configuration of the present invention. The chat system 1 of the present invention is connected to the Internet 2 by a server computer connected to the user terminals 3a, 3b, 3c,... Has been realized.
[0040]
The server computer includes a user interface unit 4, a database control unit 5, and a database unit 6.
[0041]
The database control unit 5 performs processing operations as character utterance content determination means, keyword extraction means, keyword search means, question text creation means, information collection means, response sentence creation means, keyword determination means, and user information registration means, which will be described later. This is a processing operation unit of the computer.
[0042]
As shown in FIG. 3, the database unit 6 includes a conversation DB 7, a keyword search DB 8, a user DB 9, a character definition DB 10, and a thesaurus DB 11, which will be described later.
[0043]
The character definition DB 10 is a database that stores information that defines a pseudo-personality that the chat system of the present invention has a conversation with a conversation sentence input by a user.
[0044]
INDUSTRIAL APPLICABILITY The chat system of the present invention is effective when used to collect information such as consumer preferences and needs in product development and sales, and to promote products and services to consumers.
[0045]
For example, as a singer who tries to promote a pseudo personality that talks with a conversation sentence input by the user, as a talent, etc., while the user talks with this singer and talent in a chat, It is possible to collect information on needs and the like, and to inform the user of information on promotion of the singer and the talent, for example, information on newly released CDs, information on plans for future concerts, and the like. .
[0046]
Therefore, a character definition DB 10 is provided for storing information on products / services, singers, talents, and the like who intend to perform such a promotion, that is, information defining a pseudo-personality, and has a conversation with a conversation sentence input by a user. When the simulated personality performing singer A is singer A, the age, gender, hobbies, songs announced, songs to be announced in the future, singer A's current schedule, information on singer A in newspapers, media, so-called word-of-mouth, etc. By using the character definition DB 10 provided with various information such as, for example, a conversation DB 7 in which a keyword used for selecting and determining a response sentence in a chat and a response sentence associated with the keyword is stored. , As if the singer A had a chat conversation with the user.
[0047]
As shown in FIG. 4, the character utterance content determining means obtains a conversation sentence from the user terminal 3a (step 101), performs a morphological analysis of the conversation sentence (step 102), and extracts a keyword included in the conversation sentence. Then, the response sentence is extracted from the response sentences registered in the conversation DB 7 corresponding to the keyword (step 104), and transmitted to the user terminal 3a (step 105). Is a processing operation unit of the computer that performs the processing to be performed.
[0048]
The morphological analysis of the conversation sentence and the extraction of the keywords included in the conversation sentence performed by the character utterance content determination means in the above steps 2 and 3 are performed by the keyword extraction means.
[0049]
The keyword extracting means uses a thesaurus DB11 in which a thesaurus (thesaurus = category dictionary, synonym dictionary, index for information retrieval) which is an associative dictionary using the relation between terms is stored, and converts conversational sentences using the thesaurus. This is a processing operation unit of a computer that filters and extracts a predetermined keyword (for example, word1, word2 in FIG. 1).
[0050]
The character utterance content determining means further includes, when a plurality of keywords are extracted from the utterance sentences obtained from the user terminal 3a, using the conversation DB 7 to determine a response sentence to be transmitted to the user terminal 3a, A processing operation of randomly selecting from the plurality of keywords is performed.
[0051]
Thereby, even if a sentence containing the same plural keywords (for example, word1 and word2) appears multiple times during the conversation with the user, only the same keyword (for example, word1) is displayed each time. Is not selected and the response sentence is determined, resulting in a monotonous, non-developable conversation.
[0052]
Further, when there are a plurality of response sentences corresponding to the keyword used for determining the response sentence in the conversation DB 7, the character utterance content determination means further includes a response extracted randomly from the plurality of response sentences. A processing operation for determining a sentence as a response sentence to be transmitted to the user terminal 3a is performed.
[0053]
Thus, even if a sentence including the same keyword (for example, word1) appears more than once during a conversation with the user, res1 is not returned to the user as a response sentence each time. , A response sentence randomly selected from a plurality of response sentences (for example, res1, res2, res3) registered in the conversation DB as a response sentence corresponding to word1 is transmitted to the user terminal 3a. It is determined as a response sentence, and it is prevented that the conversation ends in a monotonous and non-developing conversation.
[0054]
Further, as shown in FIG. 5, the character utterance content determining means performs morphological analysis on the utterance sentence obtained from the user terminal (step 201), and when a predetermined condition is satisfied (step 202), a topic conversion Alternatively, a conversation sentence extracted from a plurality of predetermined conversation sentences is transmitted to the user terminal for collecting user information or providing information to the user (step 203), and is determined as a response sentence. Perform processing operations.
[0055]
The above-mentioned "predetermined conditions" refer to, for example, a case where the user has input a sentence that hits each other or a case where the user has input a short sentence, and the user is tired of the current conversation content. It is in a state where it is suggested that
[0056]
In such a case, a conversation sentence for topic conversion, a conversation sentence for promotion, and a conversation sentence for acquiring user information, which are prepared in advance, are transmitted to the user terminal 3a so as not to get bored. Information that the system operator who continues the conversation or that operates the chat system of the present invention wants to provide to the user (information on CDs to be released in the future, information on plans for concerts to be held in the future, etc.) In addition, it is possible to insert, as a conversation sentence, items that the user wants to ask questions / surveys (impressions on a recently released CD, impressions on a recently performed concert, etc.).
[0057]
As shown in FIG. 6, the keyword search means acquires a sentence sentence from the user terminal 3a (step 301), and performs a morphological analysis on the sentence sentence by filtering using, for example, a thesaurus (step 302). If a keyword that is defined and cannot be extracted from the conversation DB 7 can be extracted (step 303), the keyword is searched using the keyword search DB 8 by the keyword search means (step 304). When the keyword is extracted in this manner (step 305), the response sentence is extracted from the response sentences registered in the conversation DB 7 corresponding to the keyword by the character utterance content determining means using the keyword (step 305). (Step 306), a processing operation of determining the response sentence to be transmitted to the user terminal 3a (Step 307) is performed.
[0058]
The keyword search DB 8 is a database that stores information collected in real time from the Web by information collecting means described later, in addition to a general-purpose DB such as information contained in a commercially available encyclopedia.
[0059]
As shown in FIG. 7, the keyword search means morphologically analyzes the sentence sentence obtained from the user terminal as described above (step 401), extracts a part of speech (for example, a noun) (step 402), and Using the part-of-speech obtained, a search is performed using the keyword search DB 8 (step 403), a sentence containing the part-of-speech is extracted (step 404), and the sentence is morphologically analyzed (step 405). The processing operation unit of the computer extracts and determines a keyword used for extracting and determining a response sentence by the content determining means (step 406).
[0060]
In the chat system of the present invention, as described above, the keyword search DB 8 includes not only information contained in a commercially available encyclopedia, but also information collected in real time from the Web. A keyword search is performed from a variety of information including articles, news, current affairs information, so-called word-of-mouth information, and rumors. Therefore, the situation in which the conversation does not continue unless a keyword that is predetermined and registered in the conversation DB 7 is included in the statement sentence acquired from the user terminal 3a or the like is solved.
[0061]
The question sentence creating unit is a processing operation unit of a computer that creates a question sentence to be transmitted to the user terminal 3a or the like when a keyword cannot be extracted by the keyword search unit.
[0062]
As shown in FIG. 8, a sentence sentence is acquired from the user terminal 3a or the like (step 501) and morphologically analyzed as described above (step 502). The sentence sentence is determined and stored in the conversation DB 7 in advance. If the keyword cannot be extracted (step 503), as described above, the keyword search is performed by the keyword search means (step 504). If the keyword cannot be extracted (step 505), the question sentence creation means A question is created (step 506) and transmitted to the user terminal (step 507).
[0063]
The question sentence created by the question sentence creating means is, for example, a question sentence obtained by morphologically analyzing a sentence acquired from the user terminal 3a or the like and asking the user about the meaning of the part of speech (eg, a noun) included in the sentence. Can be For example, if the part of speech "OO" is included and its meaning is not understood, a question "What is OOO?" Is asked.
[0064]
The conversation can be continued without discomfort by such a processing operation by the question sentence creating means.
[0065]
The information collecting means collects information from a Web on the Internet based on a keyword which is determined in advance and held in the conversation DB 7, and stores the collected information in the conversation DB 7, the keyword search DB 8, or the conversation DB 7. It is a processing operation unit of a computer that is registered in both the DB and the keyword search DB 8.
[0066]
There are various kinds of information on the Web of the Internet, such as newspaper articles, news, current affairs information, so-called word-of-mouth information, and rumor-like stories. Alternatively, the content of the conversation with the user can be always enriched by registering in the keyword search DB 8 or in both the conversation DB 7 and the keyword search DB 8.
[0067]
Further, information searched for by keywords relating to characters such as talents, singers, and the like who are talking with the user in a chat can be registered in the character definition DB 10.
[0068]
Therefore, for example, if the person who talks with the user in the chat system of the present invention is a specific singer having a pseudo personality, the information collecting means collects information from the Internet Web using the singer's name or nickname as a keyword. By doing so, word-of-mouth information and rumors of the singer that exist on the Internet can be stored in the conversation DB 7, the keyword search DB 8, and the character definition DB 10 and used for conversation with the user. become.
[0069]
The response sentence creating means extracts a response sentence corresponding to a keyword which is predetermined and is held in the conversation DB 7 by using a chat log acquired from the Internet Web, and the extracted response sentence Is a processing operation unit of a computer for registering in the conversation DB 7.
[0070]
As shown in FIG. 9, the response sentence creating means acquires a continuous conversation of different speakers such as A's utterance from B on the Internet (step 601), and outputs the A's utterance sentence, B's Is morphologically analyzed (step 602), and if a noun common to the statement sentence A and the statement sentence B appears as a keyword (step 603), the latter statement sentence B is used as the keyword. The processing operation is registered in the conversation DB as a corresponding response sentence (step 604).
[0071]
As a result, the type and content of the response sentence to the user's statement sent from the user terminal 3a or the like are enriched, and a more natural conversation can be performed.
[0072]
The response sentence creating means further performs a morphological analysis of the response sentence to be registered as described above, and performs a processing operation of deleting a sentence in which the name of the inner ring appears or a sentence that is clearly inconsistent. You can do it.
[0073]
The keyword determining means morphologically analyzes a sentence obtained from the user terminal 3a or the like, or information collected by the information collecting means, or a response sentence extracted by the response sentence creating means. This is a processing operation unit of a computer that determines a keyword that is determined and stored in the conversation DB 7.
[0074]
This keyword determining means, for example, a sentence obtained from a user terminal, information collected by the information collecting means, or a response sentence extracted by the response sentence creating means, is shown in FIG. , The morphological analysis is performed (step 701), the number of appearances of the parts of speech (for example, nouns) appearing in the above-mentioned statement, information, and response sentence is confirmed (step 702). (Step 703), the determined keyword is registered in the conversation DB 7 (Step 704), and is used as a keyword when the response sentence to be transmitted to the user terminal is determined by the character utterance content determining means. The processing operation for deleting a small number of keywords from the conversation DB 7 (step 705) is performed.
[0075]
As described above, the keyword determination unit is configured to perform the utterance sentence acquisition from the user terminal 3a, the information collected by the information collection unit, or the morphological analysis of the response sentence extracted by the response sentence creation unit. By ranking keywords, for example, frequently occurring parts of speech are registered as new keywords, while keywords that rarely appear are deleted from predetermined keywords, and the user's interests are always kept constant. It is possible to build a chat system that has a conversation that can respond to interests.
[0076]
As shown in FIG. 11, the user information registration means obtains a sentence sentence from the user terminal 3a or the like (step 801), performs morphological analysis of the sentence sentence (step 802), and stores the sentence sentence in the user DB 9 for each user. This is the processing operation unit of the computer to register (step 802).
[0077]
The sentence sentences obtained from the user terminal 3a and the like are registered in the user DB 9 for each user, and information on each user, such as age, gender, occupation, hobby, and taste, is obtained by searching for the sentence sentence. , Etc. can be grasped.
[0078]
Therefore, through chat conversations, people of any age and gender, people of any profession, people of any hobbies, preferences, etc. can efficiently grasp or identify any requests or needs. It is possible to provide specific information to a person having a specific age, sex, occupation, or a particular hobby or preference.
[0079]
For example, a user who is interested in a movie of a specific genre is searched using the user DB 9, and a topic related to a new movie of the genre is included in a chat conversation with the user confirmed by the search. It can be used for various promotional activities.
[0080]
The character utterance content determining means, keyword searching means, question sentence creating means, information collecting means, response sentence creating means, keyword determining means, and user information registering means described above are computer programs for causing the computer to perform the above-described processing operations. The processing according to the instruction is performed by the computer, respectively.
[0081]
【The invention's effect】
According to the present invention, chats using the Internet can be developed not only into topics and conversations prepared in advance, but also into arbitrary conversations. Further, in the chats, consumer preferences in product development, sales, etc. In addition, it is possible to collect information such as needs and promote products and services to consumers, and to naturally perform this without any discomfort for the chat user.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating an algorithm of an automatic response chat system.
FIG. 2 is a diagram illustrating a basic configuration of a chat system according to the present invention.
FIG. 3 is a diagram illustrating a configuration of a database unit in the chat system of the present invention.
FIG. 4 is a flowchart illustrating a processing operation of a character utterance content determining unit.
FIG. 5 is a flowchart for explaining another processing operation in the character utterance content determining means.
FIG. 6 is a flowchart illustrating a case where a response sentence is determined by performing processing in a keyword search unit.
FIG. 7 is a flowchart illustrating a processing operation of a keyword search unit.
FIG. 8 is a flowchart illustrating a case where a question sentence is created by a process performed by a question sentence creating unit.
FIG. 9 is a flowchart illustrating a processing operation of a response sentence creating unit.
FIG. 10 is a flowchart illustrating a processing operation of a keyword determining unit.
FIG. 11 is a flowchart illustrating a processing operation of a user information registration unit.
[Explanation of symbols]
1 chat system
2 Internet
3a, 3b, 3c User terminal
4 Interface section
5 Database control unit
6 database section
7 Conversation database
8 Keyword search database
9 user database
10 Character definition database
11 Thesaurus database

Claims (9)

インターネットを利用したチャットシステムであって、
ユーザ端末から取得した発言文章を形態素解析して、発言文章に含まれているあらかじめ定められているキーワードを抽出し、当該抽出したキーワードを利用して、前記あらかじめ定められているキーワードに対応する一乃至複数の応答文が登録されている会話用DBを用いて前記ユーザ端末に送信する応答文を決定するキャラクタ発言内容決定手段と、
ユーザ端末から取得した発言文章を形態素解析して前記あらかじめ定められているキーワードを抽出できない場合に、キーワード検索用DBを用いてキーワードを検索するキーワード検索手段と、
当該キーワード検索手段でキーワードを抽出できない場合にユーザ端末に送信する質問文を作成する質問文作成手段と、
あらかじめ定められているキーワードに基づいてインターネットのWeb上から情報を収集し、収集した情報を前記会話用DB及び/又はキーワード検索用DBに登録する情報収集手段と、
を備えていることを特徴とするチャットシステム。
A chat system using the Internet,
The utterance sentence obtained from the user terminal is subjected to morphological analysis to extract a predetermined keyword included in the utterance sentence, and the extracted keyword is used to correspond to the predetermined keyword. A character utterance content determining unit that determines a response sentence to be transmitted to the user terminal using a conversation DB in which a plurality of response sentences are registered;
A keyword search unit that searches for a keyword using a keyword search DB when the sentence sentence obtained from the user terminal is morphologically analyzed and the predetermined keyword cannot be extracted;
Question sentence creating means for creating a question sent to be transmitted to the user terminal when a keyword cannot be extracted by the keyword search means;
Information collecting means for collecting information from the Internet on the basis of a predetermined keyword and registering the collected information in the conversation DB and / or the keyword search DB;
A chat system comprising:
キャラクタ発言内容決定手段は、更に、発言文章に含まれているあらかじめ定められているキーワードを複数抽出した場合、前記会話用DBを用いてユーザ端末に送信する応答文を決定する際に用いるキーワードを、当該複数のキーワード中から無作為的に選択することを特徴とする請求項1記載のチャットシステム。The character utterance content determination means further includes, when a plurality of predetermined keywords included in the utterance sentence are extracted, a keyword used when determining a response sentence to be transmitted to the user terminal using the conversation DB. 2. The chat system according to claim 1, wherein the user randomly selects one of the plurality of keywords. キャラクタ発言内容決定手段は、更に、応答文の決定に用いるキーワードに対応する応答文が前記会話用DB中に複数存在する場合、当該複数の応答文の中から、無作為的に抽出した応答文を前記ユーザ端末に送信する応答文として決定することを特徴とする請求項1又は2記載のチャットシステム。The character utterance content determining means further includes, if a plurality of response sentences corresponding to the keyword used for determining the response sentence exist in the conversation DB, the response sentence randomly extracted from the plurality of response sentences. 3 is determined as a response sentence to be transmitted to the user terminal. インターネットのWeb上から取得したチャットのログを利用して、前記あらかじめ定められているキーワードと対応する応答文を抽出し、当該抽出された応答文を前記会話用DBに登録する応答文作成手段を更に備えていることを特徴とする請求項1乃至3のいずれか一項記載のチャットシステム。A response sentence creating means for extracting a response sentence corresponding to the predetermined keyword by using a chat log obtained from the Internet Web, and registering the extracted response sentence in the conversation DB; The chat system according to claim 1, further comprising: ユーザ端末から取得した発言文章、又は、前記情報収集手段で収集した情報、若しくは、前記応答文作成手段で抽出した応答文を形態素解析して前記あらかじめ定められているキーワードを決定するキーワード決定手段を更に備えていることを特徴とする請求項1乃至4のいずれか一項記載のチャットシステム。Keyword determining means for morphologically analyzing a statement sentence obtained from a user terminal, or information collected by the information collecting means, or a response sentence extracted by the response sentence creating means, and determining the predetermined keyword. The chat system according to claim 1, further comprising: キーワード決定手段は、ユーザ端末から取得した発言文章、又は、前記情報収集手段で収集した情報、若しくは、前記応答文作成手段で抽出した応答文についての形態素解析に基づいてキーワードの順位付けを行うことを特徴とする請求項5記載のチャットシステム。The keyword determining means ranks keywords based on morphological analysis of a statement sentence obtained from a user terminal, information collected by the information collecting means, or a response sentence extracted by the response sentence creating means. The chat system according to claim 5, wherein: キャラクタ発言内容決定手段は、更に、ユーザ端末から取得した発言文章を形態素解析し、あらかじめ定めてある条件に該当した場合に、あらかじめ定められている話題転換用、又は、ユーザ情報収集用、若しくは、ユーザへの情報提供用にあらかじめ定められている複数の会話文の中から抽出した会話文を前記ユーザ端末に送信する応答文として決定することを特徴とする請求項1乃至6のいずれか一項記載のチャットシステム。Character utterance content determining means further performs morphological analysis on the utterance sentence obtained from the user terminal, and when a predetermined condition is met, for a predetermined topic conversion, or for collecting user information, or The conversation sentence extracted from a plurality of conversation sentences predetermined for providing information to a user is determined as a response sentence to be transmitted to the user terminal. The described chat system. ユーザ端末から取得した発言文章を各ユーザごとに登録するユーザ情報登録手段を更に備えていることを特徴とする請求項1乃至7のいずれか一項記載のチャットシステム。The chat system according to any one of claims 1 to 7, further comprising user information registration means for registering a statement sentence acquired from the user terminal for each user. 会話文を形態素解析し、会話文中に含まれているキーワードを抽出する手段として、用語間の関係を用いた連想辞書であるシソーラスを用いて会話文をフィルタリングして前記あらかじめ定められているキーワードを抽出するキーワード抽出手段を更に備えていることを特徴とする請求項1乃至7のいずれか一項記載のチャットシステム。As a means for morphologically analyzing a conversational sentence and extracting a keyword included in the conversational sentence, the conversational sentence is filtered using a thesaurus which is an associative dictionary using a relation between terms to filter the predetermined keyword. The chat system according to any one of claims 1 to 7, further comprising keyword extracting means for extracting.
JP2002308487A 2002-10-23 2002-10-23 Chat system Pending JP2004145541A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002308487A JP2004145541A (en) 2002-10-23 2002-10-23 Chat system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002308487A JP2004145541A (en) 2002-10-23 2002-10-23 Chat system

Publications (1)

Publication Number Publication Date
JP2004145541A true JP2004145541A (en) 2004-05-20

Family

ID=32454616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002308487A Pending JP2004145541A (en) 2002-10-23 2002-10-23 Chat system

Country Status (1)

Country Link
JP (1) JP2004145541A (en)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006011754A1 (en) * 2004-07-29 2006-02-02 Nhn Corporation Method and system for providing joint viewing service of moving picture
JP2009193532A (en) * 2008-02-18 2009-08-27 Oki Electric Ind Co Ltd Dialogue management device, method, and program, and consciousness extraction system
JP2010048953A (en) * 2008-08-20 2010-03-04 Toshiba Corp Interaction sentence generating device
JP2010072578A (en) * 2008-09-22 2010-04-02 Toshiba Corp Dialogue generation apparatus and dialogue generation method
JP2011076627A (en) * 2010-12-16 2011-04-14 Oki Electric Industry Co Ltd Interaction management device, method, program, and consciousness extraction system
JP2014164582A (en) * 2013-02-26 2014-09-08 Nippon Telegr & Teleph Corp <Ntt> Speech candidate creation device, method thereof, and program
JP2014191496A (en) * 2013-03-26 2014-10-06 Xing Inc Song lyrics replacing server, karaoke device, and song lyrics replacing program
JP2014222402A (en) * 2013-05-13 2014-11-27 日本電信電話株式会社 Utterance candidate generation device, utterance candidate generation method, and utterance candidate generation program
JP2016080981A (en) * 2014-10-21 2016-05-16 トヨタ自動車株式会社 Response generation device, response generation method, and response generation program
JP2016090891A (en) * 2014-11-07 2016-05-23 トヨタ自動車株式会社 Response generation apparatus, response generation method, and response generation program
JP2017151987A (en) * 2016-02-23 2017-08-31 Line株式会社 Content management device, method, and computer program
JP6218057B1 (en) * 2017-07-14 2017-10-25 Jeインターナショナル株式会社 Automatic response server device, terminal device, response system, response method, and program
JP2018160088A (en) * 2017-03-23 2018-10-11 株式会社サテライトオフィス Chat system and program
CN110874533A (en) * 2018-08-14 2020-03-10 杭州智语网络科技有限公司 Intention identification method based on keyword matching and response path after voice identification
KR20200079629A (en) * 2018-12-26 2020-07-06 지의소프트 주식회사 Interactive information providing system and method
US10713006B2 (en) 2016-07-19 2020-07-14 Gatebox Inc. Image display apparatus, topic selection method, topic selection program, image display method, and image display program
JP2020140355A (en) * 2019-02-27 2020-09-03 東京瓦斯株式会社 Providing method, server system, server device, and program for homecoming notification service
JP2021057077A (en) * 2020-12-24 2021-04-08 株式会社サテライトオフィス Chat system, program
JP2021533489A (en) * 2018-08-09 2021-12-02 リアルアイズ・オーウー Computer implementation system and method for collecting feedback

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006011754A1 (en) * 2004-07-29 2006-02-02 Nhn Corporation Method and system for providing joint viewing service of moving picture
US7849145B2 (en) 2004-07-29 2010-12-07 Nhn Corporation Method and system for providing joint viewing service of moving picture
JP2009193532A (en) * 2008-02-18 2009-08-27 Oki Electric Ind Co Ltd Dialogue management device, method, and program, and consciousness extraction system
JP2010048953A (en) * 2008-08-20 2010-03-04 Toshiba Corp Interaction sentence generating device
JP2010072578A (en) * 2008-09-22 2010-04-02 Toshiba Corp Dialogue generation apparatus and dialogue generation method
US8856010B2 (en) 2008-09-22 2014-10-07 Kabushiki Kaisha Toshiba Apparatus and method for dialogue generation in response to received text
JP2011076627A (en) * 2010-12-16 2011-04-14 Oki Electric Industry Co Ltd Interaction management device, method, program, and consciousness extraction system
JP2014164582A (en) * 2013-02-26 2014-09-08 Nippon Telegr & Teleph Corp <Ntt> Speech candidate creation device, method thereof, and program
JP2014191496A (en) * 2013-03-26 2014-10-06 Xing Inc Song lyrics replacing server, karaoke device, and song lyrics replacing program
JP2014222402A (en) * 2013-05-13 2014-11-27 日本電信電話株式会社 Utterance candidate generation device, utterance candidate generation method, and utterance candidate generation program
JP2016080981A (en) * 2014-10-21 2016-05-16 トヨタ自動車株式会社 Response generation device, response generation method, and response generation program
JP2016090891A (en) * 2014-11-07 2016-05-23 トヨタ自動車株式会社 Response generation apparatus, response generation method, and response generation program
JP2017151987A (en) * 2016-02-23 2017-08-31 Line株式会社 Content management device, method, and computer program
US10713006B2 (en) 2016-07-19 2020-07-14 Gatebox Inc. Image display apparatus, topic selection method, topic selection program, image display method, and image display program
JP2018160088A (en) * 2017-03-23 2018-10-11 株式会社サテライトオフィス Chat system and program
US10997371B2 (en) 2017-07-14 2021-05-04 Je International Corporation Automatic response server device, terminal device, response system, response method, and program
WO2019012872A1 (en) * 2017-07-14 2019-01-17 Jeインターナショナル株式会社 Automated response server device, terminal device, response system, response method, and program
JP2019020995A (en) * 2017-07-14 2019-02-07 Jeインターナショナル株式会社 Automatic response server device, terminal device, response system, response method, and program
JP6218057B1 (en) * 2017-07-14 2017-10-25 Jeインターナショナル株式会社 Automatic response server device, terminal device, response system, response method, and program
JP2021533489A (en) * 2018-08-09 2021-12-02 リアルアイズ・オーウー Computer implementation system and method for collecting feedback
CN110874533A (en) * 2018-08-14 2020-03-10 杭州智语网络科技有限公司 Intention identification method based on keyword matching and response path after voice identification
CN110874533B (en) * 2018-08-14 2020-06-30 杭州智语网络科技有限公司 Intention identification method based on keyword matching and response path after voice identification
KR20200079629A (en) * 2018-12-26 2020-07-06 지의소프트 주식회사 Interactive information providing system and method
KR102132696B1 (en) 2018-12-26 2020-07-13 지의소프트 주식회사 Interactive information providing system and method
JP2020140355A (en) * 2019-02-27 2020-09-03 東京瓦斯株式会社 Providing method, server system, server device, and program for homecoming notification service
JP7229043B2 (en) 2019-02-27 2023-02-27 東京瓦斯株式会社 Return home notification service providing method, server system and program
JP2021057077A (en) * 2020-12-24 2021-04-08 株式会社サテライトオフィス Chat system, program

Similar Documents

Publication Publication Date Title
KR102528518B1 (en) Proactive incorporation of unsolicited content into human-to-computer dialogs
JP2004145541A (en) Chat system
Danescu-Niculescu-Mizil et al. You had me at hello: How phrasing affects memorability
Adams et al. Topic detection and extraction in chat
CN107797984A (en) Intelligent interactive method, equipment and storage medium
JP2008052449A (en) Interactive agent system and method
CN110188248A (en) Data processing method, device and electronic equipment based on news question and answer interactive system
JP6796384B2 (en) Dictionary construction device, information processing device, evaluation word dictionary production method, information processing method, and program
JP4743766B2 (en) Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program
JP5872183B2 (en) Information processing system, preference visualization system, censorship system, and preference visualization method
JP5420874B2 (en) Digital story providing system, digital story providing method, and computer program for causing computer system to execute this method
JP2004341672A (en) Method and device for presenting information
JP2006134183A (en) Information classification method, system and program, and storage medium with program stored
JP5425333B1 (en) Marketing support system, marketing support method, program, and computer storage medium
JP6011180B2 (en) Facet generation device, facet generation method, and facet generation program
JP4279883B2 (en) Conversation control system, conversation control method, program, and recording medium recording program
JP2005032197A (en) Information analysis system and method
JP2004110435A (en) Profile generating device and information providing device
JP6502732B2 (en) Document display apparatus, document display method and program thereof
JP4110011B2 (en) Conversation control device and conversation control method
JP4110012B2 (en) Conversation control device and conversation control method
Upadhyay et al. Legislative agenda-setting power of social media: # BlackLivesMatter and the George Floyd Justice in Policing Act of 2020
JP7001662B2 (en) Dictionary construction device, information processing device, comment output device, evaluation word dictionary production method, information processing method, comment output method and program
JP5138622B2 (en) Information processing apparatus, complaint extraction method, and program
JP2003173335A (en) Natural language conversation device and method, and storage medium