JP2001306612A - 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体 - Google Patents

情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体

Info

Publication number
JP2001306612A
JP2001306612A JP2000125711A JP2000125711A JP2001306612A JP 2001306612 A JP2001306612 A JP 2001306612A JP 2000125711 A JP2000125711 A JP 2000125711A JP 2000125711 A JP2000125711 A JP 2000125711A JP 2001306612 A JP2001306612 A JP 2001306612A
Authority
JP
Japan
Prior art keywords
word
information
feature vector
vector
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000125711A
Other languages
English (en)
Inventor
Akiyoshi Kawamura
晃好 河村
Kenichi Kuromushiya
健一 黒武者
Ikuo Karashi
育雄 芥子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2000125711A priority Critical patent/JP2001306612A/ja
Publication of JP2001306612A publication Critical patent/JP2001306612A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 利用履歴に基づいて、利用者の興味が高い情
報を検索して提供する。 【解決手段】 提供可能な情報を記憶する提供可能デー
タ記憶部8と、利用履歴情報を記憶する操作履歴データ
記憶部10と、単語と単語の特徴を表わす単語特徴ベク
トルとをそれぞれ対応付けて記憶する単語辞書6と、操
作履歴データに基づいて単語辞書6を修正する単語辞書
修正処理部7と、提供可能な情報および利用履歴情報に
含まれる単語を抽出する抽出処理部36と、抽出した単
語に対応する単語ベクトルに基づいて利用履歴情報ごと
の特徴ベクトルを生成するベクトル生成処理部38と、
特徴ベクトルの距離に基づき利用履歴情報を分類するク
ラスタリング処理部40と、分類された利用履歴情報に
基づき提供可能情報から利用者の興味が高い情報を検索
する検索処理部46とを含む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、利用者の操作履歴
から利用者の興味の高い情報を検索し提供する装置に関
し、特に、利用者の操作履歴を分析した後、その分析結
果に基づいて利用者にとって興味の高い情報を検索する
装置に関する。
【0002】
【従来の技術】従来の情報提供技術において、利用者が
興味のある情報の提供を受けるには、予め関連するキー
ワードを利用者自身の手で登録しておかなければならな
い。
【0003】このようなキーワードの登録を避けるもの
として、特開平7−56929号公報に開示された履歴
利用データベース検索方式がある。この発明は、利用者
がかつて購入した物件の履歴を保持する購入履歴データ
ベースと、購入対象データを保持する物件データベース
と、登録データと利用者がかつて購入した物件との類似
度を計算する距離計算部と、登録物件を類似度の降順に
整列する類似物件整列部と、類似物件を推奨物件として
表示する推奨物件表示部とを含む。この発明によると、
過去の購入履歴を参照し、利用者がかつて購入した物件
と類似した傾向を有する物件を検索することができる。
そして次の物件購入の際に、利用者はその検索結果を推
奨物件として参考にして、購入の意思決定を行なうこと
ができる。
【0004】
【発明が解決しようとする課題】しかし、前述の発明で
は、物件データベースのデータ量および購入履歴データ
ベースのデータ量が大きくなった場合、購入履歴データ
ベース内の個々の履歴データと、物件データベース内の
物件データとの類似度を個々に計算し、検索していたの
では多大な時間がかかる。また、前述の発明は、購入履
歴のうちの一部に検索対象を制限するための付加情報を
入力し、検索回数を減らす処理も含むが、選択された購
入履歴だけで利用者の興味を完全に表現する検索はでき
ない。
【0005】そこで、本発明は前述の課題を解決するた
めになされたものであって、その目的は、利用者の利用
履歴から利用者の興味の高い情報を迅速かつ的確に抽出
し、その情報を用いて利用者の興味を反映した情報を検
索し提供することができる情報提供装置、情報提供方
法、およびそれらを実現するプログラムを記録した機械
読取可能な記録媒体を提供することである。
【0006】
【課題を解決するための手段】第1の発明に係る情報提
供装置は、複数個の単語と、各単語の特徴を表わす単語
特徴ベクトルとを対応付けて記憶するための単語特徴記
憶手段と、利用者に対して提供可能な情報と、提供可能
な情報の各々に対して単語特徴記憶手段に記憶された単
語および単語特徴ベクトルに基づいて生成された提供可
能情報特徴データとを準備するための提供可能情報準備
手段と、利用者が利用した情報の履歴情報を記憶するた
めの利用履歴情報記憶手段と、単語特徴記憶手段に記憶
された単語および単語特徴ベクトルを参照し、利用履歴
情報記憶手段に記憶された履歴情報を、各履歴情報に含
まれる単語および対応の単語特徴ベクトルに基づいて複
数個のカテゴリに分類するための分類手段と、複数個の
カテゴリはそれぞれ、単語および単語特徴ベクトルに関
連して定められる利用履歴情報特徴データにより特徴付
けられ、単語特徴記憶手段に記憶された単語および単語
特徴ベクトルを参照し、複数の履歴情報の各々について
の特徴ベクトルを生成するための特徴ベクトル生成手段
と、予め定められた条件が満たされると、複数の履歴情
報とその特徴ベクトルとに基づいて、単語特徴記憶手段
の内容を更新するための単語特徴更新手段と、提供可能
情報準備手段によって準備された提供可能な情報のう
ち、利用履歴情報特徴データと予め定められた関係にあ
る提供可能情報特徴データを有するものを検索し出力す
るための提供情報検索手段とを含む。
【0007】第1の発明によると、単語特徴記憶手段
は、複数個の単語と、各単語の特徴を表わす単語特徴ベ
クトルとを対応付けて記憶する。提供可能情報準備手段
は、利用者に対して提供可能な情報と、提供可能な情報
の各々に対して単語特徴記憶手段に記憶された単語およ
び単語特徴ベクトルに基づいて生成された提供可能情報
特徴データとを準備する。利用履歴情報記憶手段は、利
用者が利用した情報の履歴情報を記憶する。分類手段
は、単語特徴記憶手段に記憶された単語および単語特徴
ベクトルを参照し、利用履歴情報記憶手段に記憶された
履歴情報を、各履歴情報に含まれる単語および対応の単
語特徴ベクトルに基づいて複数個のカテゴリに分類す
る。特徴ベクトル生成手段は、単語特徴記憶手段に記憶
された単語および単語特徴ベクトルを参照し、複数の履
歴情報の各々についての特徴ベクトルを生成する。単語
特徴更新手段は、予め定められた条件が満たされると、
複数の履歴情報とその特徴ベクトルとに基づいて、単語
特徴記憶手段の内容を更新する。提供情報検索手段は、
提供可能情報準備手段によって準備された提供可能な情
報のうち、利用履歴情報特徴データと予め定められた関
係にある提供可能情報特徴データを有するものを検索し
出力する。これにより、単語特徴記憶手段の内容は逐次
更新され、最新の利用者の履歴情報に基づく単語および
その単語の単語特徴ベクトルとが記憶される。これに加
えて、利用履歴情報自体ではなく単語特徴記憶手段に記
憶された内容に基づき分類されたカテゴリごとの特徴デ
ータに従って提供情報を検索することができるため、利
用者に提供すべき情報を迅速かつ的確に検索できる。そ
の結果、利用者の利用履歴から利用者の興味の高い情報
を迅速かつ的確に抽出し、その情報を用いて利用者の興
味を反映した情報を検索し提供することができる情報提
供装置を提供することができる。
【0008】第2の発明に係る情報提供装置は、第1の
発明の構成に加えて、単語特徴更新手段は、複数の履歴
情報とその特徴ベクトルとに基づいて、単語特徴記憶手
段に単語およびその単語に対応する単語特徴ベクトルを
追加するための手段を含む。
【0009】第2の発明によると、単語特徴更新手段
は、複数の履歴情報とその特徴ベクトルとに基づいて、
単語特徴記憶手段に単語およびその単語に対応する単語
特徴ベクトルを追加する。これにより、単語特徴記憶手
段に記憶されていなかった単語およびその単語の単語特
徴ベクトルを生成し、記憶させることができる。その結
果、当初記憶させた単語およびその単語の単語特徴ベク
トルに加えて、多数の単語に基づいて、利用者の利用履
歴から利用者の興味の高い情報を迅速かつ的確に抽出
し、その情報を用いて利用者の興味を反映した情報を検
索し提供することができる情報提供装置を提供すること
ができる。
【0010】第3の発明に係る情報提供装置は、第1ま
たは2の発明の構成に加えて、単語特徴更新手段は、複
数の履歴情報とその特徴ベクトルとに基づいて、単語特
徴記憶手段に記憶された単語特徴ベクトルを更新するた
めの手段を含む。
【0011】第3の発明によると、単語特徴更新手段
は、複数の履歴情報とその特徴ベクトルとに基づいて、
単語特徴記憶手段に記憶された単語特徴ベクトルを更新
する。これにより、利用履歴情報の変化に対応させて単
語特徴ベクトルを生成し、単語特徴記憶手段に記憶させ
ることができる。その結果、利用履歴情報の変化に対応
させて当初記憶させた単語特徴ベクトルを更新して、更
新された単語特徴ベクトルに基づいて、利用者の利用履
歴から利用者の興味の高い情報を迅速かつ的確に抽出
し、その情報を用いて利用者の興味を反映した情報を検
索し提供することができる情報提供装置を提供すること
ができる。
【0012】第4の発明に係る情報提供装置は、第1〜
3のいずれかの発明の構成に加えて、特徴ベクトル生成
手段は、履歴情報に含まれる各単語に割当てられる第1
の重みを算出するための第1の重み算出手段と、複数の
履歴情報の各々について、履歴情報に含まれる単語に対
応する単語特徴ベクトルに第1の重みを付けた第1のベ
クトルを算出し、算出された第1のベクトルを互いに加
算するための加算手段とを含む。
【0013】第4の発明によると、第1の重み算出手段
は、履歴情報に含まれる各単語に割当てられる第1の重
みを算出する。加算手段は、複数の履歴情報の各々につ
いて、履歴情報に含まれる単語に対応する単語特徴ベク
トルに第1の重みを付けた第1のベクトルを算出し、算
出された第1のベクトルを互いに加算する。これによ
り、利用者の履歴情報ごとの特徴ベクトルを算出する場
合において、単語に対応させた第1の重み(たとえば、
単語の出現頻度に対応させて設定する重み)に基づいて
履歴情報ごとの特徴ベクトルを算出できる。その結果、
単語特徴記憶手段に記憶された単語特徴ベクトルを適切
に更新することができる。
【0014】第5の発明に係る情報提供装置は、第1〜
3のいずれかの発明の構成に加えて、特徴ベクトル生成
手段は、単語特徴ベクトルの成分ごとに割当てられる重
みを算出するための重み算出手段と、複数の履歴情報の
各々について、履歴情報に含まれる単語に対応する単語
特徴ベクトルの成分に重みを付けたベクトルを算出し、
算出されたベクトルを互いに加算するための加算手段と
を含む。
【0015】第5の発明によると、重み算出手段は、単
語特徴ベクトルの成分ごとに割当てられる重みを算出す
る。加算手段は、複数の履歴情報の各々について、履歴
情報に含まれる単語に対応する単語特徴ベクトルの成分
に重みを付けたベクトルを算出し、算出されたベクトル
を互いに加算する。これにより、利用者の履歴情報ごと
の特徴ベクトルを算出する場合において、単語ベクトル
の成分に対応させた重み(たとえば、単語ベクトルの特
定の成分の出現頻度に対応させて設定する重み)に基づ
いて履歴情報ごとの特徴ベクトルを算出できる。その結
果、単語特徴記憶手段に記憶された単語特徴ベクトルを
適切に更新することができる。
【0016】第6の発明に係る情報提供装置は、第4の
発明の構成に加えて、特徴ベクトル生成手段は、単語特
徴ベクトルの成分ごとに割当てられる第2の重みを算出
するための第2の重み算出手段をさらに含み、加算手段
は、複数の履歴情報の各々について、履歴情報に含まれ
る単語に対応する単語特徴ベクトルの成分に第2の重み
を付けた第2のベクトルを算出し、第2のベクトルに第
1の重みを付けた第1のベクトルを算出し、算出された
第1のベクトルを互いに加算するための手段を含む。
【0017】第6の発明によると、第2の重み算出手段
は、単語特徴ベクトルの成分ごとに割当てられる第2の
重みを算出する。加算手段は、複数の履歴情報の各々に
ついて、履歴情報に含まれる単語に対応する単語特徴ベ
クトルの成分に第2の重みを付けた第2のベクトルを算
出し、第2のベクトルに第1の重みを付けた第1のベク
トルを算出し、算出された第1のベクトルを互いに加算
する。これにより、利用者の履歴情報ごとの特徴ベクト
ルを算出する場合において、単語ベクトルの成分に対応
させた第2の重み(たとえば、単語ベクトルの特定の成
分の出現頻度に対応させて設定する重み)と、単語に対
応させた第1の重み(たとえば、単語の出現頻度に対応
させて設定する重み)とに基づいて履歴情報ごとの特徴
ベクトルを算出できる。その結果、単語特徴記憶手段に
記憶された単語特徴ベクトルを適切に更新することがで
きる。
【0018】第7の発明に係る情報提供装置は、第1〜
6のいずれかの発明の構成に加えて、利用者を識別する
ための利用者識別手段をさらに含み、利用履歴記憶手段
は、利用者別に情報を記憶するための複数の記憶手段を
含み、単語特徴更新手段は、利用者識別手段により識別
された利用者が変更されたことを検知すると、単語特徴
ベクトルを、識別された利用者の履歴情報とその特徴ベ
クトルとに基づいて、単語特徴記憶手段の内容を更新す
るための手段を含む。
【0019】第7の発明によると、利用者識別手段は利
用者を識別し、利用履歴記憶手段は、利用者別に情報を
記憶する。単語特徴更新手段は、利用者識別手段により
識別された利用者が変更されたことを検知すると、単語
特徴ベクトルを、識別された利用者の履歴情報とその特
徴ベクトルとに基づいて、単語特徴記憶手段の内容を更
新する。これにより、利用者ごとの履歴情報に基づい
て、単語特徴記憶手段の内容を更新することができる。
その結果、利用者ごとに利用者の利用履歴から利用者の
興味の高い情報を迅速かつ的確に抽出し、その情報を用
いて利用者の興味を反映した情報を検索し提供すること
ができる情報提供装置を提供することができる。
【0020】第8の発明に係る情報提供装置は、第1〜
7のいずれかの発明の構成に加えて、提供可能情報特徴
データは、各提供可能な情報に出現する単語に対応する
単語特徴ベクトルを含み、利用履歴情報特徴データは、
各分類ごとに含まれる利用履歴情報に出現する単語に対
応する単語特徴ベクトルを含み、提供情報検索手段は、
提供可能情報特徴データに含まれる単語特徴ベクトルと
利用履歴情報特徴データに含まれる単語特徴ベクトルと
により検索するための手段を含む。
【0021】第8の発明によると、提供情報検索手段
は、各提供情報に出現する単語特徴ベクトルと各カテゴ
リに含まれる利用履歴情報に出現する単語に対応した単
語特徴ベクトルに基づいて利用者の興味が高い情報を検
索する。これにより、ベクトルによる演算を用いて、情
報を検索することができ、利用者に提供する情報をさら
に正確に検索できる情報提供装置を実現できる。その結
果、利用者の利用履歴から利用者の興味の高い情報を迅
速かつ的確に抽出し、その情報を用いて利用者の興味を
反映した情報を検索し提供することができる情報提供装
置を提供することができる。
【0022】第9の発明に係る情報提供方法は、コンピ
ュータを用いて利用者に情報を提供する方法であって、
複数個の単語と、各単語の特徴を表わす単語特徴ベクト
ルとを対応付けて記憶する単語特徴記憶ステップと、利
用者に対して提供可能な情報と、提供可能な情報の各々
に対して単語特徴記憶ステップにて記憶した単語および
単語特徴ベクトルに基づいて生成された提供可能情報特
徴データとを準備する提供可能情報準備ステップと、利
用者が利用した情報の履歴情報を記憶する利用履歴情報
記憶ステップと、単語特徴記憶ステップにて記憶した単
語および単語特徴ベクトルを参照し、利用履歴情報記憶
ステップにて記憶した履歴情報を、各履歴情報に含まれ
る単語および対応の単語特徴ベクトルに基づいて複数個
のカテゴリに分類する分類ステップと、複数個のカテゴ
リはそれぞれ、単語および単語特徴ベクトルに関連して
定められる利用履歴情報特徴データにより特徴付けら
れ、単語特徴記憶ステップにて記憶した単語および単語
特徴ベクトルを参照し、複数の履歴情報の各々について
の特徴ベクトルを生成する特徴ベクトル生成ステップ
と、予め定められた条件が満たされると、複数の履歴情
報とその特徴ベクトルとに基づいて、単語特徴記憶ステ
ップにて記憶した内容を更新する単語特徴更新ステップ
と、提供可能情報準備ステップにて準備した提供可能な
情報のうち、利用履歴情報特徴データと予め定められた
関係にある提供可能情報特徴データを有するものを検索
し出力する提供情報検索ステップとを含む。
【0023】第9の発明によると、単語特徴記憶ステッ
プは、複数個の単語と、各単語の特徴を表わす単語特徴
ベクトルとを対応付けて記憶する。提供可能情報準備ス
テップは、利用者に対して提供可能な情報と、提供可能
な情報の各々に対して単語特徴記憶ステップにて記憶し
た単語および単語特徴ベクトルに基づいて生成された提
供可能情報特徴データとを準備する。利用履歴情報記憶
ステップは、利用者が利用した情報の履歴情報を記憶す
る。分類ステップは、単語特徴記憶ステップにて記憶し
た単語および単語特徴ベクトルを参照し、利用履歴情報
記憶ステップにて記憶した履歴情報を、各履歴情報に含
まれる単語および対応の単語特徴ベクトルに基づいて複
数個のカテゴリに分類する。特徴ベクトル生成ステップ
は、単語特徴記憶ステップにて記憶した単語および単語
特徴ベクトルを参照し、複数の履歴情報の各々について
の特徴ベクトルを生成する。単語特徴更新ステップは、
予め定められた条件が満たされると、複数の履歴情報と
その特徴ベクトルとに基づいて、単語特徴記憶ステップ
にて記憶した内容を更新する。提供情報検索ステップ
は、提供可能情報準備ステップにて準備した提供可能な
情報のうち、利用履歴情報特徴データと予め定められた
関係にある提供可能情報特徴データを有するものを検索
し出力する。これにより、単語特徴記憶ステップにより
記憶される内容は逐次更新され、最新の利用者の履歴情
報に基づく単語およびその単語の単語特徴ベクトルとが
記憶される。これに加えて、利用履歴情報自体ではなく
単語特徴記憶ステップにて記憶した内容に基づき分類さ
れたカテゴリごとの特徴データに従って提供情報を検索
することができるため、利用者に提供すべき情報を迅速
かつ的確に検索できる。その結果、利用者の利用履歴か
ら利用者の興味の高い情報を迅速かつ的確に抽出し、そ
の情報を用いて利用者の興味を反映した情報を検索し提
供することができる情報提供方法を提供することができ
る。
【0024】第10の発明に係る情報提供方法は、第9
の発明の構成に加えて、単語特徴更新ステップは、複数
の履歴情報とその特徴ベクトルとに基づいて、単語特徴
記憶ステップにて記憶した内容に単語およびその単語に
対応する単語特徴ベクトルを追加するステップを含む。
【0025】第10の発明によると、単語特徴更新ステ
ップは、複数の履歴情報とその特徴ベクトルとに基づい
て、単語特徴記憶ステップにて記憶した内容に単語およ
びその単語に対応する単語特徴ベクトルを追加する。こ
れにより、単語特徴記憶ステップにて記憶されていなか
った単語およびその単語の単語特徴ベクトルを生成し、
記憶させることができる。その結果、当初記憶させた単
語およびその単語の単語特徴ベクトルに加えて、多数の
単語に基づいて、利用者の利用履歴から利用者の興味の
高い情報を迅速かつ的確に抽出し、その情報を用いて利
用者の興味を反映した情報を検索し提供することができ
る情報提供方法を提供することができる。
【0026】第11の発明に係る情報提供方法は、第9
または10の発明の構成に加えて、単語特徴更新ステッ
プは、複数の履歴情報とその特徴ベクトルとに基づい
て、単語特徴記憶ステップにて記憶した単語特徴ベクト
ルを更新するステップを含む。
【0027】第11の発明によると、単語特徴更新ステ
ップは、複数の履歴情報とその特徴ベクトルとに基づい
て、単語特徴記憶ステップにて記憶した単語特徴ベクト
ルを更新する。これにより、利用履歴情報の変化に対応
させて単語特徴ベクトルを生成し、単語特徴更新ステッ
プにて更新することができる。その結果、利用履歴情報
の変化に対応させて当初記憶させた単語特徴ベクトルを
更新して、更新された単語特徴ベクトルに基づいて、利
用者の利用履歴から利用者の興味の高い情報を迅速かつ
的確に抽出し、その情報を用いて利用者の興味を反映し
た情報を検索し提供することができる情報提供方法を提
供することができる。
【0028】第12の発明に係る情報提供方法は、第9
〜11のいずれかの発明の構成に加えて、特徴ベクトル
生成ステップは、履歴情報に含まれる各単語に割当てら
れる第1の重みを算出する第1の重み算出ステップと、
複数の履歴情報の各々について、履歴情報に含まれる単
語に対応する単語特徴ベクトルに第1の重みを付けた第
1のベクトルを算出し、算出された第1のベクトルを互
いに加算する加算ステップとを含む。
【0029】第12の発明によると、第1の重み算出ス
テップは、履歴情報に含まれる各単語に割当てられる第
1の重みを算出する。加算ステップは、複数の履歴情報
の各々について、履歴情報に含まれる単語に対応する単
語特徴ベクトルに第1の重みを付けた第1のベクトルを
算出し、算出された第1のベクトルを互いに加算する。
これにより、利用者の履歴情報ごとの特徴ベクトルを算
出する場合において、単語に対応させた第1の重み(た
とえば、単語の出現頻度に対応させて設定する重み)に
基づいて履歴情報ごとの特徴ベクトルを算出できる。そ
の結果、単語特徴記憶ステップにて記憶した単語特徴ベ
クトルを適切に更新することができる。
【0030】第13の発明に係る情報提供方法は、第9
〜11のいずれかの発明の構成に加えて、特徴ベクトル
生成ステップは、単語特徴ベクトルの成分ごとに割当て
られる重みを算出する重み算出ステップと、複数の履歴
情報の各々について、履歴情報に含まれる単語に対応す
る単語特徴ベクトルの成分に重みを付けたベクトルを算
出し、算出されたベクトルを互いに加算する加算ステッ
プとを含む。
【0031】第13の発明によると、重み算出ステップ
は、単語特徴ベクトルの成分ごとに割当てられる重みを
算出する。加算ステップは、複数の履歴情報の各々につ
いて、履歴情報に含まれる単語に対応する単語特徴ベク
トルの成分に重みを付けたベクトルを算出し、算出され
たベクトルを互いに加算する。これにより、利用者の履
歴情報ごとの特徴ベクトルを算出する場合において、単
語ベクトルの成分に対応させた重み(たとえば、単語ベ
クトルの特定の成分の出現頻度に対応させて設定する重
み)に基づいて履歴情報ごとの特徴ベクトルを算出でき
る。その結果、単語特徴記憶ステップにて記憶した単語
特徴ベクトルを適切に更新することができる。
【0032】第14の発明に係る情報提供方法は、第1
2の発明の構成に加えて、特徴ベクトル生成ステップ
は、単語特徴ベクトルの成分ごとに割当てられる第2の
重みを算出する第2の重み算出ステップをさらに含み、
加算ステップは、複数の履歴情報の各々について、履歴
情報に含まれる単語に対応する単語特徴ベクトルの成分
に第2の重みを付けた第2のベクトルを算出し、第2の
ベクトルに第1の重みを付けた第1のベクトルを算出
し、算出された第1のベクトルを互いに加算するステッ
プを含む。
【0033】第14の発明によると、第2の重み算出ス
テップは、単語特徴ベクトルの成分ごとに割当てられる
第2の重みを算出する。加算ステップは、複数の履歴情
報の各々について、履歴情報に含まれる単語に対応する
単語特徴ベクトルの成分に第2の重みを付けた第2のベ
クトルを算出し、第2のベクトルに第1の重みを付けた
第1のベクトルを算出し、算出された第1のベクトルを
互いに加算する。これにより、利用者の履歴情報ごとの
特徴ベクトルを算出する場合において、単語ベクトルの
成分に対応させた第2の重み(たとえば、単語ベクトル
の特定の成分の出現頻度に対応させて設定する重み)
と、単語に対応させた第1の重み(たとえば、単語の出
現頻度に対応させて設定する重み)とに基づいて履歴情
報ごとの特徴ベクトルを算出できる。その結果、単語特
徴記憶ステップにて記憶された単語特徴ベクトルを適切
に更新することができる。
【0034】第15の発明に係る情報提供方法は、第9
〜14のいすれかの発明の構成に加えて、利用者を識別
する利用者識別ステップをさらに含み、利用履歴記憶ス
テップは、利用者別に情報を記憶する複数の記憶ステッ
プを含み、単語特徴更新ステップは、利用者識別ステッ
プにより識別された利用者が変更されたことを検知する
と、単語特徴ベクトルを、識別された利用者の履歴情報
とその特徴ベクトルとに基づいて、単語特徴記憶ステッ
プにて記憶した内容を更新するステップを含む。
【0035】第15の発明によると、利用者識別ステッ
プは、利用者を識別し、利用履歴記憶ステップは、利用
者別に情報を記憶する。単語特徴更新ステップは、利用
者識別ステップにより識別された利用者が変更されたこ
とを検知すると、単語特徴ベクトルを、識別された利用
者の履歴情報とその特徴ベクトルとに基づいて、単語特
徴記憶ステップにて記憶した内容を更新する。これによ
り、利用者ごとの履歴情報に基づいて、単語特徴記憶ス
テップにて記憶した内容を更新することができる。その
結果、利用者ごとに利用者の利用履歴から利用者の興味
の高い情報を迅速かつ的確に抽出し、その情報を用いて
利用者の興味を反映した情報を検索し提供することがで
きる情報提供方法を提供することができる。
【0036】第16の発明に係る情報提供方法は、第9
〜15のいすれかの発明の構成に加えて、提供可能情報
特徴データは、各提供可能な情報に出現する単語に対応
する単語特徴ベクトルを含み、利用履歴情報特徴データ
は、各分類ごとに含まれる利用履歴情報に出現する単語
に対応する単語特徴ベクトルを含み、提供情報検索ステ
ップは、提供可能情報特徴データに含まれる単語特徴ベ
クトルと利用履歴情報特徴データに含まれる単語特徴ベ
クトルとにより検索するステップを含む。
【0037】第16の発明によると、提供情報検索ステ
ップは、提供可能情報特徴データに含まれる単語特徴ベ
クトルと利用履歴情報特徴データに含まれる単語特徴ベ
クトルとにより検索する。これにより、ベクトルによる
演算を用いて、情報を検索することができ、利用者に提
供する情報をさらに正確に検索できる情報提供方法を実
現できる。その結果、利用者の利用履歴から利用者の興
味の高い情報を迅速かつ的確に抽出し、その情報を用い
て利用者の興味を反映した情報を検索し提供することが
できる情報提供方法を提供することができる。
【0038】第17の発明に係る機械読取可能な記録媒
体は、コンピュータを用いて利用者に情報を提供する方
法を実現するプログラムを記録した記録媒体であって、
情報提供方法は、複数個の単語と、各単語の特徴を表わ
す単語特徴ベクトルとを対応付けて記憶する単語特徴記
憶ステップと、利用者に対して提供可能な情報と、提供
可能な情報の各々に対して単語特徴記憶ステップにて記
憶した単語および単語特徴ベクトルに基づいて生成され
た提供可能情報特徴データとを準備する提供可能情報準
備ステップと、利用者が利用した情報の履歴情報を記憶
する利用履歴情報記憶ステップと、単語特徴記憶ステッ
プにて記憶した単語および単語特徴ベクトルを参照し、
利用履歴情報記憶ステップにて記憶した履歴情報を、各
履歴情報に含まれる単語および対応の単語特徴ベクトル
に基づいて複数個のカテゴリに分類する分類ステップ
と、複数個のカテゴリはそれぞれ、単語および単語特徴
ベクトルに関連して定められる利用履歴情報特徴データ
により特徴付けられ、単語特徴記憶ステップにて記憶し
た単語および単語特徴ベクトルを参照し、複数の履歴情
報の各々についての特徴ベクトルを生成する特徴ベクト
ル生成ステップと、予め定められた条件が満たされる
と、複数の履歴情報とその特徴ベクトルとに基づいて、
単語特徴記憶ステップにて記憶した内容を更新する単語
特徴更新ステップと、提供可能情報準備ステップにて準
備した提供可能な情報のうち、利用履歴情報特徴データ
と予め定められた関係にある提供可能情報特徴データを
有するものを検索し出力する提供情報検索ステップとを
含む。
【0039】第17の発明によると、単語特徴記憶ステ
ップは、複数個の単語と、各単語の特徴を表わす単語特
徴ベクトルとを対応付けて記憶する。提供可能情報準備
ステップは、利用者に対して提供可能な情報と、提供可
能な情報の各々に対して単語特徴記憶ステップにて記憶
した単語および単語特徴ベクトルに基づいて生成された
提供可能情報特徴データとを準備する。利用履歴情報記
憶ステップは、利用者が利用した情報の履歴情報を記憶
する。分類ステップは、単語特徴記憶ステップにて記憶
した単語および単語特徴ベクトルを参照し、利用履歴情
報記憶ステップにて記憶した履歴情報を、各履歴情報に
含まれる単語および対応の単語特徴ベクトルに基づいて
複数個のカテゴリに分類する。特徴ベクトル生成ステッ
プは、単語特徴記憶ステップにて記憶した単語および単
語特徴ベクトルを参照し、複数の履歴情報の各々につい
ての特徴ベクトルを生成する。単語特徴更新ステップ
は、予め定められた条件が満たされると、複数の履歴情
報とその特徴ベクトルとに基づいて、単語特徴記憶ステ
ップにて記憶した内容を更新する。提供情報検索ステッ
プは、提供可能情報準備ステップにて準備した提供可能
な情報のうち、利用履歴情報特徴データと予め定められ
た関係にある提供可能情報特徴データを有するものを検
索し出力する。これにより、単語特徴記憶ステップによ
り記憶される内容は逐次更新され、最新の利用者の履歴
情報に基づく単語およびその単語の単語特徴ベクトルと
が記憶される。これに加えて、利用履歴情報自体ではな
く単語特徴記憶ステップにて記憶した内容に基づき分類
されたカテゴリごとの特徴データに従って提供情報を検
索することができるため、利用者に提供すべき情報を迅
速かつ的確に検索できる。その結果、利用者の利用履歴
から利用者の興味の高い情報を迅速かつ的確に抽出し、
その情報を用いて利用者の興味を反映した情報を検索し
提供することができる情報提供方法を実現するプログラ
ムを記録した記録媒体を提供することができる。
【0040】第18の発明に係る機械読取可能な記録媒
体は、第17の発明の構成に加えて、単語特徴更新ステ
ップは、複数の履歴情報とその特徴ベクトルとに基づい
て、単語特徴記憶ステップにて記憶した内容に単語およ
びその単語に対応する単語特徴ベクトルを追加するステ
ップを含む。
【0041】第18の発明によると、単語特徴更新ステ
ップは、複数の履歴情報とその特徴ベクトルとに基づい
て、単語特徴記憶ステップにて記憶した内容に単語およ
びその単語に対応する単語特徴ベクトルを追加する。こ
れにより、単語特徴記憶ステップにて記憶されていなか
った単語およびその単語の単語特徴ベクトルを生成し、
記憶させることができる。その結果、当初記憶させた単
語およびその単語の単語特徴ベクトルに加えて、多数の
単語に基づいて、利用者の利用履歴から利用者の興味の
高い情報を迅速かつ的確に抽出し、その情報を用いて利
用者の興味を反映した情報を検索し提供することができ
る情報提供方法を実現するプログラムを記録した記録媒
体を提供することができる。
【0042】第19の発明に係る機械読取可能な記録媒
体は、第17または18の発明の構成に加えて、単語特
徴更新ステップは、複数の履歴情報とその特徴ベクトル
とに基づいて、単語特徴記憶ステップにて記憶した単語
特徴ベクトルを更新するステップを含む。
【0043】第19の発明によると、単語特徴更新ステ
ップは、複数の履歴情報とその特徴ベクトルとに基づい
て、単語特徴記憶ステップにて記憶した単語特徴ベクト
ルを更新する。これにより、利用履歴情報の変化に対応
させて単語特徴ベクトルを生成し、単語特徴更新ステッ
プにて更新することができる。その結果、利用履歴情報
の変化に対応させて当初記憶させた単語特徴ベクトルを
更新して、更新された単語特徴ベクトルに基づいて、利
用者の利用履歴から利用者の興味の高い情報を迅速かつ
的確に抽出し、その情報を用いて利用者の興味を反映し
た情報を検索し提供することができる情報提供方法を実
現するプログラムを記録した記録媒体を提供することが
できる。
【0044】第20の発明に係る機械読取可能な記録媒
体は、第17〜19のいずれかの発明の構成に加えて、
特徴ベクトル生成ステップは、履歴情報に含まれる各単
語に割当てられる第1の重みを算出する第1の重み算出
ステップと、複数の履歴情報の各々について、履歴情報
に含まれる単語に対応する単語特徴ベクトルに第1の重
みを付けた第1のベクトルを算出し、算出された第1の
ベクトルを互いに加算する加算ステップとを含む。
【0045】第20の発明によると、第1の重み算出ス
テップは、履歴情報に含まれる各単語に割当てられる第
1の重みを算出する。加算ステップは、複数の履歴情報
の各々について、履歴情報に含まれる単語に対応する単
語特徴ベクトルに第1の重みを付けた第1のベクトルを
算出し、算出された第1のベクトルを互いに加算する。
これにより、利用者の履歴情報ごとの特徴ベクトルを算
出する場合において、単語に対応させた第1の重み(た
とえば、単語の出現頻度に対応させて設定する重み)に
基づいて履歴情報ごとの特徴ベクトルを算出できる。そ
の結果、単語特徴記憶ステップにて記憶した単語特徴ベ
クトルを適切に更新することができる。
【0046】第21の発明に係る機械読取可能な記録媒
体は、第17〜19のいずれかの発明の構成に加えて、
特徴ベクトル生成ステップは、単語特徴ベクトルの成分
ごとに割当てられる重みを算出する重み算出ステップ
と、複数の履歴情報の各々について、履歴情報に含まれ
る単語に対応する単語特徴ベクトルの成分に重みを付け
たベクトルを算出し、算出されたベクトルを互いに加算
する加算ステップとを含む。
【0047】第21の発明によると、重み算出ステップ
は、単語特徴ベクトルの成分ごとに割当てられる重みを
算出する。加算ステップは、複数の履歴情報の各々につ
いて、履歴情報に含まれる単語に対応する単語特徴ベク
トルの成分に重みを付けたベクトルを算出し、算出され
たベクトルを互いに加算する。これにより、利用者の履
歴情報ごとの特徴ベクトルを算出する場合において、単
語ベクトルの成分に対応させた重み(たとえば、単語ベ
クトルの特定の成分の出現頻度に対応させて設定する重
み)に基づいて履歴情報ごとの特徴ベクトルを算出でき
る。その結果、単語特徴記憶ステップにて記憶した単語
特徴ベクトルを適切に更新することができる。
【0048】第22の発明に係る機械読取可能な記録媒
体は、第20の発明の構成に加えて、特徴ベクトル生成
ステップは、単語特徴ベクトルの成分ごとに割当てられ
る第2の重みを算出する第2の重み算出ステップをさら
に含み、加算ステップは、複数の履歴情報の各々につい
て、履歴情報に含まれる単語に対応する単語特徴ベクト
ルの成分に第2の重みを付けた第2のベクトルを算出
し、第2のベクトルに第1の重みを付けた第1のベクト
ルを算出し、算出された第1のベクトルを互いに加算す
るステップを含む。
【0049】第22の発明によると、第2の重み算出ス
テップは、単語特徴ベクトルの成分ごとに割当てられる
第2の重みを算出する。加算ステップは、複数の履歴情
報の各々について、履歴情報に含まれる単語に対応する
単語特徴ベクトルの成分に第2の重みを付けた第2のベ
クトルを算出し、第2のベクトルに第1の重みを付けた
第1のベクトルを算出し、算出された第1のベクトルを
互いに加算する。これにより、利用者の履歴情報ごとの
特徴ベクトルを算出する場合において、単語ベクトルの
成分に対応させた第2の重み(たとえば、単語ベクトル
の特定の成分の出現頻度に対応させて設定する重み)
と、単語に対応させた第1の重み(たとえば、単語の出
現頻度に対応させて設定する重み)とに基づいて履歴情
報ごとの特徴ベクトルを算出できる。その結果、単語特
徴記憶ステップにて記憶された単語特徴ベクトルを適切
に更新することができる。
【0050】第23の発明に係る機械読取可能な記録媒
体は、第17〜22のいずれかの発明の構成に加えて、
利用者を識別する利用者識別ステップをさらに含み、利
用履歴記憶ステップは、利用者別に情報を記憶する複数
の記憶ステップを含み、単語特徴更新ステップは、利用
者識別ステップにより識別された利用者が変更されたこ
とを検知すると、単語特徴ベクトルを、識別された利用
者の履歴情報とその特徴ベクトルとに基づいて、単語特
徴記憶ステップにて記憶した内容を更新するステップを
含む。
【0051】第23の発明によると、利用者識別ステッ
プは、利用者を識別し、利用履歴記憶ステップは、利用
者別に情報を記憶する。単語特徴更新ステップは、利用
者識別ステップにより識別された利用者が変更されたこ
とを検知すると、単語特徴ベクトルを、識別された利用
者の履歴情報とその特徴ベクトルとに基づいて、単語特
徴記憶ステップにて記憶した内容を更新する。これによ
り、利用者ごとの履歴情報に基づいて、単語特徴記憶ス
テップにて記憶した内容を更新することができる。その
結果、利用者ごとに利用者の利用履歴から利用者の興味
の高い情報を迅速かつ的確に抽出し、その情報を用いて
利用者の興味を反映した情報を検索し提供することがで
きる情報提供方法を提供することができる。
【0052】第24の発明に係る機械読取可能な記録媒
体は、第17〜23のいずれかの発明の構成に加えて、
提供可能情報特徴データは、各提供可能な情報に出現す
る単語に対応する単語特徴ベクトルを含み、利用履歴情
報特徴データは、各分類ごとに含まれる利用履歴情報に
出現する単語に対応する単語特徴ベクトルを含み、提供
情報検索ステップは、提供可能情報特徴データに含まれ
る単語特徴ベクトルと利用履歴情報特徴データに含まれ
る単語特徴ベクトルとにより検索するステップを含む。
【0053】第24の発明によると、提供情報検索ステ
ップは、提供可能情報特徴データに含まれる単語特徴ベ
クトルと利用履歴情報特徴データに含まれる単語特徴ベ
クトルとにより検索する。これにより、ベクトルによる
演算を用いて、情報を検索することができ、利用者に提
供する情報をさらに正確に検索できる情報提供方法を実
現できる。その結果、利用者の利用履歴から利用者の興
味の高い情報を迅速かつ的確に抽出し、その情報を用い
て利用者の興味を反映した情報を検索し提供することが
できる情報提供方法を実現するプログラムを記録した記
録媒体を提供することができる。
【0054】
【発明の実施の形態】以下、図面を参照しつつ、本発明
の実施の形態について説明する。以下の説明では、同一
の部品には同一の符号を付してある。それらの名称およ
び機能も同じである。したがってそれらについての詳細
な説明の繰返しは適宜省略する。 <第1の実施の形態>図1を参照して、本発明の第1の
実施の形態に係る情報提供装置は、利用者が過去に利用
した情報などを含む操作履歴データを入力する入力部2
と、利用者を識別する利用者識別部4と、単語と単語の
特徴を表わす単語ベクトルとをそれぞれ対応付けて記憶
した単語辞書6と、利用者に提供可能な情報を記憶する
提供可能データ記憶部8と、入力部2と利用者識別部4
とに接続され、入力部2から入力された利用者の操作履
歴データを利用者ごとに記憶する操作履歴データ記憶部
10と、操作履歴データから生成した操作履歴ベクトル
を記憶する操作履歴ベクトル記憶部12と、操作履歴ベ
クトルをクラスタリング処理して分類し、その分類ごと
の特徴データである興味情報を記憶する興味情報記憶部
14と、検索した結果をモニタ、プリンタなどに出力す
る出力部16と、利用者の興味が高い情報を検索する興
味情報処理部30とを含む。
【0055】興味情報処理部30は、実際にはコンピュ
ータ上で実行されるソフトウェアにより実現されるが、
利用者を識別したり操作履歴データの種類を識別したり
するデータ識別処理部32と、操作履歴データおよび提
供可能データに含まれる単語の中で情報提供処理に不要
な単語を削除する不要語処理部34と、単語辞書6に記
憶された単語に基づいて操作履歴データおよび提供可能
データから単語を抽出する単語抽出処理部36と、単語
辞書6に記憶された単語ベクトルおよび抽出された単語
に基づいて操作履歴データごとの特徴を表わす操作履歴
ベクトルを生成するベクトル生成処理部38と、操作履
歴ベクトルを距離の近いベクトル同士に分類するクラス
タリング処理部40と、所定のタイミングでクラスタリ
ング処理部40に動作の指示を出力する更新処理部42
と、クラスタリング処理部40で分類されたカテゴリご
とに興味情報を生成する興味情報生成処理部44と、興
味情報に基づいて提供可能データの中で利用者に対応し
た提供情報を検索する検索処理部46と、検索された提
供情報を重要度順に並べ替える提示情報選定処理部48
とを含む。
【0056】さらに、興味情報処理部30は、単語辞書
6に記憶された単語ベクトルを更新したり、単語辞書に
記憶されていない単語およびその単語に対応する単語ベ
クトルを単語辞書に記憶させたりする単語辞書修正処理
部7と、所定のタイミングで単語辞書修正処理部7に動
作の指示を出力する学習制御処理部37とを含む。
【0057】入力部2および利用者識別部4は、後述す
るコンピュータのキーボード、マウス、CD−ROM
(Compact Disc Read-Only Memory)駆動装置、FD(F
lexible Disk)駆動装置などであって、操作履歴デー
タ、利用者識別コードを入力する。入力される操作履歴
データは、たとえば、インターネットのホームページデ
ータ、テレビ番組の情報であるEPG(Electronic Pro
gram Guide)データであって、利用者が同じホームペー
ジ、同じテレビ番組を一定時間以上見続けたり、あるホ
ームページからデータをダウンロードしたり、あるテレ
ビ番組を録画したりした場合のホームページデータ、E
PGデータである。なお、入力された操作履歴データ
は、利用者識別コードとデータ種類識別コードとともに
操作履歴データ記憶部10に記憶される。なお、このよ
うな入力部2を介さずにインターネットなどを操作した
際の履歴データを固定ディスクに記憶しておき、コンピ
ュータの内部処理により、この履歴データから操作履歴
データを生成することもできる。
【0058】単語辞書6と提供可能データ記憶部8と操
作履歴データ記憶部10と操作履歴ベクトル記憶部12
と興味情報記憶部14とは、コンピュータの固定ディス
ク上の予め定めた記憶領域に存在し、該当するデータを
記憶するものである。
【0059】以下の説明では、利用者にとって興味のあ
るテレビ番組の情報を、そのテレビ番組に対応するEP
Gデータで提供する装置について説明する。
【0060】図2を参照して、提供可能データ記憶部8
に記憶されたデータは、放送予定の番組のEPGデータ
であって提供可能データの番号とそれぞれに対応したデ
ータ内容とを含む。このEPGデータの例において、E
PGデータは1行目に番組タイトル、2行目に放送日
時、放送時間、チャンネル、いわゆるGコード(登録商
標)、3行目に番組内容説明文を含む。
【0061】不要語処理部34は、操作履歴データおよ
び提供情報データに対して、利用者の興味には直接関係
しない部分を不要語として以降の処理で無視する処理を
行なう。本実施の形態では、図2および後述する図3に
示すEPGデータのデータ内容の第2行目(放送日時、
放送時間、チャンネル、Gコード)を不要語としてい
る。なお、この不要語処理は、インターネット上のホー
ムページデータを操作履歴データとした場合には、HT
ML(Hyper-Text Markup Language)のタグなどを取除
くという処理になる。
【0062】図3を参照して、操作履歴データ記憶部1
0に記憶されたデータは、利用者が一定時間見続けた
り、録画したりした番組のEPGデータであって、操作
履歴データの番号とそれぞれに対応したデータ内容とを
含む。データの内容については前述と同じであるため詳
細な説明は繰返さない。
【0063】図4を参照して、単語辞書6は、単語とそ
の単語に対応した単語ベクトルとを含む。単語辞書6
は、人手により単語およびその単語に対応する単語ベク
トルが入力されて記憶される基本的な単語(以下、基本
単語という。)と、後述する単語辞書修正処理により、
基本単語に基づいて単語ベクトルが生成されて記憶され
る単語とを含む。単語ベクトルは、文章中の単語が持つ
概念と文脈との関係の程度を示したものであり、個々の
単語が有する概念と予め定めた特徴単語との関係をベク
トル形式にて表現したものである。n個の特徴単語を例
として説明すると、ある単語の単語ベクトルはn次元ベ
クトルであって、その各要素の値は対応の特徴単語に対
応して定められる。基本単語Jの単語ベクトルをx
(J)=(xj(1),…,xj(m),…,xj
(n))とする。この各要素の値は、0≦xj(m)≦
A(Aは正の定数、m=1〜n)である。単語Jとm番
目の特徴単語との間に全く関係がない場合にはxj
(m)=0となり、関係がある場合にはxj(m)はそ
の関係の程度に応じた値を取る。以下の説明において
は、A=1を用いて説明する。たとえば、単語ベクトル
が10個の特徴単語(1)=「娯楽・趣味」、特徴単語
(2)=「地名」、特徴単語(3)=「自然」、特徴単
語(4)=「動的」、特徴単語(5)=「感情」、特徴
単語(6)=「変化」、特徴単語(7)=「複雑」、特
徴単語(8)=「喜楽」、特徴単語(9)=「活動」、
特徴単語(10)=「明るさ」から成り立っているもの
とし、それぞれの要素の値が0か1かの2値である場合
には、基本単語「お笑い」の単語ベクトルは(0,0,
0,0,0,0,0,1,1,1)などと表わすことが
できる。図4に示す単語辞書は、10次元(n=10)
の単語ベクトルを含む。
【0064】単語抽出処理部36は、図4に示す単語辞
書6に記憶された単語により、図2に示す提供可能デー
タおよび図3に示す操作履歴データのデータ内容から単
語抽出処理を行なう。
【0065】学習制御処理部37は、入力部2から入力
され操作履歴データ記憶部10に記憶された操作履歴デ
ータのデータ量が予め定められたデータ量を超えた場
合、利用者識別部4から入力され操作履歴データ記憶部
10に記憶された利用者が変更された場合、または前回
の単語辞書修正指示出力から予め定められた時間を経過
した場合などに、単語辞書修正処理部7へ単語辞書の修
正処理の指示を出力する。この場合、操作履歴データか
ら抽出された単語(単語辞書に記憶されていない単語)
の中で、単語辞書6に記憶する単語を選択させることも
できる。また、単語辞書6に記憶されている単語の中
で、単語ベクトルを修正する単語を選択させることもで
きる。また、操作履歴データの中から操作履歴データの
一部を選択して、選択された操作履歴データに基づいて
単語辞書6の修正を行わせることもできる。
【0066】単語辞書修正処理部7は、たとえば、電子
情報通信学会発行の信学技法AI92−99(1993
年1月22日発行)「大規模データベースからの連想検
索」で提案されたブートストラップ学習に基づいて、単
語辞書6の修正処理を行なう。このブートストラップ学
習を用いて、操作履歴データに含まれる単語に基づい
て、単語辞書6に記憶されていない単語とその単語に対
応した単語ベクトルとを生成したり、単語辞書6に記憶
されている単語の単語ベクトルを修正したりする。基本
単語とその単語に対応する単語ベクトルは人手により単
語辞書6に入力され、入力された基本単語に基づいて、
ブートストラップ学習を行うことにより基本単語以外の
単語の単語ベクトルが生成される。なお、この単語辞書
修正処理については、このブートストラップ学習による
処理には限定されない。また、この処理の詳細について
は、後述する。
【0067】ベクトル生成部38は、図4に示す単語辞
書6に記憶された単語ベクトルにより、図3に示す操作
履歴データごとに抽出された単語に対応した単語ベクト
ルのベクトル和を計算し、操作履歴ベクトルを生成す
る。たとえば、図3の操作履歴データ1の場合には、不
要語処理部34でデータ内容の第2行目を不要語とする
処理をして、不要語の処理がされたデータに対して単語
抽出処理部36により図4に示す単語辞書6に記憶され
た単語を抽出する。この結果、図3の操作履歴データ1
について「今日」、「旅行」、「気分」、「温泉」、
「紹介」の5単語を抽出する。図4に示す単語辞書6に
記憶された抽出単語の各々に対応する単語ベクトルの和
を計算する。この結果、操作履歴データ1のベクトルは
(3,2,1,2,1,0,0,0,2,1)となる。
これを操作履歴ベクトル記憶部12に記憶する(図
5)。
【0068】クラスタリング処理部40は、利用者の操
作履歴である操作履歴データから生成した複数の操作履
歴ベクトルに基づいて自己組織化マップを用いて、操作
履歴データを後述するカテゴリに分類する。クラスタリ
ング処理の手法は、前述の操作履歴ベクトルを互いに近
い(「近い」とはベクトル間の互いのユークリッド距離
または余弦角が小さいことを意味する。以下同じ。)も
の同士に分類できるものであればよく、特定のものには
限定されない。たとえば、多次元空間内に存在する個々
の要素に対してクラスタリング処理を行なう手法は、階
層的手法によるものや、非階層的手法によるものなどが
ある。
【0069】本実施の形態におけるクラスタリング手法
は、自己組織化マップを用いる。自己組織化マップの学
習モデルについての詳細は、T. Kohonen,“The Self-or
ganizing map”, Proc. IEEE, vol.78(9), p.1464〜80
に記載がある。自己組織化マップは、T. Kohonenによっ
て提案された手法で、ニューラルネットワークに基づく
教師なし競合学習モデルであり、多次元の特性値で表現
されるベクトルデータを、通常2次元に位相配置できる
特徴がある。
【0070】ここでは、単語ベクトルで表現された各操
作履歴ベクトルを学習用の入力データとして教師なし学
習を行なう。出力層の各ユニットは2次元空間に位相配
置されており、入力データと同次元のベクトルを有して
いる。学習は、各ユニットのベクトルを入力データに選
択的に近づけることによって進められる。まず、ある入
力データに対して最も近いベクトルを持つユニットを見
つける。次に、このユニットの近傍領域内にある複数の
ユニットについて、それぞれのベクトルを入力データに
近づける。この近傍領域以外のユニットのベクトルは、
更新せずそのままとする。一定回数の学習を行なった
後、各操作履歴ベクトルを最も近いベクトルを持つユニ
ットに写像することで終了する。この結果、単語ベクト
ルが同一と見なされる操作履歴データは、同一のユニッ
トに、特徴が類似していると見なされる操作履歴データ
は、近接のユニットに配置されて分類される。この同一
および近接のユニットについてまとめたものをカテゴリ
という。
【0071】更新処理部42は、クラスタリング処理部
40に対して、クラスタリング処理の指示を与える。た
とえば、更新処理部42は、一定時間間隔でクラスタリ
ング処理を指示したり、操作履歴データ記憶部10に一
定量以上操作履歴データが蓄積するとクラスタリング処
理を指示したりする。
【0072】興味情報生成処理部44は、カテゴリに分
類された操作履歴データに含まれる単語を調べて、分類
ごとに出現する単語を抽出し興味情報とする。たとえ
ば、図5に示す操作履歴データ1〜5を自己組織化マッ
プによる手法でクラスタリング処理をすると、図6に示
すようにカテゴリ1〜3に分類される。分類されたカテ
ゴリごとに出現単語をまとめると、図7のようなカテゴ
リごとの興味情報となる。これを興味情報記憶部14に
記憶する。
【0073】検索処理部46は、図2に示す提供可能デ
ータと興味情報とから、利用者の興味に合致する提供情
報を検索する。検索処理部46は、カテゴリごとに興味
情報の単語と、提供可能データに含まれる単語との一致
度(「検索点数1」という。)を以下の式1で評価す
る。 [式1] 検索点数1=提供可能データに含まれる興味情報の単語
の数×100/興味情報の単語の数 たとえば、図7に示すカテゴリ1における図2の提供可
能データ1の検索点数1について説明する。提供可能デ
ータ1に出現する単語は、不要語処理部34にて不要語
が処理され、単語抽出処理部36により抽出された「ニ
ュース」、「テレビ」、「事件」、「スポーツ」の4単
語である。これらは、カテゴリ1の興味情報である「ニ
ュース」、「スポーツ」などの8単語の中の3単語
(「ニュース」、「テレビ」、「スポーツ」)を含む。
よって検索点数1は、3×100/8=37.5とな
る。
【0074】提示情報選定処理部48は、検索処理部4
6における検索結果が、利用者の操作履歴データと重複
していた場合には当該検索結果を除外したり、提供する
情報を重要度順に並べ替えたりする。
【0075】前述のように興味情報処理部30は実際に
は、パーソナルコンピュータまたはワークステーション
など、コンピュータ上で実行されるソフトウェアにより
実現される。図8に、利用者に対する情報提供装置の一
例であるコンピュータの外観を示す。図8を参照して、
このコンピュータ60は、FD駆動装置82およびCD
−ROM駆動装置84とを備えたコンピュータ本体70
と、モニタ88と、プリンタ86と、キーボード76
と、マウス74とを含む。
【0076】図9に、このコンピュータ60の構成をブ
ロック図形式で示す。図9に示すように、コンピュータ
60はFD駆動装置82およびCD−ROM駆動装置8
4に加えて、相互にバスで接続されたCPU72(Cent
ral Processing Unit)と、メモリ78と、固定ディス
ク80とを含む。FD駆動装置82にはFD90が装着
される。CD−ROM駆動装置84にはCD−ROM9
2が装着される。
【0077】既に述べたように、利用者に対して情報を
提供する装置は、コンピュータハードウェアとCPU7
2により実行されるソフトウェアとにより実現される。
一般的にこうしたソフトウェアは、FD90、CD−R
OM92などの記録媒体に格納されて流通し、FD駆動
装置82またはCD−ROM駆動装置84などにより記
録媒体から読取られて固定ディスク80に一旦格納され
る。さらに固定ディスク80からメモリ78に読出され
て、CPU72により実行される。図8および図9に示
したコンピュータのハードウェア自体は一般的なもので
ある。したがって、本発明の最も本質的な部分は、FD
90、CD−ROM92、固定ディスク80などの記録
媒体に記録されたソフトウェアである。
【0078】なお、図8および図9に示したコンピュー
タ自体の動作は周知であるので、ここではその詳細な説
明は繰返さない。
【0079】図10を参照して、操作履歴データ処理に
ついて説明する。ステップ2(以下、ステップをSと略
す。)にて開始される操作履歴データ処理は、操作履歴
データの蓄積量が一定量を超えたり、前回の操作履歴デ
ータ処理から一定時間を経過したりした場合に行なわれ
る。
【0080】S4にて、CPU72は、入力部2などか
ら入力されて操作履歴データ記憶部10に記憶されてい
る操作履歴データを、固定ディスク80から読出しメモ
リ78に格納する。このとき、操作履歴データ記憶部1
0に記憶されている利用者識別コード、データ識別コー
ドをあわせて読出す。
【0081】S6にて、データ識別処理部32は、S4
で読出されたデータの種類を判別する。この判断は、S
2で読出されたデータ識別コードにより行なう。以下の
説明では、データ識別処理部32がデータの種類をEP
Gデータであると判断したものとして説明する。
【0082】S8にて、不要語処理部34は、S4で読
出された操作履歴データに対する不要語を抽出し、これ
以降の処理で無視する不要語処理を行なう。S6にて、
識別したデータの種類に基づいて不要語が決定される。
たとえば、図3に示すEPGデータの場合には、利用者
の興味と直接関係のない、第2行目の放送日、放送時
間、放送局、Gコードが不要語として決定される。操作
履歴データ1の場合、このS8における処理の結果、操
作履歴データ1は「今日は旅行気分」、「温泉を紹介」
というデータとなる。
【0083】S10にて、CPU72は、不要語処理が
された操作履歴データを操作履歴データ記憶部10に一
旦格納する。
【0084】S12にて、CPU72は、固定ディスク
80に記憶された単語辞書6の中で操作履歴データの種
類に合致した単語辞書を読出した後、S10にて、CP
U72は、操作履歴データ記憶部10から一旦格納した
操作履歴データを読出す。
【0085】S14にて、単語抽出処理部36は、読出
した操作履歴データに対し、操作履歴データごとに単語
辞書6に基づく単語抽出処理を行なう。
【0086】S16にて、ベクトル生成処理部38は、
操作履歴ごとの操作履歴ベクトルを、S14で操作履歴
ごとに抽出した単語に対応した単語ベクトルのベクトル
和として生成する。
【0087】S18にて、CPU72は、操作履歴ごと
の操作履歴ベクトルを操作履歴ベクトル記憶部12に記
憶する。たとえば、図3に示す操作履歴データでは、操
作履歴データ1〜6に対応する6つの操作履歴ベクトル
が記憶される(図5)。
【0088】次に、図11を参照して、提供可能データ
処理について説明する。S22にて、提供可能データ記
憶部8に記憶されたデータが更新されると、提供可能デ
ータ処理が開始される。なお、この開始タイミングは、
前述の操作履歴データ処理の開始タイミングと同期を取
る必要はない。
【0089】S23にて、CPU72は、単語辞書修正
処理部7による単語辞書6の修正が完了しているか否か
を判断する。単語辞書6の修正が完了していると(S2
3にてYES)、処理はS24に移される。一方、単語
辞書6の修正が完了していないと(S23にてNO)、
処理はS23に戻され、単語辞書修正処理部7による単
語辞書6の修正の完了を待つ。
【0090】S24にて、CPU72は、入力部2など
から入力されて提供可能データ記憶部8に記憶されてい
る提供可能データを読出す。このとき、メモリ78に保
持されている利用者識別コードおよびデータ識別コード
に従い、利用者識別コードに合致しかつデータ識別コー
ドに合致する提供可能データを読出す。
【0091】S26にて、不要語処理部34は、S24
にて読出した提供可能データに対する不要語を抽出し、
以降の処理で無視する不要語処理を行なう。
【0092】S28における処理はS10における処理
に、S30における処理はS12における処理に、S3
2における処理はS14における処理に各々相当するた
め、ここでは詳細な説明は繰返さない。このような処理
の結果、たとえば、図2に示す提供可能データ1につい
ては、「ニュース」、「テレビ」、「事件」、「スポー
ツ」の4つの単語が抽出される。
【0093】S34にて、CPU72は、提供可能デー
タごとに抽出された単語を提供可能データ記憶部8に記
憶させる。
【0094】次に、図12を参照して、提供情報検索処
理について説明する。S44にて、CPU72は、更新
処理部42から提供情報検索処理の更新指示が出されて
いるか否かを判断する。更新指示部42からの更新指示
がされていると(S44でYES)、処理はS46へ移
される。一方、更新指示がされていないと(S44でN
O)、処理はS44へ戻され、更新指示を待つ。
【0095】S46にて、CPU72は、操作履歴ベク
トル記憶部12に記憶された操作履歴ごとの操作履歴ベ
クトルを読出す(図5)。
【0096】S48にて、クラスタリング処理部40
は、読出された操作履歴ベクトルに自己組織化マップ手
法を適用することにより、ベクトル同士の近さによって
操作履歴データをカテゴリごとに分類する。図5に示す
6個の操作履歴データ1から6は、図6に示す3つのカ
テゴリに分類される。カテゴリ1は、ニュースやスポー
ツに関し、カテゴリ2は旅行に関し、カテゴリ3はバラ
エティに関する。このカテゴリは操作履歴データの特徴
をもとに分類されたものであって、それぞれのカテゴリ
が利用者の興味を示していると考えることができる。
【0097】S50にて、興味情報生成処理部44は、
S48にて分類されたカテゴリから利用者の興味情報を
生成する。図4に示す単語辞書6に基づいて、各カテゴ
リに含まれる操作履歴データに含まれるすべての単語を
利用者の興味情報とする。たとえば、図6のカテゴリ3
の興味情報は「爆笑」、「コント」、「気分」の3つの
単語で表わされる(図7)。
【0098】S52にて、興味情報生成処理部44は、
S50にて生成した興味情報を興味情報記憶部14に記
憶する。
【0099】S54にて、CPU72は、提供可能デー
タ記憶部8から、提供可能データを読出し、S56に
て、CPU72は、興味情報記憶部14から興味情報デ
ータを読出す。
【0100】S58にて、検索処理部46は、S56に
て読出した興味情報データに基づいて、S54にて読出
した提供可能データの中から利用者に対応した興味情報
を検索する。図7に示す各カテゴリについて、図2に示
す提供可能データのそれぞれについての検索点数1を算
出する。それらの検索点数1の中で1位のものを示すと
次のようになる。
【0101】 S60にて、提示情報選定処理部48は、S58で検索
した各カテゴリごとの1位の提供可能データの出力順序
を定める。図6に示すように、カテゴリ1には3件の操
作履歴データが、カテゴリ2には2件の操作履歴データ
が、カテゴリ3には1件の操作履歴データが含まれてい
る。操作履歴データが多く含まれるカテゴリは、利用者
の興味が集中しており重要度が高いと考えられる。その
ため、カテゴリを操作履歴データ件数の多い順に並べ
る。並べたカテゴリの順に従って、各カテゴリにおける
検索点数1の1位の提供可能データを出力する。図6に
示す場合には、カテゴリ1、カテゴリ2、カテゴリ3の
順になり、提供情報の出力順序は、提供可能データ1、
提供可能データ3、提供可能データ5、提供可能データ
2の順となる。
【0102】S62にて、CPU72は、S60にて定
めた順序に従って出力部16から利用者に提供可能デー
タを出力する。
【0103】図13および図14を参照して,単語辞書
修正処理について説明する。S72にて、CPU72
は、学習制御処理部37から単語辞書修正処理部7へ単
語辞書の学習制御の指示がされたか否かを判断する。学
習制御の指示があると(S72にてYES)、処理はS
74へ移される。一方、学習制御の指示がないと(S7
2にてNO)、処理はS72へ戻され、学習制御の指示
を待つ。
【0104】S74にて、CPU72は、変数Iを初期
化(I=1)する。S76にて、CPU72は、操作履
歴データ記憶部10から操作履歴データ(I)を読出
す。読出した操作履歴データ(I)は、操作履歴データ
ごとにメモリ78の所定のレコードに格納する。この場
合、図3に示す操作履歴データ1のデータ内容がレコー
ド1に格納される。
【0105】S78にて、CPU72は、所定のレコー
ドに格納された操作履歴データ(I)から単語を抽出す
る。この場合、抽出される単語は、単語辞書6に単語お
よびその単語に対応する単語ベクトルが記憶された基本
単語と、基本単語以外の単語とを含む。
【0106】S80にて、CPU72は、変数Iについ
てI=I+1の演算を行なう。S82にて、CPU72
は、変数Iが操作履歴データ数を上回っているか否かを
判断する。変数Iが操作履歴データ数を上回っていると
(S82にてYES)、処理はS84へ移される。一
方、変数Iが操作履歴データ数以下であると(S82に
てNO)、処理はS76へ戻され、操作履歴データ記憶
部10からさらに別の操作履歴データを読出して単語抽
出処理を行なう。
【0107】S84にて、CPU72は、操作履歴デー
タから抽出された全ての単語に基づいて重みを算出す
る。算出された特徴単語の重みと単語ベクトルの重みと
は、メモリ78に格納される。なお、これら重みに関す
る詳細は後述する。
【0108】S86にて、CPU72は、変数Iを初期
化(I=1)する。S88にて、CPU72は、操作履
歴データ(I)から抽出した単語に含まれる基本単語の
単語ベクトルに重みを付けて、操作履歴データ(I)の
特徴ベクトルRSV(I)を以下の式2により算出す
る。 [式2] RSV(I)=cΣ{W(J)P(I,J)(a(1)
xj(1),…,a(n)xj(n))} この式2において、演算Σは、Jが1から操作履歴デー
タ(I)に含まれる基本単語の数までについて行なわれ
る。cはベクトルRSV(I)を所定の長さにするため
の係数、W(J)は操作履歴データにおける基本単語J
の重み、P(I,J)は利用履歴データ(I)(レコー
ドI)における基本単語Jの出現頻度、(a(1),
…,a(n))はそれぞれの特徴単語の重み、(xj
(1),…,xj(n))は基本単語Jの単語ベクトル
を表わしている。なお、xj(1)は、基本単語Jの特
徴単語(1)に対するベクトルの成分であり、xj
(n)は、基本単語Jの特徴単語(n)に対するベクト
ルの成分であり、いずれも0か1の値である。なお、本
発明はこれに限定されるものではなく、特徴単語との関
係の度合いを数値化したものを複数のビットデータで表
現してもよい。
【0109】基本単語の重みW(J)は、利用履歴デー
タの中の基本単語Jの出現頻度により算出される。たと
えば、以下の式3により算出される。 [式3] W(J)=log(N/df(J)) この式3において、Nは全レコード数、df(J)は、
基本単語Jを含むレコード数を示す。すなわち、あるレ
コードに偏って出現する基本単語ほど重要であるため、
重みW(J)が大きくなる。
【0110】特徴単語の重み(a(1),…,a
(n))は、基本単語中の各特徴単語の出現頻度により
算出される。たとえば、以下の式4により算出される。 [式4] a(m)=log(NC/fc(m))、(m=1〜
n) この式4において、NCは基本単語の数、fc(m)は
特徴単語(m)が付与された基本単語の数を示す。すな
わち、多くの基本単語に付与されている特徴単語は単語
を意味的に分類する上での効果が小さいため、特徴単語
の重みa(m)は小さくなる。たとえば、特徴単語
(3)=「自然」、特徴単語(4)=「動的」であっ
て、基本単語の中で、特徴単語「動的」が少ない基本単
語にしか付与されておらず、かつ、特徴単語「自然」が
多くの基本単語に付与されている場合、式4により算出
される重みは、a(3)<a(4)となる。多くの基本
単語に付与されていない特徴単語(4)の重みa(4)
の方が大きくなる。
【0111】このような処理は、n次元の単語ベクトル
を有効的に活用するために、n個の特徴単語が均等に基
本単語に付与されている必要があるために行なわれる。
このため、上述の式2は、式3および式4を用いて、レ
コード中に含まれている基本単語について、ブートスト
ラップ学習により特徴単語の偏りが小さくなるように、
その単語ベクトルを特徴単語の重みで変調して、操作履
歴データにおける単語の重みとレコード内の単語の頻度
とにより重み付けして加算したベクトルの和を一定の長
さに正規化したものである。なお、上述の特徴単語の重
みと単語ベクトルの重みとは、S84にて算出されメモ
リ78に格納されている。
【0112】S90にて、CPU72は、S88にて算
出したベクトルRSV(I)をメモリ78に格納する。
S92にて、CPU72は、変数IについてI=I+1
の演算を行なう。S94にて、CPU72は、変数Iが
操作履歴データ数を上回っているか否かを判断する。変
数Iが操作履歴データ数を上回っていると(S94にて
YES)、処理は図14のS96へ移される。一方、変
数Iが操作履歴データ数以下であると(S94にてN
O)、処理はS86へ戻され、さらに別のベクトルRS
V(I)を算出する。
【0113】S96にて、CPU72は、変数Iを初期
化(I=1)する。S98にて、CPU72は、変数K
を初期化(K=1)する。S100にて、CPU72
は、操作履歴データ(I)から抽出したK番目の単語
(I,K)を選択する。この場合、選択された単語
(I,K)は、既に単語辞書6に単語ベクトルが登録さ
れている基本単語であったり、単語辞書6に登録されて
いない単語であったりする。
【0114】S102にて、CPU72は、S100に
て選択した単語(I,K)を含む操作履歴データの特徴
ベクトルRSVを抽出する。単語(I,K)を含む操作
履歴データの特徴ベクトルに重みを付けて、重みを付け
たものを加算する。これは、以下の式5で算出される。 [式5] T’(I,K)=Σ{P(I,K)RSV(I)} この式5において、演算Σは、単語(I,K)を含む操
作履歴データ(I)の操作履歴データRSV(I)につ
いて行なわれる。すなわち、重みP(I,K)が乗算さ
れて加算されるのは、単語(I,K)を含む操作履歴デ
ータ(I)の操作履歴データRSV(I)である。P
(I,K)は、利用履歴データ(I)(レコードI)に
おける単語(I,K)の出現頻度を示す。また、加算さ
れて算出された単語(I,K)に対するT’(I,K)
は、メモリ78に単語(I,K)とともに格納される。
【0115】S104にて、CPU72は、変数Kにつ
いてK=K+1の演算を行なう。S106にて、CPU
72は、変数Kが操作履歴データ(I)から抽出された
単語数を上回っているか否かを判断する。変数Kが操作
履歴データ数(I)から抽出された単語数を上回ってい
ると(S106にてYES)、処理はS108へ移され
る。一方、変数Kが操作履歴データ(I)から抽出され
た単語数以下であると(S106にてNO)、処理はS
100へ戻され、操作履歴データ(I)から抽出された
他の単語について、T’(I,K)を算出する。なお、
単語(I,K)は、同じ操作履歴データの中において
も、異なる操作履歴データ間においても重複して出現す
ることがある。このような場合、一旦算出したT’と同
じ単語についてT’を算出する場合には、再計算するこ
となくS102の処理を行わないようにして、メモリ7
8に格納されたT’を用いると、重複する計算を省略で
きる。
【0116】S108にて、CPU72は、変数Iにつ
いてI=I+1の演算を行なう。S110にて、CPU
72は、変数Iが操作履歴データ数を上回っているか否
かを判断する。変数Iが操作履歴データ数を上回ってい
ると(S110にてYES)、処理はS112へ移され
る。一方、変数Iが操作履歴データ数以下であると(S
110にてNO)、処理はS98へ戻され、次の操作履
歴データにおける単語を抽出して、抽出された他の単語
について、T’(I,K)を算出する。
【0117】S112にて、CPU72は、単語(T,
K)の単語ベクトルを変更する。この場合、単語(I,
K)が既に単語辞書6に単語およびその単語の単語ベク
トルが記憶されている単語である場合には、T’(I,
K)を正規化したものを単語ベクトルとして更新する。
また、単語(I,K)が単語辞書6に記憶されていない
単語である場合には、単語(T,K)とT’(I,K)
を正規化したものとを記憶する。
【0118】以上のような構造およびフローチャートに
基づく興味情報提供装置の動作について説明する。
【0119】利用者は、放送予定のEPGデータが記憶
されたFD90、CD−ROM92などをコンピュータ
のFD駆動装置82、CD−ROM駆動装置84に挿入
し、EPGデータを提供可能データ記憶部8に記憶させ
る。また、利用者が一定時間見続けたり録画したりした
番組のEPGデータを同様の方法により操作履歴データ
記憶部10に記憶させる。このとき利用者は利用者識別
コードを利用者識別部4から入力する。
【0120】入力された操作履歴データの種類がデータ
識別処理部32により識別される(S6)。その種類に
従って不要語処理部34により不要な単語の処理がなさ
れる(S8)。その後、操作履歴データはユーザ識別コ
ードとともに操作履歴データ記憶部10に記憶される
(S10)。
【0121】入力された提供可能データに対しては、不
要語処理部34により不要な単語の処理がなされ(S2
6)、単語抽出処理部36により単語辞書6に基づいて
データ内の単語が抽出され(S32)、提供可能データ
記憶部8に記憶される(S34)。
【0122】記憶された操作履歴データに対しては、単
語抽出処理部36により単語辞書6に基づいてデータ内
の単語が抽出される(S14)。ベクトル生成処理部3
8により操作履歴データごとに抽出された単語に対応し
た単語ベクトルのベクトル和が計算される(S16)。
その後、このベクトル和は操作履歴ベクトル記憶部12
に記憶される(S18)。
【0123】前回の興味情報提供時から一定時間が経過
していたり、操作履歴データが一定量以上蓄積していた
りすると(S44にてYES)、操作履歴ベクトルが読
出されクラスタリング処理部40によりカテゴリに分類
される(S48)。興味情報生成処理部44により、分
類されたカテゴリごとに含まれる操作履歴データに出現
するすべての単語を抽出した興味情報が生成される(S
50)。検索処理部46により、利用者ごとの興味情報
に基づいて、提供可能データの中で、利用者の興味が高
い情報を検索して(S58)、提示情報選定処理部48
により情報の出力順序を定める(S60)。出力部16
は、その出力順序に従って、モニタ88やプリンタ86
に利用者の興味が高い情報を出力する(S62)。
【0124】操作履歴データ記憶部10に記憶された操
作履歴データのデータ量が予め定められたデータ量を超
えた場合、利用者識別部4が利用者の変更を検知した場
合、または、前回の単語辞書修正から予め定められた時
間を経過した場合、単語辞書修正処理が開始される(S
72にてYES)。操作履歴データ記憶部10に記憶さ
れた操作履歴データが読み出され(S76)、操作履歴
データから基本単語が抽出される(S78)。操作履歴
データの全てを読み出して、単語の抽出が終わると(S
82にてYES)、抽出された基本単語などから、式3
と式4とに基づいて、基本単語の重みと特徴単語の重み
とが算出される(S84)。
【0125】操作履歴データごとに、式2に基づいて、
基本単語の単語ベクトルと基本単語の重みと特徴単語の
重みとを用いて、操作履歴データ(I)の特徴ベクトル
RSV(I)が算出される(S88)。操作履歴データ
の全てについて特徴ベクトルの算出が終わると(S94
にてYES)、操作履歴データの中から単語(基本単語
および基本単語以外の単語)を選択する(S100)。
選択された単語について、その単語を含む操作履歴デー
タの特徴ベクトルのベクトル和が算出される(S10
2)。全ての操作履歴データに含まれる全ての単語につ
いて特徴ベクトルのベクトル和の算出が終わると(S1
06にてYES、S110にてYES)、特徴ベクトル
のベクトル和を正規化して、単語辞書6に反映させる
(S112)。
【0126】図15を参照して、たとえば、操作履歴デ
ータ(1)がレコード1に格納され、抽出された基本単
語は、「今日」(対応する単語ベクトルはx(5))、
「旅行」(対応する単語ベクトルはx(25))、「気
分」(対応する単語ベクトルはx(4))、「温泉」
(対応する単語ベクトルはx(2))、「紹介」(対応
する単語ベクトルはx(15))である。このような基
本単語を含む操作履歴データ(1)の特徴ベクトルRS
V(1)が、式2に基づいて、基本単語の単語ベクトル
と基本単語の重みと特徴単語の重みとを用いて算出され
る。このような操作履歴データごとの特徴ベクトルが算
出される(RSV(1),…,RSV(n),RSV
(n+1),…)。図15に示すような操作履歴データ
および特徴ベクトルが格納されている場合において、基
本単語でない単語「露天」の単語ベクトルを算出するに
は、「露天」を含む操作履歴データの特徴ベクトルを加
算する。すなわち、特徴ベクトルRSV(n)とRSV
(n+1)とを重みを付けて加算して、特徴ベクトルの
ベクトル和を正規化して、「露天」の単語ベクトルとす
る。これを単語辞書6に反映させる。
【0127】なお、全ての操作履歴データに含まれる全
ての単語について単語辞書の更新処理を行うのではな
く、予め定められた条件に従って、操作履歴データに含
まれる全ての単語から一部の単語を選択して単語辞書の
更新処理を行うようにしてもよい。
【0128】以下、第1の実施の形態の変形例を示す。
変形例は、図1における入力部2を受信部18に、出力
部16を送信部22に変更したものである。受信部18
と送信部22は、通信回線を介して他のコンピュータ、
ワークステーションなどとネットワーク接続されてお
り、それらとデータの送受信が可能である。
【0129】受信部18は利用者の操作履歴データを、
他のコンピュータから利用者識別コードとともに受信す
る。
【0130】送信部22は、利用者識別コードに従い提
示情報選定処理部48で選定した情報を受信データの発
信元である他のコンピュータへ送信する。
【0131】たとえば、本発明の情報提供装置を、イン
ターネットを接続するためのプロキシサーバ(proxy se
rver)として機能するコンピュータにて実現させること
ができる。この場合、受信部18でクライアントパソコ
ンからの操作履歴データを利用者識別コードとともに受
信し、操作履歴データを利用者ごとに操作履歴データ記
憶部12に記憶させる。興味情報処理部30で、この操
作履歴データの特徴に応じて、利用者に提供する情報を
検索し、送信部で提供する情報をクライアントパソコン
に送信させる。
【0132】以上のようにして、本実施の形態に係る情
報提供装置は、利用者の操作履歴をその特徴に応じたカ
テゴリに分類することにより、利用者の興味に関する情
報を効率よく取得できる。その結果、利用者の興味に応
じた情報を提供することができる。また、本実施の形態
に係る情報提供装置をネットワーク上のサーバにて実現
させることにより、クライアントパソコン各々に情報提
供装置を有していなくても利用者の興味に応じた情報を
提供することができる。 <第2の実施の形態>次に、本発明の第2の実施の形態
に係る情報提供装置について説明する。
【0133】図16を参照して、本発明の実施の形態に
係る情報提供装置は、図1に示す装置に加えて提供可能
データベクトル記憶部20をさらに含む。また、情報提
供装置は、図1に示す興味情報生成部44と検索処理部
46とに代えて、それぞれこれらと多少機能の異なる興
味情報生成処理部50と検索処理部52とを含む。
【0134】提供可能データベクトル記憶部20は、操
作履歴ベクトル記憶部12と同様、コンピュータの固定
ディスク上の予め定めた記憶領域に存在し、該当するデ
ータを記憶する。提供可能ベクトルは、データ識別処理
部32、不要語処理部34、単語抽出処理部36、ベク
トル生成処理部38により操作履歴ベクトルと同様の処
理により生成されるため、同じ処理についての詳細な説
明は繰返さない。このような処理により、たとえば、図
2に示す提供可能データ1〜5から、図17に示す提供
可能ベクトルが生成され、提供可能データベクトル記憶
部20に記憶される。本実施の形態においては、各提供
可能ベクトルの大きさが10なるように正規化処理がさ
れる。
【0135】興味情報生成処理部50は、クラスタリン
グ処理部40により分類された操作履歴データに基づい
て、興味情報として興味ベクトルを生成する。興味ベク
トルは、各カテゴリに属する操作履歴ベクトルのベクト
ル和を求め、さらに、ベクトルの大きさを10とする正
規化処理を行なうことにより求める。たとえば、図6に
示すカテゴリ2の興味ベクトルは、カテゴリ2に属する
操作履歴データ1と操作履歴データ3の操作履歴ベクト
ルとの和となるため、図5の各々の操作履歴データのベ
クトル和を計算し(6,5,5,2,1,0,0,0,
5,2)となる。これをベクトルの大きさが10となる
ように正規化処理を行なうことにより、図18に示すよ
うに(5.5,4.6,4.6,1.8,0.9,0,
0,0,4.6,1.8)となる(小数点2位以下四捨
五入)。これがカテゴリ2の興味ベクトルとなる。各カ
テゴリごとに求めた興味ベクトルを興味情報として興味
情報記憶部14に記憶する。
【0136】検索処理部52は、図17に示す提供可能
ベクトルと図18に示す興味ベクトルとから利用者の興
味が高い情報を検索する。検索処理部52は、各カテゴ
リごとの興味ベクトルVqに基づいて提供可能ベクトル
Viの評価度(「検索点数2」という。)を以下の式6
で算出する。 [式6] 検索点数2=Vq・Vi この式6において、演算子「・」はベクトルの内積を表
わしている。Vq,Viともにその大きさを10とする
正規化処理を行なっているため、検索点数2の値は0か
ら100までの間の値を取り、ベクトルの距離が近いほ
ど大きな値となる。
【0137】本実施の形態に係る情報提供装置は、以下
のように動作する。なお、以下では第1の実施の形態と
同様の動作についての詳細な説明は繰返さず、相違する
動作についてのみ説明する。
【0138】図12のS54にて、CPU72は、提供
可能データベクトル記憶部20から提供可能ベクトルを
提供可能データとして読出し、S56にて、CPU72
は、興味情報記憶部14から興味ベクトルを興味情報デ
ータとして読出す。
【0139】S58にて、検索処理部52は、S54で
読出した提供可能ベクトルの中で、S56で読出した興
味ベクトルに基づいて、利用者の興味に応じた情報を検
索する。図18に示す各カテゴリについて、図17に示
す提供可能データのそれぞれについての提供可能ベクト
ルの検索点数2を算出する。それらの検索点数2の中
で、1位のものを示すと次のようになる。
【0140】 カテゴリ1 1位 提供可能データ1 95 カテゴリ2 1位 提供可能データ3 85.6 カテゴリ3 1位 提供可能データ2 79.5 S60にて、提示情報選定処理部48は、S58にて検
索した各カテゴリごとの1位の提供可能データの出力順
序を定める。本実施の形態では提供可能データ1、提供
可能データ3、提供可能データ2の順となる。
【0141】以上のように、本実施の形態に係る情報提
供装置は、利用者の操作履歴データをその特徴に応じて
カテゴリに分類し、分類ごとの興味ベクトルを生成す
る。また、提供可能データの単語ベクトルを生成する。
それらのベクトル演算により利用者の興味に関する情報
を精度よく取得できる。
【0142】今回開示された実施の形態はすべての点で
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の範囲によって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態に係る情報提供装
置のブロック図である。
【図2】 提供可能データの内容を示す図である。
【図3】 操作履歴データの内容を示す図である。
【図4】 単語辞書の内容を示す図である。
【図5】 操作履歴ベクトルの内容を示す図である。
【図6】 クラスタリング処理がなされたカテゴリの内
容を示す図である。
【図7】 カテゴリ内の単語を示す図である。
【図8】 図9に示すコンピュータの外観図である。
【図9】 本発明の第1の実施の形態に係る情報提供装
置を実現するコンピュータのブロック図である。
【図10】 操作履歴データ処理の概略を示すフローチ
ャートである。
【図11】 提供可能データ処理の概略を示すフローチ
ャートである。
【図12】 提供情報検索処理の概略を示すフローチャ
ートである。
【図13】 単語辞書修正処理の概略を示すフローチャ
ート(その1)である。
【図14】 単語辞書修正処理の概略を示すフローチャ
ート(その2)である。
【図15】 操作履歴データごとの特徴ベクトルの内容
を示す図である。
【図16】 本発明の第2の実施の形態に係る情報提供
装置のブロック図である。
【図17】 提供情報ベクトルの内容を示す図である。
【図18】 カテゴリ内のベクトルを示す図である。
【符号の説明】
6 単語辞書、7 単語辞書修正処理部、8 提供可能
データ記憶部、10操作履歴データ記憶部、30 興味
情報処理部、36 単語抽出処理部、37学習制御処理
部、38 ベクトル生成処理部、40 クラスタリング
処理部、46 検索処理部
フロントページの続き (72)発明者 芥子 育雄 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内 Fターム(参考) 5B075 NR12 PP02 PP03 PQ02 PQ03 PQ75 PR03 PR06 QM06

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 複数個の単語と、各前記単語の特徴を表
    わす単語特徴ベクトルとを対応付けて記憶するための単
    語特徴記憶手段と、 利用者に対して提供可能な情報と、前記提供可能な情報
    の各々に対して前記単語特徴記憶手段に記憶された単語
    および単語特徴ベクトルに基づいて生成された提供可能
    情報特徴データとを準備するための提供可能情報準備手
    段と、 利用者が利用した情報の履歴情報を記憶するための利用
    履歴情報記憶手段と、 前記単語特徴記憶手段に記憶された単語および単語特徴
    ベクトルを参照し、前記利用履歴情報記憶手段に記憶さ
    れた履歴情報を、各前記履歴情報に含まれる単語および
    対応の単語特徴ベクトルに基づいて複数個のカテゴリに
    分類するための分類手段と、前記複数個のカテゴリはそ
    れぞれ、前記単語および単語特徴ベクトルに関連して定
    められる利用履歴情報特徴データにより特徴付けられ、 前記単語特徴記憶手段に記憶された単語および単語特徴
    ベクトルを参照し、複数の前記履歴情報の各々について
    の特徴ベクトルを生成するための特徴ベクトル生成手段
    と、 予め定められた条件が満たされると、前記複数の履歴情
    報とその特徴ベクトルとに基づいて、前記単語特徴記憶
    手段の内容を更新するための単語特徴更新手段と、 前記提供可能情報準備手段によって準備された提供可能
    な情報のうち、前記利用履歴情報特徴データと予め定め
    られた関係にある提供可能情報特徴データを有するもの
    を検索し出力するための提供情報検索手段とを含む、情
    報提供装置。
  2. 【請求項2】 前記単語特徴更新手段は、前記複数の履
    歴情報とその特徴ベクトルとに基づいて、前記単語特徴
    記憶手段に単語およびその単語に対応する単語特徴ベク
    トルを追加するための手段を含む、請求項1に記載の情
    報提供装置。
  3. 【請求項3】 前記単語特徴更新手段は、前記複数の履
    歴情報とその特徴ベクトルとに基づいて、前記単語特徴
    記憶手段に記憶された単語特徴ベクトルを更新するため
    の手段を含む、請求項1または2に記載の情報提供装
    置。
  4. 【請求項4】 前記特徴ベクトル生成手段は、前記履歴
    情報に含まれる各単語に割当てられる第1の重みを算出
    するための第1の重み算出手段と、 複数の前記履歴情報の各々について、前記履歴情報に含
    まれる単語に対応する単語特徴ベクトルに前記第1の重
    みを付けた第1のベクトルを算出し、算出された前記第
    1のベクトルを互いに加算するための加算手段とを含
    む、請求項1〜3のいずれかに記載の情報提供装置。
  5. 【請求項5】 前記特徴ベクトル生成手段は、単語特徴
    ベクトルの成分ごとに割当てられる重みを算出するため
    の重み算出手段と、 複数の前記履歴情報の各々について、前記履歴情報に含
    まれる単語に対応する単語特徴ベクトルの成分に前記重
    みを付けたベクトルを算出し、算出された前記ベクトル
    を互いに加算するための加算手段とを含む、請求項1〜
    3のいずれかに記載の情報提供装置。
  6. 【請求項6】 前記特徴ベクトル生成手段は、単語特徴
    ベクトルの成分ごとに割当てられる第2の重みを算出す
    るための第2の重み算出手段をさらに含み、 前記加算手段は、複数の前記履歴情報の各々について、
    前記履歴情報に含まれる単語に対応する単語特徴ベクト
    ルの成分に前記第2の重みを付けた第2のベクトルを算
    出し、前記第2のベクトルに前記第1の重みを付けた第
    1のベクトルを算出し、算出された前記第1のベクトル
    を互いに加算するための手段を含む、請求項4に記載の
    情報提供装置。
  7. 【請求項7】 前記情報提供装置は、利用者を識別する
    ための利用者識別手段をさらに含み、 前記利用履歴記憶手段は、前記利用者別に情報を記憶す
    るための複数の記憶手段を含み、 前記単語特徴更新手段は、前記利用者識別手段により識
    別された利用者が変更されたことを検知すると、単語特
    徴ベクトルを、前記識別された利用者の履歴情報とその
    特徴ベクトルとに基づいて、前記単語特徴記憶手段の内
    容を更新するための手段を含む、請求項1〜6のいずれ
    かに記載の情報提供装置。
  8. 【請求項8】 前記提供可能情報特徴データは、各提供
    可能な情報に出現する単語に対応する単語特徴ベクトル
    を含み、 前記利用履歴情報特徴データは、各分類ごとに含まれる
    利用履歴情報に出現する単語に対応する単語特徴ベクト
    ルを含み、 前記提供情報検索手段は、前記提供可能情報特徴データ
    に含まれる単語特徴ベクトルと前記利用履歴情報特徴デ
    ータに含まれる単語特徴ベクトルとにより検索するため
    の手段を含む、請求項1〜7のいずれかに記載の情報提
    供装置。
  9. 【請求項9】 コンピュータを用いて利用者に情報を提
    供する方法であって、 複数個の単語と、各前記単語の特徴を表わす単語特徴ベ
    クトルとを対応付けて記憶する単語特徴記憶ステップ
    と、 利用者に対して提供可能な情報と、前記提供可能な情報
    の各々に対して前記単語特徴記憶ステップにて記憶した
    単語および単語特徴ベクトルに基づいて生成された提供
    可能情報特徴データとを準備する提供可能情報準備ステ
    ップと、 利用者が利用した情報の履歴情報を記憶する利用履歴情
    報記憶ステップと、 前記単語特徴記憶ステップにて記憶した単語および単語
    特徴ベクトルを参照し、前記利用履歴情報記憶ステップ
    にて記憶した履歴情報を、各前記履歴情報に含まれる単
    語および対応の単語特徴ベクトルに基づいて複数個のカ
    テゴリに分類する分類ステップと、前記複数個のカテゴ
    リはそれぞれ、前記単語および単語特徴ベクトルに関連
    して定められる利用履歴情報特徴データにより特徴付け
    られ、 前記単語特徴記憶ステップにて記憶した単語および単語
    特徴ベクトルを参照し、複数の前記履歴情報の各々につ
    いての特徴ベクトルを生成する特徴ベクトル生成ステッ
    プと、 予め定められた条件が満たされると、前記複数の履歴情
    報とその特徴ベクトルとに基づいて、単語特徴記憶ステ
    ップにて記憶した内容を更新する単語特徴更新ステップ
    と、 前記提供可能情報準備ステップにて準備した提供可能な
    情報のうち、前記利用履歴情報特徴データと予め定めら
    れた関係にある提供可能情報特徴データを有するものを
    検索し出力する提供情報検索ステップとを含む、情報提
    供方法。
  10. 【請求項10】 前記単語特徴更新ステップは、前記複
    数の履歴情報とその特徴ベクトルとに基づいて、前記単
    語特徴記憶ステップにて記憶した内容に単語およびその
    単語に対応する単語特徴ベクトルを追加するステップを
    含む、請求項9に記載の情報提供方法。
  11. 【請求項11】 前記単語特徴更新ステップは、前記複
    数の履歴情報とその特徴ベクトルとに基づいて、前記単
    語特徴記憶ステップにて記憶した単語特徴ベクトルを更
    新するステップを含む、請求項9または10に記載の情
    報提供方法。
  12. 【請求項12】 前記特徴ベクトル生成ステップは、前
    記履歴情報に含まれる各単語に割当てられる第1の重み
    を算出する第1の重み算出ステップと、 複数の前記履歴情報の各々について、前記履歴情報に含
    まれる単語に対応する単語特徴ベクトルに前記第1の重
    みを付けた第1のベクトルを算出し、算出された前記第
    1のベクトルを互いに加算する加算ステップとを含む、
    請求項9〜11のいずれかに記載の情報提供方法。
  13. 【請求項13】 前記特徴ベクトル生成ステップは、単
    語特徴ベクトルの成分ごとに割当てられる重みを算出す
    る重み算出ステップと、 複数の前記履歴情報の各々について、前記履歴情報に含
    まれる単語に対応する単語特徴ベクトルの成分に前記重
    みを付けたベクトルを算出し、算出された前記ベクトル
    を互いに加算する加算ステップとを含む、請求項9〜1
    1のいずれかに記載の情報提供方法。
  14. 【請求項14】 前記特徴ベクトル生成ステップは、単
    語特徴ベクトルの成分ごとに割当てられる第2の重みを
    算出する第2の重み算出ステップをさらに含み、 前記加算ステップは、複数の前記履歴情報の各々につい
    て、前記履歴情報に含まれる単語に対応する単語特徴ベ
    クトルの成分に前記第2の重みを付けた第2のベクトル
    を算出し、前記第2のベクトルに前記第1の重みを付け
    た第1のベクトルを算出し、算出された前記第1のベク
    トルを互いに加算するステップを含む、請求項12に記
    載の情報提供方法。
  15. 【請求項15】 前記情報提供方法は、利用者を識別す
    る利用者識別ステップをさらに含み、 前記利用履歴記憶ステップは、前記利用者別に情報を記
    憶する複数の記憶ステップを含み、 前記単語特徴更新ステップは、前記利用者識別ステップ
    により識別された利用者が変更されたことを検知する
    と、単語特徴ベクトルを、前記識別された利用者の履歴
    情報とその特徴ベクトルとに基づいて、前記単語特徴記
    憶ステップにて記憶した内容を更新するステップを含
    む、請求項9〜14のいずれかに記載の情報提供方法。
  16. 【請求項16】 前記提供可能情報特徴データは、各提
    供可能な情報に出現する単語に対応する単語特徴ベクト
    ルを含み、 前記利用履歴情報特徴データは、各分類ごとに含まれる
    利用履歴情報に出現する単語に対応する単語特徴ベクト
    ルを含み、 前記提供情報検索ステップは、前記提供可能情報特徴デ
    ータに含まれる単語特徴ベクトルと前記利用履歴情報特
    徴データに含まれる単語特徴ベクトルとにより検索する
    ステップを含む、請求項9〜15のいずれかに記載の情
    報提供方法。
  17. 【請求項17】 コンピュータを用いて利用者に情報を
    提供する方法を実現するプログラムを記録した機械読取
    可能な記録媒体であって、 前記情報提供方法は、 複数個の単語と、各前記単語の特徴を表わす単語特徴ベ
    クトルとを対応付けて記憶する単語特徴記憶ステップ
    と、 利用者に対して提供可能な情報と、前記提供可能な情報
    の各々に対して前記単語特徴記憶ステップにて記憶した
    単語および単語特徴ベクトルに基づいて生成された提供
    可能情報特徴データとを準備する提供可能情報準備ステ
    ップと、 利用者が利用した情報の履歴情報を記憶する利用履歴情
    報記憶ステップと、 前記単語特徴記憶ステップにて記憶した単語および単語
    特徴ベクトルを参照し、前記利用履歴情報記憶ステップ
    にて記憶した履歴情報を、各前記履歴情報に含まれる単
    語および対応の単語特徴ベクトルに基づいて複数個のカ
    テゴリに分類する分類ステップと、前記複数個のカテゴ
    リはそれぞれ、前記単語および単語特徴ベクトルに関連
    して定められる利用履歴情報特徴データにより特徴付け
    られ、 前記単語特徴記憶ステップにて記憶した単語および単語
    特徴ベクトルを参照し、複数の前記履歴情報の各々につ
    いての特徴ベクトルを生成する特徴ベクトル生成ステッ
    プと、 予め定められた条件が満たされると、前記複数の履歴情
    報とその特徴ベクトルとに基づいて、単語特徴記憶ステ
    ップにて記憶した内容を更新する単語特徴更新ステップ
    と、 前記提供可能情報準備ステップにて準備した提供可能な
    情報のうち、前記利用履歴情報特徴データと予め定めら
    れた関係にある提供可能情報特徴データを有するものを
    検索し出力する提供情報検索ステップとを含む、情報提
    供方法を実現するプログラムを記録した機械読取可能な
    記録媒体。
  18. 【請求項18】 前記単語特徴更新ステップは、前記複
    数の履歴情報とその特徴ベクトルとに基づいて、前記単
    語特徴記憶ステップにて記憶した内容に単語およびその
    単語に対応する単語特徴ベクトルを追加するステップを
    含む、請求項17に記載の機械読取可能な記録媒体。
  19. 【請求項19】 前記単語特徴更新ステップは、前記複
    数の履歴情報とその特徴ベクトルとに基づいて、前記単
    語特徴記憶ステップにて記憶した単語特徴ベクトルを更
    新するステップを含む、請求項17または18に記載の
    機械読取可能な記録媒体。
  20. 【請求項20】 前記特徴ベクトル生成ステップは、前
    記履歴情報に含まれる各単語に割当てられる第1の重み
    を算出する第1の重み算出ステップと、 複数の前記履歴情報の各々について、前記履歴情報に含
    まれる単語に対応する単語特徴ベクトルに前記第1の重
    みを付けた第1のベクトルを算出し、算出された前記第
    1のベクトルを互いに加算する加算ステップとを含む、
    請求項17〜19のいずれかに記載の機械読取可能な記
    録媒体。
  21. 【請求項21】 前記特徴ベクトル生成ステップは、単
    語特徴ベクトルの成分ごとに割当てられる重みを算出す
    る重み算出ステップと、 複数の前記履歴情報の各々について、前記履歴情報に含
    まれる単語に対応する単語特徴ベクトルの成分に前記重
    みを付けたベクトルを算出し、算出された前記ベクトル
    を互いに加算する加算ステップとを含む、請求項17〜
    19のいずれかに記載の機械読取可能な記録媒体。
  22. 【請求項22】 前記特徴ベクトル生成ステップは、単
    語特徴ベクトルの成分ごとに割当てられる第2の重みを
    算出する第2の重み算出ステップをさらに含み、 前記加算ステップは、複数の前記履歴情報の各々につい
    て、前記履歴情報に含まれる単語に対応する単語特徴ベ
    クトルの成分に前記第2の重みを付けた第2のベクトル
    を算出し、前記第2のベクトルに前記第1の重みを付け
    た第1のベクトルを算出し、算出された前記第1のベク
    トルを互いに加算するステップを含む、請求項20に記
    載の機械読取可能な記録媒体。
  23. 【請求項23】 前記情報提供方法は、利用者を識別す
    る利用者識別ステップをさらに含み、 前記利用履歴記憶ステップは、前記利用者別に情報を記
    憶する複数の記憶ステップを含み、 前記単語特徴更新ステップは、前記利用者識別ステップ
    により識別された利用者が変更されたことを検知する
    と、単語特徴ベクトルを、前記識別された利用者の履歴
    情報とその特徴ベクトルとに基づいて、前記単語特徴記
    憶ステップにて記憶した内容を更新するステップを含
    む、請求項17〜22のいずれかに記載の機械読取可能
    な記録媒体。
  24. 【請求項24】 前記提供可能情報特徴データは、各提
    供可能な情報に出現する単語に対応する単語特徴ベクト
    ルを含み、 前記利用履歴情報特徴データは、各分類ごとに含まれる
    利用履歴情報に出現する単語に対応する単語特徴ベクト
    ルを含み、 前記提供情報検索ステップは、前記提供可能情報特徴デ
    ータに含まれる単語特徴ベクトルと前記利用履歴情報特
    徴データに含まれる単語特徴ベクトルとにより検索する
    ステップを含む、請求項17〜23のいずれかに記載の
    機械読取可能な記録媒体。
JP2000125711A 2000-04-26 2000-04-26 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体 Withdrawn JP2001306612A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000125711A JP2001306612A (ja) 2000-04-26 2000-04-26 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000125711A JP2001306612A (ja) 2000-04-26 2000-04-26 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2001306612A true JP2001306612A (ja) 2001-11-02

Family

ID=18635614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000125711A Withdrawn JP2001306612A (ja) 2000-04-26 2000-04-26 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2001306612A (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005509954A (ja) * 2001-11-13 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ アイテムの推薦器においてアイテムの近さを評価するための方法及び装置
JP2005509967A (ja) * 2001-11-13 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 第3者のステレオタイプ選好に基づいて対象品目を推奨する方法及び装置
JP2005149033A (ja) * 2003-11-13 2005-06-09 Nippon Telegr & Teleph Corp <Ntt> コンテンツ検索方法、コンテンツ更新方法、コンテンツ更新の反映方法、コンテンツ検索装置、コンテンツ更新装置、コンテンツ検索のプログラム及びコンテンツ更新のプログラム並びにそれらの記録媒体
JP2006120126A (ja) * 2004-10-20 2006-05-11 Toshiba Corp キーワード抽出装置、キーワード抽出プログラム
JPWO2005048587A1 (ja) * 2003-11-13 2007-05-31 松下電器産業株式会社 番組推薦装置及び番組推薦装置の番組推薦方法並びにプログラム
JP2007517308A (ja) * 2003-12-31 2007-06-28 グーグル インク. 記事情報を用いて検索ランク付けを改良するための方法およびシステム
JP2008505407A (ja) * 2004-07-01 2008-02-21 エーオーエル エルエルシー カテゴリ固有電子コンテンツの管理に使用するためのクエリログの解析
WO2009001428A1 (ja) * 2007-06-25 2008-12-31 Fujitsu Limited スコア算出プログラム、スコア算出方法およびスコア算出装置
WO2009045741A1 (en) * 2007-09-28 2009-04-09 Yahoo! Inc. System and method for history clustering
US7574036B2 (en) 2003-03-24 2009-08-11 Fujifilm Corporation Apparatus, program, and recording medium for learning data to form a self-organizing map comprised of reference vectors corresponding to features of an image and used for determining objects in an image
JP2010217987A (ja) * 2009-03-13 2010-09-30 Casio Computer Co Ltd 電子機器及び情報表示プログラム
JP2011248740A (ja) * 2010-05-28 2011-12-08 Nec Corp データ出力装置、データ出力方法およびデータ出力プログラム
JP2013206270A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd ユーザ情報管理装置及びユーザ情報管理方法
CN107122392A (zh) * 2017-03-09 2017-09-01 北京小度信息科技有限公司 词库构建方法、识别搜索需求的方法及相关装置
JP6199461B1 (ja) * 2016-09-13 2017-09-20 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2019128789A (ja) * 2018-01-24 2019-08-01 株式会社リコー 言語処理装置、言語処理方法及びプログラム
JP2019128788A (ja) * 2018-01-24 2019-08-01 株式会社リコー 言語処理装置、言語処理方法及びプログラム

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005509967A (ja) * 2001-11-13 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 第3者のステレオタイプ選好に基づいて対象品目を推奨する方法及び装置
JP2005509954A (ja) * 2001-11-13 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ アイテムの推薦器においてアイテムの近さを評価するための方法及び装置
US7574036B2 (en) 2003-03-24 2009-08-11 Fujifilm Corporation Apparatus, program, and recording medium for learning data to form a self-organizing map comprised of reference vectors corresponding to features of an image and used for determining objects in an image
JP2005149033A (ja) * 2003-11-13 2005-06-09 Nippon Telegr & Teleph Corp <Ntt> コンテンツ検索方法、コンテンツ更新方法、コンテンツ更新の反映方法、コンテンツ検索装置、コンテンツ更新装置、コンテンツ検索のプログラム及びコンテンツ更新のプログラム並びにそれらの記録媒体
JPWO2005048587A1 (ja) * 2003-11-13 2007-05-31 松下電器産業株式会社 番組推薦装置及び番組推薦装置の番組推薦方法並びにプログラム
JP4505418B2 (ja) * 2003-11-13 2010-07-21 パナソニック株式会社 番組推薦装置及び番組推薦装置の番組推薦方法並びにプログラム
JP4714156B2 (ja) * 2003-12-31 2011-06-29 グーグル インコーポレイテッド 記事情報を用いて検索ランク付けを改良するための方法およびシステム
JP2007517308A (ja) * 2003-12-31 2007-06-28 グーグル インク. 記事情報を用いて検索ランク付けを改良するための方法およびシステム
JP2008505407A (ja) * 2004-07-01 2008-02-21 エーオーエル エルエルシー カテゴリ固有電子コンテンツの管理に使用するためのクエリログの解析
JP4699148B2 (ja) * 2004-10-20 2011-06-08 株式会社東芝 キーワード抽出装置、キーワード抽出プログラム
JP2006120126A (ja) * 2004-10-20 2006-05-11 Toshiba Corp キーワード抽出装置、キーワード抽出プログラム
WO2009001428A1 (ja) * 2007-06-25 2008-12-31 Fujitsu Limited スコア算出プログラム、スコア算出方法およびスコア算出装置
JPWO2009001428A1 (ja) * 2007-06-25 2010-08-26 富士通株式会社 スコア算出プログラム、スコア算出方法およびスコア算出装置
JP4992973B2 (ja) * 2007-06-25 2012-08-08 富士通株式会社 スコア算出プログラム、スコア算出方法およびスコア算出装置
WO2009045741A1 (en) * 2007-09-28 2009-04-09 Yahoo! Inc. System and method for history clustering
JP2010217987A (ja) * 2009-03-13 2010-09-30 Casio Computer Co Ltd 電子機器及び情報表示プログラム
JP2011248740A (ja) * 2010-05-28 2011-12-08 Nec Corp データ出力装置、データ出力方法およびデータ出力プログラム
JP2013206270A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd ユーザ情報管理装置及びユーザ情報管理方法
JP6199461B1 (ja) * 2016-09-13 2017-09-20 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2018045361A (ja) * 2016-09-13 2018-03-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
CN107122392A (zh) * 2017-03-09 2017-09-01 北京小度信息科技有限公司 词库构建方法、识别搜索需求的方法及相关装置
CN107122392B (zh) * 2017-03-09 2020-08-04 北京星选科技有限公司 词库构建方法、识别搜索需求的方法及相关装置
JP2019128789A (ja) * 2018-01-24 2019-08-01 株式会社リコー 言語処理装置、言語処理方法及びプログラム
JP2019128788A (ja) * 2018-01-24 2019-08-01 株式会社リコー 言語処理装置、言語処理方法及びプログラム
JP7073740B2 (ja) 2018-01-24 2022-05-24 株式会社リコー 言語処理装置、言語処理方法及びプログラム
JP7081174B2 (ja) 2018-01-24 2022-06-07 株式会社リコー 言語処理装置、言語処理方法及びプログラム

Similar Documents

Publication Publication Date Title
CN109829104B (zh) 基于语义相似度的伪相关反馈模型信息检索方法及***
US7745718B2 (en) Music-piece classifying apparatus and method, and related computer program
US7487151B2 (en) Information processing apparatus, information processing method, program for implementing information processing method, information processing system, and method for information processing system
US6993517B2 (en) Information retrieval system for documents
US20210349949A1 (en) Domain-agnostic structured search query exploration
JP2001306612A (ja) 情報提供装置、情報提供方法およびその方法を実現するプログラムを記録した機械読取可能な記録媒体
US20070239707A1 (en) Method of searching text to find relevant content
US20140201180A1 (en) Intelligent Supplemental Search Engine Optimization
US20140074813A1 (en) Media discovery and playlist generation
US20050060290A1 (en) Automatic query routing and rank configuration for search queries in an information retrieval system
US20040107194A1 (en) Information storage and retrieval
US20090240674A1 (en) Search Engine Optimization
US20060095852A1 (en) Information storage and retrieval
US20080183685A1 (en) System for classifying a search query
KR101355945B1 (ko) 온라인 문맥기반 광고 장치 및 방법
EP1426882A2 (en) Information storage and retrieval
WO2010014082A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
CN101138001A (zh) 学习处理方法和学习处理装置以及程序
US7668853B2 (en) Information storage and retrieval
CN110866102A (zh) 检索处理方法
JP2009043264A (ja) 情報検索方法およびそのシステム
CN113722443B (zh) 一种融合文本相似度和协同过滤的标签推荐方法和***
JP4891638B2 (ja) 目的データをカテゴリに分類する方法
JP3730451B2 (ja) 情報提供装置
JP3693514B2 (ja) 文書検索・分類方法および装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070703