JP5336105B2 - メッセージから活動関連のコンテキスト情報を推測するための方法 - Google Patents

メッセージから活動関連のコンテキスト情報を推測するための方法 Download PDF

Info

Publication number
JP5336105B2
JP5336105B2 JP2008128168A JP2008128168A JP5336105B2 JP 5336105 B2 JP5336105 B2 JP 5336105B2 JP 2008128168 A JP2008128168 A JP 2008128168A JP 2008128168 A JP2008128168 A JP 2008128168A JP 5336105 B2 JP5336105 B2 JP 5336105B2
Authority
JP
Japan
Prior art keywords
activity
message
user
keyword
context information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008128168A
Other languages
English (en)
Other versions
JP2009076043A (ja
Inventor
エイチ キング トレーシー
パートリッジ カート
ベー デシュノー ニコラス
ファン ジー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2009076043A publication Critical patent/JP2009076043A/ja
Application granted granted Critical
Publication of JP5336105B2 publication Critical patent/JP5336105B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、一般に、NLP(Natural Language Processing:自然言語処理)技術に関する。より具体的には、本発明は、活動関連のコンテンツデータベースを使用して、メッセージから活動に関するコンテキスト情報を推測する方法および装置に関する。
オンラインカレンダは、活動を調整すること、ユーザに思い出させること、および作業をスケジュールすることなどの、多くの役立つ機能をサポートする。しかし、オンラインカレンダは、しばしば、ユーザの実際の活動を正確に反映しない。この不一致の1つの理由は、ユーザが、しばしば、将来の活動をオンラインカレンダに記録しないことである。その結果、ユーザは、意図される約束について忘れる可能性がある。しかし、ユーザは、電子メールまたはテキストメッセージなどの電子メッセージを介して、活動に関するユーザの計画を頻繁に通信する。時として、これらの電子メッセージは、自然言語処理技術を介して解析されて、この情報が得られるが、しばしば、これらの電子メッセージは、電子メッセージが、通常、カレンダエントリに関する関係のある情報のすべてを含む詳細な記述(例えば、「Want to meet at the Century Cinemas 16,1500 N.Shoreline Blvd.,Mountain View,CA,to see the movie’Finding Nemo’ from 7:15pm to 9:00pm tonight」)ではなく、イベントの簡潔な記述(例えば、「nemo tonight?」)を含むため、解析することができない。
また、活動と関係する推奨を生成する作業も、ユーザが、通常、そのような活動に関する選好情報を記録しないため、困難である。しかし、理論上、ユーザ選好情報は、ユーザからの電子メッセージを解析することによって同様に得ることができる。しかし、そのようなユーザ選好情報を解析することも、そのような活動の簡潔な記述のため、同様に難しい。
したがって、必要とされているのは、前述した問題なしに、電子通信から活動関連の情報を自動的に得ることを容易にする方法および装置である。提案されるシステムは、コンテンツデータベースを使用して、活動関連の情報の抽出を誘導し、支援する。
本発明の一部の実施形態は、メッセージから活動関連のコンテキスト情報を推測するシステムを提供する。メッセージを受信すると、システムは、メッセージの中の活動関連のキーワードを探し、活動関連のキーワードは、コンテンツデータベースからである。1つ以上の活動関連のキーワードが、メッセージの中で見出された場合、システムは、その1つ以上の活動関連のキーワードからメッセージ関連のコンテキスト情報を推測する。次に、システムは、メッセージ関連のコンテキスト情報を使用して、或る活動をユーザに推奨することを円滑にする。
一部の実施形態では、メッセージ関連のコンテキスト情報を使用して、或る活動をユーザに推奨することを円滑にしながら、システムは、そのメッセージ関連のコンテキスト情報を使用して、そのメッセージ関連のコンテキスト情報に関連する1つ以上の活動に関する活動モデルを構築する。また、システムは、メッセージ関連のコンテキスト情報を使用して、そのユーザに関するユーザ選好モデルを構築する。最後に、システムは、その活動モデル、およびそのユーザ選好モデルを使用して、そのユーザに或る活動を推奨する。
一部の実施形態では、メッセージの中で、コンテンツデータベースによって誘導されて活動関連のキーワードを探しながら、システムは、メッセージの中で活動関連のキーワードの存在を示す周囲のテキストを探す。例えば、そうすることは、見込みのある活動関連のキーワードの周囲のテキストにおいて、特定のタイプの活動を示す動詞を探すことを含むことが可能である。
一部の実施形態では、システムは、メッセージの中の場所標識および時間標識を識別し、その識別された場所標識および時間標識を使用して、或る活動をユーザに推奨することを円滑にすることも行う。
一部の実施形態では、メッセージ関連のコンテキスト情報を使用して、活動をユーザに推奨することを円滑にすることは、メッセージ関連のコンテキスト情報、およびコンテンツデータベースを使用して、キーワード検索を強化して、ユーザの関心対象の活動を識別することを含む。
一部の実施形態では、メッセージ関連のコンテキスト情報は、型付き単語を含む。
一部の実施形態では、型付き単語は、信頼度重みに関連付けられる。
一部の実施形態では、型付き単語には、活動カテゴリ、活動場所、活動時間、活動時間に関する不確かさ、メッセージに関連する時制、および活動についてのユーザ意見が含まれることが可能である。
一部の実施形態では、コンテンツデータベースは、以下の活動の1つ以上と関係する活動特有のコンテンツを含む。すなわち、レストランで食べること、映画および/またはライブパフォーマンスを観ること、物理的店舗またはオンライン店舗で買い物をすること、本またはオンラインコンテンツを読むこと、および他の活動を実行することである。
一部の実施形態では、メッセージは、テキストメッセージまたは電子メールメッセージであることが可能である。
本発明の一実施形態は、NLP(自然言語処理)技術を使用して、コンテンツのデータベースに基づくメッセージのコーパス(SMS、電子メールなど)からメッセージ関連のコンテキスト情報を推測するシステムを提供する。このシステムは、データベースを使用して、どのような種類のコンテキスト情報が探されるか(例えば、システムが、レストランについてのコンテンツを有する場合、システムは、食事をすること、レストランに行くこと、料理タイプなどと関係があるキーワードを探す)を誘導する。したがって、これは、単に場所、時間などの標識を探す以上のことを行う。
本発明の一実施形態は、活動特有のコンテンツデータベースセットを使用する。例えば、システムは、映画、レストラン、および公園についてのコンテンツを含むデータベースを使用することができる。
メッセージ(テキストメッセージまたは電子メールメッセージなどの)が分析されると、データベースの中のエントリが、探すべきキーワードセットを提供する。例えば、映画データベースの場合、映画の題名が、キーワードとなることが可能である。本発明の一実施形態では、これらのデータベースに格納されたキーワードは、(1)それらのキーワードが出現した場合に、メッセージにフラグが付けられるようにする単純なキーワードとしても、(2)周囲のテキストが、関係のあるタイプのコンテンツを示す場合、メッセージ分類タイプにさらなる重みが与えられるようにするコンテキスト依存のキーワードとしても使用される。
以下の単純化された例を考慮されたい。或る映画データベースが、「Batman」、「Finding Nemo」、および「1984」という映画タイトルを含むことが可能である。これらの句の1つに遭遇するといつでも、メッセージには、映画と関係するというマークが付けられて、関係のある映画の題名が示される。しかし、題名の句の前に「see」または「watch」という語が付く場合、またはこの題名の句が、映画のメッセージスレッドの中で、より早期に出現する場合、そのメッセージに関連する映画事実の重みは、増加される。このことは、題名が、普通の句である可能性があるため、映画関連のコンテンツに関して特に重要である。前述の例において、「1984」は、年を指す可能性もある(「she graduated in 1984」)。したがって、コンテンツデータベース内のデータを使用して、このタイプのコンテンツに関係のあるキーワードにフラグが付けられるべきことが合図される。このため、映画データベースとレストランデータベースの両方を参照するアプリケーションが、映画およびレストランと関係のあるキーワードを有するメッセージにマークを付けるとともに、データベースからの映画名およびレストラン名にマークを付けることが可能である。異なるアプリケーションは、ホテルデータベース、列車データベース、およびレストランデータベースを参照することが可能であり、このため、これらの領域を使用して、メッセージにフラグを付ける関係のあるキーワードを生成することができる。
データベースに関連するキーワードは、手書きの規則および/または確率的方法によって生成されることが可能である。これらの規則は、従来の意味におけるキーワード(例えば、「movie」、「film」、「see」)を含むだけでなく、句情報および位置情報も含むことが可能である。例えば、「see a film」という句は、非常に大きい重みを受け取り、「see」という語の直後に、データベースの中の或る映画の名前が続く場合も同様である。これに対して、「see」という語の前に、或る映画の名前がくる場合は、はるかに小さい重みを受け取る。
コンテンツ情報は、孤立したメッセージからだけでなく、メッセージスレッドからも抽出されることが可能である。メッセージスレッドは、コンテンツが、関係がある尤度(ゆうど:the Likelihood of content)を高めるのに活用されることが可能であることに留意されたい。例えば、タイプXのコンテンツを有するメッセージが、タイプXのコンテンツを有するメッセージと同一のスレッドに入っている場合、そのコンテンツタイプの尤度が、高められる。さらに、それらのメッセージが、スレッドの中で近いほど、尤度の重みの増加が大きくなる。例えば、送信されたメッセージが、或るレストランの名前を含み、外食することについてのメッセージに応答している場合、その名前が、レストランの名前である信頼度スコアが、相当に高められる。
本発明の一実施形態では、システムによって抽出された情報には、各メッセージに関連する関係のある型付きの単語が含まれる。前述したとおり、これらの型付きの単語は、信頼度重みを有することが可能である。メッセージは、複数のデータベースからの単語に関連付けることが可能であることに留意されたい。このため、短いSMSまたはテキストメッセージでさえ、映画および場所についての情報を含むことが可能である。より長い電子メールメッセージは、例えば、映画情報とレストラン情報をともに含むことが可能である。例として、夕食に行き、映画を観ることを所望するかどうかを受信者に尋ねる電子メールが、type=movie、title=batman、time=today、type=restaurant、name=giovanni’s、cuisine=Italian、time=todayのような単語に関連することが可能である。この例では、「type=」情報は、アプリケーション特有のデータベースに関連するキーワードに由来し、「title=」および「name=」は、データベースエントリからのキーワードであり、「cuisine=」は、さらなるデータベース情報であり、「time=」は、メッセージから従来のキーワード抽出を介して得られる。
本発明の説明される実施形態は、英語に特有であるが、この技術は、一般に、任意の言語に適用されることが可能であることに留意されたい。
テキストメッセージは、通常、そのようなメッセージにおける一般的な略語を変換するのに、いくつかのアプリケーション特有のNLP技術を要求する(これは、電子メールメッセージの場合、幾分、該当しない)。変換の一部は、リストにおいて定義されることが可能である。例えば、英語のテキストメッセージにおいて、文字「2」は、「to」、「two」、または「too」に変換されることが可能であり、このため、メッセージが関係のあるコンテンツを含む尤度を高める位置情報を提供する際に重要である可能性がある。他の変換は、より体系化されていることが可能である。例えば、英語のテキストメッセージにおいて、母音は、省略されることが可能であり(例えば、「talk」は、「tlk」になることが可能であり)、文字は、置き換えられることが可能である(例えば、「ks」の代わりに「x」)。そのような体系化された変換規則は、位置コンテキスト情報およびキーワード自体を正しく識別するのに役立つ可能性がある。
最後に、コンテンツデータベースとの対話中、名前が参照されることが可能な仕方が、データベースコンテンツをメッセージテキストと正しくマッチングするために重要である。例えば、映画の題名において、題名または副題が、使用される可能性がある(例えば、「Fantastic Four:Rise of the Silver Surfer」が、メッセージにおいて「Silver Surfer」である可能性がある)。レストラン名において、「Cafe」および「Restaurant」のような言葉は、しばしば、省略される(例えば、「Giovanni’s Cafe」が、「Givanni’s」である可能性がある)。語のより一般的な改変(母音を省略することなどの)が、データベースキーワード、およびそれらのキーワードの省略に適用されることが可能である。このため、システムは、キーワードを正しく識別するために、これらの変種の組合せを考慮に入れることができる。
本発明の一実施形態では、このコンテンツ抽出技術は、いくつかの仕方で使用されることが可能である。より具体的には、この技術は、オフラインアプリケーションにおいて使用されて、ユーザ選好モデルを構築するのに役立てられることが可能である。例えば、メッセージの大量のコーパスが分析されて、関係のある活動パターンのモデルが構築されることが可能である。アプリケーションが、レストランデータベース、映画データベース、および買い物データベースを使用する場合、情報は、ユーザが、いつレストランで食事をしているか、いつ映画を観ているか、またはいつ買い物をしているかについて、各ユーザに関して抽出されることが可能である。
さらに、人々が、いつ、そのような活動を計画しているかについての情報を抽出することが可能である。例えば、そのような情報は、ユーザが、昼下がりに友人に日常的に電子メールを送信して、その夕方の食事活動に関する計画を整える場合、抽出されることが可能である。
メインコンテンツデータベースクラス(例えば、レストラン、映画、買い物)に対応する粗粒の分類に加えて、メッセージからのコンテンツ抽出は、特定のデータベースにおいて使用されるコンテンツの特定のタイプについての、より細粒の情報を提供することができる。例えば、映画の題名を使用して、映画ジャンルの選好を知ることができ、レストランの名前を使用して、料理タイプの選好を知ることができる。このことにより、モデルが、抽出されたメッセージ内容を、サブタイプ分類についてのデータベースの中に格納された情報と組み合わせることにより、より正確なパターンおよび選好を知ることが可能になる。このため、ユーザ選好モデルは、ユーザが物理的に何をしているかと、ユーザが、所与の日の所与の時間に関して、どのような計画をしているかの両方についてメッセージコンテンツによって強化されることが可能である。
また、コンテンツ抽出技術は、オンラインで使用されて、活動またはコンテンツをユーザに推奨することを円滑にすることも可能である。そのケースにおいて、ユーザが、データベースコンテンツおよび活動と関係するメッセージ(送信された、または受信された)を有する場合、システムは、メッセージから抽出された単語および重みを、どのような活動を推奨すべきかを判定する際に、またはユーザが参加しているとシステムが考える活動に関するコンテンツ示唆を提供するのに、ファクタとして使用することができる。例えば、食事をする場所を取り決めるメッセージが存在する場合、システムは、データベースからレストラン推奨をユーザに与えることができる。
別の実施例において、ユーザが、しばしば、午後にディスコまたは映画に行くことを示すモデルをシステムが有するものと想定されたい。そのケースでは、ユーザが、夕方の計画について尋ねる一般的なメッセージを有する場合、システムは、ディスコまたは映画に行くことを推奨することが可能である。
また、コンテンツ抽出技術は、スケジュール詳細が、メッセージの中で入手できない場合に、スケジュール詳細を埋めるのに使用されることも可能である。例えば、或る映画が、メッセージの本文中の語と映画の題名が合致するために、識別されることが可能であるが、時刻は、地元の映画上映に関する可能な時刻のデータベースから得られる。
次に、前述した技術に関するいくつかの実施形態詳細を提示する。
図1は、本発明の実施形態によるコンピュータシステム100を示す。コンピュータシステム100には、一般に、マイクロプロセッサに基づくコンピュータシステム、メインフレームコンピュータ、デジタルシグナルプロセッサ、ポータブルコンピューティングデバイス、パーソナルオーガナイザ、携帯電話機、デバイスコントローラ、または器具内部の計算エンジンを含むが、以上には限定されない任意のタイプのコンピュータシステムが含まれることが可能である。
図1を参照すると、コンピュータシステム100は、推論モジュール104を使用してメッセージ102を処理する。メッセージ102は、一般に、電子メールメッセージやテキストメッセージなどの、任意のタイプの電子通信であることが可能であることに留意されたい。
メッセージ102を処理しながら、推論モジュール104は、コンテンツデータベース106にアクセスする。本発明の一実施形態では、コンテンツデータベース106は、1つ以上の活動特有のデータベースを含む。例えば、これらの活動特有のデータベースには、映画に関するデータベース、レストランに関するデータベース、および小売業者に関するデータベースが含まれることが可能である。また、推論モジュール104は、コンテンツデータベース106からの情報を使用して、メッセージ102の中で話し合われている活動についての情報を推測することも行う。このプロセスは、後段でより詳細に説明される。
推論モジュール104からの出力は、活動モデル108に供給され、モデル108は、ユーザが、特定の活動に関心があるかどうかを判定するのに使用されることが可能である。
推論モジュール104からの情報は、ユーザ選好モデル110にも供給され、モデル110は、特定のユーザの選好を追跡する。
活動モデル108およびユーザ選好モデル110は、推奨モデル112によって使用されて、推奨114を生成し、推奨114は、ディスプレイ120を介してユーザ122によって見られることが可能である。推奨を生成するプロセスは、後段でより詳細に説明される。
図2は、本発明の実施形態による推奨を行うプロセスを示す流れ図を提示する。最初に、システムは、電子メールメッセージまたはテキストメッセージなどのメッセージ102を受信する(ステップ202)。次に、システムは、メッセージの中で活動関連のキーワードを探し(ステップ204)、活動関連のキーワードは、コンテンツデータベース106の中に含まれる。次に、システムは、それらの活動関連のキーワードを使用して、メッセージ関連のコンテキスト情報を推測する(ステップ206)。例えば、システムが、テキストメッセージの中で「finding」および「nemo」というキーワードを見つけた場合、システムは、テキストメッセージが、映画「Finding Nemo」について話し合っていると推測することができる。
また、システムは、メッセージ102(および、通常、多数のさらなるメッセージ)からのメッセージ関連のコンテキスト情報を使用して、活動モデル108を構築するのを助ける(ステップ208)。これを行う際、システムは、送受信された電子メールメッセージのコンテンツを分析して、将来の活動に関するユーザの計画についての情報を抽出する。抽出された情報は、次に、活動モデル108に送られ、特定の時点における特定の活動へのユーザの関心の確率を推測するさらなる手がかりとして使用される。
例えば、本発明の一実施形態では、システムは、いくつかの最上レベルの活動(EAT、BUY、SEE、DO、およびREAD)についての情報にユーザが関心を持っている確率を、ユーザが、近い将来にそれらの活動を行うというシステムの信念に基づき、計算する。この推測は、母集団の人口統計学的に類似したセグメントにおいて観察されるパターンと、そのユーザの個別の個人的行動履歴との組合せに基づくことが可能である。システムは、或るタイプの場所の訪問を特定の活動と関連付けることにより、或る活動をおそらく行っていることを推測することができる。例えば、ユーザが、小売店を訪問する場合、システムは、ユーザが、BUY活動を行っているものと推測する。別の例として、ユーザが、レストランまたはカフェを訪問する場合、システムは、ユーザが、EAT活動を行っているものと推測することができる。同様に、劇場または博物館を訪問することは、SEE活動に関連することが可能であり、ジムを訪問することは、DO活動に関連することが可能であり、デバイス自体の上のコンテンツを読むことは、READ活動に関連することが可能である。
また、システムは、このメッセージ関連のコンテキスト情報を使用して、ユーザ選好モデル110を構築することを助け(ステップ210)、モデル110は、ユーザの個々の嗜好および選好を示す。本発明の一部の実施形態では、ユーザ選好モジュール110は、UCPM(User Content Preference Model:ユーザコンテンツ選好モデル)を含む、いくつかの構成要素を含み、UCPMは、ユーザが、過去に見たWebページおよび文書のコンテンツから構築されて、標準のtf/idf(単語頻度/逆文書頻度)メトリックを使用して、重み付きトピック単語のリストを生成する。また、ユーザ選好モデル110は、各タイプの活動内の属性に関するユーザの言明される選好も含むことが可能である。例えば、EAT活動内で、ユーザは、いくつかのタイプの料理(アメリカ料理、アジア料理など)、価格範囲、活気のある雰囲気、駐車、喫煙などのそれぞれに関するユーザの選好を言明することができる。この属性リストは、レストラン批評で見られる一般的な属性から導き出されることが可能である(同様のアプローチが、他の活動に適用可能なコンテンツに対して使用される)。また、ユーザ選好モデル110は、前述した活動モデル学習プロセスと類似した機構を使用して、時とともに自動的に選好を推測することも可能である。
最後に、推奨モジュール112は、活動モデル108およびユーザ選好モデル110からの情報を使用して、或る活動をユーザ122に推奨する(ステップ212)。本発明の一実施形態では、所与のユーザおよびコンテキストに関して、推奨モジュール112は、様々なモデルからの結果を組み合わせることにより、各コンテンツアイテムの値を計算する。すべてのアイテムにスコアが付けられると、一番上からN個のアイテムが、戻される。ほとんどの既存の推奨システムは、1つのモデルに排他的に依拠し、このモデルは、たいてい、或る形態の協調フィルタリングであり、このモデルの内部実装は、極めて複雑である可能性があることに留意されたい。
これに対して、本発明の一実施形態では、アイテムに関する最終スコアが、1つではなく、任意の数のモデルの結果に基づいて計算される。この実施形態では、セットジェネレータが、すべての利用可能なモデルのリストを保持し、システムの他の構成要素からセットジェネレータが受け取る入力に応じてケースバイケースで、それらのモデルを組み合わせる。モデルが、組み合わされる仕方は、規則セットにおいて指定されることが可能であり、あるいは現在のユーザのコンテキストから推測されることが可能である。また、セットジェネレータは、所与のコンテキストにおける所与のユーザに、どのようなモデルが最も適切であるかを、時間をかけて学習することもできる。
例えば、本発明の一実施形態は、以下のモデルタイプを組み合わせる。すなわち、
(1)格付けを使用して、アイテム間の類似度を計算する協調フィルタリングモデル。このタイプのモデルは、各アイテムに対するユーザによる格付けが、どれだけ類似しているかに基づき、各アイテムにスコアを付ける。
(2)時とともに進化する可能性がある、ユーザによって表明された選好を組み込むソフトクエリモデル。例えば、ユーザは、ユーザが、日本食を特に好むが、騒々しい場所を嫌う傾向があることを示すことが可能である。このタイプのモデルは、これらの主観的な選好に合致するアイテムに高いスコアを与える。各活動タイプの特定の属性が、スコアを計算する際に考慮に入れられる(例えば、料理は、EAT活動に関して関係のある属性であるが、製品タイプがより有用である、BUY活動には関係がない)。
(3)コンテキストソフトクエリモデル。このモデルタイプは、ソフトクエリモデルタイプに似通った仕方で機能するが、言明された選好からではなく、以前のユーザ行動から学習された選好を使用する。
(4)距離ベースのモデル。これらのモデルにおいて、ユーザに関する或る距離範囲(ユーザによって明示的に入力された、またはユーザの場所追跡から推測された)を所与として、モデルは、その範囲内でアイテムに最大の有用性を与え、指数関数的減衰関数を使用して、その他のアイテムを格付けする。
(5)レコメンダが、前述したUCPMを使用して、ユーザが以前に見たコンテンツに対するコンテンツの類似度を測定するコンテンツ選好モデル。
(6)経験的な結果に従って、どのようなアイテムをユーザが読む可能性が最も高いかを示すリーディングベースのモデル。
(7)前に見られたアイテムのスコアを低減する(ユーザの退屈さを減らすように)モデル。
(8)コンテンツ分析技術(後段で説明される)からの情報を使用して、コンテンツと関係するアイテムのスコアを上げるモデル。これらのモデルを使用して、システムは、推奨可能な各アイテムの合計の平均スコアを計算し、各活動カテゴリ内の最高の格付けをされたコンテンツから推奨を行う。
図3は、活動関連のキーワードを使用して、メッセージ関連のコンテキスト情報を推測するプロセスを示す流れ図を提示する。この流れ図は、図2の流れ図のステップ204およびステップ206にかかわる動作を、より詳細に示す。
さらに、システムは、メッセージからのデータを片付ける(ステップ302)。例えば、片付けることは、メッセージからXML(拡張マークアップ言語)コードを、後続スペースと一緒に除去することを含むことが可能である。また、片付けることは、ホワイトスペースを「正規化」し、すべての文字を小文字に変換することも含むことが可能である。
次に、システムは、例えば、一般的な省略形を展開することにより、言語を「正規化」する(ステップ304)。例えば、展開することは、2つのホワイトスペースに挟まれた文字「u」を「you」という語で置き換えることを含むことが可能である。
次に、システムは、メッセージの中で活動を示すキーワードおよびパターンを識別する(ステップ306)。例えば、メッセージの中の「movie」というキーワードが、そのメッセージに映画活動がかかわることを示すことが可能である。
また、システムは、メッセージの中の語を証拠語リストと比較する(ステップ308)。これらの証拠語リストには、例えば、時制情報または意見を示す語またはパターンのリストが含まれることが可能である。また、証拠語リストには、データベースからの語のリストも含まれることが可能であり、語は、例えば、活動の場所、映画の題名、料理タイプ、レストラン名などを指定することが可能である。
また、システムは、データから絶対時刻、および時間についての不確かさを抽出する、または推測する(ステップ310)。例えば、システムは、データの中で日付および時刻を探すことができる。また、システムは、時間表現を標準形にして、不確かさの値を時間表現に割り当てることもできる。
最後に、システムパターンは、メッセージの中の語と合致し、識別された合致に基づき、値を属性に割り当てる(ステップ312)。例えば、MOVIE活動に関する属性には、以下が含まれることが可能である。すなわち、
ACTCAT:activity category;
ACTLOC:activity location;
ACTTIME:activity time;
UNCERTAINTY:uncertainty for the activity time;
TENSE:tense information for the message;
TITLE:movie title;and
OPINION:a user’s opinion about a movie.となる。
別の実施例では、EAT活動に関する属性には、以下が含まれることが可能である。すなわち、
ACTCAT:activity category;
SUBCAT:activity subcategory;
CUISINE−TYPE;
ACTLOC:activity location;
RESTAURANT−NAME;
ACTTIME:activity time;
UNCERTAINTY:uncertainty for the activity time;
TENSE:tense information for the message;and
OPINION:a user’s opinion about a restaurant.となる。
例として、テキストメッセージ「hey joe...do you want to watch a movie tonight?」を考慮されたい。このテキストメッセージは、以下の属性値割り当てを生じさせることが可能である。すなわち、
ACTCAT=MOVIE;
ACTLOC=NONE;
ACTTIME=2007/05/25 20:00;
UNCERTAINTY=2hours
TENSE=FUTURE;
TITLE=NONE;
OPINION=NONE.となる。
本発明の一実施形態によるコンピュータシステムを示す図である。 本発明の一実施形態による推奨を行うプロセスを示す流れ図である。 活動関連のキーワードを使用して、メッセージ関連のコンテキスト情報を推定するプロセスを示す流れ図である。
符号の説明
102 メッセージ、104 推論モジュール、106 コンテンツデータベース、108 活動モデル、110 ユーザ選好モデル、112 推奨モジュール、114 推奨、120 ディスプレイ、122 ユーザ。

Claims (3)

  1. プロセッサと、記憶装置と、表示装置と、活動関連のキーワードとキーワードカテゴリとが関連付けられて記憶されたコンテンツデータベースと、を有するコンピュータにおいて、ユーザから送信されるメッセージから活動関連のコンテキスト情報を推測するための方法であって、
    前記プロセッサが、
    前記メッセージを受信するステップと、
    前記メッセージおよび前記コンテンツデータベースを参照し、前記メッセージの中から、前記コンテンツデータベースに保持されている活動関連のキーワード及び前記キーワードに関連する時刻情報を探すステップと、
    前記メッセージの中で見つかった前記キーワード、前記キーワードと関連付けられたキーワードカテゴリ、及び前記時刻情報に基づいて、前記メッセージに関連するコンテキスト情報を推測して前記記憶装置に記憶させるステップと、
    前記記憶装置に記憶されたコンテキスト情報に基づいて、特定の時点における特定の最上レベルの活動へのユーザの関心を示す活動モデルを構築するステップと、
    前記活動モデルと、前記コンテキスト情報に基づいて構築され前記最上レベルの活動内におけるユーザの嗜好を示すユーザ選好モデルとに基づいて、前記ユーザが好むであろう活動を推測して前記表示装置に表示させることで、或る活動を前記ユーザに推奨するステップと、
    を実行することを特徴とする方法。
  2. 請求項1に記載の方法であって、
    前記コンテキスト情報を推測して前記記憶装置に記憶させるステップは、
    前記メッセージの中で見つかったキーワードが複数のキーワードカテゴリと関連付けられている場合は、前記メッセージの中における当該キーワードの周囲のテキストに基づいて、いずれか1のキーワードカテゴリを選択し、前記選択されたキーワードカテゴリに基づいて、前記コンテキスト情報を推測する、
    ことを特徴とする方法。
  3. 請求項1に記載の方法であって、
    前記周囲のテキストは、特定のタイプの活動を示す動詞である、
    ことを特徴とする方法。
JP2008128168A 2007-09-18 2008-05-15 メッセージから活動関連のコンテキスト情報を推測するための方法 Expired - Fee Related JP5336105B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/856,874 US8661046B2 (en) 2007-09-18 2007-09-18 Using a content database to infer context information for activities from messages
US11/856,874 2007-09-18

Publications (2)

Publication Number Publication Date
JP2009076043A JP2009076043A (ja) 2009-04-09
JP5336105B2 true JP5336105B2 (ja) 2013-11-06

Family

ID=39864919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008128168A Expired - Fee Related JP5336105B2 (ja) 2007-09-18 2008-05-15 メッセージから活動関連のコンテキスト情報を推測するための方法

Country Status (3)

Country Link
US (1) US8661046B2 (ja)
EP (1) EP2043032A1 (ja)
JP (1) JP5336105B2 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090187467A1 (en) * 2008-01-23 2009-07-23 Palo Alto Research Center Incorporated Linguistic extraction of temporal and location information for a recommender system
US8874086B2 (en) * 2008-02-07 2014-10-28 Microsoft Corporation Providing relevant advertisements or other content based on a communications identifier
US20100241663A1 (en) * 2008-02-07 2010-09-23 Microsoft Corporation Providing content items selected based on context
US8271413B2 (en) * 2008-11-25 2012-09-18 Google Inc. Providing digital content based on expected user behavior
US8700072B2 (en) 2008-12-23 2014-04-15 At&T Mobility Ii Llc Scalable message fidelity
US8341175B2 (en) 2009-09-16 2012-12-25 Microsoft Corporation Automatically finding contextually related items of a task
EP2317730B1 (en) * 2009-10-29 2015-08-12 Unify GmbH & Co. KG Method and system to automatically change or update the configuration or setting of a communication system
US9672204B2 (en) * 2010-05-28 2017-06-06 Palo Alto Research Center Incorporated System and method to acquire paraphrases
US8818981B2 (en) 2010-10-15 2014-08-26 Microsoft Corporation Providing information to users based on context
WO2013090395A1 (en) * 2011-12-12 2013-06-20 Textbeats, Llc System and method for decoding and/or encoding a text message or instant message sent by a wireless device and transmitting audio and/or video content to the recipient of the text message or instant message based on key words in the text message
US9424334B2 (en) 2011-12-12 2016-08-23 Tcb Encore, Llc Keyword based identity of multi-media content for message
US10313279B2 (en) 2011-12-12 2019-06-04 Rcs Ip, Llc Live video-chat function within text messaging environment
KR101554449B1 (ko) * 2012-06-22 2015-09-18 구글 인코포레이티드 예상된 위치에 기초한 일기 예보
US9256593B2 (en) * 2012-11-28 2016-02-09 Wal-Mart Stores, Inc. Identifying product references in user-generated content
US9015195B1 (en) 2013-01-25 2015-04-21 Google Inc. Processing multi-geo intent keywords
JP5814980B2 (ja) * 2013-06-19 2015-11-17 ヤフー株式会社 レコメンド装置、レコメンド方法及びレコメンドプログラム
US9471671B1 (en) * 2013-12-18 2016-10-18 Google Inc. Identifying and/or recommending relevant media content
US10044661B2 (en) 2014-03-27 2018-08-07 International Business Machines Corporation Social media message delivery based on user location
US10614445B1 (en) 2014-06-04 2020-04-07 Square, Inc. Proximity-based payments
US10963868B1 (en) 2014-09-09 2021-03-30 Square, Inc. Anonymous payment transactions
US10783513B2 (en) * 2014-10-27 2020-09-22 Facebook, Inc. Facilitating sending and receiving of payments using message-based contextual prompts
US20160125370A1 (en) * 2014-10-31 2016-05-05 Square, Inc. Money transfer by use of a syntax
KR102598273B1 (ko) * 2015-09-01 2023-11-06 삼성전자주식회사 답신 메시지 추천 방법 및 이를 위한 디바이스
JP6062515B2 (ja) * 2015-09-18 2017-01-18 ヤフー株式会社 レコメンド装置、レコメンド方法及びレコメンドプログラム
US10049349B1 (en) 2015-09-29 2018-08-14 Square, Inc. Processing electronic payment transactions in offline-mode
US10204084B2 (en) * 2016-06-10 2019-02-12 Microsoft Technology Licensing, Llc Activity modeling in email or other forms of communication
US10397157B2 (en) * 2016-10-27 2019-08-27 International Business Machines Corporation Message management in a social networking environment
US11501262B1 (en) * 2019-02-06 2022-11-15 Intrado Corporation Dynamic and automated management of meetings based on contextual information
US10839166B1 (en) * 2019-07-03 2020-11-17 Loomis Sayles & Company, L.P. Methods and systems for inter-application communication
JP7287333B2 (ja) * 2020-04-06 2023-06-06 トヨタ自動車株式会社 制御装置、プログラム、及び情報処理方法
CN112765486B (zh) * 2021-01-22 2022-04-05 重庆邮电大学 一种融合知识图谱的注意力机制的电影推荐方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003303148A (ja) * 2002-04-09 2003-10-24 Nec Corp 情報配信方法、情報配信システム及びシステム制御プログラム
US7389290B2 (en) * 2002-07-31 2008-06-17 Hewlett-Packard Development Company, L.P. System and method for scoring new messages based on previous responses within a system for harvesting community knowledge
GB2399427A (en) * 2003-03-12 2004-09-15 Canon Kk Apparatus for and method of summarising text
JP4236976B2 (ja) * 2003-03-28 2009-03-11 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 情報通信端末及び情報通知方法
JP2004326150A (ja) * 2003-04-21 2004-11-18 Ntt Docomo Inc コンテンツ提供システム、コンテンツ提供方法、サーバ装置及びクライアント装置
US7158980B2 (en) * 2003-10-02 2007-01-02 Acer Incorporated Method and apparatus for computerized extracting of scheduling information from a natural language e-mail
JP2005267187A (ja) * 2004-03-18 2005-09-29 Nec Corp リンク情報付加装置及びリンク情報付加方法
JP2006228141A (ja) * 2005-02-21 2006-08-31 Nec Corp 情報推薦システム、管理装置、情報推薦方法およびプログラム
US20070168430A1 (en) * 2005-11-23 2007-07-19 Xerox Corporation Content-based dynamic email prioritizer
JP4393454B2 (ja) * 2005-12-27 2010-01-06 株式会社東芝 情報提示システム、情報提示方法、情報提示装置
US7664740B2 (en) * 2006-06-26 2010-02-16 Microsoft Corporation Automatically displaying keywords and other supplemental information
US7836151B2 (en) * 2007-05-16 2010-11-16 Palo Alto Research Center Incorporated Method and apparatus for filtering virtual content
US20080294607A1 (en) * 2007-05-23 2008-11-27 Ali Partovi System, apparatus, and method to provide targeted content to users of social networks

Also Published As

Publication number Publication date
EP2043032A1 (en) 2009-04-01
US20090077027A1 (en) 2009-03-19
JP2009076043A (ja) 2009-04-09
US8661046B2 (en) 2014-02-25

Similar Documents

Publication Publication Date Title
JP5336105B2 (ja) メッセージから活動関連のコンテキスト情報を推測するための方法
US20240169375A1 (en) Linguistic extraction of temporal and location information for a recommender system
US10832008B2 (en) Computerized system and method for automatically transforming and providing domain specific chatbot responses
US20210232589A1 (en) Ephemeral Content Digests for Assistant Systems
US20220020056A1 (en) Systems and methods for targeted advertising
US11514333B2 (en) Combining machine-learning and social data to generate personalized recommendations
US10728203B2 (en) Method and system for classifying a question
US20230306052A1 (en) Method and system for entity extraction and disambiguation
US9171262B2 (en) Directed expertise level-based discovery system, method, and device
US9454729B2 (en) Serendipity generating method, system, and device
US20150095278A1 (en) Adaptive Probabilistic Semantic System and Method
US20140108143A1 (en) Social content distribution network
US20170097966A1 (en) Method and system for updating an intent space and estimating intent based on an intent space
US20200210442A1 (en) Identifying and extracting addresses within content
US10387432B2 (en) Methods, systems and techniques for ranking blended content retrieved from multiple disparate content sources
KR101935937B1 (ko) 오피니언 마이닝을 이용한 광고 정보 제공 시스템 및 그 방법
US20140025496A1 (en) Social content distribution network
US11216735B2 (en) Method and system for providing synthetic answers to a personal question
WO2015096146A1 (en) Systems and methods for a unified audience targeting solution
Panoutsos-Archontis Tourism recommendation system based on user generated content
WO2015042482A1 (en) Social content distribution network
WO2024086395A1 (en) Context-based natural language processing
Schmelewa RELEVANCE OF SOCIAL MEDIA ANALYSIS FOR OPERATIONAL MANAGEMENT IN HEALTH INSURANCE

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130801

R150 Certificate of patent or registration of utility model

Ref document number: 5336105

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees