JP2022135055A - 情報処理装置、情報処理方法および情報処理プログラム - Google Patents

情報処理装置、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
JP2022135055A
JP2022135055A JP2021034630A JP2021034630A JP2022135055A JP 2022135055 A JP2022135055 A JP 2022135055A JP 2021034630 A JP2021034630 A JP 2021034630A JP 2021034630 A JP2021034630 A JP 2021034630A JP 2022135055 A JP2022135055 A JP 2022135055A
Authority
JP
Japan
Prior art keywords
query
information processing
information
search
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021034630A
Other languages
English (en)
Other versions
JP7008152B1 (ja
Inventor
孝太 坪内
Kota Tsubouchi
拓明 田口
Hiroaki Taguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021034630A priority Critical patent/JP7008152B1/ja
Application granted granted Critical
Publication of JP7008152B1 publication Critical patent/JP7008152B1/ja
Publication of JP2022135055A publication Critical patent/JP2022135055A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Figure 2022135055000001
【課題】クエリ間の関係性を適切に推定することができる情報処理装置、情報処理方法および情報処理プログラムを提供する。
【解決手段】本願に係る情報処理装置は、取得部と、抽出部と、推定部とを備える。取得部は、ユーザによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザの検索行動に関する履歴情報を取得する。抽出部は、取得部によって取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出する。推定部は、抽出部によって抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。
【選択図】図5

Description

本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
従来、ユーザが入力した文字列を検索クエリ(以下、単に「クエリ」と呼ぶ)として、様々な情報の検索サービスを行うための技術が提供されている。そのような検索サービスにおいては、ユーザが入力したクエリに誤記が含まれる場合等において、その誤記を変換した上で検索を行い、検索結果をユーザに提供する技術が提供されている(例えば、特許文献1参照)。
特許第6529456号公報
しかしながら、上記の従来技術を用いた場合、入力されたクエリと実際の検索に用いるべきクエリの間の関係性を判断することが難しい。例えば、従来技術では、第1文字列とその第1文字列の誤記として入力され得る第2文字列とを対応付けた辞書を用いて、第2文字列が入力された場合に、第2文字列を第1文字列へと変換しているに過ぎない。
このため、従来技術では、ユーザが入力した第2文字列をそのままクエリとしたい場合には、ユーザは望む検索結果を得られないおそれがある。したがって、クエリ間の関係性を適切に推定することが望まれている。
本願は、上記に鑑みてなされたものであって、クエリ間の関係性を適切に推定することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。
本願に係る情報処理装置は、取得部と、抽出部と、推定部とを備える。前記取得部は、ユーザによって入力された第1クエリによる検索要求に基づいて前記第1クエリとは異なる第2クエリを用いた検索結果が提供された場合の前記ユーザの検索行動に関する履歴情報を取得する。前記抽出部は、前記取得部によって取得された前記履歴情報に基づいて前記検索行動に際してのコンテキストを含む前記検索行動の特徴情報を抽出する。前記推定部は、前記抽出部によって抽出された前記特徴情報の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する。
実施形態の一態様によれば、クエリ間の関係性を適切に推定することができるという効果を奏する。
図1は、実施形態に係る情報処理の一例を示す図である。 図2は、実施形態に係る情報処理の処理説明図(その1)である。 図3は、実施形態に係る情報処理の処理説明図(その2)である。 図4は、実施形態に係る情報処理システムの構成例を示す図である。 図5は、実施形態に係る情報処理装置の構成例を示すブロック図である。 図6は、実施形態に係る推定処理の処理説明図(その1)である。 図7は、実施形態に係る推定処理の処理説明図(その2)である。 図8は、実施形態に係る推定処理の処理説明図(その3)である。 図9は、実施形態に係る情報処理装置が実行する処理手順を示すフローチャートである。 図10は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.情報処理の一例〕
まず、実施形態に係る情報処理の一例について、図1~図3を用いて説明する。図1は、実施形態に係る情報処理の一例を示す図である。また、図2は、実施形態に係る情報処理の処理説明図(その1)である。また、図3は、実施形態に係る情報処理の処理説明図(その3)である。
図1~図3では、実施形態に係る情報処理システム1に含まれる情報処理装置100が、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得し、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出し、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する処理を実行する例を示す。
図1に示すように、実施形態に係る情報処理システム1は、ユーザ端末10と、情報処理装置100とを含む。
ユーザ端末10は、ユーザUすなわちユーザU1,U2…がそれぞれ利用する端末装置であるユーザ端末10-1,10-2…である。ユーザUは、ユーザ端末10から図示略のネットワークを介し、情報処理装置100へアクセスすることで、情報処理装置100が提供するサービスの一つである検索サービスを利用する。なお、以下では、「ユーザU」は、適宜「ユーザ端末10」と読み替えることができる。
情報処理装置100は、各種サービスをユーザUへ提供するサーバ装置である。情報処理装置100が提供するサービスは、例えば、ユーザ端末10にインストールされた各種アプリやブラウザを介して各種情報を提供するサービスである。提供されるサービスには、検索サービスの他、例えば、ニュース提供サービスや、オークションサービス、天気予報サービス、ショッピングサービス、金融取引(株取引等)サービス、路線検索サービス、地図提供サービス、旅行サービス、飲食店紹介サービス、ブログサービス等が含まれてもよい。
ユーザUは、検索サービスを利用する場合、情報処理装置100へアクセス後、ユーザ端末10から検索キーワードとなる文字列であるクエリを入力する。以下、ユーザUが入力するクエリを「第1クエリ」と呼ぶ。そして、ユーザUは、第1クエリによる検索要求を情報処理装置100へ送信する(ステップS1)。
ここで、第1クエリには誤記が含まれる場合がある。情報処理装置100は、例えば誤記として入力され得る第1クエリと、第1クエリに対し正しいと想定される文字列である第2クエリとを対応付けた辞書情報を有しており、これを用いて第1クエリが入力された場合に、第1クエリを第2クエリへ変換して第2クエリを用いた情報の検索を行う。
そして、情報処理装置100は、かかる第2クエリを用いた検索結果をユーザUへ送信する(ステップS2)。ユーザUは、これに応じ、閲覧したい検索結果のうちの一つを選択する(ステップS3)。
ステップS1~S3までの流れを分かりやすく図2に示した。図2に示すのは、ユーザ端末10に表示された検索結果一覧画面の一部の例である。図2では、ユーザUが第1クエリ「XXXX」を入力し、検索を実行したところ、「XXXX」は「YYYY」の誤記候補に含まれており、情報処理装置100は、これに応じて「YYYY」を第2クエリとして用いた検索結果を提供した例を示している。
なお、同図に示すように、第1クエリ「XXXX」による検索結果も下方に表示されており、ユーザUがかかる第1クエリによる検索結果を望んでいるのであれば、これを選択することはできる。ただし、下方に表示されるなど、第2クエリによる検索結果よりも低い優先度で取り扱われる都合上、ユーザUがこれを選択するまでには、第2クエリによる検索結果を選択するよりも時間がかかることとなる。
図1の説明に戻る。情報処理装置100は、これらステップS1~S3のユーザUの検索行動を含むユーザUの行動に関する履歴情報をユーザ端末10から随時収集し、蓄積する。
履歴情報には、例えば、ユーザUが入力した第1クエリによる検索が要求された時点から、ユーザUに第1クエリとは異なる第2クエリを用いた検索結果を提供し、ユーザUによりその検索結果が選択された時点までの経過時間が含まれる。また、履歴情報には、例えば、ユーザUの行動から推定されるコンテキストが含まれる。
コンテキストは、検索行動を含む各種の行動をユーザUが取るに際してのユーザUの状況や、ユーザUの環境等を示す情報である。具体的には、コンテキストには、ユーザUのジオグラフィック属性(検索行動をとった際の位置等)や、デモグラフィック属性(年齢や、性別、収入、職業等)、サイコグラフィック属性(価値観や、ライフスタイル、性格、好み等)等が含まれる。
そして、情報処理装置100は随時、履歴情報に基づいてユーザUの検索行動に関する特徴情報を抽出する(ステップS4)。特徴情報は、前述した選択までの経過時間に関する特徴や、検索行動に際してのコンテキストに関する特徴を含む。
これら特徴は、例えば統計的な特徴である。情報処理装置100は、例えば前述の経過時間の標準偏差を抽出する。例えば、図1には、情報処理装置100が、経過時間の中央値μに対する標準偏差σを抽出した例を示している。また、情報処理装置100は、例えば前述のコンテキストの分布を抽出する。
そして、情報処理装置100は、抽出された時系列上の特徴情報の変化に基づいて、クエリ間、すなわち第1クエリと第2クエリとの間の関係性を推定する(ステップS5)。
具体的には、図3に示すように、情報処理装置100は、例えば経過時間のばらつき度合いが小さい間は、第1クエリと第2クエリとの関係性が高いと推定する。すなわち、情報処理装置100は、第1クエリが第2クエリの誤記であると推定する。
また、情報処理装置100は、例えば経過時間のばらつき度合いが大きくなると、第1クエリと第2クエリとの関係性が低いと推定する。すなわち、情報処理装置100は、第1クエリが第2クエリの誤記でなく、新規のワードであると推定する。これにより、情報処理装置100は、例えば前述の第2クエリの誤記候補から第1クエリを除外することができる。
また、情報処理装置100は、例えばコンテキストの分布のばらつき度合いが小さい間は、第1クエリと第2クエリとの関係性が高いと推定する。すなわち、情報処理装置100は、この場合、ユーザUの検索行動の際のコンテキストが例えば一様であり、これまでの既知の用法により、第1クエリが用いられていると推定する。したがって、第1クエリが第2クエリの誤記である場合を含む。
また、情報処理装置100は、例えばコンテキストの分布のばらつき度合いが大きくなると、第1クエリと第2クエリとの関係性が低いと推定する。すなわち、情報処理装置100は、既知の用法とは異なる新規の用法で用いられていると推定する。したがって、第1クエリが第2クエリの誤記でなく、新規のワードとして入力される場合を含む。
このように、新規の用法で用いられていることを推定できる、言い換えれば、特定の文字列に新たな特徴が表出してくるのを検出できることによって、ターゲティング等の各種分析や、いわゆる「バズる」といった事象発生の検出等に活用することができる。
上述したように、実施形態に係る情報処理方法では、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得し、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出し、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。
したがって、実施形態に係る情報処理方法によれば、クエリ間の関係性を適切に推定することができる。
以下、上記のような情報処理を行う情報処理装置100、および、かかる情報処理装置100を含む情報処理システム1について詳細に説明する。
〔2.情報処理システム1の構成〕
次に、図4を用いて、実施形態に係る情報処理システム1の構成について説明する。図4は、実施形態に係る情報処理システム1の構成例を示す図である。図4に例示するように、実施形態に係る情報処理システム1は、複数のユーザ端末10-1~10-nと、情報処理装置100と、を含む。
これらの各種装置は、ネットワークNを介して、有線または無線により通信可能に接続される。ネットワークNは、LAN(Local Area Network)、WAN(Wide Area Network)、電話網(携帯電話網、固定電話網等)、地域IP(Internet Protocol)網、インターネット等の通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。
ユーザ端末10は、上記したように、ユーザUによって利用される端末装置である。ユーザ端末10は、例えば、スマートフォンを含む携帯電話機や、タブレット端末や、デスクトップ型PCや、ノート型PCや、PDA(Personal Digital Assistant)等の情報処理装置である。また、ユーザ端末10には、眼鏡型や時計型の情報処理装置であるウェアラブルデバイス(wearable device)も含まれる。
ユーザ端末10は、ユーザUによる操作や、ユーザ端末10が有する機能(例えば、検索サービスを利用するためのアプリを実行する機能や、ブラウザ機能等)に応じて各種情報を取得し、取得した情報に応じた情報を生成して送信する。例えば、ユーザ端末10は、ネットワークNを介して、情報処理装置100が提供する検索サービスのサイトへアクセスする。そして、ユーザUが例えば検索したい検索キーワードであるクエリを指定することによって、ユーザ端末10は、情報処理装置100に対してクエリを送信する。
情報処理装置100は、ユーザ端末10に対し、検索サービスを提供するサービス提供サーバとして機能するサーバ装置である。また、情報処理装置100は、検索サービスの履歴情報に基づいてユーザUの検索行動の特徴情報を抽出するとともに、抽出された特徴情報の変化に基づいてクエリ間の関係性を推定する。
なお、図4では、1つの情報処理装置100が、検索サービスの提供、特徴情報の抽出、クエリ間の関係性の推定の各機能を兼ね備える場合を示したが、例えば、複数の情報処理装置100が、これらの各機能を分担して行ってもよい。
〔3.情報処理装置100〕
次に、図5を用いて、情報処理装置100の構成例について説明する。図5は、実施形態に係る情報処理装置100の構成例を示すブロック図である。なお、図5では、情報処理装置100の説明に必要となる構成要素のみを示しており、一般的な構成要素についての記載を省略している。
図5に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、ネットワークNと有線または無線で接続され、ネットワークNを介して、ユーザ端末10との間で情報の送受信を行う。
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現され、図5の例では、記憶部120は、履歴情報記憶部121と、特徴情報記憶部122と、推定情報記憶部123とを有する。
(履歴情報記憶部121)
履歴情報記憶部121は、後述する取得部131によって取得されるユーザUの検索行動の履歴に関する各種情報、すなわち上述した履歴情報を記憶する。したがって、履歴情報記憶部121は、例えば、ユーザUが入力した第1クエリによる検索が要求された第1時点から、ユーザUに第1クエリとは異なる第2クエリを用いた検索結果を提供し、ユーザUによりその検索結果が選択された第2時点までの経過時間を記憶する。また、履歴情報記憶部121は、例えば、ユーザUの検索行動から推定されるコンテキストを記憶する。
(特徴情報記憶部122)
特徴情報記憶部122は、後述する抽出部132によって抽出されるユーザUの検索行動に関する特徴情報を記憶する。特徴情報は、上述したように、前述の経過時間に関する統計的な特徴や、コンテキストに関する統計的な特徴を含む。
(推定情報記憶部123)
推定情報記憶部123は、後述する推定部133によって推定された推定結果に関する情報を記憶する。例えば、推定情報記憶部123は、新たなワードとして推定した新単語を記憶する。また、例えば、推定情報記憶部123は、推定した新たな用法を単語(新単語を含む)に対応付けて記憶する。
(制御部130について)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、コントローラであり、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図5に示すように、制御部130は、取得部131と、抽出部132と、推定部133と、処理部134と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図5に示した構成に限られず、後述する情報処理を行うことができる構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図5に示した接続関係に限られず、他の接続関係であってもよい。
制御部130は、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得し、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出し、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。
(取得部131について)
取得部131は、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得する。
具体的には、取得部131は、通信部110を介して、ユーザUによって入力された第1クエリによる検索要求を取得する。また、取得部131は、通信部110を介して、ユーザUによって選択された検索結果を取得する。また、取得部131は、通信部110を介して履歴情報を取得し、履歴情報記憶部121へ記憶させる。
(抽出部132について)
抽出部132は、履歴情報記憶部121へ記憶された履歴情報に基づいて、ユーザUの検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出する。
抽出部132は、例えば前述の経過時間の標準偏差を抽出する。また、抽出部132は、例えば前述のコンテキストの分布を抽出する。コンテキストの分布については、図6~図8を用いた説明で後述する。また、抽出部132は、抽出された特徴情報を特徴情報記憶部122へ記憶させる。
(推定部133について)
推定部133は、特徴情報記憶部122へ記憶された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。また、推定部133は、推定された推定結果に関する情報を推定情報記憶部123へ記憶させる。
ここで、推定部133が実行する推定処理について、より具体的に説明する。図6は、実施形態に係る推定処理の処理説明図(その1)である。また、図7は、実施形態に係る推定処理の処理説明図(その2)である。また、図8は、実施形態に係る推定処理の処理説明図(その3)である。
なお、図6~図8を用いた説明では、上述したコンテキストの分布に基づいてクエリ間の関係性を推定する場合について説明する。
図6に示すように、例えば既知のメディア作品に関する既知のワード「鬼滅の巨人」があり、これに対する第1クエリとして「撲滅の巨人」があるものとする。当初、「撲滅の巨人」は、「鬼滅の巨人」の誤記候補であるものとする。
かかる場合に、第1クエリ「撲滅の巨人」が入力されたユーザUの検索行動から推定されるコンテキスト群が、図7に示すように、時点T1においては、年齢「10代」、性別「男性および女性」、職業「学生」、検索時間帯「「鬼滅の巨人」の放送時間帯」、位置情報「全国各地」等であったとする。
一方、同図に示すように、時点T1より後の時点T2においては、年齢「20代以上」、性別「男性および女性」、職業「社会人」、検索時間帯「B県警の「事故撲滅の巨人」キャンペーンCM放送後」、位置情報「B県」等であったとする。なお、時点T1から時点T2の間は通常、ある程度の日数が空く場合が多い。
推定部133は、これら時点T1,T2のそれぞれにおけるコンテキストの分布を比較することによって、クエリ間の関係性を推定する。なお、同図に示すようにコンテキストの内容およびその変化は多様であり、言い換えればコンテキストは多次元の特徴を有すると言える。
そこで、推定部133は、例えば機械学習のアルゴリズムを用いた時点T1,T2それぞれにおけるコンテキストの分布を算出する。
具体的には、図8に示すように、例えば推定部133は、UMAP(Uniform Manifold Approximation and Projection)を用いた次元削減により、コンテキストの分布を算出する。UMAPは、機械学習による非線形次元圧縮手法であり、リーマン幾何学と代数トポロジーに基づき、高次元空間のデータ構造を保ち、トポロジー間のクロス・エントロピーを最小にしながら低次元のデータに変換する。
すなわち、推定部133は、かかるUMAPを用いて、時点T1,T2それぞれにおける検索行動のコンテキストの高次元空間における特徴量を、次元削減による低次元表現へ変換する。同図では、推定部133が、コンテキストの高次元空間における特徴量を三次元の低次元空間へ変換して埋め込んだ例を示している。図中の丸印の一つ一つは、それぞれユーザUの検索行動の一つ一つに対応する。
ここで、同図に示すように、例えばコンテキストの分布が、時点T1においてはある領域R1にまとまっていたが、時点T2においては、領域R1については減少したものの、領域R1とは明らかに異なる領域R2へ新たにまとまって見られるようになったとする。
かかる場合、推定部133は、同図に示す三次元の特徴量空間においてコンテキストの分布のばらつき度合いが大きくなったと判定できるので、第1クエリと第2クエリとの関係性が低いと推定する。すなわち、推定部133は、時点T2における第1クエリ「撲滅巨人」は、既知の用法とは異なる新規の用法で用いられていると推定する。なお、コンテキストの分布のばらつき度合いが大きいか否かは、例えば上述の三次元空間におけるコンテキストの分布の時点T1から時点T2にかけての変化量が、所定の閾値以上である否かによって判定することができる。
また、図8を用いた説明では、次元削減のアルゴリズムとしてUMAPを用いる例を挙げたが、用いるアルゴリズムを限定するものではない。例えば他のアルゴリズムとして、主成分分析や、t分布型確率的近傍埋め込み法(t-SNE:t-distributed Stochastic Neighbor Embedding)等を用いてもよい。
(処理部134について)
図5の説明に戻る。処理部134は、各種の処理を実行する。処理部134は、ユーザUが入力した第1クエリに基づく検索処理を実行する。処理部134は、ユーザUが入力した第1クエリを用いて検索処理を実行する。また、処理部134は、ユーザUへ提供するコンテンツを含む各種情報を生成する。
また、処理部134は、ユーザUが入力した第1クエリとは異なる第2クエリを用いて検索処理を実行する。処理部134は、ユーザUが入力した第1クエリが前述の誤記候補に含まれる場合、第1クエリを、その第1クエリに対応付けられた第2クエリへ変換する。そして、処理部134は、変換後の第2クエリを用いて検索処理を実行する。
(提供部135について)
提供部135は、通信部110を介して、ユーザ端末10へ各種情報を送信する。提供部135は、ユーザUへ検索サービスを提供する。例えば、提供部135は、処理部134による検索処理の結果である検索結果をユーザ端末10へ送信する。また、提供部135は、処理部134により生成された各種情報をユーザ端末10へ送信する。また、提供部135は、推定部133によって推定された推定結果を情報処理装置100のオペレータ等へ提供する。
〔4.情報処理装置100の処理手順〕
次に、実施形態に係る情報処理装置100が実行する処理手順について説明する。図9は、実施形態に係る情報処理装置100が実行する処理手順を示すフローチャートである。
図9に示すように、まず取得部131が、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得する(ステップS101)。
そして、抽出部132が、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出する(ステップS102)。
そして、推定部133が、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する(ステップS103)。そして、処理を終了する。
〔5.ハードウェア構成〕
上述してきた実施形態に係る情報処理装置100やユーザ端末10は、例えば図10に示すような構成のコンピュータ1000によって実現される。以下、情報処理装置100を例に挙げて説明する。図10は、実施形態に係る情報処理装置100の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU(Central Processing Unit)1100、RAM(Random Access Memory)1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、およびメディアインターフェイス(I/F)1700を備える。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラムおよび当該プログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網500(図4に示したネットワークNに対応)を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網500を介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、当該プログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の各機能を実現する。また、HDD1400には、記憶部120内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、通信網500を介してこれらのプログラムを取得してもよい。
〔6.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、図5に示した取得部131と提供部135とは、統合されてもよい。また、例えば、抽出部132と推定部133とは、統合されてもよい。また、例えば、記憶部120に記憶される情報は、ネットワークNを介して、外部に備えられた所定の記憶装置に記憶されてもよい。
また、上記実施形態では、情報処理装置100が、例えば、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得する取得処理と、取得された履歴情報に基づいて検索行動に際してのコンテキストを含む検索行動の特徴情報を抽出する抽出処理と、抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する推定処理と、を行う例を示した。しかし、上述した情報処理装置100は、取得処理を行う取得装置と、抽出処理を行う抽出装置と、推定処理を行う推定装置とが分離されてもよい。この場合、取得装置は、少なくとも取得部131を有する。抽出装置は、少なくとも抽出部132を有する。推定装置は、少なくとも推定部133を有する。そして、上記の情報処理装置100による処理は、取得装置と、抽出装置と、推定装置との各装置を含む情報処理システム1によって実現される。
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
〔7.効果〕
実施形態に係る情報処理装置100は、取得部131と、抽出部132と、推定部133とを備える。取得部131は、ユーザUによって入力された第1クエリによる検索要求に基づいて第1クエリとは異なる第2クエリを用いた検索結果が提供された場合のユーザUの検索行動に関する履歴情報を取得する。抽出部132は、取得部131によって取得された履歴情報に基づいて上記検索行動に際してのコンテキストを含む上記検索行動の特徴情報を抽出する。推定部133は、抽出部132によって抽出された特徴情報の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。
したがって、実施形態に係る情報処理装置100によれば、クエリ間の関係性を適切に推定することができる。
また、推定部133は、特徴情報に含まれる上記検索行動に関する統計的な特徴の時系列上の変化に基づいて、第1クエリと第2クエリとの間の関係性を推定する。
したがって、実施形態に係る情報処理装置100によれば、統計的な特徴の時系列上の変化に基づいて、クエリ間の関係性を適切に推定することができる。
また、推定部133は、特徴情報に含まれるコンテキストの分布のばらつき度合いに基づいて、第1クエリと第2クエリとの間の関係性を推定する。
したがって、実施形態に係る情報処理装置100によれば、コンテキストの分布のばらつき度合いに基づいて、クエリ間の関係性を適切に推定することができる。
また、推定部133は、時点T1(「第1時点」の一例に相当)における上記ばらつき度合いと、時点T1よりも後の時点T2(「第2時点」の一例に相当)における上記ばらつき度合いとを比較することによって、第1クエリと第2クエリとの間の関係性を推定する。
したがって、実施形態に係る情報処理装置100によれば、時点T1における上記ばらつき度合いと、時点T2における上記ばらつき度合いとの比較により、クエリ間の関係性を適切に推定することができる。
また、推定部133は、時点T1から時点T2にかけての上記ばらつき度合いの変化量が所定の閾値以上である場合に、第1クエリが既知の用法とは異なる新規の用法で用いられていると推定する。
したがって、実施形態に係る情報処理装置100によれば、上記ばらつき度合いに基づいて、第1クエリが既知の用法とは異なる新規の用法で用いられていると推定することができる。また、特定の文字列に新たな特徴が表出してくるのを検出できることによって、ターゲティング等の各種分析や、いわゆる「バズる」といった事象発生の検出等に活用することができる。
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
1 情報処理システム
10 ユーザ端末
100 情報処理装置
110 通信部
120 記憶部
121 履歴情報記憶部
122 特徴情報記憶部
123 推定情報記憶部
130 制御部
131 取得部
132 抽出部
133 推定部
134 処理部
135 提供部

Claims (7)

  1. ユーザによって入力された第1クエリによる検索要求に基づいて前記第1クエリとは異なる第2クエリを用いた検索結果が提供された場合の前記ユーザの検索行動に関する履歴情報を取得する取得部と、
    前記取得部によって取得された前記履歴情報に基づいて前記検索行動に際してのコンテキストを含む前記検索行動の特徴情報を抽出する抽出部と、
    前記抽出部によって抽出された前記特徴情報の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する推定部と
    を備えることを特徴とする情報処理装置。
  2. 前記推定部は、
    前記特徴情報に含まれる前記検索行動に関する統計的な特徴の時系列上の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記推定部は、
    前記特徴情報に含まれる前記コンテキストの分布のばらつき度合いに基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する
    ことを特徴とする請求項2に記載の情報処理装置。
  4. 前記推定部は、
    第1時点における前記ばらつき度合いと、前記第1時点よりも後の第2時点における前記ばらつき度合いとを比較することによって、前記第1クエリと前記第2クエリとの間の関係性を推定する
    ことを特徴とする請求項3に記載の情報処理装置。
  5. 前記推定部は、
    前記第1時点から前記第2時点にかけての前記ばらつき度合いの変化量が所定の閾値以上である場合に、前記第1クエリが既知の用法とは異なる新規の用法で用いられていると推定する
    ことを特徴とする請求項4に記載の情報処理装置。
  6. コンピュータが実行する情報処理方法であって、
    ユーザによって入力された第1クエリによる検索要求に基づいて前記第1クエリとは異なる第2クエリを用いた検索結果が提供された場合の前記ユーザの検索行動に関する履歴情報を取得する取得工程と、
    前記取得工程において取得された前記履歴情報に基づいて前記検索行動に際してのコンテキストを含む前記検索行動の特徴情報を抽出する抽出工程と、
    前記抽出工程において抽出された前記特徴情報の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する推定工程と
    を含むことを特徴とする情報処理方法。
  7. ユーザによって入力された第1クエリによる検索要求に基づいて前記第1クエリとは異なる第2クエリを用いた検索結果が提供された場合の前記ユーザの検索行動に関する履歴情報を取得する取得手順と、
    前記取得手順によって取得された前記履歴情報に基づいて前記検索行動に際してのコンテキストを含む前記検索行動の特徴情報を抽出する抽出手順と、
    前記抽出手順によって抽出された前記特徴情報の変化に基づいて、前記第1クエリと前記第2クエリとの間の関係性を推定する推定手順と
    をコンピュータに実行させることを特徴とする情報処理プログラム。
JP2021034630A 2021-03-04 2021-03-04 情報処理装置、情報処理方法および情報処理プログラム Active JP7008152B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021034630A JP7008152B1 (ja) 2021-03-04 2021-03-04 情報処理装置、情報処理方法および情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021034630A JP7008152B1 (ja) 2021-03-04 2021-03-04 情報処理装置、情報処理方法および情報処理プログラム

Publications (2)

Publication Number Publication Date
JP7008152B1 JP7008152B1 (ja) 2022-01-25
JP2022135055A true JP2022135055A (ja) 2022-09-15

Family

ID=80629619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021034630A Active JP7008152B1 (ja) 2021-03-04 2021-03-04 情報処理装置、情報処理方法および情報処理プログラム

Country Status (1)

Country Link
JP (1) JP7008152B1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7617202B2 (en) * 2003-06-16 2009-11-10 Microsoft Corporation Systems and methods that employ a distributional analysis on a query log to improve search results
JP5080544B2 (ja) * 2009-07-23 2012-11-21 楽天株式会社 適切な検索クエリを提示する情報処理装置、情報処理方法、および、情報処理プログラム
JP5292250B2 (ja) * 2009-10-13 2013-09-18 日本電信電話株式会社 文書検索装置、文書検索方法、文書検索プログラム
JP5296011B2 (ja) * 2010-06-04 2013-09-25 ヤフー株式会社 関連バーストクエリ抽出装置及び方法

Also Published As

Publication number Publication date
JP7008152B1 (ja) 2022-01-25

Similar Documents

Publication Publication Date Title
US10699321B2 (en) Global vector recommendations based on implicit interaction and profile data
US20210142196A1 (en) Digital content classification and recommendation based upon artificial intelligence reinforcement learning
JP2020024674A (ja) 情報をプッシュするための方法及び装置
JP2018504686A (ja) 検索データを処理するための方法及び装置
JP2009265754A (ja) 情報提供装置、情報提供方法及び情報提供プログラム
JP2017146926A (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP6591012B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP6925244B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP6407318B2 (ja) 情報処理装置、端末装置、情報処理方法及び情報処理プログラム
JP6085700B2 (ja) 情報処理装置、端末装置、情報処理方法及び情報処理プログラム
US20160196266A1 (en) Inferring seniority based on canonical titles
JP7008152B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
US11586639B2 (en) Information computing apparatus, information computing method, and non-transitory computer readable storage medium
JP2020035219A (ja) 情報処理装置、情報処理方法および情報処理プログラム
WO2021098876A1 (zh) 一种基于知识图谱的问答方法及装置
JP2019185620A (ja) メッセージ処理装置及びプログラム
US20160196619A1 (en) Homogenizing time-based seniority signal with transition-based signal
US9177255B1 (en) Cloud systems and methods for determining the probability that a second application is installed based on installation characteristics
JP7390091B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2020035072A (ja) 情報処理装置、情報処理方法および情報処理プログラム
US20240177068A1 (en) Predicting user attributes using uncertainty estimate modeling
JP7372285B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP7342534B2 (ja) チャットプログラム、装置、及び方法
JP7068999B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP7413423B2 (ja) 情報処理システム、および情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211020

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20211020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220107

R150 Certificate of patent or registration of utility model

Ref document number: 7008152

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350