JP6560321B2

JP6560321B2 - 判定プログラム、判定装置及び判定方法

Info

Publication number: JP6560321B2
Application number: JP2017219946A
Authority: JP
Inventors: 純也笹本
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2017-11-15
Filing date: 2017-11-15
Publication date: 2019-08-14
Anticipated expiration: 2037-03-16
Also published as: JP2018156627A

Description

本発明は、判定プログラム、判定装置及び判定方法に関する。

インターネット等の通信において、ユーザの一連の行動（セッション）は、セッション情報としてサーバ等に取得される。サーバは、例えば、ユーザのクッキー（cookie）等を参照し、あるショッピングサイトにおける一連の行動が、ある一人のユーザ（言い換えれば、当該ユーザが操作する端末装置）によって行われていると判定する。

なお、セッションに関する技術として、例えば、クライアントとサーバとを接続する仮想私設網において、安定的な通信を確保しながら低コストでセッション情報の資源枯渇を防止するための技術が知られている。

特開２００５−１１０３０２号公報

ところで、ユーザが音声認識技術を利用してショッピングサイト等で購買を行う際には、ユーザが意図する一連の行動を一つのセッションとして認識させることが難しい場合がある。例えば、音声認識では、ユーザの発した音声が途中で途切れた場合に、そのユーザの行動が終了したものとしてセッションを閉じる場合がある。すなわち、ユーザは、意図した音声を一度に連続して発さなければ、言い直しを要求されたり、ショッピングサイトへのログインを再度求められたりする場合がある。この場合、ユーザは、意図しない余計な音声入力を行う手間を掛けなくてはならない。このように、ネットワーク上において音声認識技術を利用する場合に、ユーザビリティの高いセッション管理が行われていないという現状がある。

本願は、上記に鑑みてなされたものであって、ユーザビリティの高いセッション管理を行うことができる判定プログラム、判定装置及び判定方法を提供することを目的とする。

本願に係る判定プログラムは、ユーザが利用する端末装置であるユーザ端末の周囲の環境音を収集する収集手順と、前記収集手順によって収集された前記環境音が所定の閾値を超えて変化するか否かに基づいて当該環境音の連続性を判定するとともに、当該環境音の連続性に基づいて、前記ユーザの所定の行動が１つのセッションに含まれるか否かを判定する判定手順と、をコンピュータに実行させることを特徴とする。

実施形態の一態様によれば、ユーザビリティの高いセッション管理を行うことができるという効果を奏する。

図１は、実施形態に係る判定処理の一例を示す図である。図２は、実施形態に係る判定処理システムの構成例を示す図である。図３は、実施形態に係る判定装置の構成例を示す図である。図４は、実施形態に係るセッション記憶部の一例を示す図である。図５は、実施形態に係る行動テーブルの一例を示す図である。図６は、実施形態に係る効果テーブルの一例を示す図である。図７は、実施形態に係るユーザ端末の構成例を示す図である。図８は、実施形態に係る処理手順を示すフローチャートである。図９は、変形例に係る判定装置の構成例を示す図である。図１０は、変形例に係る登録テーブルの一例を示す図である。図１１は、変形例に係る照合テーブルの一例を示す図である。図１２は、変形例に係る処理手順を示すフローチャートである。図１３は、判定装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

以下に、本願に係る判定プログラム、判定装置及び判定方法を実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る判定プログラム、判定装置及び判定方法が限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

〔１．判定処理の一例〕
まず、図１を用いて、実施形態に係る判定処理の一例について説明する。図１は、実施形態に係る判定処理の一例を示す図である。図１では、本願に係る判定プログラムによって動作するサーバ装置である判定装置１００によって、実施形態に係る判定処理が行われる流れについて説明する。より具体的には、図１では、本願に係る判定装置１００によって、ネットワーク上のユーザの所定の行動が、１つのセッションに含まれるか否かを判定する処理が行われる一例を示す。

なお、実施形態では、セッションとは、ネットワーク上のユーザの一連の行動を示す。例えば、セッションは、ユーザが所定の目的（意図）を持った行動を行う期間を意味する。また、セッションは、その一連の行動が同一のユーザによって行われていることを意味する。

例えば、セッションは、予め設定された所定時間（例えば３０分）で定義付けられてもよいし、ユーザがショッピングサイトにログインしてからログオフするまでの間と定義付けられてもよい。また、セッションは、ユーザがショッピングサイトにログインしてから、所定の行動（例えば、任意の商品の注文手続きを完了させたこと）が行われるまでの間と定義付けられてもよい。あるいは、セッションは、ある行動が行われてから所定時間（例えば５分）が経過しないうちに次の行動が行われた場合にはセッションが継続していると判定され、次の行動が行われない場合にはセッションが終了したと判定されるように定義付けられてもよい。具体的には、判定装置１００は、ユーザがユーザ端末１０への操作を５分以上の間隔を空けずに継続している場合に、セッションが継続していると判定してもよい。また、判定装置１００は、セッションの継続中において、ユーザの操作が最後に行われてから５分以上ユーザの操作がなかった場合に、セッションを終了したとして、新たなセッションを開始してもよい。

実施形態において、判定装置１００は、ユーザから送信される音声を認識し、所定のサービスを提供するものとする。図１の例では、判定装置１００は、送信された音声を認識し、所定の商品の注文を受け付けるショッピングサービスを提供する。なお、このようなサービスは、判定装置１００ではなく、判定装置１００と通信する所定のサーバ（例えば、ウェブサーバ）によって提供されてもよい。

判定装置１００は、例えば、ユーザから送信された音声が、任意の商品名と注文を意図する語とを含む場合、当該商品がユーザから注文されたと認識する。具体的には、判定装置１００は、音声を「お米買って。」と認識した場合、「お米」を、任意の商品名と認識し、「買って。」を、注文を意図する語として認識する。すなわち、判定装置１００は、ショッピングサービスにおいてユーザがお米を注文したと認識し、注文に関する手続き処理を行う。なお、音声認識については、種々の既知の技術を用いることが可能であるため、説明を省略する。

一般に、音声認識を利用しない注文の場合、サービスを提供するサーバは、所定の識別情報に基づいて、ユーザのセッションを判定する。例えば、サービスを提供するサーバは、ショッピングページにアクセスしたユーザＵ１のクッキー情報を取得し、クッキー情報に基づいてセッションを判定する。これにより、サービスを提供するサーバは、例えば、ショッピングサイトにログインしたことや、お米をカートに入れたことや、カートに入れたお米を注文する等の行動が、ユーザＵ１によって行われた一連の行動であると判定できる。

一方、音声認識を利用した注文が行われる場合、サービスを提供するサーバは、ユーザの所定の行動が、１つのセッションに含まれるか否かを判定できない場合がある。例えば、ユーザが「お米」と言ったあとに、何らかの別の行動を行ったことにより、所定時間、音声が途切れたとする。そして、ユーザは、所定時間ののちに、「買って。」と発話したとする。この場合、サービスを提供するサーバは、先のユーザの発声と、後で行われた発声とが、１つのセッションに含まれるか否かを判定することが難しい。具体的には、サービスを提供するサーバは、「買って。」という命令に対応する商品名を認識することができない。このため、ユーザは、再度音声の入力を行うこととなる。場合によっては、ユーザは、セッションが終了したと判定され、再度のログインを求められることもある。このように、セッションが適切に判定できない場合、サービス側は、サービスのユーザビリティを低下させるおそれがある。

そこで、実施形態に係る判定装置１００は、実施形態に係る判定処理によって、ユーザの所定の行動が１つのセッションに含まれるか否かを判定する。具体的には、判定装置１００は、ユーザが利用する端末装置であるユーザ端末１０を介して、ユーザの周囲の環境音を収集する。そして、判定装置１００は、収集した環境音の連続性に基づいて、ユーザの所定の行動が１つのセッションに含まれるか否かを判定する。これにより、判定装置１００は、ユーザの置かれた状況に基づき適切にセッションの判定を行うので、ユーザビリティの高いセッション管理を行うことができる。以下、図１を用いて、実施形態に係る判定処理を流れに沿って説明する。

図１に示すユーザ端末１０は、ユーザによって利用される情報処理端末である。図１では、ユーザ端末１０は、例えばスマートフォン（Smartphone）である。図１の例では、ユーザ端末１０は、ユーザの一例であるユーザＵ１によって利用されるものとする。なお、以下では、ユーザをユーザ端末１０と読み替える場合がある。例えば、「ユーザＵ１が音声を送信する」という記載は、実際には、「ユーザＵ１が利用するユーザ端末１０が音声を送信する」という状況を示す場合がある。

図１の例において、ユーザ端末１０は、周囲の環境音や、ユーザＵ１からの音声入力を検知する（ステップＳ０１）。例えば、ユーザ端末１０は、内部に備えられたマイクロフォンによりこれらの音を検知する。なお、以下では、環境音や音声などの音に関する情報を、音情報と総称する場合がある。

実施形態では、環境音とは、ユーザＵ１が何らかの意図をもってユーザ端末１０に入力した音声以外の音をいう。例えば、環境音の一例は、ユーザＵ１が拠点とする場所における暗騒音となりうる音である。具体的には、環境音は、ユーザＵ１の自宅５０における、エアコン６０の稼働音や、テレビ７０が出力する音である。また、環境音は、自宅５０における、水道から水が流れる音や、ドアの開け閉めの音などの生活音であってもよい。また、環境音は、自然環境に関する音でもよい。例えば、環境音は、自宅５０内で検知できる外の雨音や、風の音等でもよい。また、環境音は、人工的に発せられる音でもよい。例えば、環境音は、ユーザＵ１がマウスをクリックする音や、キーボードを押下する音等であってもよい。

また、ユーザＵ１からの音声入力とは、ユーザＵ１が何らかの意図をもってユーザ端末１０に入力した音声をいう。図１の例では、ユーザＵ１からの音声入力は、例えば、ユーザ端末１０を介して、判定装置１００が提供するショッピングサービスを利用するために発せられる音声である。なお、ユーザＵ１からの音声入力は、ユーザ端末１０に対する指示の音声であってもよい。例えば、ユーザＵ１からの音声入力は、ユーザ端末１０を起動するための音声や、判定装置１００が提供するサービスへアクセスすることを指示する音声や、サービスにログインするためにユーザ端末１０の認証（例えば、声紋認証）を受けるための音声等であってもよい。

ユーザ端末１０は、これらの検知した音情報を、ネットワークを介して、判定装置１００に送信する（ステップＳ０２）。判定装置１００は、送信された音情報を収集する（ステップＳ０３）。図１の例では、判定装置１００は、ユーザ端末１０の周囲の環境音とともに、ユーザＵ１の音声入力である「お米・・・」という音情報を収集する。

ステップＳ０３の後、所定時間が経過したものとする（ステップＳ０４）。例えば、ユーザＵ１が、「お米・・・」という音声を発した後に、他に購入すべき商品がなかったかを確認するためユーザ端末１０に保存されていたメモを閲覧したことで、所定時間（例えば、数分間）が経過したものとする。また、この間、ユーザＵ１は、音声を発せず、ユーザ端末１０に表示されていたメモを閲覧していたものとする。

ユーザ端末１０は、ステップＳ０４を経て、さらに、周囲の環境音やユーザＵ１からの音声入力を検知する（ステップＳ０５）。ステップＳ０５において、ユーザ端末１０は、ユーザＵ１の「買って。」という音声入力を検知する。また、ユーザ端末１０は、ステップＳ０１からステップＳ０５までと同様に、エアコン６０が稼働する音や、テレビ７０から出力される音などの環境音を検知しているものとする。

ユーザ端末１０は、ステップＳ０２と同様、検知した音情報を判定装置１００に送信する（ステップＳ０６）。判定装置１００は、送信された音情報を収集する。

そして、判定装置１００は、収集された環境音の連続性に基づいて、ユーザの所定の行動が１つのセッションに含まれるか否かを判定する。具体的には、判定装置１００は、連続した環境音のもとで行われた一連の行動を１つのセッションと判定する（ステップＳ０７）。図１の例では、判定装置１００は、ステップＳ０１で検知された環境音と、ステップＳ０４を経て、ステップＳ０５で検知された環境音とに連続性がある場合に、ステップＳ０１で発せられた「お米・・・」という音声入力と、ステップＳ０５で発せられた「買って。」という音声入力とが１つのセッションに含まれると判定する。

判定装置１００は、音声入力が１つのセッションに含まれると判定した場合、「買って。」という注文を意図する語を認識し、その注文の対象の商品名として、ステップＳ０１で発せられた「お米・・・」を認識する。すなわち、判定装置１００は、ステップＳ０１で行われた音声入力という行動と、ステップＳ０５で行われた音声入力という行動との間に所定時間が経過し、かつ、判定装置１００に対する何らかの入力が行われなくとも、環境音の連続性に基づいて、ユーザＵ１のセッションを維持する。

なお、環境音の連続性について詳しくは後述するが、例えば、判定装置１００は、ユーザ端末１０に検知された定常的に発せられる周囲の環境音を数秒毎に収集し、収集した環境音の音圧や周波数、波形等が所定の閾値を超えない場合に、環境音の連続性が保たれていると判定する。なお、判定装置１００は、音が発せられる方向や音源までの距離等を推定し、推定した情報が所定の閾値を超えない場合に、環境音の連続性が保たれていると判定してもよい。

このように、実施形態に係る判定装置１００は、周囲の環境音を収集し、収集した環境音の連続性に基づいて、ユーザＵ１の所定の行動が１つのセッションに含まれるか否かを判定する。

すなわち、判定装置１００は、環境音に基づいて、音声認識を利用したサービスに対して行われる複数の行動が、ユーザＵ１という同一のユーザによって行われている一連の行動であることを判定する。具体的には、判定装置１００は、ユーザＵ１から送信される音声が途中で途切れた場合でも、環境音が連続している場合には、ユーザＵ１が移動したり、何か別の行動をしようとしたりしているのではなく、単にユーザ端末１０への入力を待機しているだけであると判定する。また、判定装置１００は、ユーザＵ１のログイン後、環境音が連続している場合には、ユーザ端末１０を利用するユーザに変化がないと判定する。このように、判定装置１００は、ユーザＵ１が、意図した音声を一度に連続して発さなくとも、環境音を利用することで、セッションを維持し続けることができる。これにより、ユーザＵ１は、セッションが途切れたことによる再度のログインや、再度の音声入力を行う手間を省くことができる。結果として、判定装置１００は、ユーザＵ１がネットワーク上において音声認識技術を利用する場合に、ユーザビリティの高いセッション管理を行うことができる。

また、判定装置１００によれば、ユーザＵ１の音声入力と併せて、自然とユーザ端末１０によって検知される環境音を処理に利用するため、ユーザＵ１やユーザ端末１０に、特に何らかの処理を実行させて、セッションを維持することを要しない。すなわち、判定装置１００は、ユーザＵ１からの音声を受け付ける際に、当然に収集される環境音を用いて処理を行うため、ユーザＵ１に余計な負担を掛けることなく、ユーザビリティの高いセッション管理を行うことができる。

また、判定装置１００は、環境音と、既存のセッション管理の処理とを組み合わせてもよい。例えば、判定装置１００は、環境音が連続している場合であっても、サービスの利用に関して比較的長い時間（例えば１時間など）が経過した場合には、セッションを終了させてもよい。また、ユーザＵ１が、移動しながらユーザ端末１０に対して音声入力を行う場合も想定される。この場合、判定装置１００は、環境音は連続しないものの、ユーザＵ１の音声入力が継続しているならば、ユーザＵ１の音声入力の連続性を優先して判定し、セッションを維持してもよい。

また、判定装置１００は、環境音の連続性を利用して、コンテンツの効果測定を行ってもよい。例えば、ユーザＵ１は、ユーザ端末１０やテレビ７０を介して、コンテンツ（例えば、動画による広告コンテンツや、テレビコマーシャル）を閲覧する場合がある。そして、判定装置１００は、ユーザＵ１がコンテンツを閲覧したのち、環境音が連続している間に、そのコンテンツに関する何らかの行動をユーザＵ１がとったという情報を収集する。例えば、ユーザＵ１は、そのコンテンツが宣伝する商品について「あの商品いいね」とつぶやく場合がある。判定装置１００は、ユーザ端末１０が検知した環境音とともに、このような好意的なつぶやきを音声入力として収集する。そして、判定装置１００は、例えば商品名をキーとして、コンテンツと、ユーザＵ１の好意的なつぶやきを対応付ける。この場合、判定装置１００は、当該コンテンツがユーザＵ１に対して効果を発揮したと判定する。

一般に、コンテンツがユーザＵ１に対して効果を発揮したかは、その因果関係を証明することが難しいため、真に効果を発揮したか否かを測定することは難しい。判定装置１００によれば、環境音が連続している間に、そのコンテンツに対して何らかの行動をとったという情報を収集するので、コンテンツの配信が動機付けとなってユーザＵ１に何らかの行動をとらせた、という推定を高い確度で行うことができる。

なお、図１の例では、実施形態に係る判定処理を判定装置１００が行う例を示したが、より正確には、実施形態に係る判定処理は、判定装置１００内で実行される判定プログラムによって実行される。以下、このような判定プログラムに従って、上述した判定処理を実行する判定装置１００等について詳細に説明する。

〔２．判定処理システムの構成〕
次に、図２を用いて、実施形態に係る判定装置１００が含まれる判定処理システム１の構成について説明する。図２は、実施形態に係る判定処理システム１の構成例を示す図である。図２に例示するように、実施形態に係る判定処理システム１には、ユーザ端末１０と、判定装置１００とが含まれる。これらの各種装置は、ネットワークＮを介して、有線又は無線により通信可能に接続される。また、判定処理システム１には、複数のユーザ端末１０が含まれてもよい。すなわち、ユーザは、１台のユーザ端末１０のみならず、複数台のユーザ端末１０を所有し、利用してもよい。

ユーザ端末１０は、デスクトップ型ＰＣ（Personal Computer）や、ノート型ＰＣや、タブレット端末や、スマートフォンを含む携帯電話機、ＰＤＡ（Personal Digital Assistant）等の情報処理端末である。また、ユーザ端末１０には、眼鏡型や時計型の情報処理端末であるウェアラブルデバイス（wearable device）も含まれる。さらに、ユーザ端末１０には、情報処理機能を有する種々のスマート機器が含まれてもよい。例えば、ユーザ端末１０には、ＴＶ（Television）や冷蔵庫、掃除機などのスマート家電や、自動車などのスマートビークル（Smart vehicle）や、ドローン（drone）、家庭用ロボットなどが含まれてもよい。また、ユーザ端末１０には、ユーザからの音声入力を検知し、所定の処理を行う各装置が含まれてもよい。例えば、ユーザ端末１０は、音声を検知して動作するスピーカーや照明装置等であってもよい。

ユーザ端末１０は、マイクロフォン等の集音装置を有し、ユーザからの音声入力や、ユーザ端末１０の周囲の環境音を検知する。なお、ユーザ端末１０は、マイクロフォンを内蔵するのではなく、マイクロフォンと有線又は無線の通信で接続されたり、音声情報をデータとして入力されたりすることによって、ユーザの音声や環境音を検知してもよい。

判定装置１００は、ユーザ端末１０の周囲の環境音を収集し、収集した環境音の連続性に基づいて、ユーザの所定の行動が１つのセッションに含まれるか否かを判定するサーバ装置である。判定装置１００は、実施形態に係る判定プログラムを内部で動作させることにより、実施形態に係る判定処理を実行する。

〔３．判定装置の構成〕
次に、図３を用いて、実施形態に係る判定装置１００の構成について説明する。図３は、実施形態に係る判定装置１００の構成例を示す図である。図３に示すように、判定装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、判定装置１００は、判定装置１００を利用する管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

（通信部１１０について）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。かかる通信部１１０は、ネットワークＮと有線又は無線で接続され、ネットワークＮを介して、ユーザ端末１０との間で情報の送受信を行う。

（記憶部１２０について）
記憶部１２０は、例えば、ＲＡＭ、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図３に示すように、記憶部１２０は、セッション記憶部１２１と、効果測定記憶部１２２とを有する。以下、記憶部１２０に含まれる各記憶部について順に説明する。なお、重複する項目に関する説明は、適宜省略する。

（セッション記憶部１２１について）
セッション記憶部１２１は、セッションに関する情報を記憶する。ここで、図４に、実施形態に係るセッション記憶部１２１の一例を示す。図４は、実施形態に係るセッション記憶部１２１の一例を示す図である。図４に示した例では、セッション記憶部１２１は、「セッションＩＤ」、「ユーザＩＤ」、「環境音情報」、「行動情報」といった項目を有する。また、行動情報は、「入力手段」、「収集データ」、「内容」、「日時」といった小項目を有する。

「セッションＩＤ」は、セッションを識別する識別情報である。「ユーザＩＤ」は、ユーザを識別する識別情報である。なお、実施形態では、図４に示すような識別情報を参照符号として用いる場合がある。例えば、ユーザＩＤ「Ｕ１」によって識別されるユーザを「ユーザＵ１」と表記する場合がある。

「環境音情報」は、収集された環境音に関する情報を示す。「行動情報」は、セッションにおけるユーザの所定の行動を示す。「入力手段」は、ユーザの行動における入力手段を示す。具体的には、入力手段は、ユーザがユーザ端末１０に対して情報を入力する際に用いた手段（音声入力やタッチパネルに対する操作等）を示す。「収集データ」は、ユーザの行動を示す情報として収集された具体的なデータを示す。「内容」は、ユーザの行動の内容を示す。「日時」は、ユーザの行動が行われた日時を示す。

なお、図４に示す例では、項目に記憶される情報として、「環境音データ＃１」や、「音声データ＃１」や、「時間＃１」といった概念的な情報を示しているが、実際には、任意の形式の音声ファイルや、日時を示す値等が記憶される。

すなわち、図４に示したデータの一例は、セッションＩＤ「ＳＥ０１」で識別されるセッションＳＥ０１は、ユーザＩＤ「Ｕ１」で識別されるユーザＵ１が行った一連の行動に関する情報を含むことを示している。また、セッションＳＥ０１において、環境音情報として「環境音データ＃１」が収集された際に、ユーザＵ１は、入力手段として「音声」を用いて「ログイン」を行っており、その際に収集されたデータは「音声データ＃１」であり、ログインが行われた日時は「時間＃１」であることを示している。

また、ユーザＵ１は、その後、「音声」を用いて「リクエスト」を行っており、その際に収集されたデータは「音声データ＃２」である。この行動は、例えば図１で示したように、「お米・・・」とユーザＵ１が発声したこと等によりサービス（すなわち、判定装置１００）に対するリクエストとして記憶される。また、ユーザＵ１は、その後、「タッチパネル」を用いて「ウェブ閲覧」を行っており、その際に収集されたデータは「操作データ＃１」である。この行動は、例えば図１で示したように、ユーザＵ１があるリクエストを行った後に、環境音が連続している間に行われた場合に、同一のセッションＳＥ０１の行動として記憶される。また、ユーザＵ１は、その後、「音声」を用いて「リクエスト」を行っており、その際に収集されたデータは「音声データ＃３」である。この行動は、例えば図１で示したように、環境音が連続している間に行われた場合に、「買って。」とユーザＵ１が発声したこと等によりサービスに対するリクエストとして記憶される。また、この行動は、同一のセッションＳＥ０１の行動として記憶される。

なお、図４の例では、説明のために、ユーザの所定の行動が行われる度に環境音情報が記憶される例を示したが、判定装置１００は、所定時間ごと（例えば３秒ごと）に環境音情報を収集してもよい。そして、判定装置１００は、ユーザの何らかの行動が記憶されない場合であっても、環境音の連続性が保持されると判定している間は、１つのセッションを継続させるようにしてもよい。

（効果測定記憶部１２２について）
効果測定記憶部１２２は、コンテンツの効果測定に関する情報を記憶する。効果測定記憶部１２２は、データテーブルとして、行動テーブル１２３と、効果テーブル１２４とを有する。

（行動テーブル１２３について）
行動テーブル１２３は、コンテンツの配信と、コンテンツ配信後のユーザの行動に関する情報を記憶する。ここで、図５に、実施形態に係る行動テーブル１２３の一例を示す。図５は、実施形態に係る行動テーブル１２３の一例を示す図である。図５に示した例では、行動テーブル１２３は、「セッションＩＤ」、「ユーザＩＤ」、「環境音情報」、「配信情報」、「行動情報」といった項目を有する。また、配信情報の項目は、「コンテンツＩＤ」、「配信日時」、「メディア」といった小項目を有する。また、行動情報の項目は、「入力手段」、「収集データ」、「関連コンテンツＩＤ」、「内容」といった小項目を有する。

「配信情報」は、ユーザに配信されたコンテンツに関する情報を示す。「コンテンツＩＤ」は、コンテンツを識別する識別情報を示す。「配信日時」は、コンテンツがユーザに配信された日時を示す。「メディア」は、コンテンツが配信されたメディアを示す。メディアは、例えば、ユーザ端末１０で表示されるウェブページであってもよいし、ユーザ端末１０以外のテレビやラジオ等であってもよい。例えば、判定装置１００は、ユーザ端末１０から送信されるユーザの行動履歴を収集する際に、配信されたコンテンツや、コンテンツが配信された日時に関する情報を収集する。また、メディアがテレビやラジオである場合、判定装置１００は、予めテレビやラジオにおいてコンテンツが配信される配信情報を外部サーバから取得してもおいてもよいし、収集された音情報に基づいて、コンテンツを特定してもよい。

「行動情報」は、コンテンツに反応したユーザの行動に関する情報を示す。「関連コンテンツＩＤ」は、ユーザの行動に関連していると推定されるコンテンツの識別情報を示す。なお、関連コンテンツＩＤとコンテンツＩＤとは、共通した識別情報が記憶されるものとする。「内容」は、ユーザの行動の内容を示す。

判定装置１００は、種々の手法を用いて、ユーザの行動と、配信されたコンテンツとが関連するか否かを判定する。例えば、判定装置１００は、ユーザが商品名をつぶやいた際には、商品名を認識し、認識した商品名に対応するコンテンツ（例えば、その商品を宣伝する広告コンテンツ）を特定する。そして、判定装置１００は、そのユーザのツイート（つぶやき）と、コンテンツとが関連すると判定する。また、判定装置１００は、ユーザが商品を注文した場合に、同一セッションにおいて、当該商品に関するコンテンツ（例えばテレビコマーシャル）がユーザに対して配信されていた場合には、ユーザの注文という行動と、コンテンツとが関連すると判定する。

すなわち、図５に示したデータの一例では、セッションＳＥ０２において、ユーザＵ１は、環境音データ＃２１が収集された時間＃２１のタイミングで、「テレビ」を介して、コンテンツＩＤ「Ｃ０１」で識別されるコンテンツＣ０１の配信を受けたことを示している。また、ユーザＵ１は、環境音データ＃２２が収集された時間＃２２のタイミングで、テレビを介して、コンテンツＣ０２の配信を受けたことを示している。

また、図５に示したデータの一例では、ユーザＵ１が、セッションＳＥ０２において、音声データ＃２１というツイートを行っており、そのツイートに関連するコンテンツは、コンテンツＣ０１であることを示している。また、ユーザＵ１は、音声データ＃２２というリクエスト（例えば商品の購入）を判定装置１００に行っており、そのリクエストに関連するコンテンツは、コンテンツＣ０２であることを示している。

なお、上記の例では、ユーザの行動としてツイートやリクエスト等を示したが、ユーザの行動はこれらに限られない。例えば、判定装置１００は、ユーザの行動として、コンテンツが宣伝する商品のウェブページにアクセスしたことや、商品に関する書き込みをＳＮＳ（Social Networking Service）に行ったことや、コンテンツを選択（タッチやクリック）したことや、商品をウィッシュリストに追加したことなど、種々の行動を収集してもよい。

（効果テーブル１２４について）
効果テーブル１２４は、コンテンツの効果に関する情報を記憶する。ここで、図６に、実施形態に係る効果テーブル１２４の一例を示す。図６は、実施形態に係る効果テーブル１２４の一例を示す図である。図６に示した例では、効果テーブル１２４は、「コンテンツＩＤ」、「ツイート率」、「ＣＶＲ（Conversion Rate）」といった項目を有する。

「ツイート率」は、ユーザに配信されたコンテンツに対して、ユーザがツイートを行った割合を示す。「ＣＶＲ」は、ユーザに配信されたコンテンツに対して、コンテンツの提供主に何らかの利益がもたらされた割合を示す。コンバージョンは、例えば、ユーザがコンテンツで宣伝された商品を購入したり、申込みを行ったり、資料請求を行ったり、コンテンツの提供主のウェブページにアクセスしたりした行動等が該当する。

すなわち、図６に示したデータの一例では、コンテンツＣ０１のツイート率が「ツイート率＃１」であり、ＣＶＲが「ＣＶＲ＃１」であることを示している。

（制御部１３０について）
図３に戻って説明を続ける。制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、判定装置１００内部の記憶装置に記憶されている各種プログラム（例えば、判定プログラム）がＲＡＭ（Random Access Memory)を作業領域として実行されることにより実現される。また、制御部１３０は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図３に示すように、制御部１３０は、収集部１３１と、抽出部１３２と、判定部１３３と、測定部１３４とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部１３０が有する各処理部の接続関係は、図３に示した接続関係に限られず、他の接続関係であってもよい。また、制御部１３０が有する各処理部は、本願に係る判定プログラムによって実行される各手順に対応する。例えば、収集部１３１が実行する処理は、判定プログラムが判定装置１００に実行させる収集手順に対応する。同様に、抽出部１３２が実行する処理は、判定プログラムが判定装置１００に実行させる抽出手順に対応し、判定部１３３が実行する処理は、判定プログラムが判定装置１００に実行させる判定手順に対応し、測定部１３４が実行する処理は、判定プログラムが判定装置１００に実行させる測定手順に対応する。

（収集部１３１について）
収集部１３１は、各種情報を収集する。例えば、収集部１３１は、ユーザ及びユーザ端末１０の周囲の環境音を収集する。

具体的には、収集部１３１は、ネットワークＮを介して、ユーザ端末１０が検知した環境音を収集する。なお、収集部１３１は、ユーザ端末１０が送信する音情報を収集し、音情報に含まれる環境音を収集してもよいし、ユーザ端末１０をクロール（crawl）することで、ユーザ端末１０内に保持されている音情報を収集し、音情報に含まれる環境音を収集してもよい。

収集部１３１は、定常的に発せられる周囲の環境音を収集する。例えば、収集部１３１は、音が発せられる方向、音源までの距離、収集する音の波形、収集する音の音量（音圧）の少なくとも一つが定常的である周囲の環境音を収集する。より具体的には、収集部１３１は、ユーザの自宅等における、エアコン６０の稼働音や、テレビ７０が出力する音等を環境音として収集する。

例えば、収集部１３１は、所定時間ごとに環境音を継続的に収集する。例えば、収集部１３１は、判定装置１００の管理者によって設定される所定時間ごと（例えば３秒や５秒ごと）に環境音を収集し続ける。この場合、収集される環境音は、ある瞬間の音情報のみならず、３秒や５秒の継続した音情報であってもよい。

収集部１３１は、環境音を含む音情報として、音圧レベルや、周波数や、推定される音源の数（環境音を構成していると推定される機器の数等）や、音圧や波形における周期等を収集する。なお、これらの音情報の収集について、収集部１３１は、適宜、既知の解析技術を利用して音情報を収集するようにしてもよい。

また、収集部１３１は、環境音のみならず、ユーザが発した音声情報を収集してもよい。具体的には、収集部１３１は、サービスを利用するためにユーザが発する音声情報を収集する。また、収集部１３１は、ユーザが発する音声を断続的に収集してもよい。この場合、後述する判定部１３３によって、断続的に収集した音声が、１つの意図を構成する音声情報であると判定される場合もある。

なお、収集部１３１は、音情報とともに、ユーザ端末１０が備えるセンサによって収集される各種情報を収集してもよい。例えば、収集部１３１は、ユーザ端末１０によって検知される環境情報を収集する。また、収集部１３１は、ユーザ端末１０自体のデバイス情報や、ユーザ端末１０と通信する外部装置に関する情報等を収集してもよい。

具体的には、収集部１３１は、ユーザ端末１０によって検知される情報として、ユーザ端末１０（あるいは、ユーザ端末１０を利用するユーザ）が所在する位置を示す位置情報、ユーザ端末１０の周囲の温度、湿度情報、環境光の強さを示す光情報等を収集する。また、収集部１３１は、ユーザ端末１０が備えるカメラで撮影された写真や映像に基づいて、ユーザ端末１０の周囲の環境情報を収集してもよい。例えば、収集部１３１は、カメラで撮影された画像情報や、画像情報に含まれる位置情報、撮影された日時等に基づいて、ユーザ端末１０の周囲の環境情報を収集する。

また、収集部１３１は、ユーザ端末１０自体のデバイス情報として、ユーザ端末１０のＣＰＵや、ＯＳ（Operating System）、メモリ等に関する情報、アンテナ等のネットワーク機能、インストールされたソフトウェア、使用されるブラウザソフトウェア、ユーザ端末１０が備える入力手段（例えば、マイクロフォンや、タッチパネル、指紋データを収集可能な指紋リーダ）等の情報を収集する。

また、収集部１３１は、ユーザ端末１０の動作状況を収集してもよい。例えば、収集部１３１は、ユーザ端末１０が起動状態にあるか否か、また、起動状態であれば、画面のＯＮ／ＯＦＦの状態や、ユーザ端末１０が移動／静止している状態か等の情報を収集する。かかる情報は、例えば、ユーザ端末１０にインストールされた所定のセンシング（sensing）機能を有するアプリによって収集され、ユーザ端末１０内部に保持される。また、収集部１３１は、ユーザ端末１０の動作状況として、ユーザ端末１０によって観測される加速度等を収集してもよい。

また、収集部１３１は、ユーザ端末１０と通信する外部装置に関する情報として、ユーザ端末１０と相互の通信状態にある外部装置を識別する情報や、確立している通信の種類や周波数帯域等を収集する。

また、収集部１３１は、ユーザの行動に関する情報を収集してもよい。例えば、収集部１３１は、ユーザがユーザ端末１０を利用して閲覧したサービスページの情報や、検索サービスに送信したクエリの情報等を収集してもよい。

また、収集部１３１は、ユーザの個人情報を収集してもよい。例えば、収集部１３１は、所定のサービスを利用するための登録情報として、ユーザの個人情報を受け付ける。なお、収集部１３１は、ユーザの個人情報をウェブサーバ等のサービス側から収集してもよい。

また、収集部１３１は、コンテンツの配信に関する情報を収集してもよい。例えば、収集部１３１は、コンテンツが配信されるメディア（テレビやラジオ等）や、コンテンツの配信日時等の情報を外部サーバから収集する。

収集部１３１は、収集した情報を記憶部１２０内の各記憶部に格納する。また、収集部１３１は、記憶部１２０内に既に格納されている情報を適宜収集してもよい。

（抽出部１３２について）
抽出部１３２は、収集部１３１によって収集された音情報から、環境音又はユーザの所定の行動を示す音情報を抽出する。

抽出部１３２は、既知の音声解析処理に基づいて、ユーザ端末１０から収集した音情報のうち、ユーザの所定の行動を示す音声情報を抽出する。具体的には、抽出部１３２は、ユーザの行動を示す語として予め登録されている語に対応する音声が抽出された場合に、当該音声を、ユーザの所定の行動を示す音声情報として抽出する。

例えば、抽出部１３２は、ユーザ端末１０から収集した音情報に、判定装置１００が提供するサービスを利用するためにユーザが入力する語（例えば、判定装置１００が提供するサービス名や、「ハロー」などの呼びかけであってもよい）が含まれている場合、その語と、前後の音声を、ユーザがサービスにログインを要求している音声情報として抽出する。あるいは、抽出部１３２は、ユーザ端末１０から収集した音情報に、サービスにおいて商品の注文を意図する語として登録されている語（例えば、「買って。」や、「買いたい。」や、「欲しい。」など）が含まれている場合、ユーザが任意の商品を注文しようとする行動に対応するものとして、その語と、前後の音声情報を抽出する。

なお、抽出部１３２は、予め登録されているユーザの声紋に基づいて、その音声がユーザ本人により発せられた音声か否かを判定してもよい。抽出部１３２は、ユーザ本人と判定された場合のみ、処理対象とした音声を、当該ユーザの所定の行動に対応する音声情報として抽出してもよい。これにより、抽出部１３２は、ユーザ以外の者が発した音声を、ユーザの所定の行動に対応する音声情報として誤って抽出することを防止できる。

また、抽出部１３２は、ユーザの所定の行動を示す情報として抽出された音声情報以外の音情報を、環境音として抽出する。また、抽出部１３２は、ユーザの所定の行動を示す音声情報と、環境音が同時に発せられる場合（例えば、環境音が、ユーザの発した音声に対する暗騒音として検知される場合）には、ユーザの所定の行動に対応する音情報と、環境音に対応する音情報とを分離して認識し、それぞれを抽出してもよい。

また、抽出部１３２は、音情報を解析し、ユーザの所定の行動を示す音声情報や、環境音を抽出するにあたり、既知の技術を用いて、所定の学習モデルを生成してもよい。例えば、抽出部１３２は、生成したモデルに音情報を入力することにより、その音情報に含まれるユーザの所定の行動を示す音声情報を抽出したり、環境音を抽出したりしてもよい。例えば、モデルは、ユーザが発する音声の癖等を予め学習したモデルであってもよいし、例えばディープラーニング等の各種学習技術によって学習が継続的に行われるものであってもよい。

（判定部１３３について）
判定部１３３は、環境音の連続性に基づいて、ユーザの所定の行動が１つのセッションに含まれるか否かを判定する。

例えば、判定部１３３は、定常的に発せられる周囲の環境音が収集されている間のユーザの所定の行動が、１つのセッションに含まれると判定する。より具体的には、判定部１３３は、定常的に発せられる周囲の環境音が所定の閾値を超えて変化した後に観測されたユーザの所定の行動は、１つのセッションに含まれないと判定する。言い換えれば、判定部１３３は、定常的に発せられる周囲の環境音が所定の閾値を超えない間に観測されたユーザの所定の行動は、１つのセッションに含まれると判定する。

なお、この場合の所定の閾値には、種々の種別の情報が含まれてもよい。例えば、判定部１３３は、音圧や、周波数や、音の大小の周期や、波形等の各々に関して所定の閾値を設け、それらのうち少なくとも一つが閾値を超えて観測された場合に、環境音が連続しなくなったと判定してもよい。また、判定部１３３は、音圧や周波数等を含めた波形として環境音を捉え、ある時点で観測された環境音の波形と、現時点の環境音の波形とが非類似である場合に、環境音が連続しなくなったと判定してもよい。なお、類似か非類似かの基準は、既知の音声解析の技術に基づいて、任意に設定されてもよい。

また、判定部１３３は、収集部１３１によって収集された環境音の連続性に基づいて、ユーザが発した断続的な音声が、一連の音声入力であるか否かを判定してもよい。すなわち、判定部１３３は、収集された音声が途切れている場合であっても、その音声とともに観測される環境音が連続している場合には、それらの音声を一連の音声入力として判定してもよい。図１で示した例では、判定部１３３は、ステップＳ０１でユーザＵ１が発した「お米・・・」という音声と、ステップＳ０５でユーザＵ１が発した「買って。」という音声とが、一連の音声入力であると判定する。

また、判定部１３３は、環境音が所定の時間（例えば、３０分や１時間など）を超えて連続する場合には、所定の時間の間に行われたユーザの所定の行動が１つのセッションに含まれると判定し、当該所定の時間を超えて行われたユーザの所定の行動は１つのセッションに含まれないと判定してもよい。すなわち、判定部１３３は、環境音の連続性のみならず、時間によるセッション管理を併用してもよい。

また、判定部１３３は、環境音が不連続となった場合（環境音が所定の閾値を超えて変化した場合）であっても、ユーザの音声入力が継続している間には、その音声入力は１つのセッションに含まれると判定してもよい。

また、判定部１３３は、ユーザ端末１０から収集された音情報のうちに、コンテンツの配信に関する情報が含まれているか否かを判定してもよい。判定部１３３は、環境音に、コンテンツが出力する音情報が含まれているか否かを判定することで、コンテンツが配信されたか否かを判定してもよい。あるいは、判定部１３３は、音情報のみならず、例えば、ユーザにコンテンツが配信されたことを示す情報（例えば、判定装置１００が提供するサービスにおいて、宣伝のための動画コンテンツが配信されたことを示す情報）に基づいて、コンテンツがユーザに配信されたことを判定してもよい。

（測定部１３４について）
測定部１３４は、判定部１３３によって、ユーザの所定の行動と、ユーザへのコンテンツの提供とが１つのセッションに含まれると判定された場合に、ユーザに提供されたコンテンツの効果を測定する。

例えば、測定部１３４は、ユーザの所定の行動が、コンテンツを視聴したと推定される行動であるか否かに基づいて、ユーザに提供されたコンテンツの効果を測定する。具体的には、測定部１３４は、配信されたコンテンツに対して、ユーザが何らかの音声を発したという行動に基づいて、コンテンツの効果を測定する。より具体的には、測定部１３４は、コンテンツの配信後に、コンテンツの商品名や、商品をほめる言葉や、商品に関心を示す言葉等をつぶやいた場合に、当該コンテンツがユーザに視聴されたと推定する。そして、測定部１３４は、コンテンツが視聴されたことにより、コンテンツが効果を発揮したとみなして、当該コンテンツの効果を測定する。

また、測定部１３４は、ユーザの所定の行動が、コンテンツに関するコンバージョンと成り得るか否かに基づいて、ユーザに提供されたコンテンツの効果を測定してもよい。コンバージョンは、例えば、ユーザがコンテンツで宣伝された商品を購入したり、申込みを行ったり、資料請求を行ったり、コンテンツの提供主のウェブページにアクセスしたりした行動等が該当する。

測定部１３４は、ユーザに対して配信されたコンテンツの識別情報や、コンテンツが配信された数や、コンテンツに対してツイートがあった割合（ツイート率）や、コンテンツに対してコンバージョンがあった割合（ＣＶＲ）等を記憶部１２０に格納する。なお、測定部１３４は、測定処理の際に、当該ユーザの性別や年齢等の属性に関する情報を取得してもよい。これにより、測定部１３４は、例えば、コンテンツが特に効果を発揮する年代や性別等に関する情報についても合わせて測定することができる。

また、測定部１３４は、測定した効果に関する情報を、コンテンツの提供主に送信してもよい。コンテンツの提供主は、かかる情報を参照することで、配信されたコンテンツがユーザに対して効果を発揮したか否かを確認することができる。

〔４．ユーザ端末の構成〕
次に、図７を用いて、実施形態に係るユーザ端末１０の構成について説明する。図７は、実施形態に係るユーザ端末１０の構成例を示す図である。図７に示すように、ユーザ端末１０は、通信部１１と、入力部１２と、表示部１３と、検知部１４と、記憶部１５と、制御部１６とを有する。

通信部１１は、ネットワークＮと有線又は無線で接続され、判定装置１００との間で情報の送受信を行う。例えば、通信部１１は、ＮＩＣ等によって実現される。

入力部１２は、ユーザから各種操作を受け付ける入力装置である。例えば、入力部１２は、ユーザ端末１０に備えられた操作キー等によって実現される。表示部１３は、各種情報を表示するための表示装置である。例えば、表示部１３は、液晶ディスプレイ等によって実現される。なお、ユーザ端末１０にタッチパネルが採用される場合には、入力部１２の一部と表示部１３とは一体化される。

検知部１４は、ユーザ端末１０に関する各種情報を検知する。具体的には、検知部１４は、ユーザが発する音声や、ユーザ端末１０の周囲の環境音を検知する。例えば、検知部１４は、マイクロフォン等の集音手段であり、音が入力された場合に、その音を音情報として取得する。

また、検知部１４は、ユーザ端末１０に対するユーザの操作や、ユーザ端末１０の所在する位置情報や、ユーザ端末１０と接続されている機器に関する情報や、ユーザ端末１０における環境等を検知してもよい。

例えば、検知部１４は、入力部１２に入力された情報に基づいて、ユーザの操作を検知する。すなわち、検知部１４は、入力部１２に画面をタッチする操作の入力があったことや、音声の入力があったこと等を検知する。また、検知部１４は、ユーザによって所定のアプリが起動されたことを検知してもよい。かかるアプリがユーザ端末１０内の撮像装置を動作させるアプリである場合、検知部１４は、ユーザによって撮像機能が利用されていることを検知する。また、検知部１４は、ユーザ端末１０内に備えられた加速度センサやジャイロセンサ等で検知されたデータに基づき、ユーザ端末１０自体が動かされているといった操作を検知してもよい。

また、検知部１４は、ユーザ端末１０の現在位置を検知してもよい。具体的には、検知部１４は、ＧＰＳ（Global Positioning System）衛星から送出される電波を受信し、受信した電波に基づいてユーザ端末１０の現在位置を示す位置情報（例えば、緯度及び経度）を取得する。また、位置情報は、ユーザ端末１０が備える光学式センサや、赤外線センサや、磁気センサ等によって取得されてもよい。

また、検知部１４は、ユーザ端末１０に接続される外部装置を検知してもよい。例えば、検知部１４は、外部装置との相互の通信パケットのやり取りなどに基づいて、外部装置を検知する。そして、検知部１４は、検知した外部装置をユーザ端末１０と接続される端末として認識する。また、検知部１４は、外部装置との接続の種類を検知してもよい。例えば、検知部１４は、外部装置と有線で接続されているか、無線通信で接続されているかを検知する。また、検知部１４は、無線通信で用いられている通信方式等を検知してもよい。また、検知部１４は、外部装置が発する電波を検知する電波センサや、電磁波を検知する電磁波センサ等によって取得される情報に基づいて、外部装置を検知してもよい。

なお、ユーザ端末１０が外部機器と接続される場合、ユーザからの音声は、外部機器によって検知されてもよい。外部機器とは、例えば、音声アシスト機能を有する家電等であり、ユーザ端末１０や判定装置１００と通信可能なスマート機器である。

また、検知部１４は、ユーザ端末１０における周囲の環境を検知してもよい。検知部１４は、ユーザ端末１０に備えられた各種センサや機能を利用し、環境に関する情報を検知する。例えば、検知部１４は、ユーザ端末１０の周囲の照度を検知する照度センサや、ユーザ端末１０の物理的な動きを検知する加速度センサ（又は、ジャイロセンサなど）や、ユーザ端末１０の周囲の湿度を検知する湿度センサや、ユーザ端末１０の所在位置における磁場を検知する地磁気センサ等を利用する。そして、検知部１４は、各種センサを用いて、種々の情報を検知する。例えば、検知部１４は、ユーザ端末１０の周囲における騒音レベルや、ユーザ端末１０の周囲が撮像に適する照度であるか等を検知する。さらに、検知部１４は、カメラで撮影された写真や映像に基づいて周囲の環境情報を検知してもよい。

記憶部１５は、各種情報を記憶する。記憶部１５は、例えば、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。例えば、記憶部１５は、検知部１４によって検知された音情報を、音が検知された日時と対応付けて記憶する。

制御部１６は、コントローラであり、例えば、ＣＰＵやＭＰＵ等によって、ユーザ端末１０内部の記憶装置に記憶されている各種プログラムがＲＡＭを作業領域として実行されることにより実現される。また、制御部１６は、コントローラであり、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現される。

図７に示すように、制御部１６は、取得部１６１と、送信部１６２とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１６の内部構成は、図７に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

取得部１６１は、各種情報を取得する。例えば、取得部１６１は、検知部１４を制御することにより、検知部１４によって検知される各種情報を取得する。具体的には、取得部１６１は、ユーザ又はユーザ端末１０の周囲の環境音や、ユーザが発した音声等を含む、音情報を取得する。

取得部１６１は、所定の時間毎に音情報を取得するようにしてもよい。例えば、取得部１６１は、上述した検知部１４を制御すること等により、音情報を取得する。取得部１６１は、ユーザからの音声入力がない場合には、例えば、所定時間ごと（３秒ごとや、５秒ごとや、１０秒ごと等）の長さの音情報（環境音）を取得する。あるいは、取得部１６１は、検知部１４によってユーザからの音声入力が検知された場合には、ユーザが発した音声に対応した長さの音情報を取得する。なお、取得部１６１が取得する音情報の長さは、判定装置１００によって設定されてもよい。

送信部１６２は、各種情報を送信する。例えば、送信部１６２は、判定装置１００からの要求に応じて、取得部１６１によって取得された音情報を判定装置１００に送信する。

〔５．処理手順〕
次に、図８を用いて、実施形態に係る判定装置１００による処理の手順について説明する。図８は、実施形態に係る処理手順を示すフローチャートである。

図８に示すように、判定装置１００は、ユーザ端末１０から、周囲の環境音を含む音情報を収集する（ステップＳ１０１）。そして、判定装置１００は、音情報から音声情報（すなわち、ユーザの所定の行動を示す情報）を抽出する（ステップＳ１０２）。

そして、判定装置１００は、音声情報に対応するユーザの所定の行動が、連続した環境音のもとで行われた行動か否かを判定する（ステップＳ１０３）。ユーザの所定の行動が、連続した環境音のもとで行われた行動であると判定した場合（ステップＳ１０３；Ｙｅｓ）、判定装置１００は、その所定の行動が、１つのセッションに含まれる行動であると判定する（ステップＳ１０４）。そして、判定装置１００は、音情報（環境音）を収集する処理を繰り返す。

一方、ユーザの所定の行動が、連続した環境音のもとで行われた行動でないと判定した場合（ステップＳ１０３；Ｎｏ）、判定装置１００は、その所定の行動が、別のセッションの行動であると判定する（ステップＳ１０５）。この場合、判定装置１００は、例えば、直前のセッションを終了させ、新たなセッションを開始し、当該行動は新たなセッションに含まれると判定する。

〔６．変形例〕
上述した実施形態に係る処理は、上記実施形態以外にも種々の異なる形態にて実施されてよい。以下では、判定装置１００又は判定処理システム１の他の実施形態（変形例）について説明する。

〔６−１．環境音によるセッション管理のバリエーション〕
上記実施形態では、判定装置１００は、ユーザの所定の行動が、連続した環境音のもとで行われた行動か否かを判定することにより、セッションを管理する例を示した。ここで、判定装置１００は、ユーザからの明示の行動がなくとも（ユーザが無言であっても）、ユーザがサービスの利用を継続していると推定することで、セッションを維持するといった処理を行ってもよい。この点について、図９乃至図１１を用いて説明する。なお、以下では、区別のため、変形例の構成を有する判定装置１００を判定装置１００Ａと表記するが、特に区別する必要のない場合には、判定装置１００と総称する。

例えば、判定装置１００Ａは、ユーザを認識するための音情報と環境音とを照合することにより、任意の行動の主体がユーザであるか否かを判定する。そして、判定装置１００Ａは、任意の行動の主体がユーザであると判定した場合には、任意の行動が１つのセッションに含まれると判定する。この場合、任意の行動とは、音声によるリクエストなどの明示的な行動のみならず、例えば、サービスにログインしたまま待機する、といった行動を含む。

また、ユーザを認識するための音情報とは、例えば、ユーザによって予め登録される、ユーザ本人を認識するための音情報である。例えば、ユーザは、判定装置１００Ａが提供するサービスの利用にあたり、自身を認識するための音情報をサービス側に登録する。

具体的には、ユーザは、自身がユーザ端末１０を主に操作する場所（拠点）の環境音を予め登録する。あるいは、ユーザは、自身が発する音であって、環境音になりうる音を予め登録する。具体的には、ユーザは、自身の足音を環境音の一つとして登録する。あるいは、ユーザは、自身の家族の音声やペットの音声等を環境音の一つとして登録する。なお、これらの音情報の登録は、ユーザから明示的に行われることを要さず、例えば、環境音を収集した判定装置１００Ａによって、任意に登録が行われてもよい。言い換えれば、判定装置１００Ａは、ユーザを認識するための環境音を常時収集しておき、かかる環境音が観測された場合にはユーザ本人がサービスを利用している、と推定するための情報として、これらの音情報を予め登録しておく。

そして、判定装置１００Ａは、予め登録されているユーザの足音や、ユーザとは異なる者（例えば、ユーザの家族や友人等）の音声や、ユーザが拠点とする場所の環境音の少なくともいずれか一つと、収集された環境音とを照合することにより、任意の行動の主体がユーザであるか否かを判定する。判定装置１００Ａは、収集された環境音において、予め登録された音情報が含まれる場合は、ユーザからの音声入力がしばらくの間行われなくても、そのユーザ端末１０を利用しているユーザは、ユーザ本人である蓋然性が高いものとして、セッションを維持する。すなわち、判定装置１００は、任意の行動の主体がユーザであると判定した場合に、その任意の行動が、継続している１つのセッションに含まれる行動であると判定する。これにより、ユーザは、ログインしたサービスにおいて、しばらく明示の音声入力を行わずとも、ユーザ本人を示すと推定される環境音が観測され続けている間は、セッションを維持させることができる。

上記のように、変形例に係る判定装置１００Ａは、予め登録されたユーザ本人を示す音情報と、環境音との照合に基づいて、ユーザの本人性を検証することで、セッションを維持する。変形例に係る処理を行うにあたり、変形例に係る判定装置１００Ａは、図９に示す構成を有する。図９は、変形例に係る判定装置１００Ａの構成例を示す図である。図９に示すように、判定装置１００Ａは、照合情報記憶部１２５をさらに有する。

（照合情報記憶部１２５について）
照合情報記憶部１２５は、ユーザの照合に関する情報を記憶する。照合情報記憶部１２５は、データテーブルとして、登録テーブル１２６と、照合テーブル１２７とを有する。

（登録テーブル１２６について）
登録テーブル１２６は、ユーザを認識するために用いられる登録データに関する情報を記憶する。ここで、図１０に、変形例に係る登録テーブル１２６の一例を示す。図１０は、変形例に係る登録テーブル１２６の一例を示す図である。図１０に示した例では、登録テーブル１２６は、「ユーザＩＤ」、「登録情報」、「内容」といった項目を有する。

「登録情報」は、ユーザを認識するための音情報として登録された音情報を示す。「内容」は、ユーザを認識するための音情報に関する内容を示す。なお、図１０の例では、登録情報として、「登録データ＃１」といった概念的な情報を示しているが、実際には、登録データは、任意の形式の音声ファイル等が記憶される。

すなわち、図１０に示したデータの一例では、ユーザＵ１を認識するための登録情報として、「登録データ＃１」が登録されており、その内容は、「友人の音声」であることを示している。また、ユーザＵ１を認識するための登録情報としては、「登録データ＃２」や、「登録データ＃３」や、「登録データ＃４」も登録されており、その内容は、それぞれ、「同居人の音声」や、「本人の足音」や、「部屋の環境音」であることを示している。

（照合テーブル１２７について）
照合テーブル１２７は、ユーザの照合に関する情報を記憶する。ここで、図１１に、変形例に係る照合テーブル１２７の一例を示す。図１１は、変形例に係る照合テーブル１２７の一例を示す図である。図１１に示した例では、照合テーブル１２７は、「セッションＩＤ」、「ユーザＩＤ」、「環境音情報」、「照合結果」といった項目を有する。

「照合情報」は、ユーザを認識するための音情報として登録されていたいずれかの登録データと、環境音とが照合されたか否かの結果を示す。例えば、照合情報に「○」が記憶されている場合、ユーザを認識するための音情報として登録されていたいずれかの登録データと、環境音とが照合されたことを示す。この場合、任意の行動（例えばサービスにログイン後、サービスを利用するために待機しているユーザの行動）は、ユーザＵ１本人によって行われていると推定される。このため、判定装置１００Ａは、セッションＳＥ０３を維持し、セッションを終了させないようにする。

すなわち、図１１に示したデータの一例では、セッションＳＥ０３は、ユーザＵ１に関するセッションであり、収集された環境音情報＃３１は、ユーザを認識するための音情報として登録されていたいずれかの登録データとの照合結果が「○」であることから、セッションＳＥ０３が維持されていることを示している。また、環境音情報＃３２から環境音情報＃３４までの間も、ユーザを認識するための音情報として登録されていたいずれかの登録データとの照合結果が「○」であることから、セッションＳＥ０３が維持されていることを示している。

上記のように、判定装置１００Ａは、ユーザを認識するための音情報と環境音とを照合することにより、任意の行動の主体がユーザであるか否かを判定するとともに、主体がユーザであると判定した場合には、任意の行動が１つのセッションに含まれると判定する。

具体的には、判定装置１００Ａは、予め登録されているユーザの足音、ユーザとは異なる者の音声、ユーザが拠点とする場所の環境音の少なくともいずれか一つと、収集された環境音とを照合することにより、任意の行動の主体がユーザであるか否かを判定する。

このように、判定装置１００Ａは、予め登録された、ユーザの本人性を示すと推定される音情報と、環境音との照合により、セッション管理を行ってもよい。これにより、判定装置１００Ａは、ユーザからの意識的な音声入力を受け付けずとも、同じ環境下でユーザ本人がサービスを利用し続けていることから、あえてセッションを切断せずに、セッションを維持することができる。このため、判定装置１００Ａは、ユーザビリティの高いセッション管理を行うことができる。

（変形例に係る処理手順について）
次に、図１２を用いて、変形例に係る判定装置１００Ａによる処理の手順について説明する。図１２は、変形例に係る処理手順を示すフローチャートである。

図１２に示すように、判定装置１００Ａは、ユーザ判定のための音情報を登録する（ステップＳ２０１）。その後、判定装置１００Ａは、ユーザ端末１０から、周囲の環境音を含む音情報を収集する（ステップＳ２０２）。そして、判定装置１００Ａは、音情報から音声情報（すなわち、ユーザの任意の行動を示す情報）を抽出する（ステップＳ２０３）。

そして、判定装置１００Ａは、環境音と予め登録された音情報とが合致するか否かを判定する（ステップＳ２０４）。環境音と予め登録された音情報とが合致すると判定した場合（ステップＳ２０４；Ｙｅｓ）、判定装置１００Ａは、任意の行動がユーザ本人の行動であると判定する（ステップＳ２０５）。そして、判定装置１００Ａは、その任意の行動が、１つのセッションに含まれる行動であると判定する（ステップＳ２０６）。言い換えれば、判定装置１００Ａは、セッションを切断せずに維持する。そして、判定装置１００Ａは、音情報（環境音）を収集する処理を繰り返す。

一方、環境音と予め登録された音情報とが合致しないと判定した場合（ステップＳ２０４；Ｎｏ）、判定装置１００Ａは、任意の行動がユーザ本人の行動でないと判定する（ステップＳ２０７）。そして、判定装置１００Ａは、その任意の行動が、別のセッションに含まれる行動であると判定する（ステップＳ２０８）。言い換えれば、判定装置１００Ａは、セッションを維持せずに新たなセッションを開始し、当該任意の行動は、新たなセッションに含まれると判定する。

〔６−２．判定プログラム〕
上記実施形態では、本願に係る判定プログラムは、判定装置１００内部で実行されることを示した。しかし、本願に係る判定プログラムは、ユーザ端末１０内部で実行されてもよい。この場合、ユーザ端末１０は、上記実施形態で説明した判定装置１００が有する各処理部や、記憶部１２０に格納された各情報を記憶する記憶部１５を有する。

〔６−３．ユーザ端末の数〕
上記実施形態では、ユーザ端末１０が１台の装置である例を示したが、ユーザ端末１０は１台に限られない。例えば、ユーザは、通信可能な端末装置を複数台所有することも想定される。この場合、判定装置１００は、ユーザが利用する複数のユーザ端末１０から、ユーザやユーザ端末１０の周囲の環境音を収集してもよい。

なお、判定装置１００は、複数のユーザ端末１０の識別において、必ずしも他の機器にも共通するようなグローバルな識別子を取得することを要さない。すなわち、判定装置１００は、実施形態において実行する処理において、ユーザ端末１０を一意に識別することが可能な識別子を取得しさえすればよく、必ずしも永続的に定まる識別子を取得しなくてもよい。

〔６−４．ユーザ端末の構成〕
上記実施形態では、ユーザ端末１０の構成例について図７を用いて説明した。しかし、ユーザ端末１０は、図７で例示した全ての処理部を備えることを必ずしも要しない。例えば、ユーザ端末１０は、表示部１３を必ずしも備えていなくてもよい。また、ユーザ端末１０は、２以上の機器に分離されて図７を示す構成が実現されてもよい。例えば、ユーザ端末１０は、少なくとも検知部１４を有する音声検知装置と、少なくとも通信部１１を有する通信装置とに分離された構成を有する、２台以上の機器により実現されてもよい。

〔６−５．音声入力の判定〕
上記実施形態では、判定装置１００が、環境音の連続性に基づいてセッションを管理することで、ユーザが発した断続的な音声が一連の音声入力であると判定する例を示した。ここで、判定装置１００は、音声を一連の音声入力と判定以外にも、種々の音声認識に関する処理を行ってもよい。

例えば、判定装置１００は、環境音の連続性に基づいて、ユーザが発する指示語を特定してもよい。具体的には、判定装置１００は、環境音が連続している間に発せられたユーザの指示語が、同じセッションで発せられた別の語を指しているものと判定する。例えば、判定装置１００は、「お米・・・」とユーザが発した音声を収集したのちに、「さっきのあれ買って。」という音声を収集したとする。この場合、判定装置１００は、「さっきのあれ」という指示語を、直前にユーザが発した商品名である「お米」と認識する。そして、判定装置１００は、認識した音声に対応する処理（この例では、お米を注文するという処理）を行う。

このように、判定装置１００は、環境音の連続性に基づいてセッションを管理することで、ユーザの音声が途切れた場合でも、前後の音声を一連の音声として、また、前後の音声を一連の会話として取り扱うことができる。これにより、判定装置１００は、サービスを利用するユーザの利便性を向上させることができる。

〔６−６．環境音〕
上記実施形態では、判定装置１００が、環境音として、ユーザの自宅等で観測される機器の稼働音等を収集する例を示した。しかし、環境音の例はこれに限られず、判定装置１００は、種々の音を環境音として収集してもよい。

例えば、判定装置１００は、ユーザが自動車内でユーザ端末１０を利用している場合には、自動車のエンジン音等を環境音として収集してもよい。なお、判定装置１００は、環境音を収集する場合には、環境音を発する音源の距離や、方向や、音圧や、周波数等を収集し、そのうち、普遍的に観測される音情報を環境音として収集するようにしてもよい。これにより、判定装置１００は、突発的に異なる音（例えば、ユーザ以外の者が発した音声など）が音情報に混在した場合であっても、上記のように普遍的な音情報が観測できる限りは、環境音が連続していると判定してもよい。このように、判定装置１００は、上記実施形態で説明した処理を多様な状況で実現することができる。

〔７．ハードウェア構成〕
上述してきた実施形態に係る判定装置１００やユーザ端末１０は、例えば図１３に示すような構成のコンピュータ１０００によって実現される。以下、判定装置１００を例に挙げて説明する。図１３は、判定装置１００の機能を実現するコンピュータ１０００の一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に記憶されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を記憶する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス１５００は、通信網５００（図２に示したネットワークＮに対応）を介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータを、通信網５００を介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、入出力インターフェイス１６００を介して生成したデータを出力装置へ出力する。

メディアインターフェイス１７００は、記録媒体１８００に記憶されたプログラム又はデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が実施形態に係る判定装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラム（例えば、実施形態に係る判定プログラム）を実行することにより、制御部１３０の機能を実現する。また、ＨＤＤ１４００には、記憶部１２０内のデータが記憶される。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置から通信網５００を介してこれらのプログラムを取得してもよい。

〔８．その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、図３に示した抽出部１３２と、判定部１３３とは統合されてもよい。また、例えば、記憶部１２０に記憶される情報は、ネットワークＮを介して、外部に備えられた記憶装置に記憶されてもよい。

また、例えば、上記実施形態では、判定装置１００が、ユーザから音情報を収集する収集処理と、セッションを判定する判定処理と、コンテンツの効果を測定する測定処理とを行う例を示した。しかし、上述した判定装置１００は、収集処理を行う収集装置と、判定処理を行う判定装置と、測定処理を行う測定装置に分離されてもよい。この場合、例えば、実施形態に係る判定装置１００による処理は、収集装置と、判定装置と、測定装置といった各装置を有する判定処理システム１によって実現される。

また、上述してきた各実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

〔９．効果〕
上述してきたように、実施形態に係る判定プログラムは、周囲の環境音を収集する収集手順と、収集手順によって収集された環境音の連続性に基づいて、ユーザの所定の行動が１つのセッションに含まれるか否かを判定する判定手順と、をコンピュータ（例えば、実施形態に係る判定装置１００）に実行させる。

このように、実施形態に係る判定プログラムは、音声認識技術を利用してサービスが利用される際に、ユーザの音声とは異なる、周囲の環境音に基づいて、ユーザの所定の行動が１つのセッションに含まれるか否かを判定する。これにより、判定プログラムは、クッキー情報など、ユーザ本人であることを示す識別情報等を利用できない音声認識技術を利用したサービスにおいても、行動の連続性を判定することができる。このため、判定プログラムは、ユーザに再度のログインを求めたり、音声の再入力を求めたりすることなく、セッションを維持できる。結果として、判定プログラムは、ユーザに余計な負担を掛けることなく、ユーザビリティの高いセッション管理を行うことができる。

また、収集手順は、定常的に発せられる周囲の環境音を収集する。判定手順は、定常的に発せられる周囲の環境音が収集されている間のユーザの所定の行動が、１つのセッションに含まれると判定する。

このように、実施形態に係る判定プログラムは、エアコン６０やテレビ７０の稼働音など、定常的に観測される音を周囲の環境音として収集する。このため、判定プログラムは、環境音が変化したか否かを適切に判定できるので、確度の高いセッション管理を行うことができる。

また、判定手順は、定常的に発せられる周囲の環境音が所定の閾値を超えて変化した後に観測されたユーザの所定の行動は、１つのセッションに含まれないと判定する。

このように、実施形態に係る判定プログラムは、環境音が変化した場合に、ユーザの行動が１つのセッションに含まれないと判定する。これにより、判定プログラムは、ユーザの一連の行動が終了したことを、環境音が変化するという自然なかたちで行うことができるため、ユーザにとって違和感のないセッション管理を行うことができる。

また、収集手順は、音が発せられる方向、音源までの距離、収集する音の波形、収集する音の音量の少なくとも一つが定常的である周囲の環境音を収集する。

このように、実施形態に係る判定プログラムは、種々の音の素性を含む環境音を収集する。これにより、実施形態に係る判定プログラムは、環境音の変化を正確に捉えることができるので、より適切なセッション管理を行うことができる。

また、収集手順は、ユーザが発する音声を断続的に収集する。判定手順は、収集手順によって収集された環境音の連続性に基づいて、ユーザが発した断続的な音声が、一連の音声入力であるか否かを判定する。

このように、実施形態に係る判定プログラムは、例えば、環境音が連続している場合には、途切れた音声を一連の音声として捉えるなどの柔軟な処理を行うことができる。このため、判定プログラムは、再度の音声入力等をユーザに要求する機会を減少させるので、ユーザビリティを向上させることができる。

また、判定手順は、環境音が所定の時間を超えて連続する場合には、所定の時間の間に行われたユーザの所定の行動が１つのセッションに含まれると判定し、所定の時間を超えて行われたユーザの所定の行動は１つのセッションに含まれないと判定する。

このように、実施形態に係る判定プログラムは、継続時間などを用いた既存のセッション管理と、環境音によるセッション管理とを組み合わせてもよい。これにより、判定プログラムは、より安全性の高いセッション管理を行うことができる。

また、判定手順は、ユーザを認識するための音情報と環境音とを照合することにより、任意の行動の主体がユーザであるか否かを判定するとともに、主体がユーザであると判定した場合には、任意の行動が１つのセッションに含まれると判定する。

このように、実施形態に係る判定プログラムは、ユーザからの意識的な音声入力を受け付けずとも、同じ環境下でユーザ本人がサービスを利用し続けていることから、あえてセッションを切断せずに、セッションを維持してもよい。かかる処理によっても、判定プログラムは、ユーザビリティの高いセッション管理を行うことができる。

また、判定手順は、予め登録されているユーザの足音、ユーザとは異なる者の音声、ユーザが拠点とする場所の環境音の少なくともいずれか一つと、収集手順によって収集された環境音とを照合することにより、任意の行動の主体がユーザであるか否かを判定する。

このように、実施形態に係る判定プログラムは、種々の態様の音情報を登録してもよい。これにより、判定プログラムは、ユーザの本人性を高い精度で判定することができる。

また、実施形態に係る判定プログラムは、判定手順によって、ユーザの所定の行動と、ユーザへのコンテンツの提供とが１つのセッションに含まれると判定された場合に、ユーザに提供されたコンテンツの効果を測定する測定手順、をさらにコンピュータに実行させる。

このように、実施形態に係る判定プログラムは、環境音の連続性を利用して、コンテンツの効果測定を行ってもよい。これは、環境音が連続している状況のもとで、配信されたコンテンツに関連する行動をとったユーザは、コンテンツの配信が動機付けとなって何らかの行動を起こした蓋然性が高いと判定できるという理由による。一般に、コマーシャルなどの広告コンテンツ等と、ユーザがユーザ端末１０につぶやいた行動とは、その関連性を証明することが難しい。一方、実施形態に係る判定プログラムによれば、コンテンツの配信から継続した環境音のもとで行われたユーザの行動（発したつぶやきや、音声入力による注文）を収集できるので、真にコンテンツが効果を発揮したか否かを正確に測定することができる。

また、測定手順は、ユーザの所定の行動が、コンテンツを視聴したと推定される行動であるか否かに基づいて、ユーザに提供されたコンテンツの効果を測定する。

このように、実施形態に係る判定プログラムは、例えばユーザのつぶやきなどの行動に基づいて、ユーザがコンテンツを視聴したか否かを推定し、推定した情報に基づいてコンテンツの効果測定を行ってもよい。これにより、判定プログラムは、配信されたコマーシャルや広告コンテンツがユーザに影響を及ぼしたか否かを確度良く捉えることができるので、例えばテレビ視聴率等の指標値と比べて、より正確にコンテンツの効果を測定することができる。

また、測定手順は、ユーザの所定の行動が、コンテンツに関するコンバージョンと成り得るか否かに基づいて、ユーザに提供されたコンテンツの効果を測定する。

このように、実施形態に係る判定プログラムは、コンバージョンを効果測定の要素としてもよい。判定プログラムは、コンバージョンのような、数値として成果が示しやすい要素を用いることで、より正確にコンテンツの効果を測定することができる。

以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、収集部は、収集手段や収集回路に読み替えることができる。

１判定処理システム
１０ユーザ端末
１００判定装置
１１０通信部
１２０記憶部
１２１セッション記憶部
１２２効果測定記憶部
１２３行動テーブル
１２４効果テーブル
１２５照合情報記憶部
１２６登録テーブル
１２７照合テーブル
１３０制御部
１３１収集部
１３２抽出部
１３３判定部
１３４測定部

Claims

ユーザが利用する端末装置であるユーザ端末の周囲の環境音を収集する収集手順と、
前記収集手順によって収集された前記環境音が所定の閾値を超えて変化するか否かに基づいて当該環境音の連続性を判定するとともに、当該環境音の連続性に基づいて、前記ユーザの所定の行動がネットワークを介して提供されるサービスにおける１つのセッションに含まれるか否かを判定する判定手順と、
をコンピュータに実行させることを特徴とする判定プログラム。
前記判定手順は、
前記環境音が所定の閾値を超えて変化していない間の前記ユーザの所定の行動が、前記１つのセッションに含まれると判定する、
ことを特徴とする請求項１に記載の判定プログラム。
前記判定手順は、
前記環境音が所定の閾値を超えて変化した後に観測された前記ユーザの所定の行動は、前記１つのセッションに含まれないと判定する、
ことを特徴とする請求項２に記載の判定プログラム。
前記収集手順は、
音が発せられる方向、音源までの距離、収集する音の波形、収集する音の音量の少なくとも一つが定常的である周囲の環境音を収集する、
ことを特徴とする請求項１〜３のいずれか一つに記載の判定プログラム。
前記収集手順は、
前記ユーザが発する音声を断続的に収集し
前記判定手順は、
前記収集手順によって収集された環境音の連続性に基づいて、前記ユーザが発した断続的な音声が、一連の音声入力であるか否かを判定する、
ことを特徴とする請求項１〜４のいずれか一つに記載の判定プログラム。
前記判定手順は、
前記環境音が所定の時間を超えて連続する場合には、当該所定の時間の間に行われた前記ユーザの所定の行動が１つのセッションに含まれると判定し、当該所定の時間を超えて行われた前記ユーザの所定の行動は１つのセッションに含まれないと判定する、
ことを特徴とする請求項１〜５のいずれか一つに記載の判定プログラム。
前記判定手順は、
前記ユーザを認識するための音情報と前記環境音とを照合することにより、任意の行動の主体が前記ユーザであるか否かを判定するとともに、前記主体がユーザであると判定した場合には、当該任意の行動が１つのセッションに含まれると判定する、
ことを特徴とする請求項１〜６のいずれか一つに記載の判定プログラム。
前記判定手順は、
予め登録されている前記ユーザの足音、前記ユーザとは異なる者の音声、前記ユーザが拠点とする場所の環境音の少なくともいずれか一つと、前記収集手順によって収集された環境音とを照合することにより、前記任意の行動の主体が前記ユーザであるか否かを判定する、
ことを特徴とする請求項７に記載の判定プログラム。
前記判定手順によって、前記ユーザの所定の行動と、当該ユーザへのコンテンツの提供とが１つのセッションに含まれると判定された場合に、当該ユーザに提供されたコンテンツの効果を測定する測定手順、
をさらにコンピュータに実行させることを特徴とする請求項１〜８のいずれか一つに記載の判定プログラム。
前記測定手順は、
前記ユーザの所定の行動が、前記コンテンツを視聴したと推定される行動であるか否かに基づいて、当該ユーザに提供されたコンテンツの効果を測定する、
ことを特徴とする請求項９に記載の判定プログラム。
前記測定手順は、
前記ユーザの所定の行動が、前記コンテンツに関するコンバージョンと成り得るか否かに基づいて、当該ユーザに提供されたコンテンツの効果を測定する、
ことを特徴とする請求項９又は１０に記載の判定プログラム。
ユーザが利用する端末装置であるユーザ端末の周囲の環境音を収集する収集部と、
前記収集部によって収集された前記環境音が所定の閾値を超えて変化するか否かに基づいて当該環境音の連続性を判定するとともに、当該環境音の連続性に基づいて、前記ユーザの所定の行動がネットワークを介して提供されるサービスにおける１つのセッションに含まれるか否かを判定する判定部と、
を備えたことを特徴とする判定装置。
コンピュータが実行する判定方法であって、
ユーザが利用する端末装置であるユーザ端末の周囲の環境音を収集する収集工程と、
前記収集工程によって収集された前記環境音が所定の閾値を超えて変化するか否かに基づいて当該環境音の連続性を判定するとともに、当該環境音の連続性に基づいて、前記ユーザの所定の行動がネットワークを介して提供されるサービスにおける１つのセッションに含まれるか否かを判定する判定工程と、
を含んだことを特徴とする判定方法。