JP5277941B2 - 関連商品提示方法、関連商品提示システム、プログラム、記録媒体 - Google Patents

関連商品提示方法、関連商品提示システム、プログラム、記録媒体 Download PDF

Info

Publication number
JP5277941B2
JP5277941B2 JP2008322774A JP2008322774A JP5277941B2 JP 5277941 B2 JP5277941 B2 JP 5277941B2 JP 2008322774 A JP2008322774 A JP 2008322774A JP 2008322774 A JP2008322774 A JP 2008322774A JP 5277941 B2 JP5277941 B2 JP 5277941B2
Authority
JP
Japan
Prior art keywords
product
web page
data
test
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008322774A
Other languages
English (en)
Other versions
JP2010146288A (ja
Inventor
宣幸 小林
修 中川
直之 伊藤
潤平 小林
直之 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2008322774A priority Critical patent/JP5277941B2/ja
Publication of JP2010146288A publication Critical patent/JP2010146288A/ja
Application granted granted Critical
Publication of JP5277941B2 publication Critical patent/JP5277941B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ネット通販(インタ−ネットを用いた通信販売)にて商品データを組合せて提供する方法、装置、プログラム、記録媒体に関するものである。

本発明は特に、ネット通販において、販売を促進させるために、適切に組合せた商品データを提供する場合に有用である。
なお、ネット通販で扱う商品としては、パソコン、パソコン周辺機器、家電、スポーツ用品、書籍、音楽ソフト、映像ソフト、インターネットプロバイダ、不動産、乗物(自動車・バイク・自転車等)、食品、金融、保険、旅行の予約などの様々なものがある。
現代の通信販売活動において、販売促進するためには、商品を購入する顧客に対して適切な商品データを提供することが益々重要となっている。
提供する商品データについては、顧客が購入しようとしている対象商品だけでなく、対象商品と組合せて用いられる関連商品データを同時に提供することは、売り上げを増やすために有用な一つの方法である。
そこで、ネット通販において関連商品データを提供する方法とその問題点を説明する。
《1.商品の組合せ》
対象商品に組合せる関連商品は、販売担当者が、経験や知識から判断して、選択することが多い。
この場合には、商品点数が増加するにつれて、商品を選択して組合せるための作業時間が増大する。また、販売担当者の判断は主観的であるので、販売担当者によって商品の組合せ方に相違が生じる。

あるいは、対象商品に組合せる関連商品は、インターネットの掲示板に掲載されている商品の感想や評価の意見を利用して選択することも可能である。
たとえば、特許文献1では、ネット掲示板において、他の投稿データを参照する参照データを特定する投稿データ170と、2つの参照データを関連付ける関連メタデータ268を用いて、投稿データに掲載された商品が参照する参照商品を推奨する技術が開示されている。
《2.組合せの効果判定》
ネット通販では、提供している商品データの組合せが適切であるか否かを効果判定することは重要である。
たとえば、特許文献2では、一般ユーザーにより提案される組合せ商品に対して、トレンドリーダを含むユーザーに人気投票をさせて、商品の組合せを確定する技術が開示されている。
特開2005−196469号公報(段落0045、段落0072−段落0078、図4) 特開2006−4303号公報(段落0019−段落0028、図5) Ricardo Baeza-Yates,Berthier Ribeiro-Neto,「Modern Information Retrieval」(米国)、第1版、Acm Press Books,January,1999,p.27-29 北研二他、「情報検索アルゴリズム」(日本)、第1版、共立出版、1月1日、2002、p.33-40
しかしながら、特許文献1の技術では、投稿者にとって、商品に意見がある場合にのみ、投稿が行われるのであって、全ての関連商品の情報が網羅されて投稿されるわけでは無い。
特許文献2の技術では、商品の組合せが提案者である一般ユーザーの好み(主観)に左右されるので、一般ユーザーにとって最適なものが提案される保障が無い。また、人気投票であるので、消費行動に結びつく保障は無い。
本発明は以上のような点を解決するためになされたものであって、本発明の課題は、ネット通販において、対象商品に対する関連商品の組合せを顧客に容易に提示できる、そして、顧客の反応情報を収集できる方法、装置、プログラム、記録媒体を提供することである。
ここで、用語の説明をする。
(1)特徴語の重み(tf‐idf )
特徴語の重みとは、文書を特徴づける特徴語が文書の内容と関係する程度を示す指標である。
重みの大きな特徴語は、その文書の内容と密接な関係にあるといえる。
重みの小さな特徴語は、その文書の内容と希薄な関係にあるといえる。

たとえば、n個の文書D1 、D2 、・・、Dnの文書集合があって、文書集合には、m個の文書の内容を特徴づける語(特徴語)w1 、w2 、・・、wm が存在するときに、文書Dj における特徴語wi の重みの値「wij」を算出する一般式は、以下のとおりである。
ij=(文書Djにおける特徴語wiの出現頻度)/(特徴語wiを含む文書の数)

tf-idfとは、文書を特徴づける特徴語の重みを表す値wijの一例である。
たとえば、非特許文献1や非特許文献2には、特徴語に対して、まず、文書Djにおける特徴語wiの出現頻度を局所的な重み「tf」として、また特徴語wiを含む文書の数を大域的な重み「df」として、tfと、dfの逆数「idf」と、を積算して、文章における特徴語の重み「tf-idf」を算出する技術が開示されている。
なお「局所的な重み」と「大域的な重み」の詳細については、図9と図10にて後述する。
(2)文書ベクトル
文書ベクトルとは、語(=特徴語)をベクトル空間の次元として、それぞれの語の「tf-idf」をベクトル成分とする多次元空間ベクトルとして定義したものである。
たとえば、n個の文書D1 、D2 、・・、Dnがあって、m個の特徴語w1 、w2 、・・、wm が存在するときに、文書Dj の文書ベクトルqjを表す式は、以下のとおりである。
j=(w1j 、w2j 、・・、wij 、・・、wmj
ここで、wijは、上述したとおり、文書Djにおける特徴語wiの重み「tf-idf」である。
たとえば、非特許文献1には、文書を構成する語をベクトル空間の次元に対応付けて、ベクトル空間の次元に対応付けた語の重みをベクトル成分とする文書ベクトルを定義して、2つの文書ベクトルの向きを比べることで(=内積の大きさを求めることで)、2つの文書間の類似度を測定する技術が開示されている。
なお、文書ベクトルの詳細については、図11にて後述する。

(3)類似度
類似度とは、2つの文書が類似している程度である。
2つの文書に含まれる特徴語が似ていれば、2つの文書の類似度は高いことになる。
類似度は、たとえば、2つの文書ベクトル「qi」、「qj」の内積を正規化した値で表し、以下の式で算出する。
sim(qi 、qj )=( q i ・qj )/( |q i | |q j | )
(4)ネット通販による反応情報
ネット通販による反応情報とは、顧客が、提示された商品に対する購入の意思表示である成約情報(購入件数、ショッピングカートへの登録回数など)や、提示された商品データに対する関心の意思表示である参照情報(参照回数、クリック数など)などを集約したものである。
本発明は、以下の各態様に記載の手段により、前記課題を解決する。
すなわち、本願発明の第1の発明は、
商品説明文を有する商品データと、形態素解析辞書と、を用いる関連商品提示方法において、
(1)商品データが有する説明文を読み出して、形態素解析辞書を適用して、読み出した商品説明文を形態素に分離して、分離した形態素の中から、名詞の形態素と形態素解析辞書に登録されない未知語の形態素を特徴語として抽出する特徴語抽出ステップと、
(2)特徴語を手掛りにして、2つの商品説明文における特徴語の重みを算出して、両商品説明文の特徴語の重みから類似度を算出して、この類似度の値をそれぞれ商品説明文が説明する2つの商品の関連度に設定する類似度算出ステップと、
(3)一つ商品を対象商品として指定して、対象商品との関連度の値が大きい商品の商品データを関連商品データとして取り出して、対象商品データと組合せて、テスト用Webページを編集するテスト用Webページ編集ステップと、
(4)各テスト用Webページに掲載される関連商品の類似度の総和を求め、当該総和が最も大きいテスト用WebページをチャンピオンパターンWebページとし、それ以外のテスト用WebページをチャレンジパターンWebページとするステップと、
)テスト用Webページを要求してきたWebブラウザーが、通常ユーザーかチャレンジユーザーのどちらであるかを、表示比率に従って特定するステップと、
(6)通常ユーザーに対してはチャンピオンパターンWebページを、チャレンジユーザーに対してはチャレンジパターンWebページを返信するテスト用Webページ返信ステップと、
)Webブラウザーを介してテスト用Webページの商品データに対して操作された端末操作情報を収集する端末操作情報収集ステップと、
を含んだ手順でなされることを特徴とする関連商品提示方法である。
このように、両商品の説明文の類似度を手掛りにすることで、対象商品と関連性の高い関連商品を、人の判断に依存せずに客観的に、特定することが可能である。また、人手を要さずに機械的に、特定することが可能である。
あるいは、テスト用Webページ中の商品に対して顧客が操作した端末操作情報を収集することが可能である。
本願発明の第2の発明は、請求項1の関連商品提示方法において、
前記類似度算出ステップは、
(2−1)各商品説明文における特徴語の個数情報(=tf)に対して、当該特徴語が存在する説明文書数情報の逆数(=idf)を乗算して、特徴語の重み(=tf−idf)を算出する重み算出ステップと、
(2−2)特徴語の重みの値をベクトル成分とする商品説明文の文書ベクトルデータを作成する文書ベクトル作成ステップと、
(2−3)2つの商品説明文の文書ベクトルデータを用いて、類似度を算出して、類似度値と2つの商品識別情報とを対応付けて関連度データを作成する関連度設定ステップと、
を含んだ手順でなされることを特徴とする請求項1に記載の関連商品提示方法である。
本願発明の第3の発明は、請求項1の関連商品提示方法において、
前記テスト用Webページは、
表示された対象商品や関連商品がクリックされたクリック情報を有するURLを発行して、表示された対象商品に対して購入の意思表示をした成約情報を有するURLを送信する
ことを特徴とする請求項1に記載の関連商品提示方法である。
本願発明の第4の発明は、
商品識別情報と商品説明文を有する商品データを格納する商品データ格納領域と、
形態素解析辞書を格納する辞書格納領域と、
を有する記憶部と、
商品データが有する説明文を読み出して、形態素解析辞書を適用して、読み出した商品説明文を形態素に分離する形態素抽出手段と、
分離した形態素の中から、名詞語と形態素解析辞書に登録されない未知語を抽出して、商品説明文の特徴語を作成する商品特徴語作成手段と、
特徴語を手掛りにして、商品説明文における特徴語の重みを算出して、2つの商品説明文の特徴語の重みから類似度を算出する類似度算出手段と、
一つの商品説明文を対象商品説明文に設定して、関連度データを参照して、所定の類似度の値に対応付けられた対象商品識別情報(=対象商品ID)を有する関連度データを読み出して、読み出し関連度データの有する対象商品識別情報と異なる商品識別情報を関連商品識別情報(=関連商品ID)として抽出して、抽出した関連商品識別情報を有する商品データを読み取って、対象商品の商品データと組合せて、テスト用Webページを編集するテスト用Webページ編集手段と、
各テスト用Webページに掲載される関連商品の類似度の総和を求め、当該総和が最も大きいテスト用WebページをチャンピオンパターンWebページとし、それ以外のテスト用WebページをチャレンジパターンWebページとするパターン設定手段と、
テスト用Webページを要求してきたWebブラウザーが、通常ユーザーかチャレンジユーザーのどちらであるかを、表示比率に従って特定するユーザー特定手段と、
通常ユーザーに対してチャンピオンパターンWebページを返信するチャンピオンパターン返信手段と、
チャレンジユーザーに対してチャレンジパターンWebページを返信するチャレンジパターン返信手段と、
を備えることを特徴とする関連商品提示システムである。
本願発明の第5の発明は、
記類似度算出手段が、
対象商品および関連商品の特徴語を用いて、特徴語が説明文に含まれる個数情報(=tf)と、特徴語が存在する説明文書数情報の逆数(=idf)を求めて、個数情報と文書数情報の逆数を乗算して、特徴語の重み(=tf−idf)を算出して、この重みを用いて、商品説明文の文書ベクトルデータを作成する文書ベクトル作成手段と、
対象商品説明文の文書ベクトルデータと、一つの関連商品説明文の文書ベクトルデータを用いて、内積の値を求めて、これを正規化して、類似度を算出して、類似度の値として、類似度値と2つの商品識別情報とを対応付けて関連度データを作成する関連度算出手段と、
を備えることを特徴とする請求項4に記載の関連商品提示システムである。
本願発明の第6の発明は、
記テスト用Webページは、
テスト用Webページをテスト画面として表示して、商品が表示されたことを示す参照情報や、テスト画面の商品がクリックされたことを示すクリック情報や、商品に対して購入の意思表示がされたことを示す購入情報などを有する端末操作情報を送信する機能、
を備えることを特徴とする請求項4または請求項5に記載の関連商品提示システムである。
本願発明の第7の発明は、コンピューターに組込むことによって、コンピューターを請求項4から6までのいずれか1項に記載の関連商品提示システムとして動作させるコンピュータプログラムである。
本願発明の第8の発明は、請求項7に記載のコンピュータプログラムを記録したコンピューター読み取り可能な記録媒体である。
本願発明によれば、ネット通販において、
(1)2つの商品の説明文の類似度を手掛りにして、対象商品と関連性の高い関連商品を、客観的、機械的に特定して、組合せることが可能である。
(2)テストで組合せた商品に対してコンピューターを操作した端末操作情報を収集することが可能である。
従って、本発明によれば、ネット通販において、ネット販売の顧客がテストで組合せた商品の中から興味ある商品に対して反応した情報を収集することができるという効果がある。
以下、図面等を参照しながら、本発明の実施の形態について、更に詳しく説明する。
図1は、本発明の実施の形態による関連商品提示システム1の概要を説明する図である。
関連商品提示システム1は、Webページ設計装置100と、WWWサーバー装置300と、顧客端末装置500と、がネットワーク接続されて構成される。
Webページ設計装置100は、既存のWebページ編集プログラムと、既存の自然文解析ツール(たとえば、自然文解析ツール名称「茶筌」。奈良先端技術大学院作成。以下、形態素解析ツール)と、を備えたパーソナルコンピューターに、後述する専用プログラムを搭載したものである。
WWWサーバー装置300は、既存のWebサーバープログラム(以下、Webサーバー)を備えたサーバーコンピューターに、後述する専用プログラムを搭載したものである。
顧客端末装置500は、既存のWebブラウザーを搭載したパーソナルコンピューターである。
図2は、ネット通販における、対象商品とその関連商品との組合せを決める大まかな作業手順を説明する図である。
《A.商品説明文の類似度》
Webページ設計装置100は、全ての扱い商品の商品説明文から特徴語を抽出して、特徴語を手掛りにして、2つの商品説明文の類似度を算出する(図2(1))。
ここで、扱い商品とは、ネット通販で販売する商品である。
《B.テスト用Webページの編集》
Webページ設計装置100は、一つの扱い商品を対象商品として指定して、2つの商品説明文の類似度を参照して、対象商品の説明文と類似度が高い商品説明文を抽出して、この商品説明文が説明する商品を候補商品とする。Webページ設計装置100は、候補商品から絞りこんだ関連商品と対象商品から構成されるテスト画面を表示するための複数の異なるテスト用Webページを編集する(同(2))。(テスト画面の詳細は後述する)
《C.反応情報の収集》
WWWサーバー装置300は、顧客よって異なるテスト用Webページを提供して、提供したテスト用Webページから反応情報を作成して記録する。また、WWWサーバー装置300は、顧客端末装置500がテスト画面の商品の参照や購入のために操作した端末操作情報を収集して、これから反応情報を作成して記録する(同(3))。
端末操作情報を収集する方法は、たとえば、テスト画面の商品画像をマウスがクリックしたら、商品を識別する情報や、クリックした意味を表す情報などを有するURLが送信されるようにテスト用Webページを編集しておけばよい。
WWWサーバー装置300は、反応情報を分析して、顧客の反応の良い商品を決定する(同(4))。
このように、幾つかのテスト画面を用いて販売テストを行うことで、対象商品にとって最適な組合せとなる関連商品を決定することができる。
なお、販売用Webページには、反応の良い商品と共に、目玉商品やキャンペーン商品などを追加してもよい。
図3は、対象商品と候補商品を説明する図である。
対象商品とは、扱い商品の中から選んだ任意の一つの扱い商品である。
候補商品とは、対象商品の説明文にとって類似度の高い説明文の扱い商品である。
図3には、対象商品と候補商品の画像と商品名称が例示されている。
対象商品の例は、デジタルカメラ「デジタル一眼S1」である。
候補商品の例は、デジタルカメラ「オートズームAZ」、「コンパクトP3」や、フォトフレーム「デジタルフレームDD8」、「フレームNN6」や、フォトプリンター「フォトプリンター156」、「フォトコンパクト22」である。
この例の意味は、デジタルカメラ「デジタル一眼S1」の説明文と類似度の高かった説明文の扱い商品が、デジタルカメラ「オートズームAZ」、「コンパクトP3」と、フォトフレーム「デジタルフレームDD8」、「フレームNN6」と、フォトプリンター「フォトプリンター156」、「フォトコンパクト22」であるということである。
図4は、テスト画面502を説明する図である。
テスト画面502は、対象商品の商品データと候補商品の中から絞り込んだ関連商品の商品データにより構成されたWebページを表示させた画面である。
図4には、テスト画面502が例示されている。
テスト画面502には、対象商品の商品データとして、商品画像と商品名称と商品説明文が掲載されて、関連商品の商品データとして、商品画像と商品名称とが掲載されている。
対象商品には、「購入」ボタンが関連付けられている。
関連商品には、その関連商品が対象商品として構成されたWebページを参照するためのハイパーリンクが埋め込まれている。
なお、候補商品の中から関連商品を選ぶ方法には、たとえば、以下に例示する方法を用いればよい。
(1)商品説明文の類似度の高い順に候補商品を並べて、上位から所定の個数ずつを取り出して、関連商品の集まりを作る。たとえば、商品説明文の類似度の高い順に並べた33個の候補商品の中から、上位から3個ずつを取り出して、11組の関連商品の集まりを作る。
(2)候補商品の中から所定の個数の商品を任意に取り出して、関連商品の集まりを作る。
図18は、URL表記による端末操作情報を説明する図である。
図18の(a)は、URL表記による端末操作情報の形式を説明する図である。
URL表記の端末操作情報593は、情報資源所在表記934と、対象商品ID931と、関連商品ID932と、状態ID933を含むURLパラメーターとから構成される。
対象商品ID931は、テスト画面に表示された対象商品の対象商品IDである。
関連商品ID932は、対象商品に関連商品として対応付けられた商品のIDである。
状態ID933は、テスト画面に表示された関連商品画像のクリックや、テスト画面に表示された対象商品の「購入」ボタンが押されたことを意味する情報である。
図18の(b)は、URLによる端末操作情報397の例である。
図18の(b1)は、関連商品がクリックされたときの端末操作情報397の例である。
図18の(b1)に例示された端末操作情報397は、「 http://shop.dnp.co.jp/store/product.cgi?pattern-id=8&target-product-id=c101&related-product-id=c102&related-product-status=clicked 」である。
この例の意味は、商品ID971が「c101」である対象商品のときに、商品ID972「c102」の関連商品画像がクリックされたということである。
図18の(b2)は、対象商品が購入されたときの端末操作情報397の例である。
例示された端末操作情報397は、「 http://shop.dnp.co.jp/store/cart.cgi?pattern-id=5&target-product-id=f201&target-product-status=ordered 」である。
この例の意味は、商品ID971「c101」の対象商品の「購入」ボタンが押されたということである。
図19は、反応情報を説明する図である。
図19の(a)は、反応情報の形式を説明する図である。
反応情報397は、対象商品ID971と、関連商品ID972と、閲覧情報973と、参照情報974と、成約情報975と、から構成される。
対象商品ID971は、テスト画面に表示された対象商品の対象商品IDである。
関連商品ID972は、対象商品に関連商品として対応付けられた商品のIDである。
閲覧情報973は、対象商品と関連商品の組合せでテスト画面に表示された回数である。
参照情報974は、テスト画面に表示された関連商品がクリックされた回数である。
成約情報975は、テスト画面に表示された対象商品の「購入」ボタンが押された回数である。
図19の(b)は、反応情報397の例である。
図19の(b1)は、テスト画面が表示されたときの反応情報397の例である。
図19の(b1)に例示された反応情報397は、「(c101、c102、1、0、0)、(c101、c103、1、0、0)、(c101、f201、1、0、0)」である。
この例の意味は、商品ID971「c101」の対象商品と、商品ID972「c102」と「c103」と「f201」との関連商品で構成されたテスト画面が「1」回表示されて閲覧されたということである。
図19の(b2)は、関連商品がクリックされたときの反応情報397の例である。
図19の(b2)に例示された反応情報397は「(c101、c102、0、1、0)」である。
この例の意味は、商品ID971「c101」の対象商品のときに、商品ID972「c102」の関連商品が「1」回クリックされたということである。
図19の(b3)は、対象商品が購入されたときの反応情報397の例である。
図19の(b3)に例示されている反応情報397は「(c101、c102、0、0、1)、(c101、c103、0、0、1)、(c101、f201、0、0、1)」である。
この例の意味は、商品ID972「c102」と「c103」と「f201」との関連商品のときに、商品ID971「c101」の対象商品の「購入」ボタンが「1」回クリックされたということである。
図5と図6は、ネット販売における商品の組合せを設定する詳細な処理の流れを説明する図である。
図5は、テスト用Webページを編集する処理を説明する図である。
《A.商品説明文の類似度》
Webページ設計装置100は、すべての扱い商品の商品データを読み出して、それぞれの商品データが有する説明文に対して、すでに述べた既存の自然文解析ツールを適用して、商品説明文を形態素に分離する(図5(1−1))。
ここで、図7と図8を用いて、商品データと、商品説明文の形態素を説明する。
図7は、商品データ192を説明する。
図7の(a)は、商品データ192の形式を説明する図である。
商品データ192の項目は、商品ID921と、商品名922と、商品分類923と、商品画像924と、商品説明文925と、摘要926などから構成されている。
商品ID921は、商品を識別するためのユニークな文字列である。
商品名922は、商品名を表すための文字列である。
商品分類923は、商品を分類するための文字列である。
商品画像924は、商品画像データである。商品画像データのURLでもよい。
商品説明文925は、商品を説明するための文字列である。
摘要926は、商品仕様情報、価格、製造会社名などを示すための文字列である。
図7の(b)は、商品データの例である。
図7の(b)には、商品データ「c103、コンパクトP3、デジタルカメラ、103.jpg、B社独自のテクノロジを用いた手ブレ防止撮影機能を搭載。シャープな写真を撮影できる・・・、・・・」が例示されている。
この例の意味は、
商品ID921が、「c103」であって、
商品名922が、「コンパクトP3」であって、
商品分類923が、「デジタルカメラ」であって、
商品画像924が、「103.jpg」であって、
商品説明文925が、「B社独自のテクノロジを用いた手ブレ防止撮影機能を搭載。シャープな写真を撮影できる・・・」であるということである。
図8は、商品説明文の形態素を説明する図である。
図8の(a)は、形態素解析結果データの形式を説明する図である。
形態素解析結果データ194の項目は、単語941と、単語の読み942と、単語の原形943と、品詞の種類944と、活用の種類945と、活用形946などから構成されている。
単語941は、商品説明文から分離した形態素としての文字列である。
単語の読み942は、形態素のかな読みとしての文字列である。
単語の原形943は、形態素の語としての原形を表す文字列である。
品詞の種類944は、形態素の品詞である。
活用の種類945は、形態素の活用の種類である。
活用形946は、形態素の活用形である。
図8の(b)は、形態素の例である。
図8の(b)には、商品説明文「、B社独自のテクノロジを用いた手ブレ防止撮影機能を搭載。・・・」を形態素解析した結果データが例示されている。
たとえば、結果データの例として、「社、シャ、社、名詞-接尾-一般、・・」が示されている。この例の意味は、単語941が「社」であって、単語の読み942が「 シャ」であって、単語の原形943が「社」であって、品詞の種類944が「名詞」であって、活用の種類945が「接尾」であって、活用形946が「一般」であると言うことである。
また、結果データの例として、「テクノロジ 、 、 、未知語、・・」が示されている。この例の意味は、単語941が「テクノロジ」であって、品詞の種類944が「未知語」であると言うことである。なお、未知語とは、形態素解析辞書に登録されていない語のことである。
図5に戻って、テスト用Webページを編集する処理を説明する。
Webページ設計装置100は、形態素解析結果データが有する単語941(=形態素)の中から、品詞の種類944が、名詞と未知語である形態素を抽出して、特徴語とする(図5(1−2))。
ここで、未知語とは、形態素解析辞書に登録されない単語である。未知語は、商品説明をするための新しい用語(たとえば、技術用語)である可能性が高く、特徴語に加える意味がある。
Webページ設計装置100は、商品説明文から取り出した特徴語に対して、局所的な重み「tf」を算出してtf管理データを一時的に保持して、大域的な重み「df」を算出してdf管理データを一時的に保持して、「tf」と、dfの逆数「idf」とを積算して、文書おける特徴語の重み「tf−idf」を求める(図5(1−3))。
Webページ設計装置100は、特徴語の重みの値をベクトル成分とする商品説明文書ベクトルを設定する(同(1−4))。
ここで、図を用いて、特徴語の重みと、文書ベクトルを説明する。
まず、図9から図10までを用いて、特徴語の局所的な重みと大域的な重みを説明する。
図9は、特徴語の局所的な重み196(=tf)を説明する図である。
n個の商品説明文D1 、D2 、・・、Dnがあって、m個の特徴語w1 、w2 、・・、wm が存在するときに、特徴語wiの局所的な重みとは、商品説明文Djにおける特徴語wiの出現頻度である。
図9の(a)は、tf管理データ196の形式を説明する図である。
tf管理データ196は、商品ID960と、特徴語961と、tf値962とから構成される。
特徴語961と、tf値962とは対応付けられる。
商品ID960は、対応付けられている特徴語961とtf値962とに関連付けられている。
商品ID960は、この商品説明文が説明する商品のIDである。
特徴語961は、商品説明文が有する特徴語であって、図8の単語941と同じである。
tf値962は、局所的な重み(=商品説明文における特徴語の出現頻度)を表す数値指標である。
図9の(b)は、tf管理データ196の例である。
図9の(b)には、tf管理データ196の例として、たとえば、特徴語961とtf値962とが対応付けられた「(コンパクト、2)、(デザイン、1)、(顔、1)」に、商品ID960「c101」が関連付けられたデータが示されている。
この例の意味は、このtf管理データ196は、商品ID960「c101」の商品説明文の中に含まれる特徴語の出現頻度は、それぞれ、特徴語「コンパクト」の出現頻度が、2回であって、特徴語「デザイン」の出現頻度が、1回であって、特徴語「顔」の出現頻度が、1回であることを意味している。なお、商品ID960「c101」は、商品説明文が説明する商品のIDと同じである。
図10は、特徴語の大域的な重み197(=df)を説明する図である。
n個の商品説明文D1 、D2 、・・、Dnがあって、m個の特徴語w1 、w2 、・・、wm が存在するときに、特徴語wiの大域的な重みとは、特徴語wiを含む商品説明文の数である。
図10の(a)は、df管理データ197の形式を説明する図である。
df管理データ197は、特徴語971と、df値972とが対応付けられて構成される。
特徴語971は、商品説明文が有する特徴語であって、図8の単語941と同じである。
tf値972は、特徴語の大域的な重み(=特徴語を含む商品説明文の数)を表す数値指標である。
図10の(b)は、df管理データ197の例である。
図10の(b)には、df管理データ197の例として、たとえば、特徴語971「コンパクト」と、df値972「2」とが対応付けられて示されている。
この例の意味は、特徴語971「コンパクト」という単語は、2つの商品説明文に出現することを意味している。
また、df管理データ197の例として、たとえば、特徴語971「カメラ」と、df値972「5」とが対応付けられて示されている。
この例の意味は、特徴語971「カメラ」という単語は、5つの商品説明文に出現することを意味している。
次に、説明文の文書ベクトル(以下、説明文書ベクトル)を説明する。
図11は、説明文書ベクトルを説明する図である。
n個の商品説明文D1 、D2 、・・、Dnがあって、m個の特徴語w1 、w2 、・・、wm が存在するときに、商品説明文Dj の文書ベクトルqjは、文書Djおける特徴語wiの重み「tf−idf」をベクトル成分とするm次元ベクトルである。
図11の(a)は、説明文書ベクトルデータ198の形式を説明する図である。
説明文書ベクトルデータ198は、商品ID980と、特徴語981と、tf−idf値982とから構成される。
特徴語981とtf−idf値982が対応付けられている。
商品ID980は、この商品説明文が説明する商品IDである。
特徴語981は、文字列である
tf−idf値982は、商品説明文における特徴語の所定の重み「tf‐idf」を表す数値である。
なお、所定の重み「tf‐idf」の値は、次の式で算出される値「wij」である。
ij=(商品説明文Djにおける特徴語wiの出現頻度)/(特徴語wiを有する商品説明文の数)
図11の(b)は、説明文書ベクトルデータ198の例である。
図11の(b)には、説明文書ベクトルデータ198の例として、たとえば、特徴語981とtf−idf982とが対応付けられた「商品ID980「c102」が関連付けられた(コンパクト、1.0)、(デザイン、0.0)、(顔、5.0)」が示されている。
この例の意味は、この説明文書ベクトルデータ198は、商品ID980「c102」の商品説明文における特徴語のtf‐idf値は、それぞれ、特徴語「コンパクト」のtf‐idf値が、「1.0」であって、特徴語「デザイン」のtf‐idf値が、「0.0」であって、特徴語「顔」のtf‐idf値が、「5.0」であることを意味している。
ここで、tf‐idf値が、「0.0」であるとは、特徴語がこの商品説明文に出現しない(tf値=「0」)ということである。
なお、商品ID980「c101」は、商品説明文が説明する商品IDと同じである。
図5に戻って、テスト用Webページを編集する処理を説明する。
Webページ設計装置100は、2つの商品の類似度を、それぞれの商品を説明する商品説明文の説明文書ベクトルを用いて算出する。すなわち、Webページ設計装置100は、2つの商品説明文の説明文書ベクトルの内積を正規化して、2つの商品説明文の類似度を算出して、これを2つの商品の類似度値として、2つの商品識別情報(商品ID)と類似度値とを対応付けて関連度データ191を作成する(図5(1−5))。
ここで、図を用いて、2つの商品説明文の説明文書ベクトルを用いて、2つの商品説明文の類似度を算出する手順を説明する。
図12は、類似度算出手順を説明する図である。
10次元の説明文書ベクトル198を例に説明する。
例示される10次元説明文書ベクトル198は、10個の特徴語(コンパクト、デザイン、顔、検出、機能、カメラ、本体、画素、手、ブレ)を次元として、互いの次元が直交するベクトルである。
2つの商品説明文の10次元説明文書ベクトルデータ198「q i」と「qj」のを読み出す(図12(1))。
たとえば、商品ID「c101」の説明文書ベクトル「q i」=「 (コンパクト、1.0)、(デザイン、1.0)、(顔、0.5)、(検出、0.5)、(機能、0.1)、(カメラ、0.2)、(本体、0.0)、(画素、0.0)、(手、0.0)、(ブレ、0.0)」と、商品ID「c102」の説明文書ベクトル「qj」=「 (コンパクト 、1.5)、(デザイン、0.0 )、(顔、5.0 )、(検出、5.0 )、(機能、0.1 )、(カメラ、1.0 )、(本体、1.0 )、(画素、0.25 )、(手、0.5 )、(ブレ、0.5 )」と、を読み出す。
2つの10次元説明文書ベクトル「q i」と「qj」の内積( q i ・qj )を計算する(同(2))。
たとえば、商品ID「c101」の説明文書ベクトル「q i」と商品ID「c102」の説明文書ベクトル「qj」の内積( q i ・qj )の値は、「 q i ・qj = ( 1.0 × 1.5 ) + ( 1.0 × 0.0 ) + ( 0.5 × 0.0 ) + ( 0.5 × 0.0 ) + ( 0.1 × 0.1 ) + ( 0.2 × 1.0 ) + ( 0.0 × 1.0 ) + ( 0.0 × 0.25 ) + ( 0.0 × 0.5 ) + ( 0.0 × 0. 5 ) = 1.701 」である。
2つの10次元説明文書ベクトル「q i」と「qj」のユークリッドノルム|q i | と |q j |をそれぞれ計算する(同(3))。
たとえば、商品ID「c101」の説明文書ベクトル「q i」のユークリッドノルム|q i |と、商品ID「c102」の説明文書ベクトル「qj」のユークリッドノルム|q j |とは、それぞれ、「|q i |=(1.0 2 + 1.0 2 + 0.5 2 + 0.5 2 + 0.1 2 + 0.2 2 +0.0 2 + 0.0 2 + 0.0 2 + 0.0 2)の平方根 = 1.596872 」と、(「qj」=「1.5 2 + 0.0 2 + 0.0 2 + 0.0 2 + 0.1 2 + 1.0 2 + 1.0 2 + 0.25 2 + 0.5 2 + 0.5 2 )の平方根 = 2.196019 」である。
2つの10次元説明文書ベクトル「q i」と「qj」の内積をそれぞれのユークリッドノルムで除して、正規化して、2つの商品説明文の類似度sim(qi 、qj )を算出する(同(4))。
たとえば、商品ID「c101」の説明文書ベクトル「q i」と商品ID「c102」の説明文書ベクトル「qj」の類似度sim(qi 、qj )は、「sim(qi 、qj )=( q i ・qj )/( |q i | |q j | ) = 1.701 / (1.596872× 2.196019) = 0.485063 」である。
図13は、関連度データ191を説明する図である。
図13の(a)は、関連度データ191の形式を説明する図である。
関連度データ191は、第1の商品ID911と、第2の商品ID912と、類似度値913とから構成される。
第1の商品ID911は、第1の商品のID921である。
第2の商品ID912は、第2の商品のID921である。
類似度値913は、第1の商品と第2の商品の類似度の程度を表す数値で、2つの商品説明文の文書ベクトル「qi」と、「qj」の内積を正規化した値である。
図13の(b)は、関連度データ191の例である。
図13の(b)には、関連度データ191cの例として、「c201、c202、0.485063」が示されている。
この例の意味は、商品ID911「c201」の商品(第1の商品)と商品ID「c202」の商品(第2の商品)との類似度の値が、「0.485063」であることを意味している。
図5に戻って、テスト用Webページを編集する処理を説明する。
《B.テスト用Webページの編集》
Webページ設計装置100は、扱い商品の中から任意に選んだ一つを対象商品として指定して、関連度データ191を参照して、対象商品との類似度値が高い扱い商品の中から、所定の候補個数の扱い商品を読み取って、候補商品として設定する(図5(2−1))。
たとえば、所定の候補個数が「33個」の場合には、対象商品との類似度値が高い上位33個の扱い商品を候補商品として設定する。
Webページ設計装置100は、候補商品の中から所定の抽出条件で抽出した関連商品と対象商品の商品データを組合せて、テスト画面の商品がクリックされたクリック情報や、対象商品の購入の意思表示をした「購入」ボタンをクリックした情報などの端末操作情報を収集して、WWWサーバー装置に送信するテスト用Webページを編集する(同(2−2))。(詳細は後述する)
ここで、抽出条件の例としては、「候補商品の中から類似度の高い順に3個ずつを関連商品として選ぶ」である。このようにして抽出した関連商品を用いることで、複数のテスト用Webページを編集することが可能である。
次に、反応情報収集処理を説明する。
図6は、反応情報を作成して収集する処理を説明する図である。
《C.反応情報の収集》
WWWサーバー装置300は、テスト用Webページに掲載される関連商品の類似度値の総和を求めて、総和が最も大きいテスト用WebページをチャンピオンパターンWebページとして、それ以外のものにチャレンジパターン識別情報を付してチャレンジパターンWebページとする(図6(3−1))。
WWWサーバー装置300は、WEBサイトにアクセスしてきた顧客端末装置500にユーザーIDを発行して、ユーザーIDに所定の通常ユーザーとチャレンジユーザーの分類比率を適用して通常ユーザーとチャレンジユーザーに分類して特定する。
(同(3−2))。
ユーザーを分類する方法は、たとえば、通常ユーザーとチャレンジユーザーの分類比率が「65:35」の場合には通常ユーザーの分類が65%であるので、ユーザーIDの数値を「100」で剰余演算した剰余の値が「65未満」であれば通常ユーザーと特定して、また、剰余の値が「65以上」であればチャレンジユーザーと特定すればよい。
WWWサーバー装置300は、通常ユーザーに分類し特定した顧客端末装置500には、チャンピオンパターンWebページを提供し、チャレンジユーザーに分類し特定した顧客端末装置500には、所定の方法で決定したチャレンジパターンWebページを提供する。このとき、WWWサーバー装置300は提供したWebページの商品情報を用いて反応情報を作成して記録する(同(3−3))。
チャレンジパターンWebページを決定して提供する方法は、WWWサーバー装置300が、チャレンジユーザーに分類し特定した顧客端末装置500に対して、更にチャレンジユーザーIDを発行して、チャレンジユーザーIDを用いてチャレンジパターンIDを算出して、そのチャレンジパターンIDを有するチャレンジパターンWebページを提供するように決定すればよい。たとえば、チャレンジユーザーIDが「127421」で、チャレンジパターンが「11個」の場合には、チャレンジユーザーIDをチャレンジパターン個数情報で剰余演算した剰余の値「127421 mod 11 = 8 」を算出して、剰余の値「8 」と一致するチャレンジパターンID「8」が対応付けられたチャレンジパターンWebページを読み取ればよい。
このように、チャレンジユーザーには、ユーザーIDと、チャレンジユーザーIDとが発行される。
なお、ユーザーIDやチャレンジユーザーIDとして、ユニークな整数値を有するユーザーID用Cookieを用いてよい。
このCookieとは、WWWサーバー装置300が、WebページにアクセスしたWebブラウザーを通じて、ユーザーの顧客端末装置500にデータ(=Cookieと称する)を書き込んで保存させる仕組み、または、Webブラウザーに保存された情報のことである。
WWWサーバー装置300は、顧客端末装置500に提供したチャンピオンパターンWebページやチャレンジパターンWebページが送信する端末操作情報を受信して、これから反応情報を作成して記録する(同(3−4))。
ここで、図20から図23までを用いて、WWWサーバー装置300にて反応情報を作成する処理を図解する。
図20は、顧客端末装置500における、商品画像クリックによる端末操作情報処理を図解したものである。
顧客端末装置500のテスト画面の関連商品(商品ID972「f201」)の画像がクリックされる(図20(1))。
Webブラウザーは、クリックした画像にハイパーリンクされている端末操作情報(=URL)「http://shop.dnp.co.jp/store/product.cgi?pattern-id=8&target-product-id=c101&related-product-id=f201&related-product-status=clicked」を、WWWサーバー装置300に送信する(同(2))。
顧客端末装置500は、WWWサーバー装置300が送信する商品ID972「c102」の商品が対象商品であるWebページを受信して、Webブラウザーは、これを表示する(同(3))。
図21は、WWWサーバー装置における、商品画像クリックによる端末操作情報を用いた反応情報作成の図解である。
WWWサーバー装置300は、顧客端末装置500が送信する端末操作情報(=URL)「http://shop.dnp.co.jp/store/product.cgi?pattern-id=8&target-product-id=c101&related-product-id=f201&related-product-status=clicked」を受信して、反応情報「(c101、f201、0、1、0)」を作成する(図21(1))。
972「f201」の商品が対象商品であるWebページ(たとえば、f201」の対象商品と商品IDが「f202」「p301」「p302」の関連商品で構成されるwebページ)を抽出して、顧客端末装置500に送信して、反応情報「(f201、f202、1、0、0)、(f201、p301、1、0、0)、(f201、p302、1、0、0)」を作成する(同(2))。
図22は、顧客端末装置500における、テスト画面の「購入」ボタンのクリック動作を図解したものである。
顧客端末装置500のテスト画面の対象商品(商品ID972「f201」)の「購入」ボタンがクリックされる(図22(1))。
Webブラウザーは、クリックした「購入」ボタンにハイパーリンクされている端末操作情報(=URL)「http://shop.dnp.co.jp/store/cart.cgi?pattern-id=8&target-product-id=f201&target-product-status=ordered 」を、WWWサーバー装置300に送信する(同(2))。
顧客端末装置500は、WWWサーバー装置300が送信するショッピングカートWebページを受信して、Webブラウザーは、テスト画面の対象商品(商品ID972「f201」の商品と、すでに購入を意思表示した商品が掲載されたショッピングカートを表示する(同(3))。
図23は、WWWサーバー装置における、購入による端末操作情報を用いた反応情報作成の図解である。
WWWサーバー装置300は、顧客端末装置500が送信する端末操作情報(=URL)を受信して、ショッピングカートWebページ(たとえば、商品IDが「f201」「c102」「p302」の商品で構成されるwebページ)を作成して、これを返信する(図23(1))。
WWWサーバー装置300は、ショッピングカートWebページデータを用いて、反応情報「(f201、c102、0、0、1)、(f201、p302、0 、0、1)、(c102、f201、0、0、1)、(p302、f201、0、0、1)」を作成する(同(2))。
図6に戻って、反応情報を作成して収集する処理を説明する図である。
WWWサーバー装置300は、反応情報を集計して、関連商品の反応スコアを算出する(図6(4))。
たとえば、販売用Webページに3個の関連商品を掲載する場合には、反応スコアの値が高い商品の中から上位3個を抽出すればよい。
反応スコアの算出式は、たとえば、「 ( 反応スコア=A1×成約数+A2×クリック数+・・・) / 閲覧数 」(A1、A2、・・・:重み係数)のように、閲覧数で正規化した値である。
チャンピオンパターンWebページやチャレンジパターンWebページから収集した端末操作情報を元に、反応スコアを算出するときに、
反応情報を収集する期間の途中で、各商品の反応スコアを算出して、Webページごとに反応スコアを集計して、反応スコアの値がもっとも高いものをチャンピオンパターンWebページに設定し直して、それ以外のWebページをチャレンジパターンWebページとして、テストを継続しても良い。
なお、顧客端末装置500がすでに、ユーザーIDやチャレンジユーザーIDを有する場合には、このIDを読み取って、チャレンジパターンWebページもしくは該当するチャレンジパターンWebページを提供すればよい。
なお、反応スコアの値が高い関連商品で構成される販売用Webページの編集は、Webページ設計装置100で行えばよい。
図14は、Webページ設計装置100の詳細な構成図である。
Webページ設計装置100は、CPU101と、表示部103と、入力部102と、ネットワーク通信部104と、記憶部109と専用プログラムとを備える。
CPU101と、表示部103と、入力部102と、ネットワーク通信部104と、記憶部109とは、BUS199で接続される。
CPU101は、中央演算装置である。
表示部103は、液晶表示装置や有機EL表示装置である。
入力部102は、マウスやキーボードである。
ネットワーク通信部104は、LANアダブターである。
記憶部109は、半導体メモリーや磁気メモリーである。
記憶部109は、商品データ格納領域109aと、辞書格納領域109bと、雛形格納領域109cと、を有して、自然文解析ツール110と専用プログラムとを記憶する。
商品データ格納領域109aは、商品識別情報(=商品ID)を有する商品データ192を格納する。
辞書格納領域109bは、形態素解析辞書を格納する。
雛形格納領域109cは、URL雛形データ194とレイアウト雛形データ195とを格納する。
URLテンプレートデータ194は、商品画像にハイパーリンクさせるクリック用URLテンプレートと、購入ボタンにハイパーリンクさせる購入用URLテンプレートを作成するためのテンプレートから構成される雛形データである。
レイアウトテンプレートデータ195は、対象商品と関連商品のWebページを編集するためのHTML(HyperText Markup Language)で記述された雛形データである。
自然文解析ツール110は、既存のプログラムである。
このほかに、形態素抽出手段112と、商品特徴語作成手段130と、類似度算出手段140と、Webページ編集手段150と、Webページ送信手段160と、を備える。これらの各手段は、それぞれの専用プログラムによって実現され、専用プログラムがCPU101に解釈・実行されることによって機能する。
形態素抽出手段112は、商品データ192が有する説明文を読み出して、形態素解析辞書を適用して、読み出した商品説明文を形態素に分離して、形態素を有する形態素解析結果データ194を作成する。
商品特徴語作成手段130は、形態素解析結果データ194が有する分離した形態素の中から、名詞の形態素と、形態素解析辞書に登録されない形態素(=未知語)を特徴語として抽出して、特徴語が存在する説明文書数(=tf)と、特徴語が説明文に含まれる個数(=df)を求めて、tf管理データ196とdf管理データ197とから構成される特徴語情報を作成する。
類似度算出手段140は、商品特徴語作成手段130が作成した特徴語情報を用いて、2つの商品説明文における特徴語の重みをそれぞれ算出して、両商品説明文の特徴語の重みから類似度を算出して、類似度の値と2つの商品説明文が説明する商品のIDとを対応付けた関連度データ191を作成する。
前記類似度算出手段140は、文書ベクトル作成手段142と、関連度算出手段144と、を含んで構成される。
文書ベクトル作成手段142は、特徴語が存在する説明文書数(=tf)と、特徴語が説明文に含まれる個数の逆数(=idf)を乗算して、特徴語の重み(=tf−idf)を算出して、この重みの値をベクトル成分とする説明文書ベクトル198を作成する。
関連度算出手段144は、2つの説明文書ベクトルを用いて、内積の値を求めて、これを正規化して、類似度を算出する。
Webページ編集手段150は、扱い商品の中から任意に選んだ一つを対象商品として指定して、関連度データ191を参照して、所定の類似度の値が対応付けられた対象商品IDを有する関連度データを読み出して、読み出し関連度データの有する対象商品IDと異なる商品IDを関連商品IDとして抽出して、抽出した関連商品IDを有する商品データ(関連商品の商品データ)を読み取って、この関連商品の商品データと対象商品の商品データと組合せてレイアウトテンプレートデータ195に適用して、テスト用Webページデータを編集する。
テスト用Webページデータが有する商品画像や購入ボタンには、それぞれ、クリック情報や、商品に対して購入の意思表示がされたことを示す購入情報を有するURLがハイパーリンクされている。(詳細は後述する)
Webページ編集手段150は、更に、編集したテスト用Webページの個数より1個少ないチャレンジパターン個数情報を作成する。
Webページ編集手段150は、候補商品読取手段152と関連商品抽出手段154とクリックURL作成手段156と、購入URL作成手段157と、を含んで構成される。
候補商品読取手段152は、関連度データ191を参照して、対象商品の商品IDに対応付けられた類似度の値が所定の値以上であるときのもう一方の商品IDを候補商品IDとして読み取る。
関連商品抽出手段154は、候補商品IDの中から、所定の個数を、関連商品の商品IDとして抽出する。
クリックURL作成手段156は、URLテンプレートデータ194のクリック用URLテンプレートに、関連商品抽出手段154が抽出した関連商品の商品IDと対象商品の商品IDとを設定して、当該関連商品のクリックURLを作成して、このクリックURLを当該関連商品の商品画像にハイパーリンク設定する。
購入URL作成手段157は、URLテンプレートデータ194の購入用URLテンプレートに対して、対象商品の商品IDを設定して、当該対象商品の購入URLを作成して、この購入URLを購入ボタンにハイパーリンク設定する。
Webページ送信手段160は、テスト用Webページデータとチャレンジパターン個数情報をWWWサーバー装置300に送信する。
図15は、WWWサーバー装置300の詳細な構成図である。
WWWサーバー装置300は、CPU301と、表示部302と、入力部303と、ネットワーク通信部304と、記憶部309と、専用プログラムとを備える。CPU301と、表示部302と、入力部303と、ネットワーク通信部304と、記憶部309とは、BUS199で接続される。
CPU301は、中央演算装置である。
表示部302は、液晶表示装置や有機EL表示装置である。
入力部303は、マウスやキーボードである。
ネットワーク通信部304は、LANアダプターである。
記憶部309は、半導体メモリーや磁気メモリーである。
記憶部309は、Webページ格納領域309aと、パターン情報格納領域309bと、反応情報格納領域309cと、を有して、Webサーバー380と、専用プログラムとを記憶する。
Webページ格納領域309aは、Webページデータを格納する。
パターン情報格納領域309bは、チャンピオンパターンとチャレンジパターンの表示比率情報392と、チャレンジパターン個数情報393とを格納する。
反応情報格納領域309cは、反応情報395を格納する。
反応情報395とは、商品IDとクリック回数情報や成約情報を対応付けた情報である。
このほかに、Webページ受信手段310と、テスト画面送信手段320と、販売用Webパターン設定手段330と、を備える。これらの各手段は、それぞれの専用プログラムによって実現され、専用プログラムがCPU301に解釈・実行されることによって機能する。
Webページ受信手段310は、Webページ設計装置が送信するテスト用Webページデータ391とチャレンジパターン個数情報を受信して、テスト用Webページデータ391をWebページ格納領域309aに格納して、チャレンジパターン個数情報をパターン情報格納領域309bに格納する。
Webページ受信手段310は、パターン設定手段322を含んで構成する。
パターン設定手段322は、Webページ格納領域309aに格納されたテスト用Webページデータ391を参照して、最も類似度の値が高いものをチャンピオンパターンWebページデータとして設定し、それ以外のテスト用Webページに、チャレンジ識別情報を付して、チャレンジパターンWebページデータとして設定する。
チャレンジ識別情報として、たとえば、チャレンジパターン個数情報393が「11個」の場合には、「0」から「10」までの数値を用いてもよい。
テスト画面送信手段320は、Webページ格納領域309aが格納するテスト用Webページの中から1つを読み出して、顧客端末装置500に送信する。
テスト画面送信手段320は、ユーザーID発行手段323と、チャレンジパターンID発行手段327と、チャンピオンパターン返信手段326と、チャレンジパターン返信手段329と、反応情報作成手段332と、を含んで構成される。
ユーザーID発行手段323は、Webページデータを要求するWebブラウザーに対して、通常ユーザーかチャレンジユーザーかを特定可能なユーザーIDが未発行であれば、これを発行する。
通常ユーザーかチャレンジユーザーかを特定可能なユーザーIDとして、ユニークな整数値を有するユーザーID用Cookieを用いてもよい。
チャレンジパターンID発行手段327は、チャレンジユーザーを特定可能なユーザー識別情報を有するWebブラウザーに対して、チャレンジ識別情報(=チャレンジパターンID)が未発行であれば、チャレンジパターンIDを発行とする。
チャレンジパターンIDは、ユニークな整数値を有するチャレンジパターンID用Cookieを用いてもよい。
チャレンジパターンID発行手段327は、ユーザー特定手段325を含んで構成される。
ユーザー特定手段325は、通常ユーザーかチャレンジユーザーかを特定可能なユーザーIDを用いて、通常ユーザーかチャレンジユーザーかを特定する。
そこで、ユーザー特定手段325は、ユーザーIDとして、ユニークな整数値を有するユーザーID用Cookieを用いて、ユニークな整数値を「100」で剰余演算し、剰余の値に対して、「65:35」の表示比率392を適用して、「0〜64」の範囲であれば通常ユーザーと特定して、また、余りが「65〜99」の範囲であればチャレンジユーザーと特定すればよい。
たとえば、ユーザー特定手段325は、ユーザーID用Cookieが有するユニークな整数値が「 891270 」の時には、この値を「100」で除した剰余は、「891270 mod 100 = 70 」であるので、チャレンジユーザーと特定する。
チャンピオンパターン返信手段326は、Webブラウザーが発行する商品ページ表示要求を受け付けて、Webブラウザーが通常ユーザーを特定可能なユーザーIDを有していれば、チャンピオンパターンWebページをWebブラウザーに返信する。
チャンピオンパターン返信手段326は、ユーザー特定手段325を含んで構成される。たとえば、ユーザー特定手段325は、ユーザーID用Cookieが有するユニークな整数値が「 107654 」の時には、この値を「100」で除した剰余は、「 107654 mod 100 = 54 」であるので、通常ユーザーと特定する。
チャレンジパターン返信手段329は、Webブラウザーが発行する商品ページ表示要求を受け付けて、ユーザー特定結果が、チャレンジユーザーであれば、チャレンジパターンWebページを返信する。
チャレンジパターン返信手段329は、チャレンジパターン読取手段328と、を含んで構成される。
チャレンジパターン読取手段328は、Webブラウザーが有するチャレンジパターンIDを用いて、チャレンジパターンWebページの識別情報を参照して、両者が一致するチャレンジパターンWebページを読み取る。
そこで、チャレンジパターン読取手段328は、チャレンジパターン用Cookieの整数値をチャレンジパターン個数情報393で剰余演算し、剰余の値をチャレンジパターンIDにしてチャレンジパターンWebページに適用して、提示するチャレンジパターンWebページに識別する。
たとえば、チャレンジパターン個数情報393が「11個」の場合には、各チャレンジパターンWebページに「0」から「10」のチャレンジパターンIDを対応付けおく。このとき、チャレンジパターン読取手段328は、チャレンジパターン用Cookieの整数値が「127421」の時には、この値を「11」除した剰余は、「127421 mod 11 = 8 」であるので、「8」が対応付けられたチャレンジパターンWebページを読み取る。
反応情報作成手段332は、テスト画面送信手段320が送信したテスト用Webページを用いて、反応情報を作成して、記録する。
また、反応情報作成手段332は、Webバーバー380が受信したURLの中から、端末操作情報を読み出して、反応情報を作成して、記録する。
販売用Webパターン設定手段330は、顧客端末装置のWebブラウザーから返信される端末操作情報を受信して反応情報395を作成収集して、反応情報395を用いて反応スコアを算出して、反応スコアの値の良い商品の商品データを読み取って、反応の良い商品の商品データを設定する。
販売用Webパターン設定手段330は、反応情報作成手段332と、反応スコア算出手段334を含んで構成される。
反応スコア算出手段334は、反応情報395を読み出して、各端末操作情報のそれぞれに重み係数を乗じた総和を算出して、反応スコアとする。
図16は、Webページ提示処理のフローチャートである。
(1)Webブラウザーは、WEBサーバーにWebページ要求を送信する(ステップS100)
(2)WEBサーバーは、cookie確認をWebブラウザーに発行する。(ステップS110)
(2)WEBサーバーは、Webブラウザーからcookie確認の回答を受信する。(ステップS120)
(3)WEBサーバーは、回答にユーザーID用cookieが含まれているか否かを判定する。
ユーザーID用cookieが含まれていれば、ステップS140に進む。
ユーザーID用cookieが含まれていなければ、ステップS135に進む。(ステップS130)
(4)未発行ユーザーWebページ提示処理に進んで、終了する。(ステップS135)
(5)テスト画面送信手段320は、回答にチャレンジパターン用cookieが含まれているか否かを判定する。
チャレンジパターン用cookieが含まれていれば、ステップS150に進む。
チャレンジパターン用cookieが含まれていなければ、ステップS145に進む。(ステップS140)
(6)テスト画面送信手段320は、サイト訪問者のWebブラウザーに対して、チャンピオンパターンWebページを提示して、終了する。(ステップS145)
(7)チャレンジパターン読取手段328は、チャレンジパターン用Cookieの整数値を「チャレンジパターン個数」で剰余演算し、剰余の値と一致する数値が対応付けられたチャレンジパターンWebページを特定する。(ステップS150)
(8)チャレンジパターン返信手段329は、サイト訪問者のWebブラウザーに対して特定されたチャレンジパターンWebページを送信して、終了する。(ステップS160)
図17は、未発行ユーザーWebページ提示処理のフローチャートである。
(1)テスト画面送信手段320は、パターン情報格納領域309bからチャンピオンパターンとチャレンジパターンの表示比率情報と、チャレンジパターン個数情報を読み取る。(ステップS210)
(2)WEBサーバーは、ユーザーID用Cookieを未発行なWebブラウザーに対して、ユーザー識別情報(ユニークな整数値=)を有するユーザーID用Cookieを発行する。(ステップS220)
(3)ユーザー特定手段325は、商品ページを訪れたときにユーザーID用Cookieの整数値を「100」で剰余演算し、剰余の値に対して、通常ユーザーとチャレンジユーザーの比の整数値を表す表示比率情報を適用して、剰余の値が表示比率情報の通常ユーザーの比の整数値の範囲であれば、通常ユーザーに振り分け、剰余の値が表示比率情報の通常ユーザーの比の整数値の範囲で無ければ、チャレンジユーザーと特定する。(ステップS230)
(4)ユーザー特定結果が、通常ユーザーかチャレンジユーザーかを判定する。
ユーザー特定結果が通常ユーザーであれば、ステップS245に進む。
ユーザー特定結果がチャレンジユーザーであれば、ステップS250に進む。(ステップS240)
(5)チャンピオンパターン返信手段326は、Webブラウザーに対して、チャンピオンパターンWebページデータを送信する。終了する。(ステップS245)
(6)チャレンジパターンID発行手段327は、Webブラウザーに対して、ランダムな整数値を有するチャレンジパターン用Cookieを発行とする。(ステップS250)
(7)チャレンジパターン読取手段328は、チャレンジパターン用Cookieの整数値を「チャレンジパターン個数」で剰余演算し、剰余の値と一致するチャレンジパターンIDが対応付けられたチャレンジパターンを読み取る。(ステップS260)
(8)チャレンジパターン返信手段329は、サイト訪問者のWebブラウザーに対して読み取られたチャレンジパターンを送信する。(ステップS270)
本発明の実施の形態による関連商品提示システム1の概要を説明する図 対象商品と関連商品との組合せを決める大まかな作業手順を説明する図 対象商品と関連商品を説明する図 テスト画面を説明する図 テスト用Webページを編集する処理を説明する図 販売用Webページを設定する処理を説明する図。 商品データ192を説明する図 商品説明文の形態素を説明する図 特徴語の局所的な重み196(=tf)を説明する図 特徴語の大域的な重み197(=df)を説明する図 説明文書ベクトルを説明する図 類似度算出手順を説明する図 関連度データ191を説明する図 Webページ設計装置100の詳細な構成図。 WWWサーバー装置300の詳細な構成図 テストパターン提示処理のフローチャート Cookie発行処理のフローチャート 端末操作情報を説明する図 反応情報を説明する図 顧客端末装置における端末操作情報処理の図解(1) WWWサーバー装置における反応情報作成の図解(1) 顧客端末装置における端末操作情報処理の図解(2) WWWサーバー装置における反応情報作成の図解(2)
符号の説明
1 関連商品提示システム
100 Webページ設計装置
112 形態素抽出手段
130 商品特徴語作成手段
140 類似度算出手段
142 文書ベクトル作成手段
144 関連度算出手段
150 Webページ編集手段
152 候補商品読取手段
154 関連商品抽出手段
156 クリックURL作成手段
157 購入URL作成手段
160 Webページ送信手段
191 関連度データ
192 商品データ
194 形態素解析結果データ
196 tf管理データ
197 df管理データ
198 説明文書ベクトルデータ
300 WWWサーバー装置
310 Webページ受信手段
322 パターン設定手段
320 テスト画面送信手段
323 ユーザーID発行手段
326 チャンピオンパターン返信手段
325 ユーザー特定手段
327 チャレンジパターンID発行手段
328 チャレンジパターン読取手段
329 チャレンジパターン返信手段
330 販売用Webパターン設定手段
332 反応情報作成手段
334 反応スコア算出手段
391 テスト用Webページデータ
392 表示比率情情報
393 チャレンジパターン個数情報
395 反応情報
500 顧客端末装置
502 テスト画面


Claims (8)

  1. 商品説明文を有する商品データと、形態素解析辞書と、を用いる関連商品提示方法において、
    商品データが有する説明文を読み出して、形態素解析辞書を適用して、読み出した商品説明文を形態素に分離して、分離した形態素の中から、名詞の形態素と形態素解析辞書に登録されない未知語の形態素を特徴語として抽出する特徴語抽出ステップと、
    特徴語を手掛りにして、2つの商品説明文における特徴語の重みを算出して、両商品説明文の特徴語の重みから類似度を算出して、この類似度の値をそれぞれの商品説明文が説明する2つの商品の関連度に設定する類似度算出ステップと、
    一つ商品を対象商品として指定して、対象商品との関連度の値が大きい商品の商品データを関連商品データとして取り出して、対象商品データと組合せて、テスト用Webページを編集するテスト用Webページ編集ステップと、
    各テスト用Webページに掲載される関連商品の類似度の総和を求め、当該総和が最も大きいテスト用WebページをチャンピオンパターンWebページとし、それ以外のテスト用WebページをチャレンジパターンWebページとするステップと、
    テスト用Webページを要求してきたWebブラウザーが、通常ユーザーかチャレンジユーザーのどちらであるかを、表示比率に従って特定するステップと、
    通常ユーザーに対してはチャンピオンパターンWebページを、チャレンジユーザーに対してはチャレンジパターンWebページを返信するテスト用Webページ返信ステップと、
    Webブラウザーを介してテスト用Webページの商品データに対して操作された端末操作情報を収集する端末操作情報収集ステップと、
    を含んだ手順でなされることを特徴とする関連商品提示方法。
  2. 記類似度算出ステップは、
    各商品説明文における特徴語の個数情報に対して、当該特徴語が存在する説明文書数情報の逆数を乗算して、特徴語の重みを算出する重み算出ステップと、
    特徴語の重みの値をベクトル成分とする商品説明文の文書ベクトルデータを作成する文書ベクトル作成ステップと、
    2つの商品説明文の文書ベクトルデータを用いて、類似度を算出して、類似度値と2つの商品識別情報とを対応付けて関連度データを作成する関連度設定ステップと、
    を含んだ手順でなされることを特徴とする請求項1に記載の関連商品提示方法。
  3. 記テスト用Webページは、
    表示された対象商品や関連商品がクリックされたクリック情報を有するURLを発行して、表示された対象商品に対して購入の意思表示をした成約情報を有するURLを送信することを特徴とする請求項1または請求項2に記載の関連商品提示方法。
  4. 商品識別情報と商品説明文を有する商品データを格納する商品データ格納領域と、
    形態素解析辞書を格納する辞書格納領域と、
    を有する記憶部と、
    商品データが有する説明文を読み出して、形態素解析辞書を適用して、読み出した商品説明文を形態素に分離する形態素抽出手段と、
    分離した形態素の中から、名詞語と形態素解析辞書に登録されない未知語を抽出して、商品説明文の特徴語を作成する商品特徴語作成手段と、
    特徴語を手掛りにして、商品説明文における特徴語の重みを算出して、2つの商品説明文の特徴語の重みから類似度を算出する類似度算出手段と、
    一つの商品説明文を対象商品説明文に設定して、関連度データを参照して、所定の類似度の値に対応付けられた対象商品識別情報を有する関連度データを読み出して、読み出し関連度データの有する対象商品識別情報と異なる商品識別情報を関連商品識別情報として抽出して、抽出した関連商品識別情報を有する商品データを読み取って、対象商品の商品データと組合せて、テスト用Webページを編集するテスト用Webページ編集手段と、
    各テスト用Webページに掲載される関連商品の類似度の総和を求め、当該総和が最も大きいテスト用WebページをチャンピオンパターンWebページとし、それ以外のテスト用WebページをチャレンジパターンWebページとするパターン設定手段と、
    テスト用Webページを要求してきたWebブラウザーが、通常ユーザーかチャレンジユーザーのどちらであるかを、表示比率に従って特定するユーザー特定手段と、
    通常ユーザーに対してチャンピオンパターンWebページを返信するチャンピオンパターン返信手段と、
    チャレンジユーザーに対してチャレンジパターンWebページを返信するチャレンジパターン返信手段と、
    を備えることを特徴とする関連商品提示システム
  5. 記類似度算出手段が、
    対象商品および関連商品の特徴語を用いて、特徴語が説明文に含まれる個数情報と、特徴語が存在する説明文書数情報の逆数を求めて、個数情報と文書数情報の逆数を乗算して、特徴語の重みを算出して、この重みを用いて、商品説明文の文書ベクトルデータを作成する文書ベクトル作成手段と、
    対象商品説明文の文書ベクトルデータと、一つの関連商品説明文の文書ベクトルデータを用いて、内積の値を求めて、これを正規化して、類似度を算出して、類似度の値として、類似度値と2つの商品識別情報とを対応付けて関連度データを作成する関連度算出手段と、
    を備えることを特徴とする請求項4に記載の関連商品提示システム
  6. 記テスト用Webページは、
    テスト用Webページをテスト画面として表示して、商品が表示されたことを示す参照情報や、テスト画面の商品がクリックされたことを示すクリック情報や、商品に対して購入の意思表示がされたことを示す購入情報などを有する端末操作情報を送信する機能、
    を備えることを特徴とする請求項4または請求項5に記載の関連商品提示システム
  7. ンピューターに組込むことによって、コンピューターを請求項4から6までのいずれか1項に記載の関連商品提示システムとして動作させるコンピュータプログラム。
  8. 請求項7に記載のコンピュータプログラムを記録したコンピューター読み取り可能な記録媒体。
JP2008322774A 2008-12-18 2008-12-18 関連商品提示方法、関連商品提示システム、プログラム、記録媒体 Expired - Fee Related JP5277941B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008322774A JP5277941B2 (ja) 2008-12-18 2008-12-18 関連商品提示方法、関連商品提示システム、プログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008322774A JP5277941B2 (ja) 2008-12-18 2008-12-18 関連商品提示方法、関連商品提示システム、プログラム、記録媒体

Publications (2)

Publication Number Publication Date
JP2010146288A JP2010146288A (ja) 2010-07-01
JP5277941B2 true JP5277941B2 (ja) 2013-08-28

Family

ID=42566668

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008322774A Expired - Fee Related JP5277941B2 (ja) 2008-12-18 2008-12-18 関連商品提示方法、関連商品提示システム、プログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP5277941B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020032487A1 (ko) * 2018-08-08 2020-02-13 삼성전자 주식회사 우선 순위에 기반하여 상품과 관련된 정보를 제공하는 방법 및 그 전자 장치

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102456057B (zh) * 2010-11-01 2016-08-17 阿里巴巴集团控股有限公司 基于网上交易平台的检索方法、装置和服务器
JP4947477B1 (ja) * 2011-04-27 2012-06-06 株式会社天問堂 レコメンド装置、レコメンド方法およびレコメンドプログラム
JP5788240B2 (ja) * 2011-06-24 2015-09-30 楽天株式会社 情報提供装置、情報提供方法、情報提供プログラム、情報表示プログラム、及び情報提供プログラムを記憶するコンピュータ読取可能な記録媒体
JP5705710B2 (ja) * 2011-11-30 2015-04-22 日本電信電話株式会社 特徴語抽出装置、特徴語抽出方法、及びプログラム
JP5775241B1 (ja) 2014-03-05 2015-09-09 楽天株式会社 情報処理システム、情報処理方法、および情報処理プログラム
CN106294295B (zh) * 2016-08-10 2019-08-16 成都轻车快马网络科技有限公司 基于词频的文章相似度识别方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001265852A (ja) * 2000-03-16 2001-09-28 Ricoh Co Ltd 商品推奨システム及び方法
JP2002215665A (ja) * 2001-01-16 2002-08-02 Dainippon Printing Co Ltd 情報推薦サーバー装置
JP2002304537A (ja) * 2001-04-06 2002-10-18 Rakuten Books Kk 商品注文システム
JP2004318579A (ja) * 2003-04-17 2004-11-11 System Wave:Kk 商品販売支援システム
JP2006146742A (ja) * 2004-11-24 2006-06-08 Hitachi Ltd 商品情報提供システム
JP4951404B2 (ja) * 2007-05-08 2012-06-13 楽天株式会社 商品レコメンド・システム
JP2007299432A (ja) * 2007-08-20 2007-11-15 Ricoh Co Ltd ネットワークシステム、サーバ装置、および、プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020032487A1 (ko) * 2018-08-08 2020-02-13 삼성전자 주식회사 우선 순위에 기반하여 상품과 관련된 정보를 제공하는 방법 및 그 전자 장치
US11604820B2 (en) 2018-08-08 2023-03-14 Samsung Electronics Co., Ltd. Method for providing information related to goods on basis of priority and electronic device therefor

Also Published As

Publication number Publication date
JP2010146288A (ja) 2010-07-01

Similar Documents

Publication Publication Date Title
US7555478B2 (en) Search results presented as visually illustrative concepts
JP5277941B2 (ja) 関連商品提示方法、関連商品提示システム、プログラム、記録媒体
CA2595160C (en) Method and system for automated comparison of items
US8356248B1 (en) Generating context-based timelines
US8707167B2 (en) High precision data extraction
JP5083669B2 (ja) 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム
US8880536B1 (en) Providing book information in response to queries
JP5462510B2 (ja) 商品検索サーバ、商品検索方法、プログラム、および記録媒体
CN105512180B (zh) 一种搜索推荐方法及装置
CN107111640B (zh) 用于与图像搜索结果一起呈现辅助内容的方法和用户界面
JP2012510128A (ja) 画像検索装置およびその方法
KR20110085995A (ko) 검색 결과들의 제공
US9330071B1 (en) Tag merging
JP2008158893A (ja) 情報検索装置、情報検索プログラム、プログラム格納媒体
JP5103051B2 (ja) 情報処理システム及び情報処理方法
JP2008152606A (ja) 情報推薦システム
TWI457775B (zh) 網址分類管理方法及使用該方法之電子裝置
WO2011093358A1 (ja) 情報検索装置、情報検索方法、情報検索プログラム及び記録媒体
JP2012043289A (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP4883644B2 (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
JP2008210209A (ja) コンテンツ登録・検索システム、およびコンテンツ登録・検索方法
JP5767413B1 (ja) 情報処理システム、情報処理方法、および情報処理プログラム
JP2004240887A (ja) 検索情報表示システム及び検索キーワード情報表示方法及び検索キーワード情報表示プログラム
JP2004326537A (ja) 選択関連情報の情報検索装置,情報検索処理方法,情報検索プログラムおよびそのプログラム記録媒体
JP4755834B2 (ja) 属性評価装置、属性評価方法および属性評価プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111021

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130506

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5277941

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees