JP6172750B2 - 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法 - Google Patents

絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法 Download PDF

Info

Publication number
JP6172750B2
JP6172750B2 JP2013235366A JP2013235366A JP6172750B2 JP 6172750 B2 JP6172750 B2 JP 6172750B2 JP 2013235366 A JP2013235366 A JP 2013235366A JP 2013235366 A JP2013235366 A JP 2013235366A JP 6172750 B2 JP6172750 B2 JP 6172750B2
Authority
JP
Japan
Prior art keywords
word
content
search
words
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013235366A
Other languages
English (en)
Other versions
JP2015095180A (ja
Inventor
服部 元
元 服部
滝嶋 康弘
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013235366A priority Critical patent/JP6172750B2/ja
Publication of JP2015095180A publication Critical patent/JP2015095180A/ja
Application granted granted Critical
Publication of JP6172750B2 publication Critical patent/JP6172750B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、入力キーワードに基づいてコンテンツを検索する検索エンジンの技術に関する。
Google(登録商標)やYahoo!(登録商標)のような一般的な検索エンジンによれば、ユーザの入力キーワードに基づいて、複数のコンテンツの検索結果を明示する。このとき、入力キーワードにスペルミスの可能性がある場合には、修正後のキーワードをユーザに明示する技術もある。また、入力キーワードだけでなく、他の候補のキーワードも合わせて、入力頻度が高いキーワードのリストを明示することもできる。
従来、ユーザの入力キーワードに基づいてコンテンツを検索すると共に、そのキーワードから検索に最適な「関連キーワード」をユーザに明示する技術がある(例えば特許文献1参照)。これら関連キーワードをユーザに選択させることによって、検索結果を更に絞り込むと共に、ヒット率を向上させたノイズの少ない情報検索を実行することができる。この技術によれば、例えば入力キーワード「大阪」について、その「大阪」に関連する「大阪市」「大阪水道局」等の関連キーワードがユーザに明示される。ユーザは、いずれかの関連キーワードを選択することによって、更に絞り込んで検索することができる。
特開2006−163645号公報
従来技術によれば、あくまで、ユーザの入力キーワード自体を修正したり、又は、その入力キーワードを補完する他の関連キーワードを導出しているに過ぎない。
ここで、例えば「簡単な」「家計簿」のアプリケーションを検索する場合を想定する。ユーザは、例えば「入力が」簡単家計簿のアプリケーションを検索したかったとする。簡単な入力操作とは、例えば選択式(タップ式)操作が想定され、本来であれば「選択式」「家計簿」のようなキーワードを、クエリ語とするのが好ましいのかもしれない。
しかしながら、ユーザが、「選択式」のようにアプリケーションの機能を具体的にイメージして、クエリ語を設定することは難しい。実際には、そのような機能の存在自体を全く知らない場合や、「とにかく難しくないアプリ」のような曖昧な意図で探したいだけの場合もある。このような場合にも、「簡単」「家計簿」で検索できることが望ましい。
一方で、「簡単」と説明されたアプリケーションは、大量に存在すると共に、「簡単な」と称する観点として「入力」なのか「表示」なのか様々なものがある。ユーザとしては、クエリ語「簡単」「家計簿」によって検索された多数の検索結果の中から、各説明文を読みながら、「簡単」と称する観点を確認する作業が必要となってしまう。
前述した特許文献1に記載の技術によれば、クエリ語を含む言葉として「簡単操作」「簡単入力」をユーザに推薦することができる。しかし、「操作がとても簡単」や「入力が選択式で簡単」などは単語でないために推薦されない。また、既存の検索エンジンによれば、「家計簿 簡単」のように、多数のユーザによって過去に入力されたクエリ語の組み合わせを推薦することもできる。しかし、それが必ずしも、そのユーザの要求に合っているとは限らない。実際に、既存の検索エンジンに「家計簿 簡単」を入力した場合、「家計簿 簡単 アプリ」や「家計簿 簡単 無料」などが推薦された。ここで、「簡単」の観点を表すようなキーワード候補は、推薦されていない。尚、「家計簿」のみを入力した場合、「家計簿 フリーソフト」や「家計簿 アプリ」など推薦されることとなる。
また、一般的な関連単語抽出技術として、同一文章に共起する可能性の高さを指標として、複数の単語を抽出する技術もある。しかし、「アプリ」「無料」などの出現頻度の高い単語が抽出されやすいという問題も生じる。加えて、単語間の関係の確からしさまでは考慮されていないため、離れた位置にある無関係な語が抽出される場合もある。
そこで、本発明は、入力されたクエリ語に対する観点をユーザに選択候補として明示すると共に、選択された観点で更に絞り込んで検索するコンテンツ検索プログラム、装置及び方法を提供することを目的とする。
本発明によれば、装置に搭載されたコンピュータを実行させるコンテンツ検索プログラムにおいて、
コンテンツ毎に、当該コンテンツに関する説明文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集手段と、
コンテンツ情報収集手段を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索するコンテンツ検索手段と、
コンテンツ検索手段によって検索された複数のコンテンツの複数の説明文章から、複数の用言又は体言を抽出する用言体言抽出手段と、
コンテンツ検索手段によって検索された説明文章をコンテンツ毎にユーザに明示すると共に、次の検索キーとして、抽出された複数の用言又は体言の中からいずれか1つ以上の用言又は体言をユーザに選択させる検索結果明示手段と、
ユーザによって選択された用言又は体言を、次の検索キーのクエリ語として、コンテンツ検索手段へ入力する再検索入力手段と
してコンピュータを機能させることを特徴とする。
本発明のコンテンツ検索プログラムにおける他の実施形態によれば、
用言は、活用自立語としての形容詞、形容動詞及び/又は動詞であり、
体言は、単語自立語としての名詞であ
うにコンピュータを機能させることも好ましい。
本発明のコンテンツ検索プログラムにおける他の実施形態によれば、
再検索入力手段によって、用言体言抽出手段及び検索結果明示手段は、少なくとも2回以上繰り返され、
用言体言抽出手段は、最初に用言(又は体言)を抽出し、次に体言(又は用言)を抽出し、
検索結果明示手段は、最初にユーザに用言(又は体言)を選択させ、次にユーザに体言(又は用言)を選択させ、
再検索入力手段は、最初にユーザによって選択された用言(又は体言)をコンテンツ検索手段へ入力し、次にユーザによって選択された体言(又は体言)をコンテンツ検索手段へ入力する
ようにコンピュータを機能させることも好ましい。
本発明のコンテンツ検索プログラムにおける他の実施形態によれば、
関係語によって結ばれた用言及び体言の2つの語からなる語対を抽出して登録した語対登録手段を更に有し、
用言体言抽出手段は、語対登録手段を用いて、説明文章から複数の用言又は体言を抽出する
ようにコンピュータを機能させることも好ましい。
本発明のコンテンツ検索プログラムにおける他の実施形態によれば、
語対登録手段に語対を登録するために、
少なくとも1つの関係語を登録する関係語登録手段と、
コンテンツ毎に、関係語登録手段に登録された関係語によって係り受けされた用言又は体言の語対を、コンテンツ情報収集手段から検索し、当該語対を語対登録手段へ登録する語対取得手段と、
語対登録手段に登録された語対を用いて、当該語対に対する関係語を、コンテンツ情報収集手段から検索し、当該関係語を関係語登録手段へ登録する関係語取得手段と
してコンピュータを更に機能させることも好ましい。
本発明によれば、コンテンツ検索装置において、
コンテンツ毎に、当該コンテンツに関する説明文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集手段と、
コンテンツ情報収集手段を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索するコンテンツ検索手段と、
コンテンツ検索手段によって検索された複数のコンテンツの複数の説明文章から、複数の用言又は体言を抽出する用言体言抽出手段と、
コンテンツ検索手段によって検索された説明文章をコンテンツ毎にユーザに明示すると共に、次の検索キーとして、抽出された複数の用言又は体言の中からいずれか1つ以上の用言又は体言をユーザに選択させる検索結果明示手段と、
ユーザによって選択された用言又は体言を、次の検索キーのクエリ語として、コンテンツ検索手段へ入力する再検索入力手段と
を有することも好ましい。
本発明によれば、装置を用いたコンテンツ検索方法において、
コンテンツ毎に、当該コンテンツに関する説明文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集部を有し、
コンテンツ情報収集部を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索する第1のステップと、
第1のステップによって検索された複数のコンテンツの複数の説明文章から、複数の用言又は体言を抽出する第2のステップと、
第1のステップによって検索された複数のコンテンツの説明文章をユーザに明示すると共に、次の検索キーとして、抽出された複数の用言又は体言の中からいずれか1つ以上の用言又は体言をユーザに選択させる第3のステップと、
コンテンツ情報収集部を用いて、ユーザによって選択された用言又は体言を、次の検索キーのクエリ語として、一致する語を多く含む順に複数のコンテンツを検索する第4のステップと、
第1のステップによって検索された複数のコンテンツの説明文章をユーザに明示する第5のステップと
を有することを特徴とする。
本発明のコンテンツ検索方法における他の実施形態によれば、
次の検索キーとして、抽出された複数の体言又は用言の中からいずれかの体言又は用言をユーザに選択させる第6のステップと、
コンテンツ情報収集部を用いて、ユーザによって選択された体言又は用言を、次の検索キーのクエリ語として、一致する語を多く含む順に複数のコンテンツを検索する第7のステップと、
第7のステップによって検索された複数のコンテンツの説明文章をユーザに明示する第8のステップと
を有することも好ましい。
本発明のコンテンツ検索方法における他の実施形態によれば、
関係語によって結ばれた用言及び体言の2つの語からなる語対を抽出して登録した語対登録部を更に有し、
第2のステップは、語対登録部を用いて、説明文章から複数の用言又は体言を抽出する
ことも好ましい。
本発明のコンテンツ検索方法における他の実施形態によれば、
語対登録部に語対を登録するために、
少なくとも1つの関係語を登録する関係語登録部を更に有し、
コンテンツ毎に、関係語登録に登録された関係語によって係り受けされた用言又は体言の語対を、コンテンツ情報収集から検索し、当該語対を語対登録へ登録するステップと、
語対登録に登録された語対を用いて、当該語対に対する関係語を、コンテンツ情報収集から検索し、当該関係語を関係語登録へ登録するステップと
を更に有することも好ましい。
本発明のコンテンツ検索プログラム、装置及び方法によれば、入力されたクエリ語に対する観点をユーザに選択候補として明示すると共に、選択された観点で更に絞り込んで検索することができる。そのために、ユーザは、感覚的で且つ曖昧なクエリ語を入力しても、その観点となるキーワードの選択候補を一見することによって、次に絞り込むべき所望のキーワードを直ぐに選択することができる。
本発明におけるコンテンツ検索装置の機能構成図である。 本発明におけるコンテンツ検索方法のフローチャートである。 図2のS11における端末の画面表示図である。 図2のS14における端末の画面表示図である。 図2のS21における端末の画面表示図である。 図2のS24における端末の画面表示図である。 図2のS31における端末の画面表示図である。 図2のS33における端末の画面表示図である。 本発明における語対登録部及び関係語登録部の登録情報を表す説明図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明におけるコンテンツ検索装置の機能構成図である。
コンテンツ検索装置1は、ユーザによって操作される端末2から、クエリ語(検索語)を受信し、そのクエリ語をキーとして複数のアプリケーション(コンテンツ)を検索する。コンテンツ検索装置1は、多数のサーバ群3から、アプリケーションの名称、説明文章及び取得先URL(Uniform Resource Locator)を予め取得し、蓄積している。また、端末2は、例えばスマートフォンやタブレットのような端末であることが好ましい。本発明のコンテンツ検索装置1によれば、ユーザは、入力したクエリ語に対してその観点のキーワードが選択候補として表示されるために、それをタップするだけで更に絞り込んで検索することができる。
図1によれば、コンテンツ検索装置1は、<コンテンツ検索機能>と、<語対収集機能>とに大きく区分できる。<コンテンツ検索機能>としては、コンテンツ情報収集部101と、コンテンツ検索部111と、用言体言抽出部112と、検索結果明示部113と、再検索入力部114とを有する。<語対収集機能>としては、語対登録部102と、関係語登録部103と、語対取得部121と、関係語取得部122とを更に有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現できる。
<コンテンツ検索機能>
コンテンツ検索機能は、ユーザの端末2から受信したクエリ語に基づいて、アプリケーション(コンテンツ)を検索し、その検索結果と共に、クエリ語に対する観点を選択候補として返信する。
[コンテンツ情報収集部101]
コンテンツ情報収集部101は、コンテンツ毎に、当該コンテンツに関する大量の文章(説明文章)を蓄積したデータベースである。又は、コンテンツ情報収集部101は、ネットワークを介して、インターネットに接続された様々なサーバ群に蓄積されたコンテンツ情報を検索することができるものであってもよい。コンテンツ情報収集部101は、コンテンツ検索部111から参照されるものである。
コンテンツとは、例えばアプリケーションであって、ユーザが所望のアプリケーションを検索することができる。また、説明文章は、そのアプリケーションを説明するテキストあって、アプリケーションそのものではない。あくまで、ユーザが所望のアプリケーションを検索する際に参照するためのものである。
[コンテンツ検索部111]
コンテンツ検索部111は、端末2からクエリ語を受信する。そして、コンテンツ情報収集部101を用いて、そのクエリ語と一致する語を多く含む順に複数のコンテンツを検索する。検索されたコンテンツの説明文章は、用言体言抽出部112へ出力される。尚、端末2から、ユーザによって入力されたクエリ文章の中から、形態素解析によってクエリ語を抽出するものであってもよい。
[用言体言抽出部112]
用言体言抽出部112は、コンテンツ検索部111によって検索された複数のコンテンツの複数の説明文章から、複数の用言又は体言を抽出する。
「用言」とは、活用自立語としての形容詞、形容動詞及び/又は動詞である。
「体言」とは、単語自立語としての名詞である。
ここで、用言体言抽出部112は、例えば以下の2つの方法で説明文章から複数の用言又は体言を抽出することもできる。
・語対登録部102に登録された用言又は体言を抽出する。
・説明文章に対する形態素解析によって用言又は体言を抽出する。
抽出された用言又は体言は、検索結果明示部113へ出力される。
また、用言体言抽出部112は、後述する再検索入力部114によって、少なくとも2回以上繰り返されることが好ましい。この場合、最初に用言を抽出し、次に体言を抽出する。逆に、最初に体言を抽出し、次に用言を抽出するものであってもよい。
[検索結果明示部113]
検索結果明示部113は、コンテンツ検索部111によって検索された説明文章をコンテンツ毎にユーザに明示すると共に、次の検索キーとして、抽出された複数の用言又は体言の中からいずれか1つ以上の用言又は体言をユーザに選択させる。
また、検索結果明示部113は、後述する再検索入力部114によって、用言体言抽出部112と一緒に、少なくとも2回以上繰り返されることが好ましい。この場合、最初にユーザに用言を選択させ、次にユーザに体言を選択させる。逆に、最初に体言を選択させ、次に用言を選択させるものであってもよい。
[再検索入力部114]
再検索入力部114は、ユーザによって選択された用言又は体言を、次の検索キーのクエリ語として、コンテンツ検索部111へ入力する。特に、再検索入力部114は、用言体言抽出部112及び検索結果明示部113を、少なくとも2回以上繰り返すことも好ましい。即ち、ユーザによって入力されたクエリ語によってアプリケーションを検索した後、用言及び体言の組み合わせによって、検索結果をソートする。
本発明によれば、端末2を操作するユーザは、クエリ語を入力した後、自動的に表示される検索候補キーワードをタップするだけで、その観点に基づく検索結果を表示させることができる。そのために、端末2としては、スマートフォンやタブレットのようなタッチパネルディスプレイを搭載したものに適する。
図2は、本発明におけるコンテンツ検索方法のフローチャートである。尚、図2によれば、図1の機能構成部の処理の流れと同様に、コンテンツ検索方法としても理解できる。
(S11)図3は、図2のS11における端末の画面表示イメージである。
ユーザは、「家計簿」のアプリケーション(コンテンツ)を、当該端末2へインストールすることを所望したとする。端末2は、コンテンツ検索装置1へアクセスし、その検索ページを表示する。このとき、ユーザによってこのクエリ入力欄に、「家計簿」が入力されたとする(図3参照)。端末2は、このクエリ語を含む検索要求を、コンテンツ検索装置1へ送信する。
(S12)コンテンツ検索装置1は、コンテンツ情報収集部101を用いて、入力されたクエリ語「家計簿」と一致する語を多く含む順に複数のアプリケーションを検索する。例えば、アプリケーションの説明文章の中に、クエリ語「家計簿」を多く含む、以下のようなアプリケーションが検索されたとする。
<アプリケーション名> <説明文章>
「かんたん家計簿」 (簡単に節約できる家計簿アプリです。・・・)
「かけ〜ぼ」 (入力が簡単なアプリ!シンプルな入力!・・・)
「無料・家計簿アプリ」(かわいいデザインの犬が・・・非常に入力がシンプル)
「Money Management」 (多機能な操作の家計簿アプリ!かわいい電卓を・・・)
・・・・・・
(S13)コンテンツ検索装置1は、S12によって検索された複数のコンテンツの複数の説明文章から、最初に、複数の「用言」を抽出する。用言とは、形容詞、形容動詞及び/又は動詞である。出現頻度が多い順に、例えば以下のような用言が検索されたとする。
「簡単」「シンプル」「便利」「高機能」「かわいい」「忙しい」
(S14)図4は、図2のS14における端末の画面表示イメージである。
コンテンツ検索装置1は、検索された複数のアプリケーションの説明文章と、次の検索キーとして抽出された複数の「用言」とを、ページに記述する。そのページは、端末2へ、検索応答として返信される。端末2は、コンテンツ検索装置1から受信したページをディスプレイに表示し、ユーザに認識させる。
(S21)図5は、図2のS21における端末の画面表示イメージである。
端末2は、ユーザに、次に検索キーとして絞り込むべき用言を選択させる。このとき、ユーザは、「シンプル」「かわいい」にチェックしたとする。端末は、用言「シンプル」「かわいい」を含む検索要求を、コンテンツ検索装置1へ送信する。
(S22)コンテンツ検索装置1は、用言「シンプル」「かわいい」を検索キーとして、更に絞り込んで検索する。
(S23)コンテンツ検索装置1は、検索された複数のコンテンツの複数の説明文章から、次に、複数の「体言」を抽出する。「体言」とは、名詞である。出現頻度が多い順に、例えば以下のような体言が検索されたとする。
用言「シンプル」->体言「表示」「入力」
用言「かわいい」->体言「デザイン」「電卓」
このように、「シンプル」「かわいい」のような感覚的なクエリ語であっても、それを具体化する観点となるキーワードを、ユーザは一見して認識することができる。
(S24)図6は、図2のS24における端末の画面表示イメージである。
コンテンツ検索装置1は、検索された複数のアプリケーションの説明文章と、次の検索キーとして抽出された複数の「体言」とを、ページに記述する。そのページは、端末2へ、検索応答として返信される。端末2は、コンテンツ検索装置1から受信したページをディスプレイに表示し、ユーザに認識させる。
(S31)図7は、図2のS31における端末の画面表示イメージである。
端末2は、ユーザに、次に検索キーとして絞り込むべき体言を選択させる。このとき、ユーザは、用言「シンプル」に対して体言「入力」にチェックしたとする。端末は、体言「入力」を含む検索要求を、コンテンツ検索装置1へ送信する。
(S32)コンテンツ検索装置1は、体言「入力」+用言「シンプル」を検索キーとして、更に絞り込んで検索する。
(S33)図8は、図2のS33における端末の画面表示イメージである。
最終的に、ユーザは、アプリケーションの機能名を知らなくても、直感的に検索することができる。
<語対収集機能>
語対収集機能は、前述した語対登録部102に、「語対」及び「関係語」を学習的に登録するものである。
「語対」とは、関係語によって結ばれた用言及び体言の2つの語の対をいう。「語」とは、言語の構成単位の一つであり、1以上の形態素からなる。形態素とは、ある言語について意味を持つ最小の単位をいい、それ以上分解したら意味をなさなくなる単位まで分解された音素の集合の1つ1つを指す。語には、一つの形態素からなる単純語(例えば山)と、複数の形態素からなる複合語(例えば山登り)とがある。以下では、「語」というときは、単純語及び複合語のいずれも対象とする。
「関係語」とは、文法的な役割を持つ機能語であって、係り受け語としての格助詞をいう。例えば「・・・が・・・」「・・・な・・・」「・・・の・・・」がある。
図9は、本発明における語対登録部及び関係語登録部の登録情報を表す説明図である。
[語対登録部102]
語対登録部102は、「語対」を登録する。その後の登録方法については、語対取得部121によって後述する。
[関係語登録部103]
関係語登録部103は、少なくとも1つの関係語を登録する。その後の登録方法については、関係語取得部122によって後述する。
[語対取得部121]
語対取得部121は、コンテンツ毎に、関係語登録部103に登録された「関係語」によって係り受けされた用言及び体言の「語対」を、コンテンツ情報収集部101から検索し、当該語対を語対登録部102へ登録する。
例えば最初に、関係語登録部103に、人手によって格助詞「な」が登録されている場合を考える。この場合、以下のような説明文章が記述されたコンテンツがあったとする。
(例)「・・・シンプルな入力・・・」
<シンプル(用言)>な<入力(体言)>
この場合、関係語登録部103に、語対として「シンプル」「入力」が登録される。
[関係語取得部122]
関係語取得部122は、語対登録部102に登録された語対を用いて、当該語対に対する関係語を、コンテンツ情報収集部101から検索し、当該関係語を関係語登録部103へ登録する。
前述の語対取得部121の例で取得された語対「シンプル」「入力」を用いる。語対の間にワイルドカード*を挿入した検索キーによって、関係語取得部122は、コンテンツ情報収集部101を検索する。
<入力>*<シンプル>
<シンプル>*<入力>
この場合、以下のような説明文章が記述されたコンテンツがあったとする。
(例)「・・・入力がシンプル・・・」
入力(が)シンプル
そして、関係語取得部122は、当該関係語「が」を、関係語登録部103へ登録する。
パターン:[<用言/体言>(関係語)<体言/用言>]
<体言>が<用言>
これによって、関係語「が」によって、新たな関係パターンを抽出することができる。
語対取得部121及び関係語取得部122の処理を交互に繰り返すことによって、自動的に、語対登録部102(及び関係語登録部103)のパターンを学習し且つ蓄積していくことができる。この場合、以下のような説明文章が記述されたコンテンツがあったとする。
(例2)「・・・入力が簡単・・・」
<入力(体言)>が<簡単(用言)>
この場合、関係語登録部103に、語対として「入力」「簡単」が登録される。
尚、「関係語」は、当該コンテンツにおけるコンテンツ情報全体に渡って、所定数以上の出現頻度のもののみを対象とする。具体的には上位10件程度のものであってもよい。
例えば、「入力のための操作が簡単」という文章があった場合、関係語は「のための操作が」となる。しかしながら、この関係語はほとんど出現しないため、関係語登録部103には、関係語として登録しない。
ここで、語対(言A,言B)及び関係語Cの「出現頻度」について説明する。ユーザによって入力されたクエリ語(検索用の文)から、クエリ語Aが抽出されたとする。
最初に、そのクエリ語Aの出現頻度順に、コンテンツ情報収集部101からコンテンツ情報が検索される(図1のコンテンツ検索部111及び図2のS23参照)。そして、各コンテンツ情報について、語対(言A,言B)及び関係語Cの出現頻度aが算出される。
次に、言Bの出願頻度順に、コンテンツ情報収集部101からコンテンツ情報が検索される。そして、各コンテンツ情報について、語対(言B,言D)及び関係語Eの出現頻度bが算出される。
最終的に、これら出現頻度aとbとの合計値を、語対(言A,言B)及び関係語Cの「出現頻度」としてもよい。
以上、詳細に説明したように、本発明のコンテンツ検索プログラム、装置及び方法によれば、入力されたクエリ語に対する観点をユーザに選択候補として明示すると共に、選択された観点で更に絞り込んで検索することができる。そのために、ユーザは、感覚的で且つ曖昧なクエリ語を入力しても、その観点となるキーワードの選択候補を一見することによって、次に絞り込むべき所望のキーワードを直ぐに選択することができる。特に、形容詞のような用言を先に提示することによって、ユーザにとっては感覚的に絞り込みやすい。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 コンテンツ検索装置
101 コンテンツ情報収集部
111 コンテンツ検索部
112 用言体言抽出部
113 検索結果明示部
114 再検索入力部
102 語対登録部
103 関係語登録部
121 語対取得部
122 関係語取得部
2 端末
3 サーバ群

Claims (10)

  1. 装置に搭載されたコンピュータを実行させるコンテンツ検索プログラムにおいて、
    コンテンツ毎に、当該コンテンツに関する説明文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集手段と、
    前記コンテンツ情報収集手段を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索するコンテンツ検索手段と、
    前記コンテンツ検索手段によって検索された複数のコンテンツの複数の説明文章から、複数の用言又は体言を抽出する用言体言抽出手段と、
    前記コンテンツ検索手段によって検索された説明文章をコンテンツ毎にユーザに明示すると共に、次の検索キーとして、抽出された複数の用言又は体言の中からいずれか1つ以上の用言又は体言をユーザに選択させる検索結果明示手段と、
    ユーザによって選択された用言又は体言を、次の検索キーのクエリ語として、前記コンテンツ検索手段へ入力する再検索入力手段と
    してコンピュータを機能させることを特徴とするコンテンツ検索プログラム。
  2. 前記用言は、活用自立語としての形容詞、形容動詞及び/又は動詞であり、
    前記体言は、単語自立語としての名詞であ
    うにコンピュータを機能させることを特徴とする請求項1に記載のコンテンツ検索プログラム。
  3. 前記再検索入力手段によって、前記用言体言抽出手段及び前記検索結果明示手段は、少なくとも2回以上繰り返され、
    前記用言体言抽出手段は、最初に用言(又は体言)を抽出し、次に体言(又は用言)を抽出し、
    前記検索結果明示手段は、最初にユーザに用言(又は体言)を選択させ、次にユーザに体言(又は用言)を選択させ、
    前記再検索入力手段は、最初にユーザによって選択された用言(又は体言)を前記コンテンツ検索手段へ入力し、次にユーザによって選択された体言(又は体言)を前記コンテンツ検索手段へ入力する
    ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のコンテンツ検索プログラム。
  4. 関係語によって結ばれた用言及び体言の2つの語からなる語対を抽出して登録した語対登録手段を更に有し、
    前記用言体言抽出手段は、前記語対登録手段を用いて、前記説明文章から複数の用言又は体言を抽出する
    ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のコンテンツ検索プログラム。
  5. 前記語対登録手段に語対を登録するために、
    少なくとも1つの関係語を登録する関係語登録手段と、
    コンテンツ毎に、前記関係語登録手段に登録された関係語によって係り受けされた用言又は体言の語対を、前記コンテンツ情報収集手段から検索し、当該語対を前記語対登録手段へ登録する語対取得手段と、
    前記語対登録手段に登録された前記語対を用いて、当該語対に対する関係語を、前記コンテンツ情報収集手段から検索し、当該関係語を前記関係語登録手段へ登録する関係語取得手段と
    してコンピュータを更に機能させることを特徴とする請求項4に記載のコンテンツ検索プログラム。
  6. コンテンツ検索装置において、
    コンテンツ毎に、当該コンテンツに関する説明文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集手段と、
    前記コンテンツ情報収集手段を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索するコンテンツ検索手段と、
    前記コンテンツ検索手段によって検索された複数のコンテンツの複数の説明文章から、複数の用言又は体言を抽出する用言体言抽出手段と、
    前記コンテンツ検索手段によって検索された説明文章をコンテンツ毎にユーザに明示すると共に、次の検索キーとして、抽出された複数の用言又は体言の中からいずれか1つ以上の用言又は体言をユーザに選択させる検索結果明示手段と、
    ユーザによって選択された用言又は体言を、次の検索キーのクエリ語として、前記コンテンツ検索手段へ入力する再検索入力手段と
    を有することを特徴とするコンテンツ検索装置。
  7. 装置を用いたコンテンツ検索方法において、
    コンテンツ毎に、当該コンテンツに関する説明文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集部を有し、
    前記コンテンツ情報収集部を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索する第1のステップと、
    第1のステップによって検索された複数のコンテンツの複数の説明文章から、複数の用言又は体言を抽出する第2のステップと、
    第1のステップによって検索された複数のコンテンツの説明文章をユーザに明示すると共に、次の検索キーとして、抽出された複数の用言又は体言の中からいずれか1つ以上の用言又は体言をユーザに選択させる第3のステップと、
    前記コンテンツ情報収集部を用いて、ユーザによって選択された用言又は体言を、次の検索キーのクエリ語として、一致する語を多く含む順に複数のコンテンツを検索する第4のステップと、
    第1のステップによって検索された複数のコンテンツの説明文章をユーザに明示する第5のステップと
    を有することを特徴とするコンテンツ検索方法。
  8. 次の検索キーとして、抽出された複数の体言又は用言の中からいずれかの体言又は用言をユーザに選択させる第6のステップと、
    前記コンテンツ情報収集部を用いて、ユーザによって選択された体言又は用言を、次の検索キーのクエリ語として、一致する語を多く含む順に複数のコンテンツを検索する第7のステップと、
    第7のステップによって検索された複数のコンテンツの説明文章をユーザに明示する第8のステップと
    を有することを特徴とする請求項7に記載のコンテンツ検索方法。
  9. 関係語によって結ばれた用言及び体言の2つの語からなる語対を抽出して登録した語対登録部を更に有し、
    第2のステップは、前記語対登録部を用いて、前記説明文章から複数の用言又は体言を抽出する
    ことを特徴とする請求項8に記載のコンテンツ検索方法。
  10. 前記語対登録部に語対を登録するために、
    少なくとも1つの関係語を登録する関係語登録部を更に有し、
    コンテンツ毎に、前記関係語登録に登録された関係語によって係り受けされた用言又は体言の語対を、前記コンテンツ情報収集から検索し、当該語対を前記語対登録へ登録するステップと、
    前記語対登録に登録された前記語対を用いて、当該語対に対する関係語を、前記コンテンツ情報収集から検索し、当該関係語を前記関係語登録へ登録するステップと
    を更に有することを特徴とする請求項に記載のコンテンツ検索方法。
JP2013235366A 2013-11-13 2013-11-13 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法 Active JP6172750B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013235366A JP6172750B2 (ja) 2013-11-13 2013-11-13 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013235366A JP6172750B2 (ja) 2013-11-13 2013-11-13 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法

Publications (2)

Publication Number Publication Date
JP2015095180A JP2015095180A (ja) 2015-05-18
JP6172750B2 true JP6172750B2 (ja) 2017-08-02

Family

ID=53197519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013235366A Active JP6172750B2 (ja) 2013-11-13 2013-11-13 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法

Country Status (1)

Country Link
JP (1) JP6172750B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918555B (zh) 2019-02-20 2021-10-15 百度在线网络技术(北京)有限公司 用于提供搜索建议的方法、装置、设备和介质
JP7383579B2 (ja) * 2020-07-22 2023-11-20 シチズン時計株式会社 電子機器、表示システム、及び、表示プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4177070B2 (ja) * 2002-10-09 2008-11-05 富士通株式会社 文書検索装置
JP2006085563A (ja) * 2004-09-17 2006-03-30 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US20080065370A1 (en) * 2006-09-11 2008-03-13 Takashi Kimoto Support apparatus for object-oriented analysis and design

Also Published As

Publication number Publication date
JP2015095180A (ja) 2015-05-18

Similar Documents

Publication Publication Date Title
US9448995B2 (en) Method and device for performing natural language searches
Derczynski et al. Microblog-genre noise and impact on semantic annotation accuracy
KR101040119B1 (ko) 콘텐츠 검색 장치 및 방법
US9858314B2 (en) System and method for refining search results
KR100815215B1 (ko) 웹사이트 통합 검색 장치 및 방법
US10552467B2 (en) System and method for language sensitive contextual searching
KR101524889B1 (ko) 간접 화법 내에서의 시맨틱 관계의 식별
EP2347354B1 (en) Retrieval using a generalized sentence collocation
WO2015009586A2 (en) Performing an operation relative to tabular data based upon voice input
JP2017509049A (ja) 検索結果におけるコヒーレントな質問回答
Schäfer et al. The ACL anthology searchbench
US20100076984A1 (en) System and method for query expansion using tooltips
KR20100068532A (ko) 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법
US20200210491A1 (en) Computer-Implemented Method of Domain-Specific Full-Text Document Search
Smith et al. Corpus tools and methods, today and tomorrow: Incorporating linguists’ manual annotations
JP2007072646A (ja) 検索装置、検索方法およびプログラム
Wu et al. Refining the use of the web (and web search) as a language teaching and learning resource
Strzelecki et al. Direct answers in Google search results
US9904736B2 (en) Determining key ebook terms for presentation of additional information related thereto
JP2010257001A (ja) 検索サポートキーワード提示装置、方法及びプログラム
JP6172750B2 (ja) 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法
CN108614821B (zh) 地质资料互联互查***
KR101037091B1 (ko) 자동 언어 번역을 통한 다국어의 전거 표목에 대한 온톨로지 기반 의미 검색 시스템 및 방법
Tannebaum et al. Analyzing query logs of uspto examiners to identify useful query terms in patent documents for query expansion in patent searching: a preliminary study
Stanković et al. Improving document retrieval in large domain specific textual databases using lexical resources

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170628

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170629

R150 Certificate of patent or registration of utility model

Ref document number: 6172750

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150