JP6054816B2 - 複数のコンテンツの検索結果にユーザ選択用のヒント情報を明示するプログラム、装置及び方法 - Google Patents
複数のコンテンツの検索結果にユーザ選択用のヒント情報を明示するプログラム、装置及び方法 Download PDFInfo
- Publication number
- JP6054816B2 JP6054816B2 JP2013128029A JP2013128029A JP6054816B2 JP 6054816 B2 JP6054816 B2 JP 6054816B2 JP 2013128029 A JP2013128029 A JP 2013128029A JP 2013128029 A JP2013128029 A JP 2013128029A JP 6054816 B2 JP6054816 B2 JP 6054816B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- content
- search
- unit
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
コンテンツ毎に、2つの語からなる語対と、該2つの語を結ぶ関係語とを登録した語間関係登録手段と、
コンテンツ毎に、当該コンテンツに関する大量の文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集手段と、
コンテンツ情報収集手段を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索するコンテンツ検索手段と、
検索されたコンテンツの識別情報と、当該コンテンツについて語間関係登録手段に登録された語対及び関係語を含むヒント情報とを、検索結果として返信する検索結果返信手段と
してコンピュータを機能させることを特徴とする。
語は、名詞であり、
語対は、名詞対であり、
関係語は、係り受け語であって、格助詞、動詞又は形容詞である
ようにコンピュータを更に機能させることも好ましい。
検索結果返信手段は、語対及び関係語を含むヒント情報を、当該コンテンツにおける出現頻度順に出力するようにコンピュータを機能させることも好ましい。
関係語が同義語である場合、検索結果返信手段は、コンテンツ情報収集手段を用いて、当該クエリ語と一致する第1の語に対して関係語によって結ばれた「第2の語」をキーとして検索し、当該第2の語と一致する語を多く含む順に更にコンテンツを検索するようにコンピュータを更に機能させることも好ましい。
語間関係登録手段に語対及び関係語を登録するために、
少なくとも1つの関係語を登録する関係語登録手段と、
コンテンツ毎に、関係語登録手段に登録された関係語によって係り受けされた語対を、コンテンツ情報収集手段から検索し、当該語対及び関係語を、語間関係登録手段へ登録する語間関係取得手段と、
語間関係登録手段に登録された語対を用いて、当該語対に対する関係語を、コンテンツ情報収集手段から検索し、当該関係語を、関係語登録手段へ登録する関係語取得手段と
してコンピュータを更に機能させることも好ましい。
語間関係登録手段は、コンテンツ毎に、第1の語と第2の語とを関係語によって結ぶ単位レコードを複数接続したグラフを生成しており、
検索結果返信手段は、各コンテンツの識別情報に対応付けて、グラフを更に検索結果として返信する
ようにコンピュータを機能させることも好ましい。
コンテンツ毎に、2つの語からなる語対と、該2つの語を結ぶ関係語とを登録した語間関係登録手段と、
コンテンツ毎に、当該コンテンツに関する大量の文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集手段と、
コンテンツ情報収集手段を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索するコンテンツ検索手段と、
検索されたコンテンツの識別情報と、当該コンテンツについて語間関係登録手段に登録された語対及び関係語を含むヒント情報とを、検索結果として返信する検索結果返信手段と
を有することを特徴とする。
語間関係登録手段に語対及び関係語を登録するために、
少なくとも1つの関係語を登録する関係語登録手段と、
コンテンツ毎に、関係語登録手段に登録された関係語によって係り受けされた語対を、コンテンツ情報収集手段から検索し、当該語対及び関係語を、語間関係登録手段へ登録する語間関係取得手段と、
語間関係登録手段に登録された語対を用いて、当該語対に対する関係語を、コンテンツ情報収集手段から検索し、当該関係語を、関係語登録手段へ登録する関係語取得手段と
を有することも好ましい。
コンテンツ毎に、2つの語からなる語対と、該2つの語を結ぶ関係語とを登録した語間関係登録部と、
コンテンツ毎に、当該コンテンツに関する大量の文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集部と
を有し、
コンテンツ情報収集部を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索する第1のステップと、
検索されたコンテンツの識別情報と、当該コンテンツについて語間関係登録手段に登録された語対及び関係語を含むヒント情報とを、検索結果として返信する第2のステップと
を有することを特徴とする。
語間関係登録部に語対及び関係語を登録するために、
少なくとも1つの関係語を登録する関係語登録部を更に有し、
コンテンツ毎に、関係語登録手段に登録された関係語によって係り受けされた語対を、コンテンツ情報収集手段から検索し、当該語対及び関係語を、語間関係登録手段へ登録するステップと、
語間関係登録手段に登録された語対を用いて、当該語対に対する関係語を、コンテンツ情報収集手段から検索し、当該関係語を、関係語登録手段へ登録するステップと
を有することも好ましい。
図2は、本発明におけるコンテンツ検索方法のフローチャートである。
コンテンツ検索機能は、ユーザの端末によって入力されたクエリ情報に基づいて、コンテンツを検索し、その検索結果をユーザの端末へ返信する。
コンテンツ情報収集部101は、コンテンツ毎に、当該コンテンツに関する大量の文章を蓄積したデータベースである。又は、コンテンツ情報収集部101は、ネットワークを介して、インターネットに接続された様々なサーバ群に蓄積されたコンテンツ情報を検索することができるものであってもよい。コンテンツ情報収集部101は、コンテンツ検索部112から検索キーワード(例えばクエリ語)によって検索されるものである。
語間関係登録部102は、コンテンツ毎に、2つの語からなる「語対」と、その2つの語を結ぶ「関係語」とを登録したものである。ここで、「語対」とは「語」の対をいう。「語」とは、言語の構成単位の一つであり、1以上の形態素からなる。形態素とは、ある言語について意味を持つ最小の単位をいい、それ以上分解したら意味をなさなくなる単位まで分解された音素の集合の1つ1つを指す。語には、一つの形態素からなる単純語(例えば山)と、複数の形態素からなる複合語(例えば山登り)とがある。以下では、「語」というときは、単純語及び複合語のいずれも対象とする。
語 :「名詞」
語対 :「名詞対」
関係語:係り受け語であって、「格助詞」「動詞」又は「形容詞」
「関係語」は、文法的な役割を持つ機能語であるのに対し、「語対」は、それ以外の一般的な意味を持つ内容語である。
パターン:[<名詞1>(関係語)<名詞2>]
(例1)「お姫様のエリザベス」
<お姫様>(の)<エリザベス>
(例2)「お姫様をさらった海賊」
<お姫様>(さらった)<海賊>
(例3)「お姫様と結婚したモンスター」
<お姫様>(結婚した)<モンスター>
(例4)「お姫様が食べたリンゴ」
<お姫様>(食べた)<リンゴ>
(例5)「お父さんにお姫様だっこされた子供」
<お父さん>(お姫様だっこされた)<子供>
クエリ語抽出部111は、ユーザによって操作される端末2から、クエリ情報(検索用の文)を受信する(図2のS21参照)。そして、クエリ情報から形態素解析によってクエリ語が抽出される(図2のS22参照)。
「お姫様が出てくる映画は?」
この場合、クエリ語として、少なくとも「お姫様」「映画」が抽出される。抽出されたクエリ語は、コンテンツ検索部112へ出力される。
コンテンツ検索部112は、コンテンツ情報収集部101を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索する(図2のS23参照)。
映画「カリブ」
映画「野獣」
映画「白雪姫」
映画「ファミリー・ストーリー」
検索されたコンテンツの識別情報(例えばコンテンツ名)は、検索結果返信部113へ出力される。
検索結果返信部113は、検索されたコンテンツの識別情報と、当該コンテンツについて語間関係登録部102に登録された語対及び関係語とを、検索結果として返信する(図2のS24参照)。
映画:カリブ 「お姫様」の「エリザベス」
「お姫様」さらった「海賊」
「エリザベス」さらった「ボッサ」
映画:野獣 「お姫様」結婚した「モンスター」
「お姫様」踊る「舞踏会」
映画:白雪姫 「お姫様」食べた「リンゴ」
「お姫様」いる「小人」
映画:ファミリー・ストーリー
「お父さん」お姫様だっこされた「子供」
「旦那様」お姫様だっこされた「奥様」
映画:カリブ
「お姫様は、エリザベスですか?」
「お姫様は、海賊にさらわれましたか?」
「エリザベスは、ボッサにさらわれましたか?」
映画:野獣
「お姫様は、モンスターと結婚しましたか?
「お姫様は、舞踏会で踊りましたか?」
映画:白雪姫
「お姫様は、リンゴを食べましたか?」
「お姫様は、小人といましたか?」
映画:ファミリー・ストーリー
「子供は、お父さんにお姫様だっこされましたか?」
「奥様は、旦那様にお姫様だっこされましたか?」
ユーザは、コンテンツの識別情報と共に、そのヒント情報を一見しただけで、所望のコンテンツか否かを即座に判断することができる。そして、ユーザは、端末2に表示されたいずれのコンテンツを選択するかを検討することができる。
映画:競馬 語対「女王杯」「エリザベス」 関係語「の」
語対「クイーン」「エリザベス」 関係語「と呼ばれる」
最初に、そのクエリ語Aの出現頻度順に、コンテンツ情報収集部101からコンテンツ情報が検索される(図1のコンテンツ検索部112及び図2のS23参照)。そして、各コンテンツ情報について、語対(語A,語B)及び関係語Cの出現頻度aが算出される。
次に、語Bの出願頻度順に、コンテンツ情報収集部101からコンテンツ情報が検索される。そして、各コンテンツ情報について、語対(語B,語D)及び関係語Eの出現頻度bが算出される。
最終的に、これら出現頻度aとbとの合計値を、語対(語A,語B)及び関係語Cの「出現頻度」としてもよい。
関係語収集機能は、前述した語間関係登録部102に、語対及び関係語を学習的に登録するものである。
関係語登録部103は、少なくとも1つの関係語を登録する。例えば最初に、人手によって同義語「の」が登録されてもよい。ここでは、関係語「の」によって係り受けされる語対(2つの語)を対象とする。
語間関係取得部121は、コンテンツ毎に、関係語登録部103に登録された関係語によって係り受けされた語対を、コンテンツ情報収集部101から検索する。
例えば、以下のような語対が検索される。
(例)「お姫様のエリザベスは、・・・」という文章(コンテンツ情報)
<お姫様>(の)<エリザベス>
そして、語間関係取得部121は、当該語対及び関係語を、語間関係登録部102へ登録する。
パターン:[<名詞1>(関係語)<名詞2>]
<お姫様>(の)<エリザベス>
関係語取得部122は、語間関係登録部102に登録された語対を用いて、当該語対に対する関係語を、コンテンツ情報収集部101から検索する。
例えば、以下のような関係語が検索される。
(例)「お姫様と呼ばれるエリザベスは、・・・」という文章(コンテンツ情報)
<お姫様>*<エリザベス>
お姫様(と呼ばれる)<エリザベス>
そして、関係語取得部122は、当該関係語を、関係語登録部103へ登録する。
パターン:[<名詞1>(関係語)<名詞2>]
<名詞1>と呼ばれる<名詞2>
これによって、関係語「と呼ばれる」によって、新たな関係パターンを抽出することができる。
例えば、「お姫様が恋をして虜になってしまった海賊」という文章があった場合、関係語は「が恋をして虜になってしまった」となる。しかしながら、この関係語はほとんど出現しないため、関係語登録部103には、関係語として登録しない。
101 コンテンツ情報収集部
102 語間関係登録部
103 関係語登録部
111 クエリ語抽出部
112 コンテンツ検索部
113 検索結果返信部
121 語間関係取得部
122 関係語取得部
2 端末
Claims (10)
- 装置に搭載されたコンピュータを実行させるコンテンツ検索プログラムにおいて、
コンテンツ毎に、2つの語からなる語対と、該2つの語を結ぶ関係語とを登録した語間関係登録手段と、
コンテンツ毎に、当該コンテンツに関する大量の文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集手段と、
前記コンテンツ情報収集手段を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索するコンテンツ検索手段と、
検索されたコンテンツの識別情報と、当該コンテンツについて前記語間関係登録手段に登録された語対及び関係語を含むヒント情報とを、検索結果として返信する検索結果返信手段と
してコンピュータを機能させることを特徴とするコンテンツ検索プログラム。 - 前記語は、名詞であり、
前記語対は、名詞対であり、
前記関係語は、係り受け語であって、格助詞、動詞又は形容詞である
ようにコンピュータを更に機能させることを特徴とする請求項1に記載のコンテンツ検索プログラム。 - 前記検索結果返信手段は、前記語対及び関係語を含むヒント情報を、当該コンテンツにおける出現頻度順に出力するようにコンピュータを機能させることを特徴とする請求項1又は2に記載のコンテンツ検索プログラム。
- 前記関係語が同義語である場合、前記検索結果返信手段は、前記コンテンツ情報収集手段を用いて、当該クエリ語と一致する第1の語に対して関係語によって結ばれた「第2の語」をキーとして検索し、当該第2の語と一致する語を多く含む順に更にコンテンツを検索するようにコンピュータを更に機能させることを特徴とする請求項1から3のいずれか1項に記載のコンテンツ検索プログラム。
- 前記語間関係登録手段に語対及び関係語を登録するために、
少なくとも1つの関係語を登録する関係語登録手段と、
コンテンツ毎に、前記関係語登録手段に登録された関係語によって係り受けされた語対を、前記コンテンツ情報収集手段から検索し、当該語対及び関係語を、前記語間関係登録手段へ登録する語間関係取得手段と、
前記語間関係登録手段に登録された前記語対を用いて、当該語対に対する関係語を、前記コンテンツ情報収集手段から検索し、当該関係語を、前記関係語登録手段へ登録する関係語取得手段と
してコンピュータを更に機能させることを特徴とする請求項1から4のいずれか1項に記載のコンテンツ検索プログラム。 - 前記語間関係登録手段は、コンテンツ毎に、第1の語と第2の語とを関係語によって結ぶ単位レコードを複数接続したグラフを生成しており、
前記検索結果返信手段は、各コンテンツの識別情報に対応付けて、前記グラフを更に検索結果として返信する
ようにコンピュータを機能させることを特徴とする請求項1から5のいずれか1項に記載のコンテンツ検索プログラム。 - コンテンツ検索装置において、
コンテンツ毎に、2つの語からなる語対と、該2つの語を結ぶ関係語とを登録した語間関係登録手段と、
コンテンツ毎に、当該コンテンツに関する大量の文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集手段と、
前記コンテンツ情報収集手段を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索するコンテンツ検索手段と、
検索されたコンテンツの識別情報と、当該コンテンツについて前記語間関係登録手段に登録された語対及び関係語を含むヒント情報とを、検索結果として返信する検索結果返信手段と
を有することを特徴とするコンテンツ検索装置。 - 前記語間関係登録手段に語対及び関係語を登録するために、
少なくとも1つの関係語を登録する関係語登録手段と、
コンテンツ毎に、前記関係語登録手段に登録された関係語によって係り受けされた語対を、前記コンテンツ情報収集手段から検索し、当該語対及び関係語を、前記語間関係登録手段へ登録する語間関係取得手段と、
前記語間関係登録手段に登録された前記語対を用いて、当該語対に対する関係語を、前記コンテンツ情報収集手段から検索し、当該関係語を、前記関係語登録手段へ登録する関係語取得手段と
を有することを特徴とする請求項7に記載のコンテンツ検索装置。 - 装置を用いたコンテンツ検索方法において、
コンテンツ毎に、2つの語からなる語対と、該2つの語を結ぶ関係語とを登録した語間関係登録部と、
コンテンツ毎に、当該コンテンツに関する大量の文章を、蓄積し又はネットワークを介して検索することができるコンテンツ情報収集部と
を有し、
前記コンテンツ情報収集部を用いて、入力されたクエリ語と一致する語を多く含む順に複数のコンテンツを検索する第1のステップと、
検索されたコンテンツの識別情報と、当該コンテンツについて前記語間関係登録手段に登録された語対及び関係語を含むヒント情報とを、検索結果として返信する第2のステップと
を有することを特徴とするコンテンツ検索方法。 - 前記語間関係登録部に語対及び関係語を登録するために、
少なくとも1つの関係語を登録する関係語登録部を更に有し、
コンテンツ毎に、前記関係語登録手段に登録された関係語によって係り受けされた語対を、前記コンテンツ情報収集手段から検索し、当該語対及び関係語を、前記語間関係登録手段へ登録するステップと、
前記語間関係登録手段に登録された前記語対を用いて、当該語対に対する関係語を、前記コンテンツ情報収集手段から検索し、当該関係語を、前記関係語登録手段へ登録するステップと
を有することを特徴とする請求項9に記載のコンテンツ検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013128029A JP6054816B2 (ja) | 2013-06-19 | 2013-06-19 | 複数のコンテンツの検索結果にユーザ選択用のヒント情報を明示するプログラム、装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013128029A JP6054816B2 (ja) | 2013-06-19 | 2013-06-19 | 複数のコンテンツの検索結果にユーザ選択用のヒント情報を明示するプログラム、装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015004999A JP2015004999A (ja) | 2015-01-08 |
JP6054816B2 true JP6054816B2 (ja) | 2016-12-27 |
Family
ID=52300887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013128029A Active JP6054816B2 (ja) | 2013-06-19 | 2013-06-19 | 複数のコンテンツの検索結果にユーザ選択用のヒント情報を明示するプログラム、装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6054816B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0696061A (ja) * | 1992-09-11 | 1994-04-08 | Fuji Xerox Co Ltd | 関連情報辞書作成装置 |
JP2957875B2 (ja) * | 1993-03-17 | 1999-10-06 | 株式会社東芝 | 文書情報検索装置及び文書検索結果表示方法 |
JP2012027845A (ja) * | 2010-07-27 | 2012-02-09 | Sony Corp | 情報処理装置、関連文提供方法、及びプログラム |
-
2013
- 2013-06-19 JP JP2013128029A patent/JP6054816B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015004999A (ja) | 2015-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230334257A1 (en) | Robust natural language parser | |
US20160314121A1 (en) | System and method for natural language querying | |
US10025819B2 (en) | Generating a query statement based on unstructured input | |
US8554540B2 (en) | Topic map based indexing and searching apparatus | |
US9965726B1 (en) | Adding to a knowledge base using an ontological analysis of unstructured text | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
Kim et al. | Two-step cascaded textual entailment for legal bar exam question answering | |
US9552422B2 (en) | System and method for detecting a search intent | |
CN103229162A (zh) | 使用候选答案逻辑综合提供问题答案 | |
CN104516949A (zh) | 网页数据处理方法和装置、查询处理方法及问答*** | |
Rizzo et al. | Lessons learnt from the Named Entity rEcognition and Linking (NEEL) challenge series | |
US10176256B1 (en) | Title rating and improvement process and system | |
JP6165068B2 (ja) | ストーリーを持つ文章間の類似度を導出する類似検索プログラム、装置及び方法 | |
US11640506B2 (en) | Entity disambiguation | |
CN105550217B (zh) | 场景音乐搜索方法及场景音乐搜索装置 | |
JP5718405B2 (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
US9811592B1 (en) | Query modification based on textual resource context | |
US9336311B1 (en) | Determining the relevancy of entities | |
Dalvi et al. | A language modeling approach to entity recognition and disambiguation for search queries | |
Liang et al. | A large-scale system for annotating and querying quotations in news feeds | |
JP6054816B2 (ja) | 複数のコンテンツの検索結果にユーザ選択用のヒント情報を明示するプログラム、装置及び方法 | |
JP6106489B2 (ja) | 語義解析装置、及びプログラム | |
JP2009122337A (ja) | クイズ問題作成装置 | |
Alasiry et al. | Extraction and evaluation of candidate named entities in search engine queries | |
CN111125302A (zh) | 用户输入语句检错方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6054816 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |