JP5308918B2 - キーワード抽出方法、キーワード抽出装置およびキーワード抽出プログラム - Google Patents
キーワード抽出方法、キーワード抽出装置およびキーワード抽出プログラム Download PDFInfo
- Publication number
- JP5308918B2 JP5308918B2 JP2009130604A JP2009130604A JP5308918B2 JP 5308918 B2 JP5308918 B2 JP 5308918B2 JP 2009130604 A JP2009130604 A JP 2009130604A JP 2009130604 A JP2009130604 A JP 2009130604A JP 5308918 B2 JP5308918 B2 JP 5308918B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- list
- keywords
- search
- search engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1に示すように、本発明の実施形態に係るキーワード抽出装置1は、ネットワークを介して検索エンジン2と通信可能に接続されている。
まず、前記モデル生成処理を図2の処理フローに基づき詳細に説明する。このモデル生成処理は、前記キーワード抽出装置1の主要な処理に該当する。
1.そのキーワードの構成形態素
2.そのキーワードの近傍の形態素
3.そのキーワードの構成形態素の品詞
4.そのキーワードの近傍の形態素の品詞
5.そのキーワードが出現する文脈で出現する形態素
例えば図3の例では、「京都○○杯」というキーワードに対し、素性1「そのキーワードの構成形態素」を適用した場合は、語尾に「杯」という形態素を含む「○○○杯」や、語頭に「京都」などの地名を含む「(地名)○○○」などのようなモデルが生成される。
前記キーワード抽出手段10は、前記キーワード抽出モデルデータベース9に格納されたキーワード抽出モデルを用いて、任意の電子文書からキーワードを抽出する。
2…検索エンジン
3…クエリログ
4…検索実行手段
5…キーワードリスト生成手段
6…キーワード分類手段
7…用例収集手段
8…モデル生成手段
9…キーワード抽出モデルデータベース
10…キーワード抽出手段
Claims (3)
- 検索エンジンのログを利用して生成されたモデルを適用することで電子文書に含まれるキーワードを抽出する方法であって、
リスト生成手段が、前記検索エンジンから取得したクエリログを解析して、一定の条件を満たすクエリを抽出してキーワードのリストを生成する第1ステップと、
収集手段が、前記検索エンジンから前記リスト中のキーワードの検索結果を取得し、該検索結果のタイトルおよび概要文においてキーワードが用いられる用例を収集する第2ステップと、
モデル生成手段が、前記第2ステップで収集された用例を基に前記モデルを生成する第3ステップと、
分類手段が、前記リスト中のキーワードを種別毎に分類し、該種別毎にキーワードを抽出する第4ステップと、
を有することを特徴とするキーワード抽出方法。 - 検索エンジンのログを利用して生成されたモデルを適用することで電子文書に含まれるキーワードを抽出する装置であって、
前記検索エンジンから取得したクエリログを解析して、一定の条件を満たすクエリを抽出してキーワードのリストを生成するリスト生成手段と、
前記検索エンジンから前記リスト中のキーワードの検索結果を取得し、該検索結果のタイトルおよび概要文においてキーワードが用いられる用例を収集する収集手段と、
前記収集手段で収集された用例を基に前記モデルを生成するモデル生成手段と、
前記リスト中のキーワードを種別毎に分類し、該種別毎にキーワードを抽出する分類手段と、
を備えることを特徴とするキーワード抽出装置。 - 請求項2に記載のキーワード抽出装置としてコンピュータを機能させることを特徴とするキーワード抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009130604A JP5308918B2 (ja) | 2009-05-29 | 2009-05-29 | キーワード抽出方法、キーワード抽出装置およびキーワード抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009130604A JP5308918B2 (ja) | 2009-05-29 | 2009-05-29 | キーワード抽出方法、キーワード抽出装置およびキーワード抽出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010277415A JP2010277415A (ja) | 2010-12-09 |
JP5308918B2 true JP5308918B2 (ja) | 2013-10-09 |
Family
ID=43424307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009130604A Expired - Fee Related JP5308918B2 (ja) | 2009-05-29 | 2009-05-29 | キーワード抽出方法、キーワード抽出装置およびキーワード抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5308918B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5528402B2 (ja) * | 2011-08-26 | 2014-06-25 | 日本電信電話株式会社 | キーワード関連地名抽出装置及び方法及びプログラム |
US9792629B2 (en) * | 2013-08-05 | 2017-10-17 | Yahoo Holdings, Inc. | Keyword recommendation |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3787310B2 (ja) * | 2002-03-08 | 2006-06-21 | 日本電信電話株式会社 | キーワード決定方法、装置、プログラム、および記録媒体 |
JP2004234582A (ja) * | 2003-02-03 | 2004-08-19 | Hitachi Ltd | 辞書構築方法,システム及び画面 |
JP4148247B2 (ja) * | 2005-07-01 | 2008-09-10 | 日本電信電話株式会社 | 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
JP5245255B2 (ja) * | 2007-02-15 | 2013-07-24 | 富士通株式会社 | 固有表現抽出プログラム、固有表現抽出方法および固有表現抽出装置 |
-
2009
- 2009-05-29 JP JP2009130604A patent/JP5308918B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010277415A (ja) | 2010-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11126647B2 (en) | System and method for hierarchically organizing documents based on document portions | |
US8983963B2 (en) | Techniques for comparing and clustering documents | |
JP5392077B2 (ja) | オントロジ処理装置、オントロジ処理方法、及びオントロジ処理プログラム | |
JP4724701B2 (ja) | 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体 | |
US11687826B2 (en) | Artificial intelligence (AI) based innovation data processing system | |
KR101933953B1 (ko) | 페이지랭크와 토픽 모델링을 이용한 소프트웨어 도메인 토픽 추출 시스템 | |
JP2020191075A (ja) | Web APIおよび関連エンドポイントの推薦 | |
JP4750832B2 (ja) | 情報検索方法およびそのシステム | |
JP2002245061A (ja) | キーワード抽出 | |
Jean-Louis et al. | An assessment of online semantic annotators for the keyword extraction task | |
Fantinuoli et al. | Kudo interpreter assist: Automated real-time support for remote interpretation | |
JP2009122807A (ja) | 連想検索システム | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
Lampos et al. | Archiving the greek web | |
JP5308918B2 (ja) | キーワード抽出方法、キーワード抽出装置およびキーワード抽出プログラム | |
KR101476225B1 (ko) | 자연어 및 수식 색인화 방법과 그를 위한 장치 및 컴퓨터로 읽을 수 있는 기록매체 | |
JP2008077252A (ja) | 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体 | |
JP5499546B2 (ja) | 重要語抽出方法、装置、プログラム、記録媒体 | |
KR102275095B1 (ko) | 개인 미디어 제작을 위한 유튜브 동영상 메타데이터 취득 및 정보화 방법 | |
JP4148247B2 (ja) | 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP2005202924A (ja) | 対訳判断装置、方法及びプログラム | |
JP5393392B2 (ja) | 時間表現抽出装置、時間表現抽出方法および時間表現抽出プログラム | |
JP2011086156A (ja) | 漏洩情報追跡システムおよび漏洩情報追跡プログラム | |
JP4484957B1 (ja) | 検索式生成装置、検索式生成方法、およびプログラム | |
JP2009282903A (ja) | 知識抽出・検索装置およびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110926 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130226 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130430 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130701 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5308918 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |