JP4610543B2 - Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program - Google Patents

Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program Download PDF

Info

Publication number
JP4610543B2
JP4610543B2 JP2006299171A JP2006299171A JP4610543B2 JP 4610543 B2 JP4610543 B2 JP 4610543B2 JP 2006299171 A JP2006299171 A JP 2006299171A JP 2006299171 A JP2006299171 A JP 2006299171A JP 4610543 B2 JP4610543 B2 JP 4610543B2
Authority
JP
Japan
Prior art keywords
period
content
importance
concentration
search keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006299171A
Other languages
Japanese (ja)
Other versions
JP2008117134A (en
Inventor
哲之 森田
哲雄 日高
明通 田中
泰久 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006299171A priority Critical patent/JP4610543B2/en
Publication of JP2008117134A publication Critical patent/JP2008117134A/en
Application granted granted Critical
Publication of JP4610543B2 publication Critical patent/JP4610543B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、コンテンツ閲覧における検索技術に関するものである。   The present invention relates to a search technique in content browsing.

従来、個人が閲覧した情報を管理し、再利用を可能にするサービスの例としては、Microsoft Corporation(登録商標)(以下、MicroSoft社という)が提供するInternet Explore(登録商標)の機能である“お気に入り”と“履歴”が知られている。   Conventionally, as an example of a service that enables management and reuse of information viewed by an individual, a function of Internet Explorer (registered trademark) provided by Microsoft Corporation (hereinafter referred to as Microsoft Software) is “ "Favorites" and "History" are known.

“お気に入り”が管理する情報は、フォルダ、Webページのタイトル、URL、表示回数、および最終表示日時である。ユーザは、“お気に入り”で管理しているWebページを利用するとき、Webページのタイトルを見て、望みのWebページを探し出している。また、それらのWebページを整理するためのフォルダを作成し、たとえば「Jリーグ」などの名前をつけて、そのフォルダのなかに「Jリーグ」に関するWebページのURL(Uniform Resource Locator)を格納することで、望みのWebページを検索することを容易にすることもできる。   Information managed by “favorites” is a folder, a Web page title, a URL, a display count, and a last display date and time. When a user uses a web page managed by “favorites”, the user looks at the title of the web page to find a desired web page. Also, a folder for organizing those Web pages is created, for example, a name such as “J League” is given, and the URL (Uniform Resource Locator) of the Web page related to “J League” is stored in the folder. This makes it easy to search for a desired Web page.

“履歴”が管理する情報は、最終表示日時、インターネットアドレス、タイトル、利用回数である。ユーザは、“履歴”で管理しているWebページを利用するとき、日付順、サイト順、利用回数によって並び替え、Webページのタイトルを見て望みのWebページを探すことができる。また、キーワードを入力することで過去に見たWebページの中から、そのキーワードを含むWebページを一覧表示できる。   The information managed by “History” is the last display date, Internet address, title, and number of times of use. When using a web page managed by “history”, the user can sort by date, site, and the number of times of use, and look for the desired web page by looking at the title of the web page. Also, by inputting a keyword, it is possible to display a list of Web pages including the keyword from Web pages viewed in the past.

例えば、“履歴”を利用した場合、検索キーワードを入力し、検索語を含むWebページを時系列に表示するように指定すると、過去に閲覧したWebページを閲覧時刻順にすべて表示する。   For example, when “history” is used, if a search keyword is input and a Web page including the search word is specified to be displayed in time series, all Web pages browsed in the past are displayed in the order of browsing time.

また、MicroSoft社の提供するWindows(登録商標)に備わる標準検索機能や、Google社(登録商標)が提供するパソコン内に保管されたファイルや過去に閲覧したWebページを検索するツールのように、キーワードに適合するファイルやWebページの検索を行うツールが既に知られている。   In addition, like the standard search function provided in Windows (registered trademark) provided by MicroSoft, the tool that searches files stored in the personal computer provided by Google (registered trademark) and Web pages browsed in the past, Tools for searching for files and Web pages that match keywords are already known.

これらの“お気に入り”、“履歴”や“Windows(登録商標)に備わる標準検索機能”、および“パソコン内ファイルおよびWebページ検索ツール”は、ファイル単位およびWebページ単位で過去に閲覧した情報を表示する。   These “Favorites”, “History”, “Standard search function provided in Windows (registered trademark)”, and “Computer file and Web page search tool” display information browsed in the past in file units and Web page units. To do.

また、ユーザ端末の詳細な操作履歴を収集し、ユーザが過去に閲覧したファイルごとに、ユーザが経験した強さを示す経験スコアを算出し、ユーザが過去に閲覧したファイルの中から重要なファイルやWebページをファイル単位およびWebページ単位で簡単に探し出す方法(例えば、特許文献1参照)が示されている。
特開2005−174138号公報(段落[0051]〜[0064]等)。
Also, a detailed operation history of the user terminal is collected, an experience score indicating the strength experienced by the user is calculated for each file browsed by the user in the past, and an important file among the files browsed by the user in the past And a method for easily searching for Web pages in file units and Web page units (see, for example, Patent Document 1).
JP-A-2005-174138 (paragraphs [0051] to [0064] and the like).

上述のファイル単位およびWebページ単位で検索する手法では、次のような問題があった。   The above-described method for searching in file units and Web page units has the following problems.

適切な検索キーワードが不明であって、過去に閲覧したにも関わらず、数多くのファイルおよびWebページが検索され、結局探しているファイルやWebページを見つけられないことが多くあった。   There are many cases where an appropriate search keyword is unknown and many files and Web pages are searched even though the appropriate search keyword has been browsed in the past.

また、一般的に、過去のWebページの閲覧体験(閲覧操作や閲覧行動)で得られた情報は、ひとつのWebページだけではない。同一体験中に、そのWebページ以外に見た他のWebページの内容,それらWebページ間の関係,Webページを見て得られた知識等の様々な情報を有すると考えられる。   In general, information obtained from browsing experiences (browsing operations and browsing actions) of past Web pages is not limited to a single Web page. It is considered that during the same experience, there are various information such as the contents of other web pages viewed in addition to the web page, the relationship between the web pages, and the knowledge obtained by viewing the web pages.

例えば、ユーザが何かを調べるとき、一つのWebページだけでなく複数のWebページの内容を閲覧することは多い。信頼できる特集ページに推薦されていたため、商品の詳細ページを閲覧した、というように、ユーザが辿ったWebページ間の関係やそのWebページをどのように解釈したのか、といったWebページから得た知識も、過去のWebページの閲覧体験で得られた情報である。   For example, when a user examines something, the user often browses the contents of a plurality of Web pages as well as a single Web page. Knowledge gained from Web pages such as the relationship between Web pages followed by the user and how the Web pages were interpreted, such as viewing product detail pages because they were recommended as reliable feature pages Is information obtained through browsing experience of past Web pages.

そして、上述の方法によって、ひとつのWebページだけを検索(発見)できたとしても、それらの情報を思い出すことは困難であった。   Even if only one Web page can be searched (discovered) by the above-described method, it is difficult to recall such information.

例えば、なにかのテーマについて調査した場合など、同時期に発見した複数のファイルを発見したい場合がある。この場合、個々にファイルやWebページを検索する必要が有り、複数回の検索要求操作をユーザが行うために、複数の探しているファイルやWebページを見つけるのには長い時間が必要であった。   For example, when investigating a certain theme, there are cases where it is desired to discover a plurality of files discovered at the same time. In this case, it is necessary to search for files and Web pages individually, and since a user performs a plurality of search request operations, it takes a long time to find a plurality of searched files and Web pages. .

また、上述の方法を利用し、ユーザがあるキーワードに対して集中してWebページを閲覧していた期間を抽出するときには、次のような問題があった。   In addition, when the above-described method is used to extract a period during which a user has been browsing a Web page while focusing on a certain keyword, there are the following problems.

過去のWebページの閲覧体験で得られた情報を効率よく想起させるために、時間的に連続した操作をひとつのグループとして抽出し、理解することは、良い方法として知られていた。   It has been known as a good method to extract and understand continuous operations as a group in order to efficiently recall information obtained from past web page browsing experiences.

例えば、デジタルカメラについて調査した体験があったとする。デジタルカメラに関して詳しく調査した期間を一つ発見すれば、その調査期間内の多くのデジタルカメラに関するWebページの内容を一度に想起できる。調査した期間内のWebページの閲覧操作を、時系列に詳細に追っていくことによって、Webページ間の関係を想起できる。   For example, suppose you have an experience of investigating a digital camera. If you find a period of detailed research on digital cameras, you can recall the contents of Web pages related to many digital cameras within the survey period at once. The relationship between Web pages can be recalled by following the browsing operations of Web pages within the investigated period in detail in time series.

また、複数のWebページの内容やWebページ間の関係を把握すれば、Webページの内容を見たときに、Webページから得た知識を想起しやすいと考えられる。   Further, if the contents of a plurality of Web pages and the relationship between the Web pages are grasped, it is considered that knowledge obtained from the Web pages can be easily recalled when the contents of the Web pages are viewed.

さらに、上述の方法を利用し、ユーザがあるキーワードに対して集中してWebページを閲覧していた期間を抽出する場合には、次のような問題があった。   Furthermore, when the above method is used to extract a period during which a user has been browsing a Web page concentrated on a certain keyword, the following problem has occurred.

ファイルやWebページを閲覧時刻順にファイル単位やWeb単位で検索もしくは表示し、重要なファイルやWebページを発見し、そのファイルやWebページを閲覧していた時刻を調べるなどして、時刻を特定し、その後、その時刻周辺が重要な期間であろうと推測することしかできなかった。   Search or display files or web pages in file or web order in the order of browsing time, find important files or web pages, and identify the time of browsing the file or web page. After that, I could only guess that the time around would be an important period.

また、そのようにして発見した期間は、明確な開始時刻と終了時刻がない。つまり、該重要な時間の含まれる日,該重要な時間の前後の時間を区切り無く調査する、などの操作をユーザは行う必要があった。その結果、キーワードに対して集中してWebページを閲覧していた期間を効率的に抽出できなかった。   In addition, the period thus discovered has no clear start time and end time. In other words, the user has to perform operations such as a day in which the important time is included and a time before and after the important time are examined without being divided. As a result, it was not possible to efficiently extract the period during which the Web page was browsed concentrated on the keyword.

本発明は、前記課題に基づいてなされたものであって、Webページなどのコンテンツに対する操作が集中して起こされた期間(集中期間)を容易に抽出する期間抽出装置,期間抽出方法,その方法を実装した期間抽出プログラム及びそのプログラムを格納した記録媒体を提供することにある。   The present invention has been made based on the above-described problem, and is a period extraction device, a period extraction method, and a method for easily extracting a period (concentration period) in which operations on content such as a Web page are concentrated. Is to provide a period extracting program and a recording medium storing the program.

前記課題の解決を図るために、請求項1記載の発明は、入力された検索キーワードに対応したコンテンツの操作された期間を抽出する期間抽出装置であって、前記コンテンツを特定する属性情報を管理するコンテンツ属性情報管理手段と、前記コンテンツに対して行った操作履歴情報を管理する操作履歴情報管理手段と、前記操作履歴管理情報手段から読み出された操作履歴情報により、前記コンテンツのアクティブ期間を抽出し該アクティブ期間内にユーザが行った操作から、操作種別毎に応じて重み付けされた操作ポイントを積算することで前記コンテンツの該アクティブ期間における注目度を算出し前記コンテンツ属性情報管理手段から読み出された属性情報により、前記アクティブ期間中に表示されているコンテンツに対する前記検索キーワードのコンテンツ適合度を算出し前記アクティブ期間の注目度と検索キーワードに対するコンテンツ適合度とを乗算して前記検索キーワードに対応した前記コンテンツのアクティブ期間の重要度を求めるコンテンツ解析部と、前記検索キーワードに対応した前記コンテンツのアクティブ期間の重要度を当該アクティブ期間の時間幅で除算することで、当該検索キーワードに対する時刻ごとの重要度を求め、求めた時刻ごとの重要度に対する一定の時間幅の平均値を当該検索キーワードに対する時刻ごとの平均重要度として求め、求めた時刻ごとの平均重要度が連続して特定値より高い期間をひとつの集中期間として抽出する集中期間抽出部と、を備えることを特徴とする。 In order to solve the above-mentioned problem, the invention according to claim 1 is a period extracting device that extracts an operated period of content corresponding to an input search keyword, and manages attribute information specifying the content Content attribute information management means, operation history information management means for managing operation history information performed on the content, and operation history information read from the operation history management information means. The content attribute information management means calculates the attention level of the content in the active period by extracting and accumulating operation points weighted according to operation types from the operations performed by the user during the active period. According to the attribute information read out from the previous content for the content displayed during the active period Calculating the content relevance of the search keyword, a content analysis unit for determining the importance of the active period of the content by multiplying the content fitness corresponding to the search keywords for attention the search keyword of the active period, the By dividing the importance of the active period of the content corresponding to the search keyword by the time width of the active period, the importance for each time for the search keyword is obtained, and a certain time width for the obtained importance for each time A concentration period extracting unit that obtains an average value of each of the search keywords as an average importance for each time and extracts a period in which the average importance for each time is continuously higher than a specific value as one concentration period. It is characterized by that.

請求項2記載の発明は、請求項1記載の発明において、前記検索キーワードに対する時刻ごとの重要度を、集中期間の時間幅で積分し、前記集中期間における重要度を算出する集中期間重要度算出手段と、前記集中期間と前記集中期間に応じた重要度に基づいて、該集中期間の重要度の順に集中期間をランキングするランキング手段と、を備えることを特徴とする。 According to a second aspect of the invention, in the invention according to the first aspect, the search the importance of each time for the keyword, integrated over the duration of the intensive period, concentration period importance calculation for calculating the importance degree of the concentration period Means, and ranking means for ranking the concentration periods in the order of the importance of the concentration period based on the concentration period and the importance according to the concentration period .

なお、本発明は、前記の各手段として、コンピュータを機能させるためのプログラムの態様としても良い。また、このプログラムは、記録媒体に格納した態様で提供しても良い。 In addition, this invention is good also as an aspect of the program for functioning a computer as said each means . Moreover, you may provide this program with the aspect stored in the recording medium.

前記請求項1記載の発明は、検索キーワードに対応したコンテンツに対して集中して操作された期間を所得できる。また、検索キーワードとコンテンツに関するコンテンツ適合度を算出できる。さらに、コンテンツに関する注目度と重要度を算出できる。 According to the first aspect of the present invention, it is possible to earn a period in which the content corresponding to the search keyword is operated intensively. In addition, it is possible to calculate the content suitability related to the search keyword and the content. Furthermore, it is possible to calculate the degree of attention and importance regarding the content.

請求項2記載の発明は、集中期間における重要度を取得できる。また、重要度に従って、集中期間をランキングできる。 The invention according to claim 2 can acquire the importance in the concentration period. Moreover, the concentration period can be ranked according to the importance.

前記請求項3記載の発明は、請求項1または2記載の期間抽出装置を構成する各手段としてコンピュータを機能させることができる。According to the third aspect of the present invention, a computer can function as each means constituting the period extracting device according to the first or second aspect.

前記請求項4記載の発明は、請求項3記載の期間抽出プログラムを記録媒体に記録できる The invention according to claim 4 can record the period extracting program according to claim 3 on a recording medium .

なお、前記請求項1のさらに詳細な態様としては、前記コンテンツ適合度解析部が、前記コンテンツ属性情報管理手段に記録されたコンテンツ属性情報で特定される全てのコンテンツをコンテンツ集合と見做し、前記アクティブ期間に表示されていたコンテンツを前記コンテンツ集合から特定し、前記アクティブ期間に表示されていたコンテンツに対して、前記検索キーワードのTF−IDF値を計算する。 As a more detailed aspect of claim 1, the content suitability analysis unit considers all content specified by content attribute information recorded in the content attribute information management means as a content set, The content displayed during the active period is identified from the content set, and the TF-IDF value of the search keyword is calculated for the content displayed during the active period.

以上示したように、請求項1の発明によれば、重要な時刻を特定するのではなく、検索キーワードに対して集中してWebページなどのコンテンツを閲覧し、かつ操作していた期間を効率的に抽出できる。また、コンテンツ適合度に基づいた期間を抽出できる。さらに、算出した注目度と重要度によって、キーワードに対して集中してWebページなどのコンテンツを閲覧し、かつ操作していた期間を効率的に抽出することができる。 As described above, according to the first aspect of the present invention, rather than specifying an important time, the period during which content such as a web page is browsed and operated with a focus on a search keyword is efficiently used. Can be extracted automatically. In addition, a period based on the content suitability can be extracted. Furthermore, based on the calculated attention level and importance level, it is possible to efficiently extract a period during which content such as a Web page is browsed and operated in a concentrated manner on keywords.

請求項2の発明によれば、重要度によって集中期間を分類できる。また、重要度に従って集中期間を比較できる。 According to the invention of claim 2, the concentration period can be classified according to the importance. Also, the concentration periods can be compared according to the importance.

請求項3記載の発明によれば、請求項1または2に記載の期間抽出装置を構成する各手段としてコンピュータを機能させることができる。 According to invention of Claim 3 , a computer can be functioned as each means which comprises the period extracting device of Claim 1 or 2 .

請求項4記載の発明によれば、請求項3に記載の期間抽出プログラムを記録した記録媒体を提供できる。
According to invention of Claim 4, the recording medium which recorded the period extraction program of Claim 3 can be provided.

これらを以って情報検索技術分野に貢献できる。   These can contribute to the information retrieval technology field.

以下、本発明の実施形態を図面等に基づいて詳細に説明する。
本実施形態における期間抽出装置の構成を図1に基づいて説明する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
The structure of the period extracting device in this embodiment will be described with reference to FIG.

図1中の期間抽出装置1は、情報検索端末(例えば、パーソナルコンピュータ)2に備えられ、入力部2d,期間表示部2aと情報交換を行うことができる。   1 is provided in an information search terminal (for example, a personal computer) 2 and can exchange information with an input unit 2d and a period display unit 2a.

入力部2dは、期間抽出装置1に検索キーワードなどの情報を入力する。例えば、入力部2dはキーボード装置などを含み、ユーザが入力部2dを介して情報入力する。なお、本実施形態では、入力部2dから期間抽出装置1に送信される検索キーワードは、閲覧したWebに関する情報の記録やそのWebに対する操作記録を検索するための検索キーワードである。   The input unit 2 d inputs information such as a search keyword to the period extraction device 1. For example, the input unit 2d includes a keyboard device and the user inputs information via the input unit 2d. In the present embodiment, the search keyword transmitted from the input unit 2d to the period extraction device 1 is a search keyword for searching for a record of information related to the browsed Web and an operation record for the Web.

期間表示部2aは、期間抽出装置1から通知された期間を表示する。   The period display unit 2 a displays the period notified from the period extraction device 1.

期間抽出装置1は、集中期間(コンテンツの閲覧及びその閲覧に関する操作が集中する期間)の抽出を管理する抽出管理部1a,実際に集中期間を抽出する集中期間抽出部1b,コンテンツの利用時刻もしくは利用時間の重要度を解析するコンテンツ解析部1aa,ファイルや電子メールなどのコンテンツに関する属性情報を管理するコンテンツ属性情報管理手段(例えば、コンテンツ属性DB、より具体的には、ファイル属性情報DB(Database)) 1e,操作履歴情報を管理する操作履歴情報管理手段(例えば、操作履歴DB) 1f,操作履歴を取得する操作履歴取得部1g,情報検索端末2を使って過去に閲覧したファイル1h1,過去に閲覧したメール1h2を有する。   The period extraction apparatus 1 includes an extraction management unit 1a that manages extraction of a concentration period (a period in which content browsing and operations related to the browsing are concentrated), a concentration period extraction unit 1b that actually extracts a concentration period, a content use time or Content analysis unit 1aa that analyzes the importance of usage time, content attribute information management means that manages attribute information related to content such as files and e-mails (for example, content attribute DB, more specifically, file attribute information DB (Database) )) 1e, operation history information management means for managing operation history information (for example, operation history DB) 1f, operation history acquisition unit 1g for acquiring operation history, file 1h1 previously viewed using information search terminal 2 Have the mail 1h2 viewed.

また、前記コンテンツ解析部1aaは、コンテンツが利用されていた時刻を抽出するコンテンツ利用抽出部1c,過去に閲覧したファイルなどのコンテンツと検索キーワード間の適合度(コンテンツ適合度という)を解析するコンテンツ適合度解析部1dを備える。   Further, the content analysis unit 1aa is a content use extraction unit 1c that extracts the time when the content was used, and a content that analyzes the degree of matching between the content such as a file browsed in the past and the search keyword (content matching degree) A fitness analysis unit 1d is provided.

なお、各DBは、期間抽出装置1または情報検索端末2に予め備えられた記憶装置(例えば、ハードディスク装置やメモリ)に記憶される。以下では、コンテンツとして、Webページに関するファイル、または、電子メールを例にして、説明する。また、以下では、コンテンツ属性情報管理手段はファイル属性情報DB 1eとして、操作履歴情報管理手段は、操作履歴DB 1fとして説明する。各管理手段は、少なくとも、対象となる情報を書き込む手段、または、読み出す手段を有する。過去に閲覧したファイル1h1,過去に閲覧したメール1h2は、期間抽出装置11または情報検索端末2に予め備えられた記憶装置に記憶される。過去に閲覧したファイル1h1,過去に閲覧したメール1h2は、例えば、情報検索端末2を使って、ネットワーク(例えば、インターネット)100を介し閲覧したものである。コンテンツの利用時刻もしくはコンテンツの利用時間の重要度とは、コンテンツの利用時刻もしくはコンテンツの利用時間に対する操作の頻度に基づく数値である。また、アクティブにコンテンツを閲覧した時間のように、時間の長さを有する操作において、ある時間長さの操作を1回と見做すことができる。例えば、10秒間アクティブにコンテンツを閲覧した場合、Webページ閲覧は1回であったと見做し、25秒間アクティブにコンテンツを閲覧した場合、Webページ閲覧回数は2.5回であったと見做す。   Each DB is stored in a storage device (for example, a hard disk device or a memory) provided in advance in the period extraction device 1 or the information search terminal 2. In the following, description will be made by taking a file relating to a Web page or an e-mail as an example of content. Hereinafter, the content attribute information management unit will be described as the file attribute information DB 1e, and the operation history information management unit will be described as the operation history DB 1f. Each management means has at least a means for writing or reading information of interest. The file 1h1 browsed in the past and the mail 1h2 browsed in the past are stored in a storage device provided in advance in the period extraction device 11 or the information search terminal 2. The file 1h1 browsed in the past and the mail 1h2 browsed in the past are browsed via the network (for example, the Internet) 100 using the information search terminal 2, for example. The importance of content usage time or content usage time is a numerical value based on the frequency of operations for content usage time or content usage time. Further, in an operation having a length of time, such as a time when content is actively browsed, an operation having a certain length of time can be regarded as one time. For example, if the content is browsed actively for 10 seconds, it is assumed that the web page was browsed once, and if the content is browsed actively for 25 seconds, the web page is viewed 2.5 times. .

ファイル属性情報DB 1eは、過去に閲覧したWebページに関する情報を格納するWebファイルテーブル1e1,過去に送受信し閲覧したメールに関する情報を格納するメールファイルテーブル1e2を有する。図2中に、ファイル属性情報DB 1eの有する各テーブルの一例を示す。   The file attribute information DB 1e includes a Web file table 1e1 that stores information related to Web pages that have been browsed in the past, and a mail file table 1e2 that stores information related to mails that have been transmitted and received in the past. FIG. 2 shows an example of each table included in the file attribute information DB 1e.

操作履歴DB 1fは、Webを閲覧した期間に関する情報を格納するWebアクティブ期間テーブル1f1,送受信したメールを閲覧した期間に関する情報を格納するメールアクティブ期間テーブル1f2,IME入力に関する情報を格納するIME入力テーブル1f3,印刷に関する情報を格納する印刷テーブル1f4を有する。図3中に、操作履歴DB 1fの有する各テーブルの一例を示す。   The operation history DB 1f includes a Web active period table 1f1 that stores information related to a period of browsing the Web, a mail active period table 1f2 that stores information related to a period of browsing transmitted / received mail, and an IME input table that stores information related to IME input. 1f3, and a print table 1f4 that stores information related to printing. FIG. 3 shows an example of each table included in the operation history DB 1f.

本実施形態における期間抽出方法を図4,図5に基づいて以下に説明する。なお、以下の説明で、図1中の符号と同じものの説明は省略する。   The period extraction method in the present embodiment will be described below with reference to FIGS. In the following description, the same reference numerals as those in FIG. 1 are omitted.

期間抽出方法の概要を図4に基づいて説明する。   An outline of the period extraction method will be described with reference to FIG.

まず、情報検索端末2の入力部2dから検索要求を期間抽出装置1に送信する(S101)。   First, a search request is transmitted from the input unit 2d of the information search terminal 2 to the period extraction device 1 (S101).

次に、期間抽出装置1は、予め取得または記録してあった操作記録(S106)に基づいてアクティブ期間の抽出を行い、さらに、アクティブ期間の着目度,重要度を算出する(S102)。   Next, the period extracting apparatus 1 extracts the active period based on the operation record (S106) acquired or recorded in advance, and further calculates the attention level and importance of the active period (S102).

次に、期間抽出装置1は、アクティブ期間の重要度を利用して、時刻tの重要度を算出し、その時刻tにおける平均重要度を算出し、集中期間を抽出し、その集中期間の重要度を算出する(S103)。   Next, the period extraction device 1 calculates the importance at the time t using the importance of the active period, calculates the average importance at the time t, extracts the concentration period, and determines the importance of the concentration period. The degree is calculated (S103).

次に、期間抽出装置1は、集中期間をランキングして、情報検索端末2の期間表示部2aに送信する(S104)。   Next, the period extraction device 1 ranks the concentration period and transmits it to the period display unit 2a of the information search terminal 2 (S104).

そして、情報検索端末2の期間表示部2aは、集中期間に行われたユーザの操作を表示する(S105)。   Then, the period display unit 2a of the information search terminal 2 displays a user operation performed during the concentration period (S105).

以下に期間抽出方法を詳細に説明する。   The period extraction method will be described in detail below.

期間抽出装置1の操作履歴取得部1gが操作履歴を取得し記録する手順を図5に基づいて説明する(S106)。   The procedure by which the operation history acquisition unit 1g of the period extracting device 1 acquires and records the operation history will be described with reference to FIG. 5 (S106).

まず、操作履歴取得部1gは、特定のイベント(例えば、キーボードイベント,マウスイベント,アクティブになっているウィンドウの状態変化イベント)が生じた(M101)ときに、OS(例えば、Windows(登録商標)Operating System)2c上でグローバルに通信されているウィンドウメッセージ(M102)を取得(フック)する(S201)。   First, the operation history acquisition unit 1g receives an OS (for example, Windows (registered trademark)) when a specific event (for example, a keyboard event, a mouse event, or an active window state change event) occurs (M101). The window message (M102) communicated globally on the (Operating System) 2c is acquired (hooked) (S201).

次に、現在、どのプログラムがユーザによって操作されているかを特定する(S202)。また、どのウィンドウがアクティブになった、あるいは非アクティブになった、ということを取得出来る。本実施形態では、ユーザ50によって操作されているプログラムがブラウザ2b(例えば、Microsoft社のInternet Explore(登録商標)(略称はIE))であったものとして説明する。   Next, it is specified which program is currently operated by the user (S202). You can also get information about which windows are active or inactive. In the present embodiment, the description will be made assuming that the program operated by the user 50 is the browser 2b (for example, Internet Explorer (registered trademark) (abbreviated as IE) of Microsoft Corporation).

次に、操作履歴取得部1gは、プログラム間通信によってIEと通信し(M103)、IEのウィンドウ上で現在表示しているホームページのURLと、表示している情報本体(多くの場合、HTML(HyperText Markup Language)ファイル)を取得する(M104)。   Next, the operation history acquisition unit 1g communicates with the IE through inter-program communication (M103), and the URL of the home page currently displayed on the IE window and the displayed information body (in many cases, HTML ( (HyperText Markup Language) file) is acquired (M104).

次に、操作履歴取得部1gは、前記情報本体のハッシュ値(例えば、MD5(Message Digest 5)ハッシュ値)を計算し、この値をコンテンツを一意に識別するContent−keyと見做す(S203)。   Next, the operation history acquisition unit 1g calculates a hash value (for example, MD5 (Message Digest 5) hash value) of the information body, and regards this value as a Content-key that uniquely identifies the content (S203). ).

次に、操作履歴取得部1gは、前記情報本体を期間抽出装置1上に過去に見たファイル1h1として保存する(S204)。   Next, the operation history acquisition unit 1g stores the information main body on the period extraction device 1 as a file 1h1 seen in the past (S204).

次に、操作履歴取得部1gは、前記ウィンドウメッセージ(M104)に含まれるウィンドウのアクティブ化の時刻を前記URLの閲覧開始時刻であると推定し(S205)、操作履歴DB 1fに、閲覧開始時刻,情報本体のハッシュ値を操作履歴DB 1f中のWebアクティブ期間テーブル1f1に登録する(S206)。   Next, the operation history acquisition unit 1g estimates that the activation time of the window included in the window message (M104) is the URL browsing start time (S205), and stores the browsing start time in the operation history DB 1f. The hash value of the information body is registered in the Web active period table 1f1 in the operation history DB 1f (S206).

次に、操作履歴取得部1gは、前記情報本体を解析した結果と、既に取得した上記情報本体を用いて、情報本体の属性情報である作者,タイトル,更新日,情報本体のハッシュ値,インターネットで公開されていた時のURL,該情報本体を保存したファイル名(例えば、フルパス)をファイル属性情報DB 1e中のWebファイルテーブル1e1に保存する(S207)。   Next, the operation history acquisition unit 1g uses the analysis result of the information main body and the information main body already acquired, the author, title, update date, hash value of the information main body, the information body attribute information, the Internet And the file name (for example, full path) in which the information body is stored are stored in the Web file table 1e1 in the file attribute information DB 1e (S207).

次に、特定のイベントが情報検索端末2で生じ(M105)、操作履歴取得部1gが前記ウィンドウメッセージに含まれるウィンドウの非アクティブ化のメッセージ(M106)をOS 2cを介して受け取る(S208)と、その時刻を該URLの閲覧終了時刻であると推定し(S209)、操作履歴DB 1f中のWebアクティブ期間テーブル1f1に、閲覧終了時刻を登録する(S210)。   Next, a specific event occurs in the information retrieval terminal 2 (M105), and the operation history acquisition unit 1g receives a window deactivation message (M106) included in the window message via the OS 2c (S208). The time is estimated to be the browsing end time of the URL (S209), and the browsing end time is registered in the Web active period table 1f1 in the operation history DB 1f (S210).

同様にして、電子メールに関しても、操作履歴取得部1gは、情報検索端末2上のメーラとのプログラム間通信とそのメーラ上の電子メール文書に関する解析によって、電子メールのMessage−IDヘッダの値(以下、単にMessage−IDという)と、該Message−IDに対応するメールの閲覧開始時刻と閲覧終了時刻と、表示しているあるいは作成中のメール文書(即ち、情報本体)と、該Message−IDのメールの情報本体の属性情報(例えば、送信先アドレス,送信元アドレス,送信日時,題名を含む情報)と、を取得する。   Similarly, regarding the e-mail, the operation history acquisition unit 1g performs the inter-program communication with the mailer on the information search terminal 2 and the analysis on the e-mail document on the mailer, and the value of the Message-ID header ( Hereinafter, simply referred to as Message-ID), the browsing start time and browsing end time of the mail corresponding to the Message-ID, the mail document being displayed or being created (that is, the information body), and the Message-ID Attribute information (for example, information including a transmission destination address, a transmission source address, a transmission date and time, and a title) is acquired.

ここで、操作履歴取得部1gは、前記Message−IDをコンテンツを一意に識別するContent−keyと見做す。該情報本体を期間抽出装置1上に過去に見たメール1h2として保存する。   Here, the operation history acquisition unit 1g regards the Message-ID as a Content-key that uniquely identifies the content. The information body is stored on the period extracting device 1 as a mail 1h2 seen in the past.

そして、操作履歴取得部1gは、Message−IDと、該Message−IDのメールの閲覧開始時刻、閲覧終了時刻を操作履歴DB 1fに登録する。さらに、Message−IDと送信先アドレス,送信元アドレス,送信日時,題名,該情報本体を保存したファイル名(フルパス)をファイル属性情報DB 1e中のメールファイルテーブル1e2に保存する。   Then, the operation history acquisition unit 1g registers the Message-ID, the browsing start time and the browsing end time of the mail of the Message-ID in the operation history DB 1f. Further, the Message-ID, the transmission destination address, the transmission source address, the transmission date and time, the title, and the file name (full path) storing the information body are stored in the mail file table 1e2 in the file attribute information DB 1e.

また、前記ウィンドウメッセージの取得(フック)によって、操作履歴取得部1gは、情報検索端末2におけるIME(Input Method Editor)入力を、その発生時刻とともに操作履歴DB 1fのIME入力テーブル1f3に保存する。   Further, by acquiring (hooking) the window message, the operation history acquisition unit 1g stores an IME (Input Method Editor) input in the information search terminal 2 in the IME input table 1f3 of the operation history DB 1f together with the time of occurrence.

さらに、操作履歴取得部1gは、前記情報検索端末2上のプリンタスプールへの問い合わせによって、印刷イベントを、その発生時刻とともに操作履歴DB 1fの印刷テーブル1f4に保存する。   Further, the operation history acquisition unit 1g stores a print event in the print table 1f4 of the operation history DB 1f together with the occurrence time in response to an inquiry to the printer spool on the information search terminal 2.

期間抽出装置1が情報検索端末2から、検索要求を受けた時以降の期間抽出の手順を図6に基づいて説明する。   The procedure of period extraction after the period extraction apparatus 1 receives a search request from the information search terminal 2 will be described with reference to FIG.

まず、抽出管理部1aが情報検索端末2の入力部2dから検索キーワードを含む検索要求を受け取る(M201)と、コンテンツ利用時刻抽出部1cに検索キーワードを渡す(M202)(S101)。   First, when the extraction management unit 1a receives a search request including a search keyword from the input unit 2d of the information search terminal 2 (M201), it passes the search keyword to the content use time extraction unit 1c (M202) (S101).

次に、検索キーワードを受け取った後のコンテンツ利用時刻抽出部の手順を以下に詳細に説明する。なお、コンテンツ利用時刻抽出部では、ユーザがコンテンツを利用していた時刻であって、操作履歴をグループ化する最小期間であるアクティブ期間を採用している。   Next, the procedure of the content use time extraction unit after receiving the search keyword will be described in detail below. Note that the content use time extraction unit employs an active period that is a time when the user has used the content and is a minimum period for grouping operation histories.

まずは、前記アクティブ期間を定義し、つづいて、ユーザの注目の強さを表すアクティブ期間の注目度、および検索キーワードに対するアクティブ期間の重要度を算出する手順について述べる(S102)。   First, the active period is defined, and the procedure for calculating the attention level of the active period that represents the strength of the user's attention and the importance level of the active period for the search keyword will be described (S102).

ここで、手順を説明するに先立って、アクティブ期間とそのアクティブ期間の注目度を説明する。   Here, before explaining the procedure, the active period and the attention level of the active period will be described.

現在普及しているコンピュータの多くは、ウィンドウシステムを採用したオペレーションシステム(OS(Operating System))を利用している。ユーザはWebページをウィンドウ内に表示して閲覧や作業を行っている。アクティブなウィンドウに表示しているWebページを変更する、あるいは別のウィンドウをアクティブすることで、閲覧するWebページを切り替えている。   Many of the computers that are currently popular use an operating system (OS (Operating System)) that employs a window system. A user displays a Web page in a window and performs browsing and work. The Web page to be browsed is switched by changing the Web page displayed in the active window or activating another window.

例えば、ユーザが、興味のあるWebページをリンククリック(リンクをクリックすること)によって探し、いくつか注目すべきWebページが見つかると、Webブラウザを複数起動して両者を切り替えながらWebページを比較することなどの操作を行っている。   For example, a user searches for a web page of interest by clicking on a link (clicking on a link), and when several notable web pages are found, start a plurality of web browsers and compare the web pages while switching between the two. The operation is performed.

そこで、Webページや電子メールなどのコンテンツをアクティブに表示している期間をアクティブ期間と定義する。例えば、一つのウィンドウがひとつのWebページをアクティブに表示している期間を、アクティブ期間と見做すことができる。そのアクティブ期間をユーザの操作をまとめる特徴的な単位であると考える。例えば、Webブラウザに表示しているWebページを変更するたびに、新しいアクティブ期間が発生する。   Therefore, a period in which content such as a web page or an e-mail is actively displayed is defined as an active period. For example, a period in which one window is actively displaying one Web page can be regarded as an active period. The active period is considered as a characteristic unit for collecting user operations. For example, a new active period occurs each time a web page displayed on the web browser is changed.

ユーザはそれぞれのアクティブ期間内に、Webページを閲覧し、注目した文章をコピーし、特に有用であると判断すれば印刷するなど、さまざまな操作を起こす。   Within each active period, the user performs various operations such as browsing a Web page, copying a noticed sentence, and printing if determined to be particularly useful.

そこで、ユーザが多くの操作を起こしていたアクティブ期間はユーザが注目した可能性が高いと仮定し、アクティブ期間に対するユーザの注目の強さをあらわす指標としてアクティブ期間の注目度と呼ぶ。   Therefore, it is assumed that there is a high possibility that the user has noticed the active period during which the user has performed many operations, and the attention level of the active period is referred to as an index representing the strength of the user's attention to the active period.

以上のように、アクティブ期間とそのアクティブ期間の注目度を説明した。   As described above, the active period and the attention level of the active period have been described.

図6中のコンテンツ利用時刻抽出部1cは、操作履歴取得部1gが取得もしくは記録した操作履歴(即ち、操作履歴DB 1f上の操作履歴)からウィンドウ(例えば、Webページなどのコンテンツを表示していたウィンドウ)をアクティブにした時刻と、ウィンドウを非アクティブにした時刻と、アクティブなウィンドウに表示されているWebページと、に基づいて、アクティブ期間を抽出する(S301)。即ち、このアクティブ期間は、操作履歴DB 1f中のWebアクティブ期間テーブル1f1の各行(各レコード)にアクセスすることで取得もしくは抽出できる。   The content use time extraction unit 1c in FIG. 6 displays content such as a window (for example, a web page) from the operation history (that is, the operation history in the operation history DB 1f) acquired or recorded by the operation history acquisition unit 1g. The active period is extracted based on the time when the window is activated, the time when the window is deactivated, and the Web page displayed in the active window (S301). That is, the active period can be acquired or extracted by accessing each row (each record) of the Web active period table 1f1 in the operation history DB 1f.

次に、コンテンツ利用時刻抽出部1cは、アクティブ期間の注目度を算出する(S302:注目度算出)。アクティブ期間の注目度の算出方法を図7に基づいて説明する。   Next, the content use time extraction unit 1c calculates the attention level in the active period (S302: attention level calculation). A method of calculating the attention level during the active period will be described with reference to FIG.

アクティブ期間の注目度は、アクティブ期間(図7中の符号Actで示す期間)内にユーザが行ったそれぞれの操作に対し、ユーザが意識的にアクティブ期間の起こした印刷などの操作種別毎に応じて重み付けされた操作ポイント(例えば、IMEポイントP1,印刷ポイントP2,アクティブウィンドウの期間があった閲覧時間ポイントP3)を与え、アクティブ期間内のすべての操作ポイントを積算することで求める(式1)。例えば、前記の印刷ポイントP2は、閲覧時間中に発生した印刷操作に関するポイントである。図7中では、符号Atpで示すものがアクティブ期間の注目度である。なお、重み付けの係数の一例を重み付け係数w1として示す。   The attention level of the active period depends on each operation type such as printing in which the user consciously caused the active period for each operation performed by the user within the active period (the period indicated by Act in FIG. 7). Weighted operation points (for example, IME point P1, print point P2, browsing time point P3 in which there was an active window period), and all the operation points in the active period are integrated (formula 1). . For example, the print point P2 is a point related to a print operation that occurs during the browsing time. In FIG. 7, what is indicated by the symbol Atp is the attention level in the active period. An example of the weighting coefficient is shown as weighting coefficient w1.

次に、コンテンツ利用時刻抽出部1cは、検索キーワードに対するコンテンツそれぞれのアクティブ期間の重要度を求める(S303:重要度算出)。   Next, the content use time extraction unit 1c calculates the importance of the active period of each content for the search keyword (S303: importance calculation).

検索キーワードに対するそれぞれのアクティブ期間の重要度を求める具体的な方法は、アクティブ期間の注目度と、コンテンツ適合度解析部1dが算出するアクティブ期間中に表示されているWebページの検索キーワードに対するコンテンツ適合度と、を乗ずることで、式2のように求めるものである。なお、操作種類(あるいは、操作イベント)としては、情報検索端末2におけるWebページ閲覧時間,コピー,印刷,マウス操作,キーボード入力,文字列選択を利用する。例えば、印刷であれば、印刷テーブルから操作イベントに関する情報(例えば、発生時刻や発生回数)を取得できる。   The specific method for obtaining the importance of each active period with respect to the search keyword is the attention level of the active period and the content adaptation to the search keyword of the Web page displayed during the active period calculated by the content suitability analysis unit 1d By multiplying the degree, it is obtained as shown in Equation 2. Note that as the operation type (or operation event), Web page browsing time, copy, print, mouse operation, keyboard input, and character string selection in the information search terminal 2 are used. For example, in the case of printing, information related to an operation event (for example, occurrence time and occurrence count) can be acquired from the print table.

ここで、コンテンツ適合度解析部1dがWebページ(例えば、HTML形式ファイル)に対する検索キーワードのコンテンツ適合度を算出(コンテンツ適合度解析)する方法を説明する。   Here, a description will be given of a method in which the content suitability analysis unit 1d calculates the content suitability of a search keyword for a Web page (for example, an HTML file) (content suitability analysis).

コンテンツ利用時刻抽出部1cからの要請(M203)に応じて、コンテンツ適合度解析部1dは、アクティブ期間中に表示されているWebページを、操作履歴DB 1f中のWebアクティブ期間テーブル1f1のContent−keyとファイル属性情報DB 1e中のWebファイルテーブル1e1の過去に見たWebページを保存したファイル名によって特定する(S304)。   In response to the request (M203) from the content use time extraction unit 1c, the content suitability analysis unit 1d converts the Web page displayed during the active period into the Content- of the Web active period table 1f1 in the operation history DB 1f. The key and the Web file table 1e1 stored in the file attribute information DB 1e are identified by the name of the saved file (S304).

また、アクティブ期間apに表示されているWebページの検索キーワードkに対するコンテンツ適合度R(k,ap)は、操作履歴取得部1gが取得し記録したすべてのWebページ1h1をWebページ集合とし、アクティブ期間apに表示されているWebページに対する検索キーワードkのTF−IDF(Term Frequency−Inverse Document Frequency)値を用いる(式3)(S305)。TF値は、HTMLタグによる重み付けを例えば、図8のHTMLタグによる重み付け係数w2のように行う。   In addition, the content suitability R (k, ap) for the search keyword k of the Web page displayed during the active period ap is set to be all Web pages 1h1 acquired and recorded by the operation history acquisition unit 1g. A TF-IDF (Term Frequency-Inverse Document Frequency) value of the search keyword k for the Web page displayed in the period ap is used (Formula 3) (S305). The TF value is weighted by an HTML tag, for example, like the weighting coefficient w2 by the HTML tag in FIG.

ここで、TF−IDF値によるテキスト適合度の算出を説明する。TF−IDF値によるテキスト適合度の算出は、一般的なテキスト検索手法(式3)である。   Here, calculation of the text suitability based on the TF-IDF value will be described. The calculation of the text suitability based on the TF-IDF value is a general text search method (Formula 3).

まず、各ファイルおよび検索キーワードのテキストを形態素解析手法やn−gram手法などによって、小さな文字列に分解し、検索キーワードを分割した文字列の各ファイル中の出現頻度と、ファイル集合全体のなかで検索キーワードを分割した文字列を含むファイルの割合の逆数を計算することによって、ファイルごとの検索キーワードへのコンテンツ適合度を求めることができる。   First, the text of each file and search keyword is decomposed into small character strings by a morphological analysis method, an n-gram method, etc., and the appearance frequency in each file of the character string obtained by dividing the search keyword and the entire file set By calculating the reciprocal of the ratio of the file including the character string obtained by dividing the search keyword, it is possible to obtain the content suitability for the search keyword for each file.

また、システムの実装においては、TF値およびIDF値を求める計算に時間がかかるため、上記Webページ集合は一日毎など定期的、あるいはユーザ指定時に最新状態に更新し、テキストインデックスを作成する。   In addition, since it takes time to calculate the TF value and the IDF value in the implementation of the system, the Web page set is updated to the latest state periodically such as every day or at the time of user designation to create a text index.

コンテンツ適合度解析部1dは、前記算出されたコンテンツ適合度Rをコンテンツ利用時刻抽出部1cに送信する(M204)。   The content suitability analysis unit 1d transmits the calculated content suitability R to the content use time extraction unit 1c (M204).

コンテンツ利用時刻抽出部1cは、送信されたコンテンツ適合度Rとアクティブ期間の注目度に基づいてアクティブ期間の重要度を上述の方法で算出し、抽出したアクティブ期間と検索キーワードに対するアクティブ期間の重要度のリストを、抽出管理部1aに送信する(M205)。   The content use time extraction unit 1c calculates the importance of the active period based on the transmitted content suitability R and the attention level of the active period by the above method, and the importance of the active period for the extracted active period and the search keyword Is sent to the extraction management unit 1a (M205).

次に、抽出管理部1aは、検索キーワードと、アクティブ期間と検索キーワードに対応するアクティブ期間の重要度のリストを集中期間抽出部1bに送信する(M206)。   Next, the extraction management unit 1a transmits a search keyword, an active period, and a list of importance levels of the active period corresponding to the search keyword to the concentrated period extraction unit 1b (M206).

次に、集中期間抽出部1bが検索キーワードと、アクティブ期間と検索キーワードに対するアクティブ期間の重要度のリストと、を受け取った後の集中期間抽出部1bの手順を以下に詳細に説明する。   Next, the procedure of the concentration period extraction unit 1b after the concentration period extraction unit 1b receives the search keyword and the active period and the importance level of the active period for the search keyword will be described in detail below.

まずは、任意の検索キーワードに関連した操作を集中して起こした期間(以後、集中期間と呼ぶ)を抽出する手順について記し、つづいて、検索キーワードに対するそれぞれの集中期間の重要度(即ち、期間スコア)を算出する(S306)手順を説明する。   First, a procedure for extracting a period in which operations related to an arbitrary search keyword are concentrated (hereinafter referred to as a concentration period) will be described, followed by the importance (that is, a period score) of each concentration period for the search keyword. ) Is calculated (S306).

検索キーワードに対するそれぞれの集中期間の重要度(即ち、期間スコア)を算出する手順においては、次のような前提を置く。   In the procedure for calculating the importance (that is, the period score) of each concentration period for the search keyword, the following assumptions are made.

ある検索キーワードに関連するWebページを集中して閲覧していた場合、閲覧した多くのWebページに検索キーワードが含まれていた、と考えられる。   When a Web page related to a certain search keyword is being browsed in a concentrated manner, it is considered that the search keyword is included in many of the browsed Web pages.

しかし、検索キーワードを含まないが検索キーワードに関連しているWebページも存在する。   However, there are Web pages that do not include the search keyword but are related to the search keyword.

また、短期的に検索キーワードに関連せず検索キーワードを含まないWebページの閲覧に逸れ、その後、検索キーワードに関連するWebページの閲覧に戻る操作も考えられる。   In addition, an operation may be conceived in which, for a short period of time, the user browses a Web page that does not relate to the search keyword and does not include the search keyword, and then returns to browsing the Web page related to the search keyword.

検索キーワードを含むWebページを見たが、そのWebページには注目しなかったといった操作も考えられる。   An operation in which a Web page including the search keyword is viewed but the Web page is not noticed can be considered.

そこで、次のように前記集中期間を抽出(集中期間抽出)する(S103)。なお、以下では、集中期間を、コンテンツの利用時刻の重要度(あるいは、平均重要度)、もしくは、コンテンツの利用時間の重要度(あるいは、平均重要度)が連続して特定値より高い期間とする。   Therefore, the concentration period is extracted (concentration period extraction) as follows (S103). In the following, the concentration period is defined as a period in which the importance (or average importance) of content usage time or the importance (or average importance) of content usage time is continuously higher than a specific value. To do.

まず、検索キーワードkに対する任意の時刻tの重要度を、検索キーワードkに対するアクティブ期間apの重要度をアクティブ期間apの時間幅で割る(除算する)ことによって求める(式4)。   First, the importance of an arbitrary time t for the search keyword k is obtained by dividing (dividing) the importance of the active period ap for the search keyword k by the time width of the active period ap (Equation 4).

次に、検索キーワードkに対する時刻tの平均重要度を、検索キーワードkに対する[t−a,t+a]における重要度の平均として求める(式4a)(S307:平均重要度算出手段)。   Next, the average importance of the time t with respect to the search keyword k is obtained as an average of the importance in [ta, t + a] with respect to the search keyword k (Formula 4a) (S307: average importance calculation means).

そして、平均重要度がある閾値b以下であれば、検索キーワードkに関連する操作が中断されたとみなす。言い換えると、継続判定関数B(k,t)が1以上である連続した期間を、ひとつの集中期間として抽出する(式5)(S308:集中期間抽出)。例えば、図9は、平均重要度による集中期間の抽出を示す例であって、符号tm1,tm2が抽出された集中期間である。   If the average importance is equal to or less than a certain threshold value b, it is considered that the operation related to the search keyword k is interrupted. In other words, a continuous period in which the continuation determination function B (k, t) is 1 or more is extracted as one concentration period (Formula 5) (S308: concentration period extraction). For example, FIG. 9 is an example showing extraction of a concentration period based on average importance, and is a concentration period in which codes tm1 and tm2 are extracted.

ここで、一定時間幅a、閾値bは、どのように集中期間を抽出するかを調整するパラメータである。   Here, the fixed time width a and the threshold value b are parameters for adjusting how the concentration period is extracted.

一定時間幅aによって、検索キーワードkを含まないWebページを短期的に閲覧していたとしても、前後の時間帯の操作から、期間を分断せず、一つの集中期間であると、判断できる。よって、一定時間幅aの値を増減させることによって、集中期間がわずかな操作で分断されることを防ぐこと、あるいは、集中期間を細かく分断することができる。   Even if the Web page that does not include the search keyword k is browsed in a short time by the fixed time width a, it can be determined that it is a single concentration period without dividing the period from the operation in the preceding and following time zones. Therefore, by increasing or decreasing the value of the fixed time width a, the concentration period can be prevented from being divided by a slight operation, or the concentration period can be divided finely.

閾値bによって、検索キーワードkに対する重要度がある程度高い時刻でも、検索キーワードに関連する操作が中断されたとみなすことができる。   With the threshold value b, it can be considered that the operation related to the search keyword is interrupted even at a time when the importance for the search keyword k is somewhat high.

例えば(a,b)=(300,0)とすれば、10分以上検索キーワードを含むページを閲覧しなかった場合に、検索キーワードkに関連する操作が中断されたとみなすことになる。ユーザが脇道に逸れたWebページをある程度閲覧していても、一つの集中期間として抽出したい状況において有効である。(a,b)=(0,5)の場合、ユーザがキーワードに高く適合するWebページを閲覧し、かつ、印刷などの操作を集中的に起こしていた期間を一つの集中期間として抽出したい状況などにおいて有効である。   For example, if (a, b) = (300, 0), it is considered that an operation related to the search keyword k is interrupted when a page including the search keyword is not viewed for 10 minutes or more. This is effective in a situation where the user wants to extract a single concentration period even if he / she browses a web page that has deviated to a side road to some extent. When (a, b) = (0, 5), a situation in which a user browses a Web page that highly matches a keyword and wants to extract a period during which operations such as printing are intensively performed as one concentrated period It is effective in.

これらのパラメータは、抽出された集中期間を利用する情報検索端末2が、ユーザの要求に応じて変更できる。例えば、期間抽出装置1は、この一定時間幅a、閾値bを入力する手段、一定時間幅a、閾値bを記憶し管理する手段を有していても良い。更に具体的には、図9のようなグラフをGUI(Graphical User Interface)表示し、マウスなどの指示装置で一定時間幅a、閾値bをしてさせる手段を有していても良い。   These parameters can be changed by the information search terminal 2 using the extracted concentration period in response to a user request. For example, the period extracting apparatus 1 may have means for inputting the constant time width a and threshold value b and means for storing and managing the constant time width a and threshold value b. More specifically, a graph such as that shown in FIG. 9 may be displayed on a GUI (Graphical User Interface), and a certain time width a and threshold value b may be set using an instruction device such as a mouse.

なお、本実施形態では、デフォルトで(a,b)=(300,0)が設定されているとする。   In this embodiment, it is assumed that (a, b) = (300, 0) is set by default.

次に、抽出したそれぞれの集中期間ipについて、検索キーワードkに対する重要度を式6のように算出する(S309:集中期間重要度算出)。   Next, for each extracted concentration period ip, the importance for the search keyword k is calculated as in Expression 6 (S309: concentration period importance calculation).

次に、集中期間抽出部1bは、抽出した集中期間と検索キーワードに対する集中期間の重要度のリストを、抽出管理部1aに送信する(M207)。   Next, the concentration period extraction unit 1b transmits a list of the importance levels of the extracted concentration period and the concentration period for the search keyword to the extraction management unit 1a (M207).

次に、抽出管理部1aは、集中期間と検索キーワードに対する集中期間の重要度のリストに基づいて、検索キーワードに対する集中期間の重要度の高い順に集中期間をランキングし(S310:ランキング)、集中期間,集中期間の重要度,ランクを含むデータから成るリストを情報検索端末2に送信する(M208)(S104)。   Next, the extraction management unit 1a ranks the concentration periods in descending order of importance of the concentration period for the search keyword based on the concentration period and the importance level of the concentration period for the search keyword (S310: ranking), and the concentration period. , A list including data including the importance and rank of the concentration period is transmitted to the information search terminal 2 (M208) (S104).

そして、情報検索端末2の期間表示部2aは、ランキングされた集中期間を受け取ると、集中期間の検索結果画面をユーザに対して表示する(S311)(S105)。ユーザが、その集中期間の検索結果表示画面内である集中期間を選択すると、集中期間内に行われたユーザの操作結果画面を表示する(S312)。なお、図10は、集中期間の検索結果画面の表示例である。図11は、集中期間内の操作結果画面の表示例である。図10や図11の画面表示によって、ユーザは複数のWebページなどを思い出すことが出来る。   Upon receiving the ranked concentration period, the period display unit 2a of the information search terminal 2 displays a concentration period search result screen for the user (S311) (S105). When the user selects a concentration period in the search result display screen for the concentration period, the operation result screen of the user performed during the concentration period is displayed (S312). FIG. 10 is a display example of the search result screen for the concentration period. FIG. 11 is a display example of an operation result screen within the concentration period. The screen display shown in FIGS. 10 and 11 allows the user to remember a plurality of Web pages.

集中期間の検索結果画面を図10に基づいて詳細に説明する。   The search result screen during the concentration period will be described in detail with reference to FIG.

ユーザが検索キーワードを入力すると、検索キーワードに対する集中期間の重要度の高い順、あるいは開始時間順に、集中期間が表示される(図10中の画面表示D11)。それぞれの集中期間に対して、集中期間内に行われた操作の概要が提示され、どのような操作を行った集中期間かを理解できるようになっている。   When the user inputs a search keyword, the concentration periods are displayed in descending order of importance of the concentration period for the search keyword or in the order of the start time (screen display D11 in FIG. 10). For each concentration period, an overview of the operations performed during the concentration period is presented so that the user can understand what concentration period the operation was performed.

具体的には、集中期間の開始時刻と終了時刻(画面表示D12)を表示する。集中期間の開始時刻と終了時刻に張られているリンクをクリックすると、クリックした集中期間内の操作を、後述する図11のように表示する。   Specifically, the start time and end time (screen display D12) of the concentration period are displayed. When a link extending from the start time and end time of the concentration period is clicked, the operation in the clicked concentration period is displayed as shown in FIG.

また、検索キーワードに対する集中期間の重要度(画面表示D13),集中期間内にNTTレゾナント社(登録商標)の「goo」(登録商標)などのインターネット上の検索エンジンに入力された検索クエリ(画面表示D14),集中期間内に閲覧したWebページに出現する頻出名詞と未知語(画面表示D15)が表示される。さらに、集中期間における検索キーワードに対するWebページの重要度の高い上位5つのサムネイルとタイトルが表示される(画面表示D16)。検索クエリは、Webファイルテーブル1e1のインターネット上で公開されていたURLから抽出する。   In addition, the importance of the concentration period for the search keyword (screen display D13), and a search query (screen) input to a search engine on the Internet such as “goo” (registered trademark) of NTT Resonant Corporation (registered trademark) during the concentration period. Display D14), frequent nouns and unknown words (screen display D15) appearing on the Web page browsed during the concentration period are displayed. Furthermore, the top five thumbnails and titles with the highest importance of the Web page for the search keyword during the concentration period are displayed (screen display D16). The search query is extracted from the URL published on the Internet of the Web file table 1e1.

上述の集中期間の検索結果画面のようなインタフェースを利用することによって、ユーザは検索クエリに対する重要度の高い集中期間を容易に発見できる。   By using an interface such as the above-described concentration period search result screen, the user can easily find a concentration period with high importance for a search query.

また、上位にランキングされた検索キーワードに対する重要度の高い集中期間には、検索キーワードに関する多くの操作が行われている。よって、次節で説明する操作シーケンス表示インタフェースを用いて上位の集中期間内の詳細な操作を提示し、その提示をユーザが理解することによって、ユーザは効率的に体験獲得情報を想起できる。   In addition, many operations related to the search keyword are performed during a high-concentration concentration period with respect to the search keyword ranked higher. Therefore, the user can efficiently recall the experience acquisition information by presenting the detailed operation within the upper concentration period using the operation sequence display interface described in the next section and understanding the presentation by the user.

集中期間内の操作結果画面を図11に基づいて説明する。   The operation result screen within the concentration period will be described with reference to FIG.

より具体的には、アクティブ期間の遷移をWebページのサムネイルを用いて時系列に表示する。サムネイル上にマウスポインタを重ねると、拡大されたサムネイルを表示する(画面表示D21)。サムネイルを右クリックすると更に画面いっぱいに大きくサムネイルを表示する。このサムネイル表示によって、ユーザは複数のWebページの内容を発見できる。   More specifically, the transition of the active period is displayed in time series using the thumbnail of the Web page. When the mouse pointer is superimposed on the thumbnail, the enlarged thumbnail is displayed (screen display D21). Right-click on a thumbnail to display a larger thumbnail that fills the screen. With this thumbnail display, the user can discover the contents of a plurality of Web pages.

本インタフェースでは、個々のサムネイルの下にWebページのタイトルを表示する(画面表示D22)。サムネイルの上には、検索エンジンに入力した検索クエリ(画面表示D23)か、表示されているWebページに遷移するために直前のWebページ上でクリックしたアンカーテキスト(画面表示D24)を表示する。これらの画面表示によって、Webページの内容の理解を高めるだけでなく、ユーザにとってのWebページ間の関係を想起できる。   In this interface, the title of the Web page is displayed under each thumbnail (screen display D22). On the thumbnail, the search query (screen display D23) input to the search engine or the anchor text (screen display D24) clicked on the immediately preceding Web page for transition to the displayed Web page is displayed. These screen displays not only enhance understanding of the contents of the Web page, but also can recall the relationship between the Web pages for the user.

例えば、ユーザは、検索エンジンに「デジタルカメラ 薄型」と入力して薄型のデジタルカメラを探し始め、ニュースサイトでお勧めのカメラを調べた後、メーカの商品ページで詳細にスペックを調べたといった過去の操作を理解し、このWebページはこの詳細ページの商品を推薦している、といったWebページ間の関係を想起できる。   For example, in the past, a user started searching for a thin digital camera by entering “digital camera thin” into a search engine, searched for a recommended camera on a news site, and then checked the specifications in detail on the manufacturer's product page. The relationship between the Web pages can be recalled, for example, that the Web page recommends the product of the detailed page.

また、表示されているアクティブ期間のうち、検索キーワードに対するアクティブ期間の重要度の高い上位5つは赤色、次の5つは橙色の枠によって強調表示される。逆に、検索キーワードに対する重要度の低いアクティブ期間をフィルタリング操作バーを調整することで表示しないようにするフィルタリング機能を備える(画面表示D25)。注目度の高い、あるいは低いアクティブ期間を素早く理解させることによって、ユーザに体験獲得情報を効率的に想起させることができる。   Of the displayed active periods, the top five most important active periods for the search keyword are highlighted in red and the next five are highlighted in orange. Conversely, a filtering function is provided to prevent the active period with a low importance for the search keyword from being displayed by adjusting the filtering operation bar (screen display D25). By promptly understanding active periods with high or low attention, it is possible to make the user efficiently recall experience acquisition information.

サムネイルの右下端には、URL毎の番号を提示し、同じURLのWebページであるかどうかが把握できる。重複削除チェックボックスをチェックすると、同じURLを表示するアクティブ期間が複数であった場合、初回以外のアクティブ期間を表示しない。   A number for each URL is presented at the lower right corner of the thumbnail, and it is possible to grasp whether or not the web page has the same URL. When the duplicate deletion check box is checked, if there are a plurality of active periods for displaying the same URL, the active periods other than the first time are not displayed.

また、ウィンドウの新規起動や切替えを矢印でサムネイル間の矢印を用いて提示する。具体的には、同じウィンドウで遷移したアクティブ期間は矢印線でサムネイルを結び、新しいウィンドウを立ち上げた場合は<NewWindow>と書かれた矢印線でサムネイルを結び(画面表示D26)、ウィンドウを切り換えた場合は、サムネイル間に矢印線を表示しない。   In addition, a new activation or switching of a window is indicated by an arrow between thumbnails. Specifically, thumbnails are connected with arrow lines during the active period of transition in the same window, and when a new window is launched, thumbnails are connected with an arrow line written <NewWindow> (screen display D26), and the window is switched. If you do, arrow lines are not displayed between thumbnails.

また、上述の各々の機能は、チェックボックスで表示または非表示を選択できる。   In addition, each function described above can be displayed or hidden by a check box.

例えば、本を読んでいるときに重要な箇所に鉛筆などで線を引く人は多い。このような操作に対応するために、サムネイルの横に表示された吹き出し(画面表示D27)は、Webページを閲覧中に選択したテキスト情報を表している。Webページ内の重要と考えた文章を理解することにより、効率的にWebページから得た知識を想起できる。   For example, many people draw lines with a pencil or the like at important points when reading a book. In order to cope with such an operation, a balloon (screen display D27) displayed next to the thumbnail represents text information selected while browsing the Web page. By understanding the sentences considered important in the Web page, knowledge obtained from the Web page can be efficiently recalled.

以上のように、本実施形態における期間抽出装置は、検索キーワードに対する時刻の重要度を求め、次に、検索キーワードに対する該時刻の前後の時刻の重要度から、検索キーワードに対する該時刻の平均重要度を求め、検索キーワードに対する該時刻の平均重要度が連続して高い期間を抽出する。   As described above, the period extracting apparatus according to the present embodiment obtains the importance of the time for the search keyword, and then calculates the average importance of the time for the search keyword from the importance of the time around the search keyword. And a period in which the average importance of the time with respect to the search keyword is continuously high is extracted.

また、図1の情報検索端末2に、ユーザが入力する検索キーワードkに対する時刻tの重要度を積算し、期間の重要度を算出する。   Moreover, the importance of the time t with respect to the search keyword k input by the user is integrated in the information search terminal 2 of FIG. 1 to calculate the importance of the period.

また、期間抽出装置上のメッセージ電文および、期間抽出装置上で作動しているプログラムとの通信を利用して、ユーザの期間抽出装置を操作した操作履歴を多種類取得し記録する。   In addition, by using communication with a message message on the period extracting device and a program operating on the period extracting device, various types of operation histories of the user operating the period extracting device are acquired and recorded.

また、ユーザがひとつのウィンドウでひとつのコンテンツをアクティブに表示していた期間(アクティブ期間)を抽出し、アクティブ期間が注目された強さをしめす注目度を算出する。   In addition, a period of time during which the user is actively displaying one content in one window (active period) is extracted, and a degree of attention that indicates how much the active period has attracted attention is calculated.

また、検索キーワードに対するアクティブ期間の重要度を算出する。   Also, the importance of the active period for the search keyword is calculated.

また、検索キーワードに対するアクティブ期間の重要度から、検索キーワードに対する時刻の重要度を求める。   Further, the importance of the time for the search keyword is obtained from the importance of the active period for the search keyword.

そして、期間スコアを利用して抽出した期間をランキングし、要求元に送信する。   Then, the extracted periods are ranked using the period score and transmitted to the request source.

本実施形態における期間抽出装置によれば、適切な検索キーワードがわからなく、過去に閲覧したにも関わらず、閲覧したことのあるファイルを見つけられない場合でも、検索キーワード要求に適合する集中期間を抽出し、その後、操作期間に含まれるファイルを確認することで、従来では見つけることが困難であったファイルを発見できる。   According to the period extraction device in the present embodiment, even when a suitable search keyword is not known and a file that has been browsed cannot be found despite browsing in the past, a concentration period suitable for the search keyword request can be obtained. By extracting and then checking the files included in the operation period, it is possible to find files that were difficult to find in the past.

また、なにかのテーマについて調査した場合など、同時期に発見した複数のファイルを発見したいとき、集中期間を検索することによって、短時間に複数ファイルを一気に発見することができる。   Also, if you want to find multiple files discovered at the same time, such as when investigating some theme, you can find multiple files at once by searching the concentration period.

なお、本実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のCPU(Central Processing Unit)(あるいはMPU(Microprocessing Unit))が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、実現できる。その場合、記憶媒体から読み出されたプログラムコード自体が上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体、例えば、CD−ROM(Compact Disk Read Only Memory)、DVD−ROM(Digital Versatile Disk Read Only Memory)、CD−R(Compact Disk Recordable)、CD−RW(Compact Disk ReWritable)、MO(Magneto−Optical disk)、HDD(Hard Disk Drive)等は本発明を構成する。   Note that a storage medium that records a program code of software that realizes the functions of the present embodiment is supplied to a system or apparatus, and a CPU (Central Processing Unit) (or MPU (Microprocessing Unit)) of the system or apparatus stores the storage medium. This can also be realized by reading out and executing the program code stored in. In that case, the program code itself read from the storage medium realizes the functions of the above-described embodiment, and a storage medium storing the program code, for example, a CD-ROM (Compact Disk Read Only Memory), DVD-ROM (Digital Versatile Disk Read Only Memory), CD-R (Compact Disk Recordable), CD-RW (Compact Disk ReWriteable), MO (Magneto-Optical Disk), MO (Magneto-Optical Disk) To do.

以上、本発明の実施形態について説明したが、本発明は説明した実施形態に限定されるものでなく、各請求項に記載した範囲において各種の変形を行うことが可能である。   Although the embodiments of the present invention have been described above, the present invention is not limited to the described embodiments, and various modifications can be made within the scope described in each claim.

例えば、期間抽出装置は、一定時間幅a、閾値bを情報検索端末から受け取り、受け取った一定時間幅a、閾値bを、式4aおよび式5に適用することによって、集中期間の抽出を行うこともできる。   For example, the period extraction device receives the fixed time width a and the threshold value b from the information search terminal, and extracts the concentration period by applying the received fixed time width a and the threshold value b to the equations 4a and 5. You can also.

また、メールの閲覧操作に対してWebの閲覧操作と同様に、アクティブ期間の抽出、アクティブ期間の注目度の算出、検索キーワードに対するアクティブ期間の重要度の算出、集中機関の抽出、および検索キーワードに対する集中期間の重要度の算出を行うこともできる。   Similarly to the Web browsing operation for mail browsing operations, the extraction of the active period, the calculation of the attention level of the active period, the calculation of the importance of the active period for the search keyword, the extraction of the centralized organization, and the search keyword It is also possible to calculate the importance of the concentration period.

アクティブ期間の抽出、およびアクティブ期間の注目度の算出は、期間抽出装置のCPU(例えば、パーソナルコンピュータのCPU)が、他のプログラムに利用されていない時間に行い、アクティブ期間の抽出およびアクティブ期間の注目度の算出結果を保存しておくこともできる。   The extraction of the active period and the calculation of the attention level of the active period are performed at a time when the CPU of the period extracting device (for example, the CPU of the personal computer) is not used by other programs. It is also possible to save the attention level calculation result.

アクティブ期間apに表示されているWebページの検索キーワードkに対するコンテンツ適合度R(k,ap)を、操作履歴取得部が取得し記録したすべてのWebページをWebページ集合としたアクティブ期間apに表示されているWebページのTF−IDF値を用いる(式3)ことに加え、Webページの作者情報に検索キーワードが含まれていれば、そのコンテンツ適合度をさらに高くすることもできる。   The content suitability R (k, ap) for the search keyword k of the Web page displayed during the active period ap is displayed during the active period ap where all Web pages acquired and recorded by the operation history acquisition unit are Web page sets. In addition to using the TF-IDF value of the Web page being used (Formula 3), if the search keyword is included in the author information of the Web page, the content suitability can be further increased.

期間抽出装置は、上述の情報検索端末と期間抽出装置間のデータ伝送を情報検索端末内で行うことができれば、情報検索端末(入力手段と期間表示部を有するクライアント装置)と期間抽出装置(サーバ装置)を通信線で接続して構成しても良い。   If the period extraction device can perform data transmission between the information retrieval terminal and the period extraction device in the information retrieval terminal, the information retrieval terminal (client device having an input means and a period display unit) and the period extraction device (server) Apparatus) may be connected by a communication line.

期間抽出装置をサーバ装置とする場合には、集中期間に応じたWebページが判るため、ユーザの嗜好調査に使うこともできる。   When the period extracting device is a server device, a Web page corresponding to the concentration period is known, and can be used for a user preference survey.

本実施形態における期間抽出装置の構成図。The lineblock diagram of the period extraction device in this embodiment. ファイル属性情報DBの有する各テーブルの一例を示す図。The figure which shows an example of each table which file attribute information DB has. 操作履歴DBの有する各テーブルの一例を示す図。The figure which shows an example of each table which operation history DB has. 本実施形態における期間抽出方法の概要を示すフローチャート。The flowchart which shows the outline | summary of the period extraction method in this embodiment. 本実施形態における期間抽出装置が操作履歴を取得し記録する手順を示すシーケンス図。The sequence diagram which shows the procedure in which the period extraction apparatus in this embodiment acquires and records operation history. 本実施形態における期間抽出装置が期間抽出する手順を示すシーケンス図。The sequence diagram which shows the procedure which the period extraction apparatus in this embodiment extracts a period. アクティブ期間の注目度を算出する例を示す図。The figure which shows the example which calculates the attention degree of an active period. HTMLタグによる重み付け係数の一例を示す図。The figure which shows an example of the weighting coefficient by an HTML tag. 平均重要度による集中期間の抽出例を示す図。The figure which shows the example of extraction of the concentration period by average importance. 集中期間の検索結果画面の表示例を示す図。The figure which shows the example of a display of the search result screen of a concentration period. 集中期間内の操作結果画面の表示例を示す図。The figure which shows the example of a display of the operation result screen within a concentration period.

符号の説明Explanation of symbols

1…期間抽出装置
1a…抽出管理部
1aa…コンテンツ解析部
1b…集中期間抽出部
1c…コンテンツ利用時刻抽出部
1d…コンテンツ適合度解析部
1e…ファイル属性情報DB
1e1…Webファイルテーブル
1e2…メールファイルテーブル
1f…操作履歴DB
1f1…Webアクティブ期間テーブル
1f2…メールアクティブ期間テーブル
1f3…IME入力テーブル
1f4…印刷テーブル
1g…操作履歴取得部
1h1…過去に閲覧したファイル
1h2…過去に閲覧したメール
2…情報探索端末
2a…期間表示部
2b…ブラウザ
2c…OS
2d…入力部
50…ユーザ
100…ネットワーク
P1…IMEポイント
P2…印刷ポイント
P3…閲覧時間ポイント
tm1,tm2…集中期間
Act…アクティブ期間
Atp…アクティブ期間の注目度
w1…重み付け係数
w2…HTMLタグによる重み付け係数
D11〜D16,D21〜D27…表示画面
DESCRIPTION OF SYMBOLS 1 ... Period extraction apparatus 1a ... Extraction management part 1aa ... Content analysis part 1b ... Concentration period extraction part 1c ... Content utilization time extraction part 1d ... Content compatibility analysis part 1e ... File attribute information DB
1e1 ... Web file table 1e2 ... Mail file table 1f ... Operation history DB
1f1 ... Web active period table 1f2 ... Mail active period table 1f3 ... IME input table 1f4 ... Print table 1g ... Operation history acquisition unit 1h1 ... Files browsed in the past 1h2 ... Mails browsed in the past 2 ... Information search terminal 2a ... Period display Part 2b ... Browser 2c ... OS
2d ... Input unit 50 ... User 100 ... Network P1 ... IME point P2 ... Print point P3 ... Browsing time point tm1, tm2 ... Concentration period Act ... Active period Atp ... Attention level of active period w1 ... Weighting coefficient w2 ... Weighting by HTML tag Coefficients D11 to D16, D21 to D27 ... Display screen

Claims (4)

入力された検索キーワードに対応したコンテンツの操作された期間を抽出する期間抽出装置であって、
前記コンテンツを特定する属性情報を管理するコンテンツ属性情報管理手段と、
前記コンテンツに対して行った操作履歴情報を管理する操作履歴情報管理手段と、
前記操作履歴管理情報手段から読み出された操作履歴情報により、前記コンテンツのアクティブ期間を抽出し、該アクティブ期間内にユーザが行った操作から、操作種別毎に応じて重み付けされた操作ポイントを積算することで前記コンテンツの該アクティブ期間における注目度を算出し、前記コンテンツ属性情報管理手段から読み出された属性情報により、前記アクティブ期間中に表示されているコンテンツに対する前記検索キーワードのコンテンツ適合度を算出し、前記アクティブ期間の注目度と検索キーワードに対するコンテンツ適合度とを乗算して前記検索キーワードに対応した前記コンテンツのアクティブ期間の重要度を求めるコンテンツ解析部と、
前記検索キーワードに対応した前記コンテンツのアクティブ期間の重要度を当該アクティブ期間の時間幅で除算することで、当該検索キーワードに対する時刻ごとの重要度を求め、求めた時刻ごとの重要度に対する一定の時間幅の平均値を当該検索キーワードに対する時刻ごとの平均重要度として求め、求めた時刻ごとの平均重要度が連続して特定値より高い期間をひとつの集中期間として抽出する集中期間抽出部と、
を備えることを特徴とする期間抽出装置。
A period extraction device that extracts an operated period of content corresponding to an input search keyword,
Content attribute information management means for managing attribute information specifying the content;
Operation history information management means for managing operation history information performed on the content;
Based on the operation history information read from the operation history management information means, the active period of the content is extracted, and the operation points weighted according to the operation type are accumulated from the operations performed by the user within the active period. Thus, the degree of attention of the content during the active period is calculated, and the content suitability of the search keyword with respect to the content displayed during the active period is determined based on the attribute information read from the content attribute information management means. A content analysis unit that calculates and calculates the importance of the active period of the content corresponding to the search keyword by multiplying the attention level of the active period and the content suitability for the search keyword
By dividing the importance of the active period of the content corresponding to the search keyword by the time width of the active period, the importance for each time for the search keyword is obtained, and a certain time with respect to the obtained importance for each time A concentration period extraction unit that calculates an average value of the width as an average importance for each time for the search keyword, and extracts a period in which the average importance for each time obtained is continuously higher than a specific value as one concentration period;
A period extracting device comprising:
請求項1に記載の期間抽出装置であって、
前記検索キーワードに対する時刻ごとの重要度を、集中期間の時間幅で積分し、前記集中期間における重要度を算出する集中期間重要度算出手段と、
前記集中期間と前記集中期間に応じた重要度に基づいて、該集中期間の重要度の順に集中期間をランキングするランキング手段と、
を備えることを特徴とする期間抽出装置。
The period extracting device according to claim 1,
Concentration period importance calculation means for integrating the importance for each time for the search keyword with the time width of the concentration period and calculating the importance in the concentration period;
Ranking means for ranking the concentration periods in the order of importance of the concentration period based on the concentration period and the importance according to the concentration period;
A period extracting device comprising:
請求項1または2に記載の期間抽出装置を構成する各手段としてコンピュータを機能させるための期間抽出プログラム。 The period extraction program for functioning a computer as each means which comprises the period extraction apparatus of Claim 1 or 2 . 請求項3に記載の期間抽出プログラムを格納した、コンピュータ読み取り可能な記録媒体。 A computer-readable recording medium storing the period extracting program according to claim 3 .
JP2006299171A 2006-11-02 2006-11-02 Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program Active JP4610543B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006299171A JP4610543B2 (en) 2006-11-02 2006-11-02 Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006299171A JP4610543B2 (en) 2006-11-02 2006-11-02 Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program

Publications (2)

Publication Number Publication Date
JP2008117134A JP2008117134A (en) 2008-05-22
JP4610543B2 true JP4610543B2 (en) 2011-01-12

Family

ID=39503000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006299171A Active JP4610543B2 (en) 2006-11-02 2006-11-02 Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program

Country Status (1)

Country Link
JP (1) JP4610543B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8832098B2 (en) * 2008-07-29 2014-09-09 Yahoo! Inc. Research tool access based on research session detection
JP5379517B2 (en) * 2009-02-26 2013-12-25 ニフティ株式会社 Advertisement distribution information processing method and apparatus
JP5127066B2 (en) * 2009-03-02 2013-01-23 日本電信電話株式会社 Window operation activity detection device, window operation activity detection method, and program
CN102760124B (en) * 2011-04-25 2014-11-12 阿里巴巴集团控股有限公司 Pushing method and system for recommended data
JP6392578B2 (en) * 2014-08-11 2018-09-19 オリンパス株式会社 Audio processing apparatus, audio processing method, and audio processing program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312513A (en) * 2000-02-21 2001-11-09 Sony Corp Information processing system, information processing method, and program housing medium
JP2004348550A (en) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for managing browsing history
JP2006146621A (en) * 2004-11-19 2006-06-08 Nec Corp Information management device and method, and information management program
JP2006185164A (en) * 2004-12-27 2006-07-13 Nippon Telegr & Teleph Corp <Ntt> Retrieval method and retrieval device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3579111B2 (en) * 1995-03-16 2004-10-20 株式会社東芝 Information processing equipment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312513A (en) * 2000-02-21 2001-11-09 Sony Corp Information processing system, information processing method, and program housing medium
JP2004348550A (en) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for managing browsing history
JP2006146621A (en) * 2004-11-19 2006-06-08 Nec Corp Information management device and method, and information management program
JP2006185164A (en) * 2004-12-27 2006-07-13 Nippon Telegr & Teleph Corp <Ntt> Retrieval method and retrieval device

Also Published As

Publication number Publication date
JP2008117134A (en) 2008-05-22

Similar Documents

Publication Publication Date Title
RU2335013C2 (en) Methods and systems for improving search ranging with application of information about article
US7788274B1 (en) Systems and methods for category-based search
US7664734B2 (en) Systems and methods for generating multiple implicit search queries
US7693825B2 (en) Systems and methods for ranking implicit search results
US8280878B2 (en) Method and apparatus for real time text analysis and text navigation
CA2560687C (en) Systems and methods for weighting a search query result
US7747611B1 (en) Systems and methods for enhancing search query results
US7363294B2 (en) Indexing for contextual revisitation and digest generation
JP6116247B2 (en) System and method for searching for documents with block division, identification, indexing of visual elements
US20080294619A1 (en) System and method for automatic generation of search suggestions based on recent operator behavior
US20090276408A1 (en) Systems And Methods For Generating A User Interface
US9361375B2 (en) Building a research document based on implicit/explicit actions
US20100031190A1 (en) System and method for copying information into a target document
JP5425906B2 (en) Access to research tools based on detection of research sessions
US20100030765A1 (en) Automatic generation of attribution information for research documents
US8775465B2 (en) Automatic updating of content included in research documents
JP4610543B2 (en) Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program
JP2010128928A (en) Retrieval system and retrieval method
JP2006099341A (en) Update history generation device and program
US20090113281A1 (en) Identifying And Displaying Tags From Identifiers In Privately Stored Messages
JP4469432B2 (en) INTERNET INFORMATION PROCESSING DEVICE, INTERNET INFORMATION PROCESSING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
US8612431B2 (en) Multi-part record searches
Teevan et al. How people find personal information
JP4509918B2 (en) Information retrieval method and apparatus, and computer-readable recording medium
JP2009205588A (en) Page search system and program

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090609

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100514

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100824

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101012

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4610543

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350