이하에서는, 첨부된 도면을 참조하여 본 발명에 따른 사용자의 관심 키워드를 업데이트 하는 방법과 상기 방법을 수행하기 위한 시스템을 설명한다.
키워드 검색 서비스를 제공하는 정보 검색 시스템은 사용자로부터 검색 키워드가 입력되면 상기 검색 키워드를 포함하는 웹 사이트, 상기 검색 키워드를 포 함하는 기사, 상기 검색 키워드를 포함하는 파일명 등 적어도 하나의 컨텐츠를 상기 검색 키워드에 대한 검색 결과로 제공한다.
본 발명에 따른 정보 검색 시스템은 사용자의 관심 대상에 따른 키워드를 추천하고 다양한 컨텐츠를 안내하기 위하여 사용자의 검색 키워드를 근거로 추천하고자 하는 관심 키워드 목록을 업데이트 하여 제공한다.
특히, 본 발명은 사용자의 검색 키워드에 해당하는 연관 카테고리를 결정하고 상기 연관 카테고리를 이용하여 상기 관심 키워드 목록을 생성하는 관심 키워드 업데이트 방법을 제공한다.
이에 더해, 본 발명은 사용자가 최근 검색을 수행한 검색 키워드 즉, 최신 로그에 가중치를 부여하고 상기 가중치의 크기에 따라 최신 로그에 해당하는 검색 키워드를 이용하여 상기 관심 키워드 목록을 생성하는 관심 키워드 업데이트 방법을 제공한다.
도1을 참조하여, 연관 카테고리를 이용한 관심 키워드 업데이트 방법을 자세하게 설명한다. 도1은 연관 카테고리를 이용한 관심 키워드 업데이트 방법의 전 과정을 도시한 도면이다.
단계(S101)에서 정보 검색 및 관심 키워드 업데이트 시스템은 사용자가 입력한 검색 키워드와 연관되는 적어도 하나의 연관 키워드를 획득한다. 상기 연관 키워드는 단어 간의 연관도를 기초로 획득할 수 있다.
단어 간의 연관도에 대하여 수치화된 연관도 측정 방법을 상세하게 설명한다.
상기 단어 간의 연관도를 측정하기 위해서는 문서 집합이 포함하는 단어, 문서, 상기 단어에 대한 단어 분류 또는 상기 문서에 대한 문서 분류를 통해 단어 통계 정보를 획득한다.
이어, 상기 획득한 단어 통계 정보를 정형화하는데, 이때, 상기 단어 통계 정보를 다차원 벡터 집합, 실수형 랜덤변수 집합, 랜덤변수의 결합확률분포 또는 이산 랜덤변수 집합으로 정형화할 수 있다.
다음 (1) 내지 (4) 중 어느 하나의 방법을 이용하여 상기 단어 통계 정보를 정형화할 수 있다.
(1) 상기 단어, 상기 문서, 상기 단어분류 또는 상기 문서분류를 다차원 공간의 독립된 각 차원을 갖는 상기 다차원 벡터 집합의 열(column)로서 설정하고, 상기 단어를 각각 상기 다차원 공간의 벡터와 대응시켜 상기 다차원 벡터 집합의 행(row)으로서 설정함으로써 상기 단어 통계 정보를 정형화한다.
(2) 상기 단어, 상기 문서, 상기 단어분류 또는 상기 문서분류를 상기 실수형 랜덤변수 집합의 열로서 설정하고, 상기 단어를 각각 실수값을 갖는 랜덤변수와 대응시켜 상기 실수형 랜덤변수 집합의 행으로서 설정함으로써 상기 단어 통계 정보를 정형화한다.
(3) 상기 결합확률분포로의 정형화 방법은 상기 단어에 대한 단어쌍마다 두 단어가 함께 등장한 문서의 개수, 상기 두 단어가 모두 등장하지 않는 문서의 개수 및 상기 두 단어가 각각 따로 등장하는 문서의 개수인 단어-단어 결합빈도에 기초하여 상기 단어쌍마다 대응되는 랜덤변수의 결합확률분포를 생성하여 상기 단어 통 계 정보를 정형화한다. 이때, 단어쌍마다 대응되는 결합확률분포가 존재할 수 있고 상기 랜덤변수는 상기 단어의 발생 또는 비발생 사건만을 포함하는 행과 열의 사건 공간 상에서 정의될 수 있다.
(4) 이산 랜덤변수 집합으로의 정형화 방법은 상기 단어를 랜덤변수가 정의된 사건 공간의 독립된 각 사건을 의미하도록 이산 랜덤변수 집합의 열로서 설정하고, 상기 단어를 이산 랜덤변수를 의미하도록 상기 이산 랜덤변수 집합의 행으로서 설정함으로써 상기 단어 통계 정보를 정형화한다. 이러한 상기 이산 랜덤변수는 상기 단어가 다른 단어와 같이 등장한 문서의 개수인 교차빈도를 이용하여 생성될 수 있고, 상기 이산 랜덤변수 집합의 각 빈도값은 임의의 문서에 존재하는 하나의 단어(행)에 대해 다른 단어(열)가 존재할 확률과 대응할 수 있다.
상기 정형화된 단어 통계 정보에 기초하여 상기 단어 간의 단어 연관도를 측정한다. 이때, 상기 다차원 벡터 집합으로 정형화된 단어 통계 정보에 기초하는 경우, 상기 다차원 벡터 집합의 두 벡터에 대한 임버스 L p , 코사인 계수, 확장된 다이스 계수, 확장된 자카드 계수 또는 상관관계를 계산하여 상기 단어 연관도로서 측정할 수 있다.
한편, 상기 실수형 랜덤변수 집합으로 정형화된 단어 통계 정보에 기초하는 경우, 상기 실수형 랜덤변수 집합의 두 랜덤변수에 대해 퍼슨 상관 계수 또는 일관성을 계산하여 상기 단어 연관도로서 측정할 수 있다.
이에 더해, 상기 결합확률분포로 정형화된 단어 통계 정보에 기초하는 경 우, 두 랜덤변수에 대해 상기 결합확률분포를 이용하여 자카드 계수, 다이스 계수, 오즈비, 상호정보 또는 사건별 상호정보를 계산하여 상기 단어 연관도로서 측정할 수 있다.
마지막으로, 상기 이산 랜덤변수 집합으로 정형화된 단어 통계 정보에 기초하는 경우, 이산 랜덤변수 집합의 열이 포함하는 각 단어를 랜덤변수가 정의된 사건 공간의 독립된 각 사건으로 설정하고 상기 이산 랜덤변수 집합의 행이 포함하는 각 단어를 이산 랜덤변수로 설정할 수 있으며, 이러한 이산 랜덤변수 집합을 이용하여 상기 단어 연관도를 측정할 수 있다.
이와 같이, 상기 문서 집합과 연관된 단어, 문서, 단어분류 또는 문서분류간의 다양한 특징에 따른 빈도를 측정하여 단어 통계 정보를 생성하고 벡터, 랜덤변수, 결합확률분포 등을 이용하여 상기 단어 통계 정보를 정형화하고 해석함으로써 상기 단어 사이의 관계에 대해 수치화된 단어 연관도를 측정할 수 있다. 뿐만 아니라, 상기 단어 간의 교차빈도를 이산 랜덤변수 집합으로 이용하여 상기 단어 간의 서로 비대칭적인 단어 연관도를 측정할 수도 있다.
상기 단어 연관도 측정 과정을 통해 측정된 단어 간의 연관도를 기초로 상기 검색 키워드와 연관되는 연관 키워드들을 획득할 수 있다.
단계(S102)에서 정보 검색 및 관심 키워드 업데이트 시스템은 상기 단계(S101)에서 획득한 상기 연관 키워드 각각에 대하여 카테고리를 분류한다. 상기 각 연관 키워드에 대하여 카테고리를 분류하는 방식은 광고단어를 구매하는 광고주의 구매 데이터(이하, '광고주 데이터'라 칭함) 또는 검색엔진이나 쇼핑사이트에서 의 사용자의 검색 데이터(이하, '사용자 데이터'라 칭함)를 바탕으로 이루어진다.
여기서, 상기 광고주 데이터에 의한 카테고리 분류는 동일한 광고주는 동일한 카테고리의 광고단어를 구매한다는 원칙을 적용한다. 한편, 상기 사용자 데이터에 의한 카테고리 분류는 검색엔진이나 쇼핑 사이트를 통해 사용자들이 검색 키워드를 입력하고 가장 많이 선택한 카테고리를 해당 단어의 카테고리로 지정하는 방식을 적용한다.
단계(S103)에서 정보 검색 및 관심 키워드 업데이트 시스템은 상기 단계(S102)에서 각 연관 키워드마다 분류한 상기 카테고리에 대하여 해당 연관 키워드에 대한 카테고리 연관도를 산출한다.
이때, 상기 광고주 데이터에 의하여 카테고리를 분류할 경우, 각 카테고리 별로 10개 내지 20개의 광고단어를 수작업으로 선택하여 입력한 후, 나머지 모든 광고단어는 상기 원칙에 의거해서 하나의 광고단어가 특정 카테고리에 속하는 확률을 계산함으로써 카테고리 별 연관도를 산출할 수 있다.
한편, 상기 사용자 데이터에 의하여 카테고리를 분류할 경우, 검색 키워드에 대한 검색결과에서 사용자들이 상기 검색 키워드의 카테고리로 특정 카테고리를 선택하는 확률을 계산함으로써 카테고리 별 연관도를 산출할 수 있다.
단계(S104)에서 정보 검색 및 관심 키워드 업데이트 시스템은 상기 단계(S103)에서 산출된 상기 카테고리 별 연관도를 기초로 상기 검색 키워드에 해당하는 연관 카테고리를 결정할 수 있다.
도2는 연관 키워드 별로 카테고리를 분류하고 카테고리 연관도를 연산하는 과정을 설명하기 위해 '카메라'에 해당하는 검색 키워드를 일례로 연관 키워드 및 카테고리 분류표를 도시한 도면이다.
카메라(201)라는 검색 키워드와 연관되는 단어로는 단어 간의 연관도에 따라 디카, 렌즈, 삼각대, 폴라로이드 카메라 등 수많은 연관 키워드(202)들이 결정될 수 있다.
그리고, 상기 광고주 데이터 또는 사용자 데이터를 이용하여 상기 연관 키워드(202) 각각에 대한 카테고리(203)를 분류한다. 이때, 하나의 연관 키워드(202)에 대하여 적어도 하나 이상의 카테고리(203)가 존재하며 각 카테고리는 상기 광고주 데이터 또는 사용자 데이터에 의해 확률 즉, 연관도(204)가 결정된다.
예를 들어, 카메라(201)의 연관 키워드(202)인 '디카'는 가전/카메라/디지털 카메라, 가전/카메라/카메라용품 등의 카테고리(203)로 분류될 수 있으며 상기 가전/카메라/디지털 카메라의 카테고리와 가전/카메라/카메라용품의 카테고리는 상기 광고주 데이터 또는 사용자 데이터에 따라 서로 다른 연관도(204)를 가질 수 있다.
이와 같이, 카메라(201)에 해당하는 각 연관 키워드(202)마다 카테고리(203)를 분류하고 분류된 각 카테고리의 연관도(204)를 산출한다.
이어, 상기 각 연관 키워드(202)에 대하여 분류된 카테고리(203)를 동일 카테고리 별로 연관도(204)를 합산한다. 도2에 의하면, 동일 카테고리 별로, (1) 가전/카메라/디지털카메라 = 0.8+0.2+0.10 = 1.10, (2) 가전/카메라/카메라용품 = 0.15+0.1+0.7 = 0.95, (3) 가전/카메라/카메라렌즈 = 0.6 와 같이 각 카테고리의 연관도를 합산할 수 있다.
상기 카메라(201)와 연관된 카테고리로는 가전/카메라/디지털카메라, 가전/카메라/카메라용품, 가전/카메라/카메라렌즈 등이 있음을 알 수 있다.
상기 단계(S104)는 상기 합산된 연관도가 가장 큰 값을 가지는 카테고리를 상기 검색 키워드의 연관 카테고리로 결정하는 것이 바람직하다.
단계(S105)에서 정보 검색 및 관심 키워드 업데이트 시스템은 상기 단계(S104)에서 결정된 연관 카테고리에 속하는 키워드를 읽어와 상기 연관 카테고리에 속한 키워드를 상기 사용자에게 추천하기 위한 관심 키워드 목록으로 생성하여 제공한다.
단계(S106)에서 정보 검색 및 관심 키워드 업데이트 시스템은 상기 단계(S105)에서 제공한 관심 키워드 목록 중 특정 관심 키워드를 선택하면 상기 선택된 관심 키워드에 관련된 적어도 하나의 컨텐츠를 제공한다.
도3은 정보 검색 및 관심 키워드 업데이트 시스템의 사용자 인터페이스 화면으로, 관심 키워드 목록 및 특정 관심 키워드에 관련된 컨텐츠를 제공하기 위한 사용자 인터페이스 화면의 일례를 도시한 도면이다.
도3의 사용자 인터페이스 화면은, 수신 항목(301)과, 사용자 메뉴(302)와, 컨텐츠 표시 영역(303)(304)(305)과, 관심 키워드 목록(306)을 포함한다.
상기 수신 항목(301)은 뉴스, 블로그, 웹 페이지, 이미지, 지식 쇼핑, 동영상, 도서 정보, 지역 정보 등을 포함할 수 있다.
상기 사용자 메뉴(302)는 상기 사용자 인터페이스 화면에 대한 레이아웃을 사용자가 직접 변경 또는 편집하기 위한 메뉴 구성이다.
상기 컨텐츠 표시 영역(303)(304)(305)은 상기 수신 항목 각각에 관련된 컨텐츠를 표시하는 영역을 의미한다. 여기서, 상기 컨텐츠 표시 영역(303)은 상기 수신 항목 중 지식쇼핑에 해당하는 컨텐츠를 표시하는 것으로 특정 관심 키워드를 포함하는 지식쇼핑 리스트를 제공할 수 있다. 상기 컨텐츠 표시 영역(304)은 상기 수신 항목 중 검색광고에 해당하는 컨텐츠를 표시하는 것으로 특정 관심 키워드를 포함하는 관련광고 리스트를 제공할 수 있다. 상기 컨텐츠 표시 영역(305)는 상기 수신 항목 중 웹 페이지에 해당하는 컨텐츠를 표시하는 것으로 특정 관심 키워드를 포함하는 웹 페이지 목록을 제공할 수 있다.
상기 관심 키워드 목록(306)은 사용자의 검색 키워드를 근거로 업데이트 되는 키워드를 포함하는 것으로, 도2의 관심 키워드 업데이트 방법에 의하면 상기 검색 키워드에 대한 연관 카테고리를 통해 생성된 관심 키워드로 구성된다.
도4는 도3의 사용자 인터페이스 화면에 대한 사용자 환경을 설정하기 위한 사용자 설정화면의 일례를 도시한 도면이다.
도4의 사용자 설정화면은 키워드 입력메뉴(401)와, 리스트 생성메뉴(402)와, 수신항목 선택메뉴(403)와, 수신형태 선택메뉴(404)와, 업데이트 환경 설정메뉴(405)를 포함한다.
상기 키워드 입력메뉴(401)는 관심 키워드를 입력하기 위한 메뉴로, 상기 사용자 인터페이스 화면에서 제공하는 관심 키워드 목록(306)의 관심 키워드를 선택하지 않고 사용자가 상기 키워드 입력메뉴(401)를 통해 직접 관심 키워드를 입력할 수도 있다.
상기 리스트 생성메뉴(402)는 적어도 하나의 관심 키워드를 선택하여 관심 키워드 리스트를 생성하기 위한 메뉴로서, 상기 관심 키워드 리스트는 상기 키워드 입력메뉴(401)를 통해 직접 관심 키워드를 입력하거나 상기 도3의 관심 키워드 목록(306)에서 특정 관심 키워드를 선택하여 구성할 수도 있다.
상기 수신항목 선택메뉴(403)는 상기 사용자 인터페이스 화면 상에 노출되는 수신항목을 선택하기 위한 메뉴이다. 이때, 상기 수신항목 선택메뉴(403)를 통해 선택된 수신 항목에 한하여 상기 도3의 사용자 인터페이스 화면의 수신항목(301) 및 컨텐츠 표시 영역(303)(304)(305)을 제공한다.
상기 수신형태 선택메뉴(404)는 상기 관심 키워드 목록(306)과 컨텐츠 표시 영역(303)(304)(305)을 포함한 도3의 사용자 인터페이스 화면을 수신하는 수단(예를 들어, E-mail, 웹 사이트, 이동 단말기 등)을 선택하기 위한 메뉴이다.
상기 업데이트 환경 설정메뉴(405)는 상기 관심 키워드 목록(306) 및/또는 컨텐츠 표시 영역(303)(304)(305)에 대한 업데이트 설정환경(자동 업데이트, 수동 업데이트)을 설정하기 위한 메뉴이다.
상기 사용자 인터페이스 화면 상에서 사용자가 상기 관심 키워드 목록(306) 중 특정 관심 키워드를 선택하면 상기 컨텐츠 표시 영역(303)(304)(305)에 상기 선택된 관심 키워드에 관련된 컨텐츠를 수신 항목 별로 각각 디스플레이 한다. 이때, 상기 컨텐츠 표시 영역(303)(304)(305)은 사용자로부터 상기 수신항목 선택메뉴(403)를 통해 선택된 수신 항목에 한하여 컨텐츠 구성이 이루어질 수도 있다.
상기 컨텐츠 표시 영역(303)(304)(305)은 사용자가 선택한 관심 키워드와 관련 있는 관련 광고를 디폴트로 포함할 수도 있으며, 이때, 상기 관련 광고는 상기 관심 키워드와 관련 있는 지식 쇼핑 리스트 및/또는 검색 광고 리스트에 해당하는 광고를 포함할 수도 있다
한편, 도5를 참조하여 최신 로그를 이용한 관심 키워드 업데이트 방법을 자세하게 설명한다. 도5는 최신 로그를 이용한 관심 키워드 업데이트 방법의 전 과정을 도시한 도면이다.
단계(S501)에서 정보 검색 및 관심 키워드 업데이트 시스템은 기 설정된 최근 기록 기간 동안 키워드 검색 서비스를 이용한 사용자의 최근 키워드 검색 내역을 기록한다. 이때, 상기 사용자의 최근 키워드 검색 내역은 상기 최근 기록 기간 동안 사용자가 입력한 검색 키워드와 상기 검색 키워드를 입력한 검색 시간을 포함한다.
단계(S502)에서 정보 검색 및 관심 키워드 업데이트 시스템은 상기 최근 기록 기간에 기록된 검색 키워드 별로 가중치를 부여한다.
상기 검색 키워드 별 가중치는 이하 수학식 1과 같이 정의할 수 있다.
(여기서, W는 가중치, Ta는 최근 기록 기간, Tb는 현재 시간, Tc는 검색 시간)
상기 수학식 1에 의하면, 상기 검색 시간이 최근일수록 상기 검색 키워드에 대한 가중치(W)가 커지게 됨을 알 수 있다. 상기 최근 기록 기간에 기록된 검색 키워드 중 동일 키워드가 존재할 경우 동일한 검색 키워드 별로 가중치를 합산하는 것이 바람직하다.
단계(S503)에서 정보 검색 및 관심 키워드 업데이트 시스템은 상기 최근 기록 기간에 기록된 검색 키워드를 상기 단계(S502)에서 부여된 가중치에 따라 관심 키워드 목록으로 생성한다.
상기 최근 기록 기간에 기록된 검색 키워드 별로 가중치를 부여한 후 상기 가중치가 큰 순으로 상기 기록된 검색 키워드를 정렬한다. 이때, 상기 관심 키워드 목록을 구성하는 기 설정된 키워드의 개수에 따라 상기 검색 키워드를 선별하여 정렬할 수도 있다. 예를 들어, 상기 관심 키워드 목록의 키워드 개수를 10개로 설정할 경우 상기 가중치의 크기 순으로 10개의 검색 키워드만을 선별하여 이를 관심 키워드 목록으로 생성한다.
이때, 상기 사용자로부터 검색 키워드가 입력될 때마다 상기한 수학식 2을 통해 가중치를 계산한 후 상기 계산된 가중치에 따라 상기 관심 키워드 목록을 업데이트 한다.
그리고, 기 설정된 단위 시간을 주기로 상기 최근 기록 기간을 변경하고 상기 변경된 최근 기록 기간에 해당하는 키워드 검색 내역을 기록한다. 상기 단위시간을 24시간으로 설정할 경우 매일 0시에 상기 최근 기록 기간을 변경하는 것이 바람직하다. 예를 들어, 상기 최근 기록 기간을 3일로 설정한 경우 하루에 한번씩 최근 3일을 변경하고 최근 3일의 검색 키워드를 이용하여 상기 관심 키워드 목록을 업데이트 한다.
이과 같이 상기 관심 키워드 목록을 자동으로 업데이트 할 수 있으며, 또한 사용자 요청이 있을 경우에 한하여 수동으로 업데이트를 수행할 수도 있다.
단계(S504)에서 정보 검색 및 관심 키워드 업데이트 시스템은 상기 도3의 사용자 인터페이스 화면을 통해 상기 단계(S503)에서 생성된 관심 키워드 목록을 제공함과 아울러 상기 관심 키워드 목록 중 특정 관심 키워드를 선택하면 상기 선택된 관심 키워드에 관련된 적어도 하나의 컨텐츠를 제공한다.
도5의 사용자 관심 키워드 업데이트 방법에 의하면, 상기 사용자 인터페이스 화면의 관심 키워드 목록(306)은 최근 기록 기간의 사용자 키워드 검색 내역으로부터 생성된 관심 키워드로 구성된다.
본 발명에 따른 사용자 관심 키워드 업데이트 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이와 같은 사용자의 관심 키워드를 업데이트 하는 방법을 수행하기 위한 관심 키워드 업데이트 시스템을 설명한다. 도6은 본 발명에 따른 사용자 관심 키워드 업데이트 시스템의 내부 구성을 도시한 도면이다.
도6에 도시한 바와 같이, 관심 키워드 업데이트 시스템(600)은 사용자 인터페이스부(601), 관심 키워드 생성부(602), 컨텐츠 제공부(603), 기록부(604)를 포함할 수 있다.
상기 사용자 인터페이스부(601)는 검색 키워드를 입력하거나, 관심 키워드를 선택하거나, 관심 키워드에 대한 컨텐츠를 제공하는 사용자 인터페이스 화면에 대한 수신항목, 수신형태 등의 사용자 환경을 설정하기 위한 입력 수단을 포함한다.
상기 관심 키워드 생성부(602)는 상기 사용자 인터페이스부(601)를 통해 입력되는 검색 키워드를 근거로 상기 사용자에게 추천하기 위한 관심 키워드 목록을 생성한다.
상기 컨텐츠 제공부(603)는 상기 생성된 관심 키워드 목록에서 사용자가 특정 관심 키워드를 선택하면 상기 선택된 관심 키워드에 관련된 적어도 하나의 컨텐츠를 제공한다. 상기 컨텐츠 제공부(603)는 상기 선택된 관심 키워드에 해당하는 관련 광고를 디폴트로 포함한 컨텐츠를 제공할 수 있으며, 상기 관심 키워드에 관련된 뉴스, 블러그, 웹 페이지, 이미지, 지식 쇼핑, 동영상, 도서 정보, 지역 정보 중 사용자가 선택한 수신 항목에 해당하는 컨텐츠를 제공할 수도 있다.
상기 기록부(604)는 키워드 별 각종 컨텐츠를 저장할 수 있다.
상세하게, 상기 검색 키워드의 연관 카테고리를 이용하여 관심 키워드를 생성하고자 할 경우, 상기 관심 키워드 생성부(602)는 연관 키워드 획득부와, 카테고리 분류부와, 카테고리 연관도 연산부와, 관심 키워드 업데이트부를 포함할 수 있다.
상기 연관 키워드 획득부는 단어 간의 연관도에 따라 적어도 하나의 연관 키워드를 획득하기 위한 것으로, 문서 집합이 포함하는 단어, 문서, 상기 단어에 대한 단어 분류 또는 상기 문서에 대한 문서분류를 통해 단어 통계 정보를 획득하는 단어 통계 정보 획득부와, 상기 단어 통계 정보를 정형화하는 정형화부와, 상기 정형화된 단어 통계 정보에 기초하여 상기 단어 간의 단어 연관도를 측정하는 단어 연관도 측정부를 포함할 수 있다. 상기 정형화부는 상기 단어 통계 정보를 다차원 벡터 집합, 실수형 랜덤변수 집합, 랜덤변수의 결합확률분포 또는 이산 랜덤변수 집합으로 정형화할 수 있다.
상기 연관 키워드 획득부는 측정된 상기 단어 간의 단어 연관도를 기초로 검색 키워드에 대하여 단어 연관도가 기 설정된 연관도 이상인 적어도 하나의 단어를 획득하여 이들 단어를 상기 검색 키워드에 대한 연관 키워드로 사용할 수 있다.
카테고리 분류부는 상기 연관 키워드 획득부에서 획득한 연관 키워드 각각 을 카테고리 별로 분류한다. 이는 광고단어를 구매하는 광고주의 구매 데이터(광고주 데이터) 또는 검색엔진이나 쇼핑사이트에서의 사용자의 검색 데이터(사용자 데이터)를 바탕으로 분류할 수 있다.
카테고리 연관도 연산부는 각 연관 키워드에 대한 카테고리 별 연관도를 산출한다. 이때, 카테고리 별 연관도는 상기 광고주 데이터에 의하여 카테고리를 분류할 경우 각 카테고리 별로 10개 내지 20개의 광고단어를 수작업으로 선택하여 입력한 후, 나머지 모든 광고단어는 상기 원칙에 의거해서 하나의 광고단어가 특정 카테고리에 속하는 확률을 계산함으로써 산출할 수 있다. 한편, 상기 사용자 데이터에 의하여 카테고리를 분류할 경우 검색 키워드에 대한 검색결과에서 사용자들이 상기 검색 키워드의 카테고리로 특정 카테고리를 선택하는 확률을 계산함으로써 카테고리 별 연관도를 산출할 수 있다.
상기 카테고리 연관도 연산부는 각 연관 키워드에 대한 카테고리 별 연관도를 산출한 후, 산출된 상기 연관도를 동일한 카테고리 별로 합산한다.
상기 관심 키워드 업데이트부는 상기 카테고리 연관도 연산부의 결과로부터 상기 연관도가 가장 높은 카테고리를 상기 검색 키워드의 연관 카테고리로 결정하고 상기 연관 카테고리에 속하는 키워드를 상기 관심 키워드 목록으로 생성한다.
한편, 사용자의 검색 키워드에 대한 최근 로그를 이용하여 관심 키워드를 생성하고자 할 경우, 상기 관심 키워드 생성부(602)는 기록부(604)와, 가중치 결정부와, 관심 키워드 업데이트부를 포함할 수 있다.
상기 기록부(604)는 기 설정된 최근 기록 기간 동안 상기 사용자 인터페이 스부(601)를 통해 입력되는 검색 키워드와 검색 시간을 저장한다.
상기 가중치 결정부는 상기 최근 기록 기간 동안 저장된 검색 키워드 각각에 대하여 상기 검색 시간에 따른 가중치를 부여한다.
상기 검색 시간에 따른 가중치는 수식
(여기서, W는 가중치, Ta는 최근 기록 기간, Tb는 현재 시간, Tc는 검색 시간)에 의해 산출할 수 있다. 상기 최근 기록 기간에 기록된 검색 키워드 중 동일 키워드가 존재할 경우 동일한 검색 키워드 별로 가중치를 합산한다.
상기 관심 키워드 업데이트부는 상기 최근 기록 기간의 검색 키워드 중 상기 가중치의 크기 순으로 기 설정 개수의 검색 키워드를 선별하고 상기 선별된 검색 키워드를 상기 관심 키워드 목록으로 생성한다.
따라서, 본 발명은 사용자의 검색 키워드에 해당하는 연관 카테고리를 이용하거나 혹은, 사용자의 검색 키워드에 대한 최근 로그를 이용하여 상기 사용자에게 추천하고자 하는 관심 키워드 목록을 생성할 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.