KR101134073B1 - 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템 - Google Patents

검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템 Download PDF

Info

Publication number
KR101134073B1
KR101134073B1 KR1020090129156A KR20090129156A KR101134073B1 KR 101134073 B1 KR101134073 B1 KR 101134073B1 KR 1020090129156 A KR1020090129156 A KR 1020090129156A KR 20090129156 A KR20090129156 A KR 20090129156A KR 101134073 B1 KR101134073 B1 KR 101134073B1
Authority
KR
South Korea
Prior art keywords
search
user
content
word
keyword
Prior art date
Application number
KR1020090129156A
Other languages
English (en)
Other versions
KR20110072296A (ko
Inventor
최진근
Original Assignee
최진근
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 최진근 filed Critical 최진근
Priority to KR1020090129156A priority Critical patent/KR101134073B1/ko
Publication of KR20110072296A publication Critical patent/KR20110072296A/ko
Application granted granted Critical
Publication of KR101134073B1 publication Critical patent/KR101134073B1/ko

Links

Images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Library & Information Science (AREA)

Abstract

본 발명은 사용자의 검색 요청을 받고 검색어로 검색 결과물을 실시간 내용 분류하여 검색 결과 페이지를 제공하는 검색 방법 및 검색 시스템에 관한 것이다. 본 발명에 따르는 검색 방법은, 사용자 검색 키워드를 이용하여 검색된 제 1검색 결과에서 상위에 랭크된 복수의 제 1콘텐츠 링크를 선별하는 단계; 제 1콘텐츠 정보를 분석하여 등장 빈도수가 높은 제 1관련 단어들을 선정하는 단계; 사용자 검색 키워드와 제 1관련 단어로 검색된 제 2검색 결과에서 상위에 랭크된 복수의 제 2콘텐츠 링크를 선별하는 단계; 제 2콘텐츠 정보에서 등장 빈도수가 높은 제 2관련 단어들을 선정하는 단계; 제 2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 멀티미디어 정보 링크를 추출하는 단계; 및 제 2콘텐츠 정보에 대해 사용자 검색 키워드, 제 1관련 단어, 제 2콘텐츠 링크의 URL, 제 2관련 단어 및 멀티미디어 정보 링크를 포함하는 검색 결과 페이지를 실시간 생성하여 사용자 단말로 제공하는 단계를 포함한다.

Description

검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템{Search Method for using word association between search keyword and search result and system thereof}
본 발명은 검색어로 검색된 검색 결과를 분석하여 관련 단어를 추출하고, 검색어와 관련 단어의 조합으로 재검색을 수행하여 관련 단어별로 내용 분류된 검색 결과를 사용자에게 제공하는 검색 방법 및 검색 시스템에 관한 것이다.
기존의 검색 시스템은 사용자로부터 전송받는 검색어로 검색 데이터베이스를 검색하여 검색 결과를 제공하며, 경우에 따라서 검색된 데이터를 카테고리로 분류하여 제공하기도 한다. 검색 결과를 분류하는 카테고리는 사이트, 웹 문서, 지식, 동영상, 음악, 이미지, 사전, 뉴스 등이 있다.
여기서, 검색 결과의 카테고리는 데이터의 외형적 식별에 의하여 정의된 것으로서 소속 분야(사이트, 웹 문서, 지식, 블로그, 뉴스, 쇼핑) 또는 포맷(이미지, 동영상, 음악)을 나타내는 것이다. 만약, 사용자가 검색 결과의 특정 소속 분야 또는 포맷을 염두해 두고 검색을 수행한 경우라면 카테고리로 분류한 검색 결과가 도움이 된다. 반면에, 사용자가 검색어가 무엇인지 몰라서 검색하거나 또는 특정된 관련 지식 내용을 염두해 두고 검색하는 경우에는 카테고리 분류된 검색 결과가 도움이 되지 않는다. 왜냐하면, 사용자는 카테고리로 분류된 전체 데이터를 대상으로 그 내용을 직접 파악하여 원하는 정보인지를 판단해야 하기 때문이다.
때문에, 사용자가 검색어의 내용 또는 관련 내용을 얻기 위하여 검색하는 경우, 카테고리 분류와 상관없이 검색 결과의 개별 정보를 일일이 확인하는 과정이 수반된다. 그리고 검색의 실제 성공 여부는 검색 결과의 유무가 아니라 검색 결과를 확인한 정보의 내용에 따라서 판단된다. 하지만, 검색 결과에 대하여 정보의 내용(주제), 연관 관계 등을 정의하고, 정의된 내용별로 분류하는 검색 서비스를 제공하는 것은 매우 어려운 일이다.
이에 출원인은 특허출원번호 10-2005-104668 및 10-2008-118067을 출원하여 개별 정보의 의미를 한 눈에 파악할 수 있는 지식 노드(단어 노드)를 이용한 그래픽 위상 구조의 정보 검색 기술을 제공한 바 있다. 이 기술은 정보의 내용 연관성을 검색 결과로 제공하여 사용자가 검색 대상을 바로 특정할 수 있도록 한 것이다. 즉, 검색 서버가 사용자로부터 검색어를 전송받으면, 관련 단어들의 연관 관계가 나타나는 노드 그래프를 제시하여 사용자가 내용을 직관적 판단하고, 사용자가 판단된 연관성에 따라서 특정 단어 노드를 선택하면 검색 서버가 대응하는 정보를 제공하는 것이었다. 이로 인해, 사용자는 검색 결과를 검토하여 추가 검색을 반복하거나 또는 검색 결과를 검토하여 불필요한 정보를 버리고 필요한 정보를 수집하는 등의 수고를 덜을 수 있었다.
나아가, 출원인은 상기 기술과 연관되는 특허출원번호 10-2009-33995, 10- 2009-33996 및 10-2009-107536을 출원하여 시청각 정보의 검색 서비스 및 콘텐츠 정보와 시청각 정보의 교차 검색 서비스 및 그 데이터베이스의 자동 구축 기술을 제공한 바 있다. 이 3건의 출원에 기술된 내용은 사용자의 키워드 검색 요청에 대하여 정보 검색 결과를 바로 제공하는 것이 아니라 검색 결과에 대한 단어들의 연관성 관계를 먼저 제공하는 것이 공통점이다. 따라서, 사용자는 단어의 연관성 관계로부터 그 내용을 미리 파악한 후 원하는 내용에 해당하는 검색 결과를 받아 검토할 수 있다.
이에 출원인은 상기 출원의 기술 메커니즘을 기존의 검색 시스템에 적용하여 사용자의 검색 요청에 대하여 바로 검색 결과를 제시하는 것이 아니라 검색어와 검색 결과 사이의 단어 연관성을 정의하고 정의된 연관성에 따라 내용 분류된 검색 결과를 제공하고자 한다.
본 발명은 전술한 바와 같은 점에 착안하여 창출된 것으로서, 사용자의 검색 요청을 수신하면, 사용자 검색어로 검색된 검색 결과물을 실시간 분석하여 검색어와 관련 단어들의 연관성 관계를 정의하고, 연관성 관계의 관련 단어별로 검색 결과물을 분류하여 제공하는 검색 방법 및 검색 시스템을 제공하는 것을 목적으로 한다.
전술한 바와 같은 목적을 달성하기 위한 본 발명의 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법에 따르면, 유, 무선 네트워크를 이용하여 사용자 단말로부터 검색 요청을 수신하여 실시간으로 검색 결과물의 내용을 분류하여 제공하는 검색 서버의 검색 방법에 있어서, (S21)상기 검색 서버가 사용자 단말로부터 요청된 사용자 검색 키워드를 이용하여 검색 사이트를 통해 수신된 제 1검색 결과에서 상위에 랭크된 복수의 제 1콘텐츠 링크를 선별하는 단계; (S22)각각의 제 1콘텐츠 링크에 대응하는 제 1콘텐츠 정보를 분석하여 모든 제 1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 순서로 복수의 제 1관련 단어를 사용자가 설정한 개수만큼 선정하는 단계; (S23)상기 사용자 검색 키워드와 상기 제 1관련 단어의 상호 조합을 검색 키워드로 하여 상기 검색 사이트로부터 수신한 제 2검색 결과에서 상위에 랭크된 복수의 제 2콘텐츠 링크를 선별하는 단계; (S24)각각의 제 2콘텐츠 링크에 대해 대응하는 제 2콘텐츠 정보에서 등장 빈도수가 높은 순서로 복수의 제 2관련 단어를 사용자가 설정한 개수만큼 선정하는 단계; (S25)하나 이상의 제 2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 단계; 및 (S26)각각의 제 2콘텐츠 정보에 대해 사용자 검색 키워드, 제 1관련 단어, 제 2콘텐츠 링크의 URL, 제 2관련 단어 및 멀티미디어 정보 링크를 포함하는 검색 결과 페이지를 실시간 생성하여 사용자 단말로 제공하는 단계를 포함하여 검색 서버가 사용자 검색 키워드와 검색 결과물의 단어 연관성을 분석한 후 제 1관련 단어별로 분류된 검색 결과를 제공하는 것을 특징으로 한다.
나아가, 상기 검색 서버는, 사용자 단말로부터 검색 키워드 입력 방법, 검색 사이트, 멀티미디어 정보 검색 사이트, 제 1콘텐츠 링크 수, 제 2콘텐츠 링크 수, 제 1관련 단어 수, 제 2관련 단어 수 및 멀티미디어 정보 링크 수 중에서 적어도 하나 이상을 검색 옵션으로 설정받을 수 있는 것을 특징으로 한다.
상기 검색 서버는, 사용자 단말로부터 검색 키워드를 포함하는 검색 요청을 수신하는 것을 특징으로 한다.
더 나아가, 상기 검색 서버는, 제 1 또는 제 2관련 단어의 빈도수 계산시 단어가 등장된 영역에 따라 해당 단어에 대한 빈도수의 가중치를 차별적으로 부여하는 것을 특징으로 한다.
본 발명의 바람직한 특징에 따르면, 각각의 제 2콘텐츠 정보에 링크된 시청각 정보의 URL을 추출하여 제 2콘텐츠 정보와 대응하는 멀티미디어 정보 링크로 결정하는 것을 특징으로 한다.
나아가, 상기 검색 서버는, 동영상, 이미지, 음악 및 웹지도 중 적어도 하나 이상을 상기 멀티미디어 정보로 검색하는 것을 특징으로 한다.
바람직하게, 상기 검색 서버는, 빈도수 높은 순서로 제 2관련 단어를 검색 키워드로 하여 검색 사이트로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 것을 특징으로 한다.
나아가, 상기 검색 서버는, 제 2관련 단어 중 2개 이상의 단어를 조합한 검색 키워드를 이용하여 검색 사이트로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 것을 특징으로 한다.
상기 검색 서버는, 제 2관련 단어 중 등장 빈도수가 높은 순서로 2개 이상의 단어를 조합하여 상기 검색 키워드를 생성하는 것을 특징으로 한다.
더 나아가, 상기 검색 서버는, 사용자 검색 키워드에 대하여 복수의 제 1관련 단어의 단어 연관성 관계가 제 1관련 단어의 빈도수 순서로 표시되고, 개별 제 1관련 단어에 대하여 대응하는 (제 2관련 단어의 멀티미디어 정보) 및 (개별 검색 결과물)이 표시되는 상기 검색 결과 페이지를 생성하여 사용자 단말로 제공하는 것을 특징으로 한다.
상기 검색 서버는, 전체 제 1콘텐츠 정보를 대상으로 제 1관련 단어로 분류하여 제 2검색 결과를 생성하는 것을 특징으로 한다.
한편, 본 발명의 검색 시스템에 따르면, 유, 무선 네트워크를 이용하여 사용자의 검색 요청을 수신하고 실시간으로 검색 결과물의 내용을 분류하여 제공하는 검색 시스템에 있어서, 사용자 단말로부터 검색 요청을 수신하여 추출된 사용자 검색 키워드로 검색한 1차 검색 결과물의 내용을 분석하고, 사용자 검색 키워드 및 1 차 검색 결과물의 상위 빈도수 순서로 추출한 제 1관련 단어의 조합으로 검색한 2차 검색 결과물의 내용을 분석하여 상위 빈도수 순서의 제 2관련 단어를 추출하고, 제 1관련 단어 및 제 2관련 단어의 빈도수 순서로 정렬된 2차 검색 결과물 및 제 2관련 단어로 검색된 멀티미디어 정보 링크를 포함하는 검색 결과 페이지를 생성하여 사용자 단말로 제공하는 검색 서버; 및 상기 검색 서버로 사용자 검색 키워드를 전송하여 검색 요청하고, 제 1관련 단어 및 제 2관련 단어의 빈도수로 정렬된 검색 결과물과 개별 검색 결과물의 멀티미디어 정보를 포함하는 상기 검색 결과 페이지를 전송받아 화면에 표시하는 사용자 단말을 포함하여 검색 서버가 사용자 검색 키워드와 검색 결과물의 단어 연관성을 분석한 후 제 1관련 단어별로 분류된 검색 결과를 제공하는 것을 특징으로 한다.
본 발명에 따르면 사용자 검색 키워드로 실시간 검색된 검색 결과물을 제공할 때 검색 결과물로부터 사용자 검색 키워드와 단어 연관성이 존재하는 관련 단어들을 추출하고, 개별 관련 단어로 내용 분류된 검색 결과물을 제공한다.
특히, 검색 결과물이 갖는 다양한 주제에 대하여 사용자 검색 키워드와 관련 성있는 관련 단어로 개별 콘텐츠를 분류하기 때문에 사용자는 검색 결과 페이지에서 개별 콘텐츠가 무슨 내용에 해당하는지를 미리 인지한 상태에서 링크된 콘텐츠 페이지를 방문할 수 있다.
또한, 사용자는 단어 연관성 관계의 관련 단어로 분류된 검색 결과물에서 별도 분류된 멀티미디어 데이터를 제공받음으로써 역시 무슨 내용에 해당하는지를 미 리 인지한 상태에서 멀티미디어 데이터를 재생할 수 있다.
이하, 첨부도면을 참조하여 본 발명의 바람직한 실시예의 구성을 설명한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.
<1. 시스템 구성>
도 1은 본 발명의 실시예에 따른 검색 시스템(1)의 개략적 구성을 도시한다.
본 발명의 실시예에 따른 검색 시스템(1)은 사용자 검색 키워드로 검색한 검색 결과물을 실시간 분석한 후 가장 높은 빈도수로 출현하는 단어별로 검색 결과 데이터를 내용 분류한 검색 결과 페이지를 제공하는 검색 서버(2) 및 유무선 네트워크를 이용하여 검색 서버(2)로 사용자 검색 키워드를 전송하여 검색을 요청하고, 검색 서버(2)로부터 검색 결과물의 내용이 분류된 검색 결과 페이지를 제공받는 사용자 단말(3)을 포함하여 구성된다.
본 발명에서의 상기 유, 무선 네트워크는 대표적으로 이동통신망, 유, 무선 공중망이나 전용망 등과 같이 다양한 프로토콜을 이용하여 인터넷 통신이 가능한 모든 통신망을 포괄한다.
상기 사용자 단말(3)은 웹 브라우저가 설치되어 홈 페이지 접속이 가능한 컴퓨터 단말, 이동통신단말 및 기타 휴대 단말을 포함한다. 즉, 사용자 단말(3)은 기 종이나 통신 방식에 상관없이 웹 페이지의 검색창에 사용자 검색 키워드를 입력하여 검색 서버(2)로 검색을 요청하고, 검색 서버(2)로부터 내용 분류한 검색 결과 페이지를 제공받아 화면에 표시하는 단말이다.
상기 검색 서버(2)는 사용자 검색 키워드로 검색된 검색 결과물의 단어를 분석하고 분석된 단어들과 사용자 검색 키워드의 단어 연관성에 따라서 검색 결과물을 분류한다. 그리고 분류된 검색 결과물을 배치한 검색 결과 페이지를 생성하여 사용자 단말(3)로 제공한다.
먼저, 검색 서버(2)는 사용자 단말(3)로 검색 페이지를 제공하고 검색창에서 입력된 사용자 검색 키워드를 수신하여 검색을 요청받는다. 검색 요청을 받으면, 사용자 검색 키워드로 1차 검색 결과물을 검색한다. 1차 검색이 완료되면, 1차 검색 결과물을 분석하여 제 1관련 단어들을 추출하고 높은 추출 빈도수로 정렬한다. 제 1관련 단어가 정렬되면, 사용자 검색 키워드와 각각의 제 1관련 단어의 조합으로 2차 검색 결과물을 검색한다. 따라서, 2차 검색 결과물은 1차 검색 결과물을 제 1관련 단어별로 내용 분류한 것이 된다. 2차 검색이 완료되면, 2차 검색 결과물을 분석하여 제 2관련 단어들을 추출하고 높은 추출 빈도수로 정렬한다. 그리고 정렬된 제 2관련 단어로 멀티미디어 정보를 3차 검색한다.
다음으로, 상기의 3차 검색을 완료하면, 검색 서버(3)는 사용자 검색 키워드, 제 1관련 단어별 2차 검색 결과 및 2차 검색 결과로부터 3차 검색된 멀티미디어 정보 검색 결과를 검색 결과 페이지로 생성하여 사용자 단말(3)로 제공한다.
여기서, 2차 검색시 검색 키워드로 사용된 사용자 검색 키워드와 제 1관련 단어는 사용자 검색 키워드에 대하여 빈도수 높은 순서로 출현되어 가장 관련있는 제 1관련 단어라는 단어 연관성이 존재한다. 때문에, 검색 사용자가 단어 연관성 관계를 갖는 제 1관련 단어별로 분류된 2차 검색 결과물을 제공받으면, 그 단어 연관성으로부터 검색 결과물의 내용을 미리 파악할 수 있다.
본 발명에서 검색 결과물은 사이트, 지식, 사전, 뉴스, 블로그, 멀티미디어 등 데이터의 특정 종류나 포맷에 국한하지 않는다. 다만, 멀티미디어 데이터 포맷의 검색 결과는 3차 검색 결과로 별도 분류한다.
도 2는 본 발명의 실시예에 따른 검색 서버(2)의 내부 구조를 도시한다.
본 발명의 일 실시예에 따른 검색 서버(2)는 사용자 검색 키워드로 검색한 제 1검색 결과에서 제 1콘텐츠 링크를 선별하는 제 1콘텐츠 선별 수단(21), 제 1콘텐츠 정보를 분석하여 제 1관련 단어를 선정하는 제 1관련 단어 선정 수단(22), 사용자 검색 키워드와 제 1관련 단어의 조합을 검색 키워드로 하여 검색한 제 2검색 결과에서 제 2콘텐츠 링크를 선별하는 제 2콘텐츠 선별 수단(23), 제 2콘텐츠 정보에서 등장 빈도수가 높은 제 2관련 단어를 추출하는 제 2관련 단어 선정 수단(24), 제 2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 멀티미디어 정보 링크를 추출하는 멀티 미디어 정보 추출 수단(25) 및 제 2콘텐츠 정보에 대해 사용자 검색 키워드, 제 1관련 단어, 제 2콘텐츠 링크의 URL, 제 2관련 단어 및 멀티미디어 정보 링크를 포함하는 검색 결과 페이지를 사용자 단말(3)로 제공하는 검색 결과 페이지 제공 수단(26)을 포함하는 것을 특징으로 한다.
이상의 검색 서버(2)를 구성하는 개별 구성 요소들의 상세한 기능과 동작은 후술하는 검색 방법을 통하여 설명한다.
<2. 방법 구성>
본 발명의 실시예에 따른 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법은 전술한 검색 시스템(1)의 구축을 통하여 바람직하게 실현될 수 있다.
도 3은 본 발명의 실시예에 따른 검색 방법의 개략적 순서를 도시한다. 도 3의 개별 단계 설명을 위하여 도 4 내지 도 7을 적절히 참조한다. 도 4 내지 도 7은 본 발명의 실시예에 따른 검색 결과물의 단어 연관성을 정의하는 모델을 예시한다.
먼저, 사용자는 사용자 단말(3)을 이용하여 검색 서버(2)의 홈 페이지에 접속한다. 사용자 단말(3)은 검색 서버(2)가 제공하는 웹 페이지를 수신하여 화면에 표시한다. 이때, 웹 페이지에는 검색창이 표시되고, 사용자는 사용자 검색 키워드를 입력하여 검색 버튼을 누른다. 그리고 검색 서버(2)는 사용자 단말(3)로부터 사용자 검색 키워드를 포함하는 검색 요청을 수신한다.
다음으로, 검색 서버(2)의 제 1콘텐츠 선별 수단(21)은 수신된 검색 요청으로부터 사용자 검색 키워드를 추출하고, 검색 사이트로 사용자 검색 키워드를 전송하여 수신된 제 1검색 결과에서 상위에 랭크된 복수의 제 1콘텐츠 링크를 선별한다(S21).
도 4는 검색 서버(2)가 사용자 검색 키워드로 검색한 1차 검색 결과물로부터 제 1콘텐츠 링크를 선별하는 과정을 개략적으로 도시한다.
상기 제 1콘텐츠 선별 수단(21)은 사용자 검색 키워드로 1차 검색을 수행한 다. 도 4는 이러한 제 1검색 결과로서 콘텐츠 링크 A1 내지 콘텐츠 링크 A300의 총 300개의 콘텐츠 링크가 검색된 것으로 예시하였다. 이때, 검색 서버(2)는 검색 사용자 또는 검색 서버(2)의 사업자가 미리 지정한 적어도 하나 이상의 자사 또는 타사 검색 사이트(예 : 네이버, 야후, 구글 등)에서 상기 검색을 수행할 수 있다.
타사 검색 사이트의 데이터베이스를 이용하여 검색할 경우는 당해 검색 사이트가 제공하는 공개 API를 이용할 수 있다. 공개 API는 당해 검색 사이트로 검색을 요청하는 인터페이스를 말하는 것으로서, 검색 서버(2)는 당해 검색 사이트가 제시하는 API 프로토콜에 따라 코딩된 프로그램으로 사용자 검색 키워드를 전송하여 검색을 요청하면 된다.
그리고 나서, 제 1콘텐츠 선별 수단(21)은 1차 검색된 300개의 콘텐츠 링크에 대하여, 각각의 콘텐츠 링크에 대응하는 콘텐츠 정보의 제목, 태그, 본문 등에 사용자 검색 키워드가 많이 포함되어 있는 순으로 상위 10개의 제 1콘텐츠 링크(제 1콘텐츠 링크 1 내지 제 1콘텐츠 링크 10)를 선별한다. 이때, 상위 10개라는 제 1콘텐츠 링크의 선별 개수는 일 실시예에 불과하며 서비스 사업자가 디폴트 지정하거나 사용자에 의하여 다양한 수가 지정될 수 있음은 당업자에게 자명한 사항이다. 또한, 상위 10개의 순서는 사용자의 방문수(조회수), 최신 등록 일자와 같은 다양한 기준이 적용될 수 있음은 물론이다.
제 1관련 단어의 선정이 완료되면, 제 1관련 단어 선정 수단(22)은 각각의 제 1콘텐츠 링크마다 대응하는 제 1콘텐츠 정보를 분석하여 모든 제 1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 복수의 제 1관련 단어를 추출한다(S22)
도 5는 도 4의 1차 검색한 검색 결과물로부터 선별된 제 1콘텐츠 링크에 대하여 제 1관련 단어를 선정하는 과정을 개략적으로 도시한다.
먼저, 상기 제 1관련 단어 선정 수단(22)이 검색 결과물을 분석하여 단어를 추출하는 데에는 이하와 같은 단어 추출 방식이 적용된다.
10개의 제 1콘텐츠 링크가 선별되면, 제 1관련 단어 선정 수단(22)은 각각의 콘텐츠 링크마다 식별 가능한 단어별로 빈도수를 분석한다. 즉, 각각의 제 1콘텐츠 정보에 대하여 제목, 태그, 본문 등을 분석하여 식별 가능한 단어들의 리스트를 추출한 후 각 단어별로 빈도수를 분석한다. 여기서, 빈도수라 함은 단어가 제목, 태그, 본문 등에 등장하는 횟수를 의미한다.
여기서, 각각의 제 1콘텐츠 정보에 대하여 단어별 빈도수를 분석하는 방법의 일 예로 형태소 분석 방법이 이용될 수 있다. 즉, 상용화된 형태소 분석 툴을 이용한 형태소 분석을 통해 각 단어별로 빈도수가 산정될 수 있다. 다른 예로, 국내공개 제 2001-0055114호, 국내공개 제 2004-0101678호, 국내공개 제 2002-0054254호 등에 개시된 기술이 이용될 수 있다.
바람직하게, 단어의 빈도수를 계산하는 과정에서, 빈도수에 단어 등장 영역별 가중치가 차별적으로 부여될 수 있다. 예를 들어, 특정 단어가 본문 중에 등장할 경우 빈도수를 1로 계산하고, 제목 중에 등장할 경우 가중치를 적용하여 빈도수를 2로 계산할 수 있다. 이는, 특정 단어가 본문 중에 위치하는 경우보다 제목과 같은 곳에 위치하는 경우, 해당 콘텐츠 정보에 대한 그 단어의 내용 관련도가 상대적으로 높다고 판단할 수 있기 때문이다. 이러한 빈도수에 대한 가중치 부여 형태 는 일 실시예에 불과하며 가중치를 부여하는 방식은 다양한 변형이 가능하다.
상기와 같이 각각의 제 1콘텐츠 정보에 대하여 단어별 빈도수 분석이 완료되면, 검색 서버(2)는 빈도수가 높은 상위 빈도수 단어를 복수 개 추출한다. 즉, 각각의 제 1콘텐츠 정보에 대하여 단어별 빈도수를 비교하고, 빈도수가 높은 단어를 일정 개수만큼 선정한다.
그리고나서, 제 1관련 단어 선정 수단(22)은 추출된 단어에 대한 전체 빈도수를 비교하여, 전체 빈도수가 높은 제 1관련 단어를 복수 개 선정한다. 여기서, 전체 빈도수란, 각 제 1콘텐츠 정보로부터 분석된 각각의 상위 빈도수 단어에 대하여 각 제 1콘텐츠 정보에서의 빈도수를 모두 합한 수를 말한다. 예를 들어, 특정 단어 A가 제 1콘텐츠 정보 A1에서 n1회, 제 1콘텐츠 정보 A2에서 n2회, 제 1콘텐츠 정보 A3에서 n3회, ..., 제 1콘텐츠 정보 A300에서 n300회가 노출되었다면, 상기 특정 단어 A의 전체 빈도수는 n1+n2+n3+...+n300으로 계산된다. 이러한 전체 빈도수 계산 과정은 각 콘텐츠 정보로부터 추출된 상위 빈도수 단어들에 대해 반복된다.
상기의 단어 추출 방식을 도 5를 참조하여 설명하면, 검색 서버(2)가 선별한 10개의 콘텐츠 링크(제 1콘텐츠 링크 1 내지 제 1콘텐츠 링크 10)에 대하여, 개별 제 1콘텐츠 링크에 대응하는 제 1콘텐츠 정보 각각에 대하여 상위 빈도수 단어를 15개씩 추출한다. 따라서, 10개의 제 1콘텐츠 정보 전체에 대하여 추출된 상위 빈도수 단어는 모두 150개가 된다.
그리고나서, 제 1관련 단어 선정 수단(22)은 추출된 전체 150개의 상위 빈도 수 단어들로부터 중복을 제거한다. 본 실시예에서, 중복이 제거된 전체 상위 빈도수 단어들의 수는 80개라고 가정한다. 그런 후 80개의 상위 빈도수 단어 각각에 대하여 제 1콘텐츠 정보 1 내지 10에서의 빈도수를 모두 합산하여 전체 빈도수를 구한다. 전술한 바와 같이, 추출된 특정 단어의 빈도수가 제 1콘텐츠 정보 1에서 5, 제 1콘텐츠 정보 4에서 2, 제 1콘텐츠 정보 7에서 3이라면, 해당 단어의 전체 빈도수는 10이 된다. 이와 같은 방법으로, 80개의 추출된 단어에 대한 전체 빈도수가 계산되면, 전체 빈도수가 높은 단어 순으로 5개의 단어가 제 1관련 단어로 선정된다.
이때, 도 4의 실시예와 마찬가지로, 15개라는 상기 상위 빈도수 단어의 추출 개수 및 5개라는 제 1관련 단어의 선정 개수 등은 일 실시예에 불과하며, 본 발명은 이러한 특정 개수에 한정되지 않는다.
제 1관련 단어 선정이 완료하면, 제 2콘텐츠 선별 수단(23)은 사용자 검색 키워드와 제 1관련 단어의 상호 조합을 검색 키워드로 하여 상기 검색 사이트로부터 제 2검색 결과물을 검색하고 상위에 랭크된 복수의 제 2콘텐츠 링크를 선별한다(S23). 여기서, 선별되는 제 2콘텐츠 링크의 수 또한 사용자 또는 검색 서비스 사업자가 미리 지정할 수 있다. 한편, 상기 사용자 검색 키워드로 검색한 도 4의 300개 제 1검색 결과물에 대하여 각각의 제 1관련 단어로 분류하여 제 2검색 결과물을 생성하는 것도 가능하다.
도 6은 검색 서버(2)가 사용자 검색 키워드와 제 1관련 단어의 조합을 이용하여 제 2콘텐츠 링크를 검색하고 선별하는 과정을 개략적으로 도식화한 도면이다.
도 4 및 도 5의 실시예에서 설명한 바와 같이, 사용자 검색 키워드로 검색한 1차 검색한 결과물로부터 제 1관련 단어로서 "제 1관련 단어-1" ~ "제 1관련 단어-5"의 5개 단어가 선정된 경우, 사용자 검색 키워드 및 제 1관련 단어의 조합은 총 5개가 만들어질 수 있다.
그리고 나서, 제 2콘텐츠 선별 수단(23)은 총 5개의 단어 조합 각각에 대하여 검색 사이트를 통해 콘텐츠 링크를 2차 검색하고 그 결과를 전송받아 검색 결과에서 일정 개수의 상위 콘텐츠 링크를 선별한다. 예를 들어, 도 6에 도시된 바와 같이 검색 사이트로부터 "사용자 검색 키워드 * 제 1관련 단어-1"의 단어 조합을 포함하는 콘텐츠 링크를 검색하여 검색 결과 페이지를 전송받는다. 그리고 전송받은 검색 결과 페이지에 포함된 콘텐츠 링크 중 상위에 랭크된 50개의 제 2콘텐츠 링크(제 2콘텐츠 링크 1 내지 제 2콘텐츠 링크 50)를 선별한다. 물론, 50개의 선별 개수 역시 미리 설정될 수 있다.
비록, 도 6의 실시예에서는 설명의 편의상 "사용자 검색 키워드 * 제 1관련 단어-1"이라는 하나의 단어 조합에 대해서만 제 2콘텐츠 링크가 선별되는 것으로 도시되었으나, 나머지 4개의 단어 조합마다 각각 콘텐츠 링크가 50개씩 선별된다. 그러므로, 상기 5개의 단어 조합에 대하여 검색 서버(2)가 선별한 제 2콘텐츠 링크의 총 개수는 250개가 된다.
제 2콘텐츠 링크가 검색이 완료되면, 제 2관련 단어 선정 수단(24)은 각각의 제 2콘텐츠 링크에 대해 대응하는 제 2콘텐츠 정보에서 등장 빈도수가 높은 복수의 제 2관련 단어를 추출한다(S24). 제 2콘텐츠 링크의 총 개수는 250개 이므로 제 2 관련 단어의 추출은 250회 수행되는 것이다.
즉, 상기 제 2관련 단어 선정 수단(24)은 각각의 제 2콘텐츠 링크를 이용하여 해당 콘텐츠 정보를 제공하는 서버로부터 제 2콘텐츠 정보를 다운로드한 후 제 2콘텐츠 정보의 제목, 태그, 본문 등을 분석하여 식별 가능한 단어들의 리스트를 추출한 후 각 단어에 대해 빈도수를 분석하여 미리 지정된 수의 제 2관련 단어를 추출한다. 이러한 제 2관련 단어의 추출 및 각 단어별 빈도수 분석 과정은 상술한 제 1관련 단어의 추출 및 단어별 빈도수 분석 과정과 실질적으로 동일하다. 따라서, 각 제 2관련 단어의 빈도수 계산시 전술한 "단어 등장 영역별 가중치"가 빈도수에 반영될 수 있음은 당업자에게 자명하다.
제 2관련 단어의 추출이 완료되면, 멀티미디어 정보 추출 수단(25)은 하나 이상의 제 2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출한다(S25).
여기서, 상기 멀티미디어 정보 링크는, 동영상, 음악, 이미지 및 웹지도 중 어느 하나 이상의 멀티미디어 데이터에 대한 링크일 수 있다. 또한, 상기 멀티미디어 정보 링크의 추출 개수는 적절하게 조절 가능하다.
상기 멀티미디어 정보 추출 수단(25)은 제 2관련 단어 중 등장 빈도수가 가장 높은 단어를 검색 키워드로 이용하여 검색 사이트로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출할 수 있다. 예를 들어, 제 2관련 단어로서 빈도수 높은 순서로 P, Q, R 세 단어가 존재하는 경우, P에 대해서만 멀티미디어 검색을 수행하고, 그에 따른 검색 결과에서 멀티미디 어 정보 링크를 추출할 수 있다.
또한, 검색 서버(2)는 상기 제 2관련 단어 중 2개 이상의 단어를 조합한 검색 키워드를 이용하여 검색 사이트로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출할 수 있다. 예를 들어, 상기 실시예와 같이 제 2관련 단어로서 P, Q, R이 존재하는 경우, P와 Q의 단어 조합, P와 R의 단어 조합 또는 P, Q 및 R의 단어 조합을 이용하여 멀티미디어 검색을 수행하고, 그에 따른 검색 결과에서 멀티미디어 정보 링크를 추출할 수 있다.
이때, 상기 검색 키워드는 제 2관련 단어 중 등장 빈도수가 높은 순서로 2개 이상의 단어를 조합하여 생성할 수 있다. 즉, 빈도수가 상대적으로 높은 제 2관련 단어부터 이용하여 단어 조합을 구성하는 것이 좋다.
또한, 검색 서버(2)는 멀티미디어 정보 링크의 수를 n이라 할 때, 제 2관련 단어 중 등장 빈도수가 많은 순서대로 관련 단어를 검색 키워드로 지정하면서, 추출된 멀티미디어 정보 링크의 수가 n이 될 때까지 관련 단어에 대응하는 멀티미디어 검색 결과를 수집할 수 있다. 예를 들어, 3개의 멀티미디어 정보 링크를 추출하기로 지정되어 있다면, 제 2관련 단어 중 등장 빈도수가 가장 많은 제 2관련 단어를 이용하여 추출된 멀티미디어 정보 링크의 수가 3개 이상이라면, 다른 제 2관련 단어들에 대해서는 더 이상 멀티미디어 검색을 수행하지 않아도 된다. 그러나 추출된 멀티미디어 정보 링크의 수가 3개 미만이라면, 그 다음으로 등장 빈도수가 많은 제 2관련 단어를 이용하여 멀티미디어 검색을 수행하여 부족한 개수만큼 멀티미디어 정보 링크를 추출한다.
도 7은 도 6에서 사용자 검색 키워드와 제 1관련 단어-1로 검색한 후 선별된 50개 제 2콘텐츠 링크의 단어 연관성을 정의하는 데이터 구조 및 실제 데이터를 예시한다.
설명의 편의상 사용자 검색 키워드는 "라디오스타"이고, 제 1콘텐츠 링크로부터 빈도수 순서로 추출한 제 1관련 단어는 "박중훈", "안성기", "가수", "뮤지컬", "강원도" 순이라 가정한다. 이 가정을 표 1로 나타낸다.
사용자 검색 키워드 제 1관련 단어(빈도수 순)


라디오 스타

박중훈
안성기
가수
뮤지컬
강원도
도 6의 "검색 키워드 * 제 1관련 단어-1"의 조합은 "라디오 스타 * 박중훈"이다. 그리고 도 7의 "일련번호" 1 ~ 50은 도 6에서 선별된 50개의 제 2콘텐츠 링크(제 2콘텐츠 링크 1 ~ 제 2콘텐츠 링크 50)에 대응하는 제 2콘텐츠 정보의 데이터 구조에 해당한다. 즉, 도 6의 "제 2콘텐츠 링크 1"에 대한 관련 데이터는 도 7의 일련 번호 1 섹터에 해당한다. 도 7에서는 2개의 제 2콘텐츠 정보가 존재하는 것으로 도시하였으나, 실질적으로는 50개의 정보가 존재한다.
본 발명의 일 실시예에 따른 단어 연관성을 정의한 검색 결과물은 "검색 키워드", "제 1관련 단어", "제 2콘텐츠 링크", "제 2관련 단어" "멀티미디어 정보 링크" 및 "시청각 정보 링크"의 데이터 구조를 갖는다.
먼저, 검색 서버(2)는 "라디오스타"로 대응하는 검색 결과물을 1차 검색하여 제 1콘텐츠 정보를 선별한다. 이후, 제 1콘텐츠 정보를 분석하여 단어 출현 빈도수 순서로 복수개 "제 1관련 단어"를 추출한다.
다음으로, "라디오스타"와 "박중훈"을 조합하여 제 2콘텐츠 정보를 2차 검색 및 선별한다. 그리고 제 2콘텐츠 정보의 단어 출현 빈도수를 분석하여 복수개 제 "제 2관련 단어"를 추출하고, 제 2관련 단어로 멀티미디어 정보를 3차 검색한다.
여기서, "멀티미디어 정보 링크"는 제 2관련 단어로 검색 사이트에서 멀티미디어 정보를 검색한 결과물이고 "시청각 정보 링크"는 제 2콘텐츠 정보에 내부 링크 또는 첨부된 결과물이다. 도 7에서 2개의 멀티미디어 정보 링크와 1개의 시청각 정보 링크를 도시하였으나 2개 및 1개는 예시에 불과하며 복수개 동영상, 이미지, 음악 및 웹지도 등에 대한 URL이 저장될 수도 있음은 당업자에게 자명하다.
또한, 제 2콘텐츠 정보(2차 검색 결과물)는 제 1콘텐츠 정보(1차 검색 결과물)를 "제 1관련 단어"별로 내용 분류한 것에 해당한다. 즉, 사용자 검색 키워드 "라디오스타"로 검색된 1차 검색 결과물 중에는 제 1관련 단어 "박중훈"의 빈도수가 가장 높기 때문에 "라디오스타 * 박중훈"의 단어 조합으로 검색된 제 2콘텐츠 링크가 "라디오스타"와 가장 내용 관련성이 있는 것으로 판단할 수 있다. 즉, 검색 서버(2)가 "라디오스타"의 총 검색 결과물에 대하여 표 1의 5개의 제 1관련 단어별로 정렬하면 내용 연관성에 따라서 5개의 그룹으로 분류한 것이 된다. 따라서, 사용자가 5개의 그룹으로 분류된 제 2콘텐츠 링크를 포함하는 검색 결과 페이지를 제공받으면, 사용자 검색 키워드와 개별 제 1관련 단어의 단어 연관성으로부터 제 2콘텐츠 링크의 정보 내용을 짐작할 수 있다. 즉, 본 발명에서는 사용자가 내용 분류된 검색 결과 페이지를 제공받기 때문에 개별 링크를 클릭하여 방문하지 않고서도 어떤 주제의 내용인지 미리 알 수 있다.
한편, 멀티미디어 정보 링크의 추출 개수가 미리 정해진 경우, 검색 서버(2)는 제 2관련 단어 중 빈도수가 높은 단어부터 순차적으로 이용하여 상기 멀티미디어 정보 링크를 검색 및 선택할 수 있음은 상술한 바와 같다.
예를 들어, 도 5의 일련번호 1번에 대한 제 2콘텐츠 정보의 제 2관련 단어 중, 빈도수 높은 순서로 '비와 당신', '최곤', '이준익' 순이라 가정한다. 이 경우, 1번 콘텐츠 정보에 대하여 2개의 멀티미디어 정보 링크를 검색한다면, 먼저 최상위 빈도수 단어인 '비와 당신'을 검색어로 지정하여 검색 사이트를 통해 멀티미디어 정보 링크를 검색하고, 검색 결과 페이지를 수신한다. 이때, 검색 결과 페이지에 포함된 멀티미디어 정보 링크 수가 2개 이상이라면, 빈도수가 상대적으로 낮은 '최곤'과 '이준익'을 이용해서는 멀티미디어 정보 링크를 검색하지 않고 검색 결과 페이지에 포함된 멀티미디어 정보 링크 중 상위에 랭크된 2개의 멀티미디어 정보에 대한 URL 정보를 추출하여 1번 콘텐츠 정보에 대응하는 멀티미디어 정보 링크로서 저장한다.
그러나 검색 결과 페이지에 포함된 멀티미디어 정보 링크의 수가 1개 이하라면, 차상위 빈도수 단어인 '최곤'을 검색어로 지정하여 검색 사이트를 통해 멀티미디어 정보 링크의 검색을 요청하고 검색 결과 페이지를 수신한다. 그리고 검색 결과 페이지에서 랭크된 최상위 멀티미디어 정보를 부족했던 나머지 멀티미디어 정보로서 지정하고 지정된 멀티미디어 정보 링크의 URL을 추출하여 1번 콘텐츠 정보에 대응하는 멀티미디어 데이터로서 저장한다. 만일 차상위 빈도수 단어에 의한 검색에서도 멀티미디어 정보가 검색되지 않는다면, 다음으로 빈도수가 가장 낮은 '이준익'을 검색어로 하여 상술한 과정을 반복하여 멀티미디어 정보 링크의 URL을 데이터베이스에 저장한다. 검색 서버(2)가 멀티미디어 정보의 URL을 추출할 때에는, 기존의 유튜브나 구글 등의 검색 사이트가 제공하는 공개 API를 이용할 수 있음을 이미 전술한 바 있다.
한편, 도 7에서는 '라디오 스타, 박중훈' 단어 조합에 대한 50개의 제 2콘텐츠 정보에 대한 데이터 구조를 도시하고 있으나, 표 1을 참조하면 이와 같은 데이터가 '라디오스타, 안성기', '라디오스타, 가수', '라디오스타, 뮤지컬' 및 '라디오스타, 강원도'의 단어 조합에 대해서도 각각 50개의 제 2콘텐츠 정보에 대한 데이터 구조가 구축될 수 있다. 따라서, '라디오스타'라는 사용자 검색 키워드로 관련성이 있는 250개의 제 2콘텐츠 정보에 대한 데이터 구조가 구축될 수 있다. 즉, 하나의 사용자 검색 키워드 "라디오스타"로 수백 개의 관련 콘텐츠 정보를 "박중훈", "안성기", "가수", "뮤지컬" 및 "강원도"로 단어 빈도수를 분석하여 관련 단어별로 분류된 데이터 구조를 실시간 생성할 수 있다. 또한, 이러한 관련 콘텐츠 정보의 개수는 제 1 및 제 2관련 단어의 개수, 제 1 및 제 2콘텐츠 링크의 선별 개수 등에 따라 확장될 수 있으므로, 관련성 있는 콘텐츠 정보나 시청각 정보 등을 제공하기 위한 데이터 구조의 구축 및 확장이 용이하게 이루어질 수 있다.
상기 도 6 및 도 7의 실시예에서는 '라디오 스타, 박중훈', 또는 '라디오 스타, 안성기'와 같이 2개의 단어를 조합하는 경우에 대해서만 설명하였다. 하지만, 조합되는 단어의 개수는 그 이상으로 얼마든지 확장이 가능하다. 즉, 검색 키워드와 2개 이상의 제 1관련 단어를 조합하면 제 2콘텐츠 정보의 검색시 사용되는 조합 단어의 수를 3개 이상으로 확장할 수 있다.
예를 들어, 도 7의 실시예에서 제 2관련 단어 중 하나인 '비와 당신'이 추가되어 '라디오 스타, 박중훈, 비와 당신'이라는 단어 조합이 생성되었다면, 이러한 단어 조합에 대해 제 2콘텐츠 선별 수단(23)이 검색 사이트로부터 제 2콘텐츠 정보에 대한 검색 결과 페이지를 수신하고, 그 중 상위에 랭크된 복수의 제 2콘텐츠 링크를 선별한다. 이 경우, 데이터 구조에는 '라디오 스타'가 검색 키워드로, '박중훈'이 제 1관련 단어-1로, '비와 당신'이 제 1관련 단어-2로 저장될 수 있다. 그러므로 이러한 실시예에 의하면, 관련 단어 간 추가 연결 구조를 계속해서 확장시켜 나갈 수 있게 된다.
물론, 전술한 데이터 구조는 데이터베이스로 구축하여 검색 DB로 활용할 수 있음은 자명하다. 즉, 사용자의 검색 요청에 대하여 실시간 검색으로 단어 연관성을 정의한 검색 결과를 생성하여 검색 결과 페이지를 응답하고, 실시간 생성된 검색 결과를 검색 DB에 저장하여 다음번 사용자 검색 요청시 검색 DB로부터 조회된 검색 결과를 검색 결과 페이지로 제공하는 것이 가능하다. 만약, 상기 검색 DB를 이용하여 검색 결과를 제공할 경우, 주기적으로 사용자 검색 키워드를 이용하여 나머지 데이터들을 최신 데이터로 갱신해야 할 것이다.
도 8은 본 발명의 일 실시예에 따라 사용자가 검색 옵션을 설정하는 화면을 도시한다.
상기 검색 서버(2)는 도 7의 데이터 구조를 갖는 검색 결과를 실시간 생성하는데 필요한 데이터 추출 정보를 사용자 단말(3)로부터 입력받아 검색 옵션으로 저장한다. 초기 디폴트 값은 서비스 사업자가 설정한 값으로써 사용자가 검색 옵션을 변경하고자 하는 경우에만 표시되는 화면이다.
화면 인터페이스는 검색 키워드 입력 방법, 검색 사이트의 접속 정보, 멀티미디어 검색 결과를 수집할 검색 사이트 접속 정보, 제 1 및 제 2콘텐츠 링크의 수, 제 1 및 제 2관련 단어의 수, 추출할 멀티미디어 정보 링크의 수를 입력할 수 있는 인터페이스를 구비한다.
상기 인터페이스 화면을 통해 데이터 추출 정보가 입력되면, 본 발명에 따른 검색 데이터베이스 구축 장치(100)는 입력된 데이터 추출 정보에 따라 상술한 동작을 수행한다.
예를 들어, 도 8에 도시된 바와 같이, 검색 키워드 입력방법으로 '직접 입력'이 입력되면 검색 키워드는 사용자 단말(3)로부터 직접 입력받게 된다. 또한, 검색 사이트로 '네이버'가 입력되면, 상기 제 1콘텐츠 선별 수단(21) 및 제 2콘텐츠 선별 수단(23)은 '네이버' 검색 사이트의 검색 엔진을 지정하여 검색을 요청하고 검색 결과를 수신한다. 그리고 멀티미디어 정보 검색 사이트로 '유튜브'가 입력되면 멀티미디어 정보 추출 수단(25)은 유튜브 사이트에서 멀티미디어 정보 링크를 검색하고 추출한다.
또한, 제 1 및 제 2콘텐츠 링크의 수로 '10' 및 '50'이 입력되면, 제 1 및 제 2콘텐츠 선별 수단(21, 23)은 제 1콘텐츠 링크 및 제 2콘텐츠 링크를 각각 10개와 50개 선별한다. 그리고 도면에 도시된 바와 같이 제 1 및 제 2관련 단어의 수로 '5'와 '3'이 입력되면 제 1관련 단어 선정 수단(22)은 제 1관련 단어를 5개 선정하고, 제 2관련 단어 선정 수단(24)은 제 2관련 단어를 3개 선정한다. 또한, 멀티미디어 정보 링크의 수를 '2'로 입력하면, 제 2콘텐츠 정보에 대응하는 멀티미디어 정보 링크를 2개 추출한다.
비록, 도면에는 도시되지 않았으나, 데이터 추출을 위한 검색 옵션 정보로서 웹페이지, 사이트, 지식인, 동영상, 이미지, 블로그 등과 같이 제 1 및 제 2콘텐츠 링크에 대하여 선별 카테고리를 입력받을 수도 있다. 이 경우, 입력된 카테고리에서 제 1 및 제 2콘텐츠 링크를 검색하고 선별한다.
한편, 상기 도 8에 도시된 데이터 추출 정보 입력 화면은 일 실시예에 불과하며, 다양한 형태로 구성이 가능하다는 것은 당업자에게 자명하다.
실시간 검색으로 검색 결과의 생성이 완료되면, 검색 결과 페이지 제공 수단(26)은 각각의 제 2콘텐츠 정보에 대해 사용자 검색 키워드, 제 1관련 단어, 제 2콘텐츠 링크의 URL, 제 2관련 단어 및 멀티미디어 정보 링크를 포함하는 검색 결과 페이지를 실시간 생성하여 사용자 단말(3)로 제공한다(S26).
도 9는 본 발명의 실시예에 따른 단어 연관성으로 내용 분류되는 검색 결과 페이지를 예시한다.
검색 결과 페이지는 검색창(201)과 검색 버튼(202)을 포함하며, 검색창(201)에는 사용자 검색 키워드가 표시된다.
제 1관련 단어 탭(203)에는 사용자 검색 키워드에 대하여 단어 연관성으로 내용 분류된 제 1관련 단어들이 나열된다. 검색창(201), 검색 버튼(202) 및 제 1관련 단어 탭(203)은 검색 결과 페이지의 화면 상단에 항상 표시되고, 제 1관련 단어 탭(203) 이하의 위치에서 사용자가 특정 탭을 선택할 때마다 대응하는 제 1관련 단어의 검색 결과 페이지가 표시된다. 예를 들어, 사용자가 "제 1관련 단어 1"의 탭을 누르면, 검색 서버(2)로 '사용자 검색 키워드 + 제 1관련 단어 1'의 조합을 전송하여 대응하는 검색 결과 페이지를 수신한다. 물론, 사용자가 "제 1관련 단어 2" 탭을 누르면 '사용자 검색 키워드 + 제 2관련 단어 2'에 대응하는 검색 결과 페이지를 수신하여 표시한다.
한편, 제 1관련 단어 탭(203)을 버튼으로 구성하고 전체 250개의 콘텐츠를 검색 결과 페이지에 모두 표시하고, 특정 제 1관련 단어의 버튼이 선택될 때마다 당해 위치로 이동하는 것도 가능하다. 예를 들어, 사용자가 "제 1관련 단어 2" 버튼을 누르면 51번째 제 2콘텐츠 링크의 위치로 이동하여 화면 표시하는 것이다.
제 1관련 단어 탭(203)이하에서는 개별 제 1관련 단어를 이용하여 검색된 제 2콘텐츠 링크가 각각 표시된다. 그리고 개별 제 2콘텐츠 링크 옆에는 제 2관련 단어(204)가 나열된다. 제 2관련 단어(204)는 복수개 나열될 수 있고, 그 옆에는 제 2관련 단어로 검색된 멀티미디어 데이터를 조회하기 위한 멀티미디어 버튼(205)이 표시된다. 멀티미디어 버튼(205)은 "동영상", "음악", "이미지" 및 "웹 지도"와 같은 멀티미디어 분류 제목이 표시되고, 버튼 제목 옆에 괄호로 데이터 건수를 병기해도 무방하다.
따라서, 본 발명의 사용자가 검색 키워드를 입력한 후 검색 서버(2)로부터 제공받은 검색 결과 페이지가 화면 표시되면, 제 1관련 단어 탭(203)을 통하여 내용 관련성에 따라서 정렬된 5개의 제 1관련 단어들을 제시받는다. 사용자 검색 키워드와 제 1관련 단어들의 관계 표시는 그래프, 트리 또는 표 등의 다양한 구조와 기호(괄호, 화살표 등)를 이용한 인터페이스가 가능하다.
또한, 사용자는 관심있는 제 1관련 단어로 분류된 콘텐츠 정보(제 2콘텐츠 링크)를 보고 미리 내용을 인지한 상태에서 특정 콘텐츠 링크를 선택하여 방문할지를 결정할 수 있다. 나아가, 개별 제 2콘텐츠 링크와 관련하여 가장 관련성 있는 제 2관련 단어들을 제공받고 역시 제 2관련 단어로 내용을 인지한 상태에서 멀티미디어 데이터 조회 여부를 결정할 수 있다.
상기 도 9에 도시된 검색 결과 페이지 화면은 일 실시예에 불과하며, 다양한 형태로 구성이 가능하다는 것은 당업자에게 자명하다.
상술한 바와 같이, 본 발명에 따른 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템의 실시예가 구성된다. 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 전술한 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되지 않아야 한다.
도 1은 본 발명의 실시예에 따른 검색 시스템의 개략적 구성도.
도 2는 본 발명의 실시예에 따른 검색 서버의 개략적 내부 구조도.
도 3은 본 발명의 실시예에 따른 검색 방법의 개략적 순서도.
도 4 내지 도 7은 본 발명의 실시예에 따른 검색 결과물의 단어 연관성을 정의하는 예시도.
도 8은 본 발명의 실시예에 따른 단어 연관성을 이용한 검색 옵션 설정 화면의 예시도.
도 9는 본 발명의 실시예에 따른 단어 연관성으로 내용 분류되는 검색 결과 페이지의 예시도.

Claims (13)

  1. 유, 무선 네트워크를 이용하여 사용자 단말로부터 검색 요청을 수신하여 실시간으로 검색 결과물의 내용을 분류하여 제공하는 검색 서버의 검색 방법에 있어서,
    (S21)상기 검색 서버가 사용자 단말로부터 요청된 사용자 검색 키워드를 이용하여 검색 사이트를 통해 수신된 제 1검색 결과에서 상위에 랭크된 복수의 제 1콘텐츠 링크를 선별하는 단계;
    (S22)각각의 제 1콘텐츠 링크에 대응하는 제 1콘텐츠 정보를 분석하여 모든 제 1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 순서로 복수의 제 1관련 단어를 사용자가 설정한 개수만큼 선정하는 단계;
    (S23)상기 사용자 검색 키워드와 상기 제 1관련 단어의 상호 조합을 검색 키워드로 하여 상기 검색 사이트로부터 수신한 제 2검색 결과에서 상위에 랭크된 복수의 제 2콘텐츠 링크를 선별하는 단계;
    (S24)각각의 제 2콘텐츠 링크에 대해 대응하는 제 2콘텐츠 정보에서 등장 빈도수가 높은 순서로 복수의 제 2관련 단어를 사용자가 설정한 개수만큼 선정하는 단계;
    (S25)하나 이상의 제 2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 단계; 및
    (S26)각각의 제 2콘텐츠 정보에 대해 사용자 검색 키워드, 제 1관련 단어, 제 2콘텐츠 링크의 URL, 제 2관련 단어 및 멀티미디어 정보 링크를 포함하는 검색 결과 페이지를 실시간 생성하여 사용자 단말로 제공하는 단계
    를 포함하여 검색 서버가 사용자 검색 키워드와 검색 결과물의 단어 연관성을 분석한 후 제 1관련 단어별로 분류된 검색 결과를 제공하는 것을 특징으로 하는 검색 방법.
  2. 제 1항에 있어서,
    상기 검색 서버는,
    사용자 단말로부터 검색 키워드 입력 방법, 검색 사이트, 멀티미디어 정보 검색 사이트, 제 1콘텐츠 링크 수, 제 2콘텐츠 링크 수, 제 1관련 단어 수, 제 2관련 단어 수 및 멀티미디어 정보 링크 수 중에서 적어도 하나 이상을 검색 옵션으로 설정받을 수 있는 것을 특징으로 하는 검색 방법.
  3. 제 1항에 있어서,
    상기 검색 서버는,
    사용자 단말로부터 검색 키워드를 포함하는 검색 요청을 수신하는 것을 특징으로 하는 검색 방법.
  4. 제 1항 내지 제 3항 중 어느 한 항 있어서,
    상기 검색 서버는,
    제 1 또는 제 2관련 단어의 빈도수 계산시 단어가 등장된 영역에 따라 해당 단어에 대한 빈도수의 가중치를 차별적으로 부여하는 것을 특징으로 하는 검색 방법.
  5. 제 1항에 있어서,
    상기 검색 서버는,
    각각의 제 2콘텐츠 정보에 링크된 시청각 정보의 URL을 추출하여 제 2콘텐츠 정보와 대응하는 멀티미디어 정보 링크로 결정하는 것을 특징으로 하는 검색 방법.
  6. 제 1항 또는 제 5항에 있어서,
    상기 검색 서버는,
    상기 멀티미디어 정보로서 동영상, 이미지, 음악 및 웹지도 중 적어도 하나 이상을 검색하는 것을 특징으로 하는 검색 방법.
  7. 제 1항에 있어서,
    상기 검색 서버는,
    빈도수 높은 순서로 제 2관련 단어를 검색 키워드로 하여 검색 사이트로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 것을 특징으로 하는 검색 방법.
  8. 제 1항 또는 제 7항에 있어서,
    상기 검색 서버는,
    제 2관련 단어 중 2개 이상의 단어를 조합한 검색 키워드를 이용하여 검색 사이트로부터 수집한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 것을 특징으로 하는 검색 방법.
  9. 제 8항에 있어서,
    상기 검색 서버는,
    제 2관련 단어 중 등장 빈도수가 높은 순서로 2개 이상의 단어를 조합하여 상기 검색 키워드를 생성하는 것을 특징으로 하는 검색 방법.
  10. 제 9항에 있어서,
    상기 검색 서버는,
    사용자 검색 키워드에 대하여 복수의 제 1관련 단어의 단어 연관성 관계가 제 1관련 단어의 빈도수 순서로 표시되고, 개별 제 1관련 단어에 대하여 대응하는 (제 2관련 단어의 멀티미디어 정보) 및 (개별 검색 결과물)이 표시되는 상기 검색 결과 페이지를 생성하여 사용자 단말로 제공하는 것을 특징으로 하는 검색 방법.
  11. 제 10항에 있어서,
    상기 검색 서버는, 사용자 검색 키워드로 검색된 제 1검색 결과를 제 1관련 단어로 분류하여 제 2검색 결과를 생성하는 것을 특징으로 하는 검색 방법.
  12. 유, 무선 네트워크를 이용하여 사용자의 검색 요청을 수신하고 실시간으로 검색 결과물의 내용을 분류하여 제공하는 검색 시스템에 있어서,
    사용자 단말로부터 검색 요청을 수신하여 추출된 사용자 검색 키워드로 검색한 1차 검색 결과물의 내용을 분석하고, 사용자 검색 키워드 및 1차 검색 결과물의 상위 빈도수 순서로 추출한 제 1관련 단어의 조합으로 검색한 2차 검색 결과물의 내용을 분석하여 상위 빈도수 순서의 제 2관련 단어를 추출하고, 제 1관련 단어 및 제 2관련 단어의 빈도수 순서로 정렬된 2차 검색 결과물 및 제 2관련 단어로 검색된 멀티미디어 정보 링크를 포함하는 검색 결과 페이지를 생성하여 사용자 단말로 제공하는 검색 서버; 및
    상기 검색 서버로 사용자 검색 키워드를 전송하여 검색 요청하고, 제 1관련 단어 및 제 2관련 단어의 빈도수로 정렬된 검색 결과물과 개별 검색 결과물의 멀티미디어 정보를 포함하는 상기 검색 결과 페이지를 전송받아 화면에 표시하는 사용자 단말
    을 포함하여 검색 서버가 사용자 검색 키워드와 검색 결과물의 단어 연관성을 분석한 후 제 1관련 단어별로 분류된 검색 결과를 제공하는 것을 특징으로 하는 검색 시스템.
  13. 제 12항에 있어서,
    상기 검색 서버는,
    사용자 단말로부터 검색 요청을 수신하여 사용자 검색 키워드를 추출하고, 상기 사용자 검색 키워드를 이용하여 검색 사이트를 통해 수신된 제 1검색 결과에서 상위에 랭크된 복수의 제 1콘텐츠 링크를 선별하는 수단;
    각각의 제 1콘텐츠 링크에 대응하는 제 1콘텐츠 정보를 분석하여 모든 제 1콘텐츠 정보에 걸쳐 등장 빈도수가 높은 순서로 복수의 제 1관련 단어를 사용자가 설정한 개수만큼 선정하는 수단;
    상기 사용자 검색 키워드와 상기 제 1관련 단어의 상호 조합을 검색 키워드로 하여 상기 검색 사이트로부터 수신한 제 2검색 결과에서 상위에 랭크된 복수의 제 2콘텐츠 링크를 선별하는 수단;
    각각의 제 2콘텐츠 링크에 대해 대응하는 제 2콘텐츠 정보에서 등장 빈도수가 높은 순서로 복수의 제 2관련 단어를 사용자가 설정한 개수만큼 선정하는 수단;
    하나 이상의 제 2관련 단어를 검색 키워드로 한 멀티미디어 검색 결과에서 상위에 랭크된 하나 이상의 멀티미디어 정보 링크를 추출하는 수단; 및
    각각의 제 2콘텐츠 정보에 대해 사용자 검색 키워드, 제 1관련 단어, 제 2콘텐츠 링크의 URL, 제 2관련 단어 및 멀티미디어 정보 링크를 포함하는 검색 결과 페이지를 실시간 생성하여 사용자 단말로 제공하는 수단
    을 포함하는 것을 특징으로 하는 검색 시스템.
KR1020090129156A 2009-12-22 2009-12-22 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템 KR101134073B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090129156A KR101134073B1 (ko) 2009-12-22 2009-12-22 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090129156A KR101134073B1 (ko) 2009-12-22 2009-12-22 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템

Publications (2)

Publication Number Publication Date
KR20110072296A KR20110072296A (ko) 2011-06-29
KR101134073B1 true KR101134073B1 (ko) 2012-04-13

Family

ID=44403231

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090129156A KR101134073B1 (ko) 2009-12-22 2009-12-22 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템

Country Status (1)

Country Link
KR (1) KR101134073B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101331453B1 (ko) * 2011-08-10 2013-11-20 (주)다음소프트 연관어를 이용한 확장 키워드 검색 광고 방법
KR101458140B1 (ko) * 2012-05-10 2014-11-12 최진근 단어 연관성을 이용하는 정보 수집 시스템 및 정보 수집 방법
CN112100330B (zh) * 2020-09-09 2023-09-26 杭州凡闻科技有限公司 一种基于人工智能技术的主题搜索方法及其***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070027869A1 (en) 2005-07-29 2007-02-01 Collins Robert J System and method for reordering a result set copyright notice
KR20080093605A (ko) * 2007-04-17 2008-10-22 (주)야긴스텍 온톨로지 기반의 인텔리전트 이씨엠 시스템
KR20090081270A (ko) * 2008-01-23 2009-07-28 삼성전자주식회사 컨텐츠 검색 방법 및 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070027869A1 (en) 2005-07-29 2007-02-01 Collins Robert J System and method for reordering a result set copyright notice
KR20080093605A (ko) * 2007-04-17 2008-10-22 (주)야긴스텍 온톨로지 기반의 인텔리전트 이씨엠 시스템
KR20090081270A (ko) * 2008-01-23 2009-07-28 삼성전자주식회사 컨텐츠 검색 방법 및 시스템

Also Published As

Publication number Publication date
KR20110072296A (ko) 2011-06-29

Similar Documents

Publication Publication Date Title
CN102043833B (zh) 一种基于查询词进行搜索的方法和搜索装置
US7877677B2 (en) Methods and apparatus for enabling use of web content on various types of devices
US8126839B2 (en) Methods and apparatuses for adapting a ranking function of a search engine for use with a specific domain
US8612416B2 (en) Domain-aware snippets for search results
KR100886767B1 (ko) 지유아이 검색 서비스 제공 방법 및 시스템
JPH09311869A (ja) インターネット検索サーバ
JP2008204444A (ja) データ処理装置、データ処理方法及び検索装置
KR20100112512A (ko) 검색 장치 및 검색 방법
JP2010538386A (ja) クエリ別検索コレクション生成方法およびシステム
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
JP2010128928A (ja) 検索システム及び検索方法
KR100729184B1 (ko) 연상 키워드를 이용한 관계 정보 검색 방법 및 장치
JP2007072596A (ja) 情報共有システムおよび情報共有方法
KR101122737B1 (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
CN107025261B (zh) 主题网络语料库
JP2010146366A (ja) 情報提供サーバ
KR101134073B1 (ko) 검색어와 검색 결과의 단어 연관성을 이용하는 검색 방법 및 검색 시스템
JP2007034772A (ja) Webサイト検索結果の最適表示システム及びその装置及びその方法及びそのプログラム
JP2008191982A (ja) 検索結果出力装置
KR20110102052A (ko) 검색 결과 페이지에서 개별 컨텐츠를 이용하여 블로그를 생성하는 검색 시스템 및 검색 방법
CN101923548A (zh) 一种互联网信息搜索方法及一种搜索引擎
JP4842921B2 (ja) 検索システムおよびその方法
KR100942902B1 (ko) 웹페이지 검색 방법 및 상기 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
KR100813870B1 (ko) 그룹단계별 웹사이트 검색시스템 및 방법
KR101132393B1 (ko) 폭소노미와 링크 기반 랭킹 기법을 이용한 집단지성 기반 웹 페이지 검색 방법 및 이를 수행하기 위한 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee