KR20100068964A - 연관 질의어 추천 장치 및 방법 - Google Patents

연관 질의어 추천 장치 및 방법 Download PDF

Info

Publication number
KR20100068964A
KR20100068964A KR1020080127490A KR20080127490A KR20100068964A KR 20100068964 A KR20100068964 A KR 20100068964A KR 1020080127490 A KR1020080127490 A KR 1020080127490A KR 20080127490 A KR20080127490 A KR 20080127490A KR 20100068964 A KR20100068964 A KR 20100068964A
Authority
KR
South Korea
Prior art keywords
query
url
association
information
click log
Prior art date
Application number
KR1020080127490A
Other languages
English (en)
Other versions
KR101120040B1 (ko
Inventor
허정
황이규
이충희
오효정
임수종
김현기
윤여찬
최미란
이창기
장명길
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020080127490A priority Critical patent/KR101120040B1/ko
Publication of KR20100068964A publication Critical patent/KR20100068964A/ko
Application granted granted Critical
Publication of KR101120040B1 publication Critical patent/KR101120040B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)

Abstract

본 발명은 검색엔진에서 연관 질의어를 추천하는 장치 및 방법에 있어서, 기존 검색 엔진의 클릭 로그를 이용하여 질의어와 선택된 URL의 관계성을 수치화하여 제시하고, 클릭 로그에 남겨진 시간 정보와 선택된 URL 문서에 대한 분류 정보 등을 이용하여 사용자에 의해 입력된 초기 질의어와 연관성을 가지는 연관 질의어를 카테고리별로 그룹핑하는 방식으로 초기 질의어와 연관 관계가 높은 다양한 연관 질의어를 제시함으로써 사용자가 원하는 정보를 쉽게 찾을 수 있도록 하며, 또한 URL이 선택된 시간 정보를 반영하여 최근의 정보 경향을 반영할 수 있도록 한다.
검색, 질의어, 클릭 로그, 그룹핑, 연관성

Description

연관 질의어 추천 장치 및 방법{APPARATUS FOR RECOMMENDING RELATED QUERY AND METHOD THEREOF}
본 발명은 검색엔진에서 연관 질의어 제공방법에 관한 것으로, 특히 사용자가 검색엔진에서 특정 정보를 찾기 위해 질의어를 입력하는 경우 기존 검색 엔진의 클릭 로그(click log)를 이용하여 질의어와 선택된 URL의 관계성을 수치화하여 제시하고, 클릭 로그에 남겨진 시간 정보와 선택된 URL 문서에 대한 분류 정보 등을 이용하여 사용자에 의해 입력된 초기 질의어와 연관성을 가지는 연관 질의어를 카테고리별로 그룹핑(classification)하는 방식으로 초기 질의어와 연관성이 높은 연관 질의어를 제시할 수 있도록 하는 연관 질의어 추천 장치 및 방법에 관한 것이다.
본 발명은 지식경제부 및 정보통신연구진흥원의 IT신성장동력핵심기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2008-S-020-01, 과제명: 웹 QA 기술 개발].
최근 들어, 웹(web) 기술의 발전과 더불어 사용자들이 참고할 수 있는 웹 문 서의 수가 기하급수적으로 늘어나면서, 사용자들이 원하는 정보를 찾기가 쉽지 않아졌다. 이로 인해, 사용자가 원하는 웹 문서를 손쉽게 찾을 수 있도록 도와주기 위해서 다양한 웹 검색 엔진이 개발되고 있으나, 웹 문서 검색에 대한 지식이 부족한 일반 사용자의 경우 웹 검색을 위해서 사용자가 입력해야 하는 질의어 선택에 많은 어려움이 있었다.
위와 같은 사용자의 질의어 선택의 어려움을 해결하기 위해 검색정보를 제공하는 기존의 포털 사이트(portal site)에서는 질의어 자동완성 기능을 제공하고 있다. 이는 사용자가 입력한 일부 자모나 음절이 포함된 다양한 질의어를 제시하여 사용자가 선택할 수 있도록 한다. 즉, 여기서 제시되는 질의어들은 의미적인 관련성과는 무관하게 단지 동일한 패턴의 자모나 음절의 포함여부만을 파악하기 때문에 초기 질의어 선택에는 도움이 될 수 있다.
그러나, 사용자의 질의어에 대해서 자모나 음절에 대한 패턴을 포함하지 않는 의미적으로 연관된 질의어에 대해서는 추천이 불가능하다.
또한, 의미적 연관성에 따른 질의 추천을 위해서 기존에는 대용량의 문서에 기반하여 어휘들간의 공기정보를 추출하고, 이를 이용하여 연관 질의어를 제공하거나, 다양한 어휘 개념 구조(예: 워드넷)를 이용하여 질의어와 의미적으로 연관된 어휘들을 추천하였다.
그러나, 이와 같은 대용량 언어자원에 기반한 연관 질의어 추천은 실제 검색 엔진에서 사용자 의도나 선호 정보 등이 배제되어 사용자가 입력한 질의어와 연관성이 높은 다른 질의어들을 사용자의 의도에 맞게 제공하여 주지는 못하였다.
따라서 본 발명은 사용자가 검색엔진에서 특정 정보를 찾기 위해 질의어를 입력하는 경우 기존 검색 엔진의 클릭 로그를 이용하여 질의어와 선택된 URL의 관계성을 수치화하여 제시하고, 클릭 로그에 남겨진 시간 정보와 선택된 URL 문서에 대한 분류 정보 등을 이용하여 사용자에 의해 입력된 초기 질의어와 연관성을 가지는 연관 질의어를 카테고리별로 그룹핑하는 방식으로 초기 질의어와 연관성이 높은 연관 질의어를 제시할 수 있도록 하는 연관 질의어 추천 장치 및 방법을 제공하고자 한다.
상술한 본 발명은 연관 질의어 추천 장치로서, 클릭로그를 참조하여 다수의 서로 다른 질의어 및 상기 질의어에 따라 선택된 URL 정보와 각 URL이 선택된 시간 정보를 추출하는 정보 추출부와, 상기 URL이 선택된 빈도 정보를 계산하는 빈도 정보 계산부와, 상기 URL과 질의어간 관계를 산출하여 클릭로그 색인 데이터로 생성하는 색인부와, 질의어가 입력되는 경우 상기 클릭로그 색인 데이터를 참조하여 연관 URL과 연관 질의어를 검색한 후, 상기 연관 질의어를 카테고리별로 분류하여 상기 질의어와 연관성이 상대적으로 높은 연관 질의어를 추천 제공하는 서버 제어부를 포함한다.
또한 본 발명은 연관 질의어 추천을 위한 클릭 로그 색인 등록 방법으로서, 클릭로그를 참조하여 사용자들에 의해 입력되는 다수의 서로 다른 질의어 및 상기 질의어 입력 후 선택된 URL 정보와 각 URL이 선택된 시간 정보를 추출하는 단계와, 상기 URL이 선택된 빈도 정보를 계산하는 단계와, 상기 URL과 질의어간 관계를 산출하여 색인 데이터로 저장하는 단계를 포함한다.
본 발명은 검색엔진에서 연관 질의어를 추천하는 장치 및 방법에 있어서, 기존 검색 엔진의 클릭 로그를 이용하여 질의어와 선택된 URL의 관계성을 수치화하여 제시하고, 클릭 로그에 남겨진 시간 정보와 선택된 URL 문서에 대한 분류 정보 등을 이용하여 사용자에 의해 입력된 초기 질의어와 연관성을 가지는 연관 질의어를 카테고리별로 그룹핑하는 방식으로 초기 질의어와 연관 관계가 높은 다양한 연관 질의어를 제시함으로써 사용자가 원하는 정보를 쉽게 찾을 수 있는 이점이 있다. 또한 URL이 선택된 시간 정보를 반영하여 최근의 정보 경향을 반영할 수 있는 이점이 있다.
이하, 첨부된 도면을 참조하여 본 발명의 동작 원리를 상세히 설명한다. 하기에서 본 발명을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명의 기술요지를 살펴보면, 클릭 로그를 이용하여 질의어와 선택된 URL의 관계성을 수치화하여 제시하고, 클릭 로그에 남겨진 시간 정보와 선택된 URL 문서에 대한 분류 정보 등을 이용하여 사용자에 의해 입력된 초기 질의어와 연관성을 가지는 연관 질의어를 카테고리별로 그룹핑하는 방식으로 초기 질의어와 연관성이 높은 연관 질의어를 제시할 수 있도록 하는 기술을 통해 본 발명에서 이루고자 하는 바를 쉽게 달성할 수 있다.
도 1은 본 발명의 실시 예에 따른 연관질의어 추천장치의 구성을 도시한 것으로, 연관질의어 추천장치는 정보 추출부(112), 빈도 정보 계산부(114), 색인부(116), 클릭로그 색인데이터 DB(Data Base)(120), 클릭로그 DB(118) 등을 포함한다.
이하, 도 1을 참조하여 본 발명의 연관질의어 추천장치 각 구성 요소에서의 동작을 상세히 설명하기로 한다.
먼저, 클릭로그 DB(118)는 인터넷을 포함하는 유/무선 인터넷망을 통해 검색 엔진 서버(130)로 접속한 클라이언트 단말(client terminal)(100)로부터 입력되는 다양한 질의어를 저장하며, 해당 질의어 입력 후 선택한 URL(Uniform Resource Locator) 및 해당 URL이 선택된 시간 정보를 저장한다. 이때 특히 클릭 로그 DB(118)에 저장되는 시간 정보는 질의어에 대한 시간적 경향(trend)을 반영하는 것으로 최근에 가장 많이 클릭된 질의어와 선택 URL에 대한 가중치를 높여줌으로써, 시간적 경향을 수치화하여 연관 질의어 추출에 반영될 수 있다.
정보 추출부(112)는 클릭 로그 DB(118)를 참조하여 다수의 클라이언트 단말(100)을 통해 입력되는 사용자의 질의어 및 질의어에 따라 선택된 URL 정보와 각 URL이 선택된 시간 정보를 추출한다.
빈도 정보 계산부(114)는 정보 추출부(112)에서 추출된 질의어, 선택 URL에 대한 빈도 계산 및 출현 확률에 대한 계산을 수행한다. 색인부(116)는 빈도 및 확률이 계산된 질의어와 선택 URL의 관계 구조를 산출하여 클릭로그 색인 데이터 DB(120)에 저장시킨다.
서버 제어부(110)는 검색엔진 서버(130)의 동작을 제어하며, 정보 추출부(112), 빈도 정보 계산부(114), 색인부(116)를 제어하여 입력된 질의어에 대해 연관성이 높은 연관질의어를 제시하여 준다.
즉, 서버 제어부(110)는 유/무선 통신망을 통해 접속한 클라이언트 단말(100)의 사용자에 의해 초기 질의어가 입력되는 경우 클릭로그 색인 데이터를 참조하여 연관 URL과 연관 질의어를 검색한 후, 다시 연관 URL을 이용하여 초기 질의어와 연관된 다수의 연관 질의어를 검색한다. 이어 초기 질의어와 연관 질의어간 연관성을 산출한 후, 연관 질의어를 카테고리별로 분류하여 그룹핑시키고, 위 산출된 연관성 결과에 따라 연관성이 높은 연관 질의어를 우선하여 표시시킴으로써, 사용자가 원하는 정보를 보다 쉽게 검색할 수 있도록 한다.
도 2는 본 발명의 실시 예에 따른 검색엔진 서버(130)에서 입력된 질의어에 대한 연관 질의어를 추천하는 동작 제어 흐름을 도시한 것이다. 이하, 도 1 및 도 2를 참조하여 본 발명의 실시 예를 상세히 설명하기로 한다.
먼저, 서버 제어부(110)는 (S200)단계에서 유/무선 통신망을 통해 접속한 클라이언트 단말로부터 초기 질의어를 입력받는다.
이어, 서버 제어부(110)는 (S202)단계에서 클릭로그 색인 데이터 DB(120)를 참조하여 입력된 초기 질의어와 연관관계를 가지는 URL을 검색하고, (S204)단계에서 검색된 연관 URL 정보를 이용하여 클릭로그 색인 데이터 DB(120)에서 해당 URL과 연관된 다양한 질의어를 검색하고 이를 초기 질의어와 연관된 연관 질의어로 추출한다.
그런 후, 서버 제어부(110)는 (S206)단계에서 초기 질의어와 연관 URL의 연관 관계를 계산하고, 연관 URL과 연관 질의어의 연관 관계를 계산하여 초기 질의어와 연관 질의어간 연관성을 산출한다.
이어, 서버 제어부(110)는 (S208)단계에서 초기 질의어와 연관되는 것으로 검색된 연관 URL의 해당 웹페이지(web page)를 수집하고, (S210)단계에서 수집해온 URL 웹페이지를 대상으로 기 정의된 유형구조에 기반하여 카테고리별로 분류하여 해당 URL과 연관된 연관 질의어에 대해 카테고리별 그룹핑을 수행한다.
이어, 서버 제어부(110)는 (S212)단계에서 카테고리별로 그룹핑된 연관 질의어를 위 산출된 초기 질의어와의 연관성 결과에 따라 연관성이 높은 순서대로 우선하여 표시시킨다.
이에 따라, 사용자는 초기 질의어 입력 시 초기 질의어와 연관성이 높은 연관 질의어를 보다 정확히 추천받음으로써, 위와 같이 추천된 연관 질의어를 이용하여 원하는 정보를 보다 쉽게 검색할 수 있게 되는 것이다.
도 3은 클릭 로그 DB(118)상 질의어와 선택 URL간 연관성을 그래프로 도식화한 도면이다.
도 3에서는 네 개의 URL(URL1, URL2, URL3, URL4)을 기준으로 하여 연결된 다양한 질의어를 보여주고 있다. 즉, 사용자가 '소나타'라는 질의어를 입력하였을 경우, '소나타'는 'URL1', 'URL2', 'URL4'와 연관성을 가지고 연결되어 있음을 알 수 있다.
이때 'URL1'과 연관성을 가지고 연결된 질의어는 '현대모비스', '기아자동차', '정몽구', '현대자동차'가 있고, 'URL2'와 연관성을 가지고 연결된 질의어는 '현대자동차', '테라칸', '그랜저', '산타페', '제네시스', '에쿠스', '아반테'가 있고, 'URL4'와 연관성을 가지고 연결된 질의어는 '코렐리', '월광소나타' 등이 있음을 알 수 있다.
도 4는 도 3에서 '소나타'와 연관된 URL과 질의어들 간의 관계를 계층적 구조로 도시한 것으로, '소나타'와 연관된 질의어들의 예가 최단말에 표현된다.
도 4를 참조하면, 특히 '현대 자동차'의 경우, 'URL1'과 'URL2'에 모두 연관성을 가지므로 확률적으로 높은 연관성을 가질 것이다.
위와 같은 사용자에 의해 입력된 질의어와 연관 URL의 연관성과 URL과 연관 질의어의 연관성에 대한 계산은 아래 [수학식 1]에서와 같은 베이지안 모델을 사용 한다.
Figure 112008086201212-PAT00001
위 [수학식1]에서 P(URL|Q1)은 Q1이 출현하였을 때, URL이 출현할 확률이다. 반면, P(Q2|URL)은 URL이 출현하였을 때, Q2가 출현할 확률이다. 여기에 클릭 로그 DB(118)에 저장된 해당 URL이 선택된 시간 정보를 가중치로 부여하면 아래의 [수학식2]에서와 같다.
Figure 112008086201212-PAT00002
위 [수학식2]에서 TW(Q1,URL)는 Q1과 URL 선택시간에 대한 가중치로써, T(Q1,URL) 선택시간 가중치의 평균으로 아래의 [수학식3]에서와 같이 계산된다.
Figure 112008086201212-PAT00003
위 [수학식3]을 참조하면 현재시간과 T(Q1,URL)은 1970.01.01 이후의 경과 초로써 계산한다.
도 5는 본 발명의 실시 예에 따라 연관 질의어를 의미적인 구조로 클래스를 구분한 예를 도시한 것으로, 도 4의 예에 적용이 가능하다.
도 5를 참조하면, '소나타'라는 질의어는 모호성이 있는 질의어로써, 'URL1'과 'URL2'는 자동차와 관련된 것이고, 'URL4'는 음악과 관련된 것이다. 즉, '소나타'라는 질의어는 자동차와 음악과 관련된 모호성을 가지고 있는 질의어로써, 해당 모호성에 대한 해결 없이 관련 질의어를 추천한다면, 사용자에게 의미적 모호성을 가중시켜 질의어 추천의 효과를 극대화 할 수 없다.
따라서, 본 발명에서는 해당 질의어와 관련된 URL의 문서를 수집하여 문서에 대한 카테고리 분류를 수행한다. 이때 문서에 대해서 해당 유형이 결정되면, 그 URL과 연결된 모든 연관 질의어는 동일한 카테고리로 분류된다. 이로 인해, 도 4의 'URL1'과 'URL2'는 도 5의 유형들 중 '자동차'로 분류되고 따라서, 'URL1'과 'URL2'와 연결된 모든 연관 질의어는 '자동차' 카테고리로 분류된다. 반면, 'URL4'는 '음악' 카테고리로 결정이 되어, 관련 질의어에 대해서 음악 카테고리로 분류된다.
도 6은 연관 질의어에 대해 도 5에 따른 분류 후 그룹핑하여 초기 질의어에 대한 추천 질의어로 제시한 예를 도시한 것이다.
도 6을 참조하면, 현대자동차는 'URL1'과 'URL2'에 의해서 동시에 연관성을 가지고 연결되었기 때문에 연관 관계 값이 높으므로 상위로 순위화되어 제시되는 것을 알 수 있다. 또한 이중 '제네시스'가 최근 가장 많이 질의된 질의어이므로 다 른 질의어들과 동일한 출현 확률을 가지더라도 시간 가중치에 의해서 상위로 순위화되어 표시되는 것을 알 수 있으며, 이를 통해 연관 질의어에 대해 시간적 경향을 반영할 수 있는 것이다.
상술한 바와 같이, 본 발명에서는 검색엔진에서 연관 질의어를 추천하는 장치 및 방법에 있어서, 기존 검색 엔진의 클릭 로그를 이용하여 질의어와 선택된 URL의 관계성을 수치화하여 제시하고, 클릭 로그에 남겨진 시간 정보와 선택된 URL 문서에 대한 분류 정보 등을 이용하여 사용자에 의해 입력된 초기 질의어와 연관성을 가지는 연관 질의어를 카테고리별로 그룹핑하는 방식으로 초기 질의어와 연관 관계가 높은 다양한 연관 질의어를 제시함으로써 사용자가 원하는 정보를 쉽게 찾을 수 있도록 하며, 또한 URL이 선택된 시간 정보를 반영하여 최근의 정보 경향을 반영할 수 있도록 한다.
한편 상술한 본 발명의 설명에서는 구체적인 실시 예에 관해 설명하였으나, 여러 가지 변형이 본 발명의 범위에서 벗어나지 않고 실시될 수 있다. 따라서 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위에 의해 정하여져야 한다.
도 1은 본 발명의 실시 예에 따른 검색엔진에서 연관질의어 추천장치의 블록 구성도,
도 2는 본 발명의 실시 예에 따른 연관질의어를 추천하는 동작 제어 흐름도,
도 3은 본 발명의 실시 예에 따른 질의어와 URL간 연관성 관계 도식화 도면,
도 4는 본 발명의 실시 예에 따른 연관 URL과 질의어들 간 관계를 나타낸 계층적 구조도,
도 5는 본 발명의 실시 예에 따른 연관 질의어의 클래스 구분 예시도,
도 6은 본 발명의 실시 예에 따른 추천질의어 제시 예시도,
<도면의 주요 부호에 대한 간략한 설명>
100 : 클라이언트 단말 130 : 검색엔진 서버
110 : 서버 제어부 112 : 정보 추출부
114 : 빈도 정보 계산부 116 : 색인부
118 : 클릭로그 DB 120 : 클릭로그 색인 데이터 DB

Claims (8)

  1. 연관 질의어 추천 장치로서,
    클릭로그를 참조하여 다수의 서로 다른 질의어 및 상기 질의어에 따라 선택된 URL 정보와 각 URL이 선택된 시간 정보를 추출하는 정보 추출부와,
    상기 URL이 선택된 빈도 정보를 계산하는 빈도 정보 계산부와,
    상기 URL과 질의어간 관계를 산출하여 클릭로그 색인 데이터로 생성하는 색인부와,
    질의어가 입력되는 경우 상기 클릭로그 색인 데이터를 참조하여 연관 URL과 연관 질의어를 검색한 후, 상기 연관 질의어를 카테고리별로 분류하여 상기 질의어와 연관성이 상대적으로 높은 연관 질의어를 추천 제공하는 서버 제어부
    를 포함하는 연관 질의어 추천 장치.
  2. 제 1 항에 있어서,
    상기 서버 제어부는,
    상기 연관 URL 정보를 이용하여 상기 질의어와 연관된 다수의 연관 질의어를 검색하며, 상기 질의어와 상기 검색된 연관 질의어간 연관성을 산출한 후, 상기 카테고리별로 분류된 연관 질의어를 상기 연관성에 따라 우선 표시시키는 연관 질의어 추천 장치.
  3. 제 1 항에 있어서,
    상기 서버 제어부는,
    상기 질의어와 연관 질의어간 연관성 산출 시, 상기 연관 질의어와 관계된 URL의 선택횟수와 해당 URL이 선택된 가장 최근의 시간에 대한 가중치를 가산하여 산출하는 연관 질의어 추천 장치.
  4. 제 1 항에 있어서,
    상기 질의어는,
    유/무선 통신망을 통해 임의의 클라이언트 단말로부터 입력되는 연관 질의어 추천 장치.
  5. 연관 질의어 추천을 위한 클릭 로그 색인 등록 방법으로서,
    클릭로그를 참조하여 사용자들에 의해 입력되는 다수의 서로 다른 질의어 및 상기 질의어 입력 후 선택된 URL 정보와 각 URL이 선택된 시간 정보를 추출하는 단계와,
    상기 URL이 선택된 빈도 정보를 계산하는 단계와,
    상기 URL과 질의어간 관계를 산출하여 색인 데이터로 저장하는 단계
    를 포함하는 클릭 로그 색인 등록 방법.
  6. 연관 질의어 추천 방법으로서,
    질의어가 입력되는 경우 연관 URL을 검색하는 단계와,
    상기 검색된 연관 URL 정보를 이용하여 상기 질의어와 연관된 다수의 연관 질의어를 검색하는 단계와,
    상기 질의어와 상기 검색된 연관 질의어간 연관성을 산출하는 단계와,
    상기 연관 질의어를 카테고리별로 분류하는 단계와,
    상기 분류된 연관 질의어를 상기 연관성에 따른 순위별로 표시시키는 단계
    를 포함하는 연관 질의어 추천 방법.
  7. 제 6 항에 있어서,
    상기 연관성을 산출하는 단계는,
    상기 연관 질의어와 관계된 URL의 선택 횟수를 산출하는 단계와,
    상기 URL이 선택된 가장 최근의 시간을 추출하는 단계와,
    상기 URL의 선택횟수와 상기 URL 선택 시간에 대한 가중치를 연산하여 상기 질의어와의 연관성을 산출하는 연관 질의어 추천 방법.
  8. 제 7 항에 있어서,
    상기 질의어는,
    유/무선 통신망을 통해 임의의 클라이언트 단말로부터 입력되는 연관 질의어 추천 방법.
KR1020080127490A 2008-12-15 2008-12-15 연관 질의어 추천 장치 및 방법 KR101120040B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080127490A KR101120040B1 (ko) 2008-12-15 2008-12-15 연관 질의어 추천 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080127490A KR101120040B1 (ko) 2008-12-15 2008-12-15 연관 질의어 추천 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20100068964A true KR20100068964A (ko) 2010-06-24
KR101120040B1 KR101120040B1 (ko) 2012-03-23

Family

ID=42367139

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080127490A KR101120040B1 (ko) 2008-12-15 2008-12-15 연관 질의어 추천 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101120040B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101223984B1 (ko) * 2010-08-31 2013-01-24 대한민국 법률 정보 사이트를 통한 다차원 정보 서비스 방법 및 시스템
CN110889050A (zh) * 2018-09-07 2020-03-17 北京搜狗科技发展有限公司 一种泛品牌词的挖掘方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101549188B1 (ko) 2013-12-31 2015-09-11 (주)레드테이블 브랜드 이미지 측정장치 및 측정방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100645608B1 (ko) 2004-03-25 2006-11-13 (주)첫눈 사용자 방문 유알엘 로그를 이용한 정보 검색 서비스 제공 서버 및 그 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101223984B1 (ko) * 2010-08-31 2013-01-24 대한민국 법률 정보 사이트를 통한 다차원 정보 서비스 방법 및 시스템
CN110889050A (zh) * 2018-09-07 2020-03-17 北京搜狗科技发展有限公司 一种泛品牌词的挖掘方法及装置

Also Published As

Publication number Publication date
KR101120040B1 (ko) 2012-03-23

Similar Documents

Publication Publication Date Title
CN103678576B (zh) 基于动态语义分析的全文检索***
US7890493B2 (en) Translating a search query into multiple languages
US6564210B1 (en) System and method for searching databases employing user profiles
KR101060594B1 (ko) 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법
CN101194256B (zh) 具有表意文字和音标字符的语言的自动输入完成的方法和***
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
CN105069103B (zh) App搜索引擎利用用户评论的方法及***
US20060026152A1 (en) Query-based snippet clustering for search result grouping
CN103353894A (zh) 一种基于语义分析的数据搜索方法和***
WO2011097066A2 (en) Semantic table of contents for search results
EP2395441A1 (en) Systems and methods for online search recirculation and query categorization
US20090222440A1 (en) Search engine for carrying out a location-dependent search
KR101355945B1 (ko) 온라인 문맥기반 광고 장치 및 방법
CN102314452A (zh) 一种通过输入法平台进行导航的方法及***
US8700624B1 (en) Collaborative search apps platform for web search
KR20020017076A (ko) 지식 기반 맞춤 정보 제공 시스템 및 그 서비스 방법
JP5221664B2 (ja) 情報マップ管理システムおよび情報マップ管理方法
US20050114317A1 (en) Ordering of web search results
Kantorski et al. Automatic filling of hidden web forms: A survey
KR101120040B1 (ko) 연관 질의어 추천 장치 및 방법
KR20000030486A (ko) 지역정보 검색전용 인터넷 정보 검색 시스템 및 이를이용한 인터넷 정보 검색 방법
Tsukuda et al. Estimating intent types for search result diversification
US20170147679A1 (en) Query expansion system and method using language and language variants
JP2012104051A (ja) 文書インデックス作成装置
Murata Visualizing the structure of web communities based on data acquired from a search engine

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150126

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160127

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170124

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190207

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20200212

Year of fee payment: 9