KR20040048103A - 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법 - Google Patents

웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법 Download PDF

Info

Publication number
KR20040048103A
KR20040048103A KR1020020075873A KR20020075873A KR20040048103A KR 20040048103 A KR20040048103 A KR 20040048103A KR 1020020075873 A KR1020020075873 A KR 1020020075873A KR 20020075873 A KR20020075873 A KR 20020075873A KR 20040048103 A KR20040048103 A KR 20040048103A
Authority
KR
South Korea
Prior art keywords
data
website
registration
search engine
predetermined time
Prior art date
Application number
KR1020020075873A
Other languages
English (en)
Inventor
이우성
강춘식
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020020075873A priority Critical patent/KR20040048103A/ko
Priority to AU2003284776A priority patent/AU2003284776A1/en
Priority to CNA200380104370XA priority patent/CN1717684A/zh
Priority to JP2004556949A priority patent/JP2006508466A/ja
Priority to PCT/KR2003/002585 priority patent/WO2004051515A1/en
Publication of KR20040048103A publication Critical patent/KR20040048103A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 다종 다양한 정보가 위치하는 인터넷 상에서 소정의 웹사이트에 대한 정보를 제공하는 검색 엔진에 관한 것이다. 더욱 상세하게는, 소정의 웹사이트에 대한 정보를 검색 엔진에 등록하기 위한 방법 및 상기 방법을 이용하여 등록된 웹사이트에 대한 정보를 검색 엔진 이용자에게 제공하기 위한 방법에 관한 것이다.
본 발명의 바람직한 일실시예에 따른 검색 엔진에 웹사이트를 등록하여 검색 서비스를 제공하기 위한 방법은 사용자로부터 상기 웹사이트 등록 요청을 수신하는 단계, 상기 웹사이트 등록과 관련된 데이터를 저장하는 단계, 상기 데이터를 소정의 시간 주기로 추출하는 단계, 상기 추출된 데이터를 소정의 시간 주기로 인덱싱하는 단계, 일정 기간마다 추출된 데이터를 인덱싱하는 단계, 검색 서비스 이용자로부터 소정의 검색어를 입력받는 단계, 상기 인덱싱된 데이터와 상기 일정 기간마다 추출되어 인덱싱된 데이터 모두를 참조하여 상기 소정의 검색어에 대한 해당 데이터를 검색하는 단계, 및 상기 검색된 해당 데이터를 소정의 기준에 따라 디스플레이하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법에 의하면, 사용자가 등록을 요청한 웹사이트 정보를 실시간 또는 짧은 시간 내로 검색 엔진에 등록되도록 함으로써, 다양한 사용자의 요구에 부응할 수 있다는 기술적 효과를 얻을 수 있다.

Description

웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를 이용한 웹사이트 검색 서비스 방법{A METHOD OF REGISTERING WEBSITE INFORMATION TO A SEARCH ENGINE AND A METHOD OF SEARCHING A WEBSITE BY USING THE REGISTERING METHOD}
본 발명은 다종 다양한 정보가 위치하는 인터넷 상에서 소정의 웹사이트에 대한 정보를 제공하는 검색 엔진에 관한 것이다. 더욱 상세하게는, 소정의 웹사이트에 대한 정보를 검색 엔진에 등록하기 위한 방법 및 상기 방법을 이용하여 등록된 웹사이트에 대한 정보를 검색 엔진 사용자에게 제공하기 위한 방법에 관한 것이다.
알타비스타(http://www.altavista.com), 라이코스(http://www.lycos.com), 야후(http://www.yahoo.com) 등과 같은 통상의 검색 엔진은 통상 웹사이트 정보를소정의 기준에 따라 분류 및 저장하고 관리하기 위한 데이터베이스, 웹 상을 지속적으로 순회하면서 새로운 웹사이트 정보를 기계적으로 수집하기 위한 소프트웨어로 구현되는 스파이더(spider), 수집된 데이터를 데이터베이스화하여 상기 검색 엔진을 이용하는 이용자로 하여금 검색할 수 있도록 하는 검색 엔진 소프트웨어로 구성된다. 이러한 통상의 검색 엔진 서비스를 제공하기 위한 전체 시스템의 블록도가 도 1에 도시되어 있다. 도 1을 참조하면, 사용자는 사용자 단말기(110)를 통하여 인터넷을 통해 검색 엔진 서버(150)로 접속한다. 사용자가 소정의 검색어를 입력하면, 검색 엔진 서버(150)는 검색 엔진 소프트웨어(140)로 해당 검색어에 대한 웹사이트 정보를 쿼리(query)하고, 검색 엔진 소프트웨어(140)는 해당 데이터베이스(130)를 검색하여 소정의 웹사이트 정보를 알려 준다. 스파이더(120)는 상기 설명한 바와 같이, 웹 상을 지속적으로 순회하면서 웹 서버(160)로부터 새로운 웹사이트 정보를 기계적으로 수집하기 위한 소프트웨어로 구현되는 엔티티(entity)이다. 스파이더(120)는 네트워크 상에서 HTML(HyperText Markup Language)로 기술된 문장을 탐색하고, 기재되어 있는 링크처를 파싱(parsing)하여 네트워크 상에 존재하는 웹 서버(160)로부터 데이터를 수집한다. 이와 같이 스파이더(120)에 의해 수집된 데이터는 데이터베이스화되는데, 여기에서 데이터베이스화라 함은 웹사이트에 위치하는 소정의 정보에 대해 형태소 분석(morphological analysis)을 수행하고, 인덱스 테이블을 작성하여 데이터베이스(130)에 저장하는 일련의 수순을 의미한다. 데이터베이스(130)는 스파이더(120)에 의해 수집된 모든 웹사이트 정보를 저장하기 위한 것이다. 검색 엔진 소프트웨어(140)는 검색 결과를 사용자에게 보여주는 기능을 한다. 이 소프트웨어는 데이터베이스(130)에 저장된 수많은 페이지를 검색하여 검색 결과물을 검색 용어와 일치되는 정확도의 순서로 나열하게 된다. 도 1에는 검색 서버(150)와 검색 엔진부(120, 130, 140)가 별개의 엔티티인 것처럼 도시되어 있으나 이는 설명의 편의를 위한 것일 뿐, 동일한 엔티티일 수 있다.
이와 같이 스파이더를 이용한 정보 수집을 통하여 소정의 웹사이트 정보를 제공하면서 기존의 검색 엔진들은 다음의 문제점에 봉착하게 되었다.
(1) 웹 상에 많은 수의 웹사이트가 생성됨에 따라 저장 및 관리하여야 하는 데이터의 양이 급증하게 되었다.
(2) 이와 같이 급증하는 데이터 중에서 어떠한 데이터가 가치있는 것인지를 평가하기 어렵다.
(3) 스파이더를 통한 웹사이트의 정보 추출은 HTML 등의 텍스트 기반으로 구축된 웹사이트에 국한되므로, 이미지 기반으로 구축된 웹사이트의 경우에는 정보 추출이 어렵다.
상기와 같은 문제점들을 해결하기 위해서 기존의 검색 엔진에서는 사용자로부터 웹사이트 등록 요청을 받아서 이를 검색 엔진에 등록하는 서비스를 제공함으로써, 검색 엔진을 운영하는 운영자의 영리와, 등록을 통하여 자신의 웹사이트에 대한 광고 효과를 극대화하려는 사용자의 이익을 적절히 조화해 나가고 있다.
이와 같은 등록을 통한 검색 엔진 서비스 제공은 2000년 미국의 야후에서 최초로 유료화하면서, 현재 대부분의 검색 엔진 운영사들은 이러한 유료 등록 서비스를 제공하고 있다. 이러한 유료 등록 서비스가 활성화되면서 사용자의 요구도 지속적으로 변해가고 있는데, 이러한 종래의 유료 등록 서비스는 사용자의 등록 요청을 받고 이를 늦게는 2주, 빠르게는 3-5일 정도 소요되기 때문에 신속한 등록을 원하는 사용자의 요구에 부응하지 못한다는 문제점이 있다. 현재, 외국의 유명 검색 엔진인 룩스마트사, 야후, 라이코스 등도 사용자의 등록 요청일로부터 실제 검색 엔진에 등록되는 날까지는 빨라도 2-5일이 소요되고 있다. 이는 종래의 검색 엔진에서, 새로 등록 요청된 웹사이트에 대한 정보를 반영하여 새로운 인덱싱 파일을 만드는데 있어서 시스템적인 제한 또는 운영상의 문제로 말미암아 상기와 같은 2주 내지 빨라도 3-5일이 소요되기 때문인데, 이는 신속한 등록을 원하는 사용자의 다양한 요구에 부응하지 못한다는 문제점을 야기할 뿐 아니라, 사용자 별로 더욱 다양하고 차별화된 등록 서비스를 제공할 수 없다는 문제점도 야기하고 있다.
본 발명에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법은 사용자가 등록을 요청한 웹사이트 정보를 실시간 또는 짧은 시간 내로 검색 엔진에 등록되도록 함으로써, 신속한 등록을 원하는 다양한 사용자의 요구에 부응하도록 하는 것을 그 목적으로 한다.
또한, 본 발명에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 은 사용자가 등록을 요청한 웹사이트 정보를 소정의 금액에 따른 시간 간격에 따라 검색 엔진에 등록되도록 함으로써, 사용자의 선택의 폭을 넓힐 수 있을 뿐 아니라, 검색 엔진을 통한 새로운 수익 모델을 만드는 것을 그 목적으로 한다.
본 발명에 따른 검색 엔진에 웹사이트를 등록하여 검색 서비스를 제공하기위한 방법은 웹사이트 정보를 검색 엔진에 신속히 등록하여 제3자에게 등록된 상기 웹사이트 정보를 신속하게 제공하는 것을 그 목적으로 한다.
도 1은 웹사이트 검색 엔진 서비스를 제공하기 위한 전체 시스템의 구성 블록도이다.
도 2는 본 발명의 일실시예에 따른 웹사이트 검색 엔진의 구성 블록도이다.
도 3은 종래의 검색 엔진에서 수행되는 웹사이트 정보 등록의 프로세스를 도시하는 블록도이다.
도 4는 도3에 도시된 종래의 검색 엔진에서 수행되는 웹사이트 정보 등록 절차의 흐름을 도시하는 흐름도이다.
도 5는 본 발명의 일실시예에 따른 검색 엔진에서 수행되는 웹사이트 정보 등록의 프로세스를 도시하는 블록도이다.
도 6은 도 5에 도시된 본 발명의 일실시예에 따른 검색 엔진에서 수행되는 웹사이트 정보 등록 절차의 흐름을 도시하는 흐름도이다.
도 7은 본 발명의 또 다른 일실시예에 따른 검색 엔진에서 수행되는 웹사이트 정보 등록의 프로세스를 도시하는 블록도이다.
도 8은 도 7에 도시된 본 발명의 또 다른 일실시예에 따른 검색 엔진에서 수행되는 웹사이트 정보 등록 절차의 흐름을 도시하는 흐름도이다.
도 9는 도 7에 도시된 본 발명의 또 다른 일실시예에 따른 검색 엔진에서 수행되는 검색 서비스 제공 흐름을 도시하는 흐름도이다.
<도면의 주요 부분에 대한 부호의 설명>
110 : 사용자 단말기
120 : 스파이더
130 : 데이터베이스
140 : 검색 엔진 소프트웨어
150 : 검색 서버
160 : 웹 서버
본 발명의 바람직한 일실시예에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법은 사용자로부터 상기 웹사이트 등록 요청을 수신하는 단계, 상기 웹사이트 등록과 관련된 데이터를 저장하는 단계, 상기 데이터를 소정의 시간 주기로 추출하는 단계, 추출된 상기 데이터를 일정 기간 마다 추출된 데이터와 병합하는 단계, 및 상기 병합된 데이터를 소정의 시간 주기로 인덱싱하는 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 바람직한 일실시예에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법은 사용자로부터 상기 웹사이트 등록 요청을 수신하는 단계, 상기 웹사이트 등록과 관련된 데이터를 저장하는 단계, 상기 데이터를 소정의 시간 주기로 추출하는 단계, 및 상기 추출된 데이터를 소정의 시간 주기로 인덱싱하는 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 바람직한 일실시예에 따른 검색 엔진에 웹사이트를 등록하여 검색 서비스를 제공하기 위한 방법은 사용자로부터 상기 웹사이트 등록 요청을 수신하는 단계, 상기 웹사이트 등록과 관련된 데이터를 저장하는 단계, 상기 데이터를 소정의 시간 주기로 추출하는 단계, 상기 추출된 데이터를 소정의 시간 주기로 인덱싱하는 단계, 일정 기간 마다 추출된 데이터를 인덱싱하는 단계, 검색 서비스 이용자로부터 소정의 검색어를 입력받는 단계, 상기 인덱싱된 데이터와 상기 일정 기간 마다 추출되어 인덱싱된 데이터를 참조하여 상기 소정의 검색어에 대한 해당 데이터를 검색하는 단계, 및 상기 검색된 해당 데이터를 소정의 기준에 따라 디스플레이하는 단계를 포함하는 것을 특징으로 한다.
이하 첨부된 도면을 참조하여 본 발명에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를 이용한 웹사이트 검색 서비스 방법에 대하여 상술한다.
도 2는 본 발명의 일실시예에 따른 검색 엔진의 구성 블록도이다. 도 2를 참조하면, 사용자는 단말기(210)를 통하여 웹사이트의 등록 요청 및 웹사이트에 대한 정보를 검색 엔진으로 전송한다. 저장 수단(220)은 이러한 웹사이트에 대한 정보를 저장하고, 서퍼(surfer) 등과 같은 전문 검수자(230)는 상기 저장된 웹사이트에 대한 정보를 보고 상기 웹사이트의 등록 사항 등을 점검하여 이를 적절히 수정 및 보완한다. 추출부(250)에서는 상기 수정 및 보완된 웹사이트의 등록 사항 등 데이터를 추출하는 기능을 수행하고, 인덱서(240)는 상기 추출된 데이터를 인덱싱하며, 인덱싱된 데이터는 다시 저장 수단(220) 내의 인덱싱 데이터베이스(도시되지 아니함)에 저장된다. 본 발명의 바람직한 일실시예에 따른 검색 엔진에서 수행되는 데이터 추출(extract)은 저장 수단에 저장된 데이터를 검색 엔진에서 사용되는 특정 포멧에 맞게 추출하여 텍스트 파일 형태로 저장하는 것을 의미한다. 또한, 인덱싱(indexing)은 상기 추출된 데이터를 검색 엔진에서 검색이 수행될 수 있는 포멧으로 변환하는 것을 의미한다. 일반적으로 검색 엔진의 인덱싱은 어떤 전형적인 필드를 가지지 않고 검색 엔진에서 검색이 수행될 수 있을 정도로 데이터를 정리해 놓는 것을 의미한다. 그러나 검색 엔진의 인덱싱이 데이터베이스에서의 인덱싱과 거의 동일한 경우도 있는데, 알타비스타의 경우에는 웹 문서의 제목, 내용, URL 등을 특화시켜서 검색할 수 있도록 데이터를 인덱싱한다. 인덱스 페이지는 통상 URL(Uniform Resource Locator), 키워드, 속성 정보로 구성된다. URL은 페이지 데이터에 억세스하기 위하여 필요한 정보로서, 프로토콜, 도메인명, 포트번호, 경로명 등과 같은 정보를 포함한다. 키워드는 검색을 위한 것이고, 속성 정보는 인덱싱 페이지의 갱신 일자 등을 포함하는 정보로 구성될 수 있다.
도 3은 이러한 검색 엔진에서 수행되는 종래의 웹사이트 정보 등록 프로세스를 도시하는 블록도이다. 도 3에 도시된 웹사이트 정보 등록 프로세스는 도 4의 흐름도를 함께 참조하여 설명한다. 사용자는 자신의 웹사이트의 등록 요청과 웹사이트와 관련된 정보(검색어, 웹사이트 홍보 문구 등)를 검색 엔진으로 전송한다. 검색 엔진에서는 이러한 사용자의 등록 요청을 수신(단계 410)하고, 웹사이트의 등록과 관련된 데이터를 저장 수단에 저장(단계 430)한다. 서퍼 등과 같은 전문 검수자는 저장된 웹사이트의 등록과 관련된 데이터를 소정의 기준(과장 광고는 아닌지, 상기 관련 정보와 실제 웹사이트 사이에 차이가 있는 것은 아닌지 등)에 따라 리뷰(review)하여 상기 정보를 적절히 수정 및 보완(단계 440)하고 이를 다시 저장 수단에 저장한다. 저장된 새로운 웹사이트의 등록을 포함하는 저장 수단에 저장된 모든 데이터는 일정 기간(통상적으로 2-3일)마다 저장 수단으로부터 추출(단계 450)되고, 추출된 데이터는 다시 일정 기간(통상적으로 2-3일)마다 인덱싱(단계 460)된다. 인덱싱된 데이터는 다시 저장 수단 내의 인덱싱 데이터베이스(도시되지아니함)에 저장되어, 검색 엔진 이용자의 검색어 입력(쿼리)에 따라 소정의 검색 결과를 상기 이용자에게 반환할 수 있도록 한다. 이러한 종래의 웹사이트 정보 등록 방법은 상대적으로 긴 기간마다 데이터 추출 및 인덱싱을 수행하므로 새로이 등록을 원하는 웹사이트 정보가 인덱싱되어 실제로 검색 엔진의 이용자가 그 정보를 볼 수 있기까지는 짧게는 2-3일, 길게는 몇 주가 소요된다는 문제점이 있다.
도 5는 본 발명의 바람직한 일실시예에 따른 검색 엔진에서 수행되는 웹사이트 정보 등록의 프로세스를 도시하는 블록도이다. 도 5에 도시된 본 발명의 바람직한 일실시예에 따른 웹사이트 정보 등록의 프로세스는 다음과 같다.
사용자는 자신의 웹사이트의 등록 요청과 웹사이트와 관련된 정보(검색어, 웹사이트 홍보 문구 등)를 검색 엔진으로 전송한다. 이러한 전송은 사용자 단말기를 통한 네트워크 상의 전송일 수도 있고, 우편을 이용하거나 전화를 통한 전송일 수 있다. 검색 엔진에서는 이러한 사용자의 등록 요청을 수신하고, 웹사이트의 등록과 관련된 데이터를 저장 수단 내의 소정의 데이터베이스에 저장한다. 서퍼 등과 같은 전문 검수자는 저장된 웹사이트의 등록과 관련된 데이터를 소정의 기준(과장 광고는 아닌지, 상기 관련 정보와 실제 웹사이트 사이에 차이가 있는 것은 아닌지 등)에 따라 리뷰하여 상기 정보를 적절히 수정 및 보완하고, 이를 다시 저장 수단에 저장한다. 저장된 상기 새로운 웹사이트 등록과 관련된 데이터는 소정의 시간 주기(1시간 단위 또는 실시간) 마다 상기 저장 수단으로부터 추출되고, 추출된 데이터는 일정 기간(통상적으로 일별) 마다 추출된 데이터와 병합(merge)되어 병합된 추출 데이터를 소정의 시간 주기(1시간 단위 또는 실시간) 마다 인덱싱한다.인덱싱된 데이터는 다시 상기 저장 수단 내의 인덱싱 데이터베이스(도시되지 아니함)에 저장되어, 검색 엔진 이용자의 검색어 입력(쿼리)에 따라 소정의 검색 결과를 상기 이용자에게 반환할 수 있도록 한다. 본 발명의 바람직한 일실시예에 따른 검색 엔진에서, 데이터의 병합(merge)이라 함은 기존에 있던 데이터 또는 파일에 신규로 작업된 데이터 또는 파일을 덧붙이는 것을 의미한다.
도 6은 도 5에 도시된 본 발명의 일실시예에 따른 검색 엔진에서 수행되는 웹사이트 정보 등록 절차의 흐름을 도시하는 흐름도이다. 도 6을 참조하면, 등록 절차가 시작(단계 610)되고, 사용자의 등록 요청 및 등록을 원하는 웹사이트와 관련된 정보를 수신(단계 620)한다. 수신된 웹사이트 등록과 관련된 데이터는 저장 수단에 저장(단계 630)되고, 전문 검수자의 리뷰(단계 640)를 거친다. 상기 저장 수단에 저장된 새로운 웹사이트 등록과 관련된 데이터는 소정의 시간 주기(1시간 단위 또는 실시간) 마다 상기 저장 수단으로부터 추출(단계 650)되고, 추출된 데이터는 일정 시간(통상적으로 일별)마다 추출되는 데이터와 병합(단계 660)된다. 병합된 추출 데이터는 소정의 시간 주기(1시간 단위 또는 실시간) 마다 인덱싱(단계 670)되고, 등록 절차는 종료(단계 680)된다.
도 5 내지 도 6에 도시된 본 발명에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법에서, 소정의 시간 주기(1시간 단위 또는 실시간) 마다 추출된 웹사이트 등록과 관련된 데이터를 일정 기간(통상적으로 일별)마다 추출된 데이터와 병합하는 것은 저장 수단에서 새로운 데이터와 기존 데이터를 포함하는 모든 데이터를 추출함으로써 야기될 수 있는 시스템 부하를 최소화하기 위한 것이다. 즉, 새로운 웹사이트 등록과 관련된 데이터만을 저장 수단으로부터 추출하여 이를 일정 기간 마다 추출된 데이터와 병합하고, 병합된 데이터를 인덱싱함으로써 시스템의 부하를 최소화시킬 수 있다. 또한, 본 발명에 따른 검색 엔진 등록 방법의 바람직한 일실시예에 의하면, 추출 및 인덱싱을 수행하기 위한 상기 소정의 시간 주기(1시간 단위 또는 실시간)에 따라서 웹사이트의 등록을 원하는 사용자에게 과금 체계를 달리하도록 구현될 수 있다. 즉, 소정의 시간 주기가 짧을수록 사용자에게 높은 과금을 함으로써, 검색 엔진 운영자의 영리와 빠른 등록을 원하는 사용자의 기대 이익을 조율하는 것이 가능하다.
또한, 도 5 내지 도 6에 도시된 검색 엔진 등록 방법에 따르면, 상술한 바와 같이 추출된 데이터를 일정 기간(통상적으로 일별) 마다 추출된 데이터와 병합(merge)되어 병합된 추출 데이터를 소정의 시간 주기(1시간 단위 또는 실시간) 마다 인덱싱하는 구성을 가질 수도 있고, 추출된 데이터를 인덱싱하고 인덱싱된 데이터를 일정 기간(통상적으로 일별) 마다 추출되어 인덱싱된 데이터와 병합하는 구성을 가질 수 있다. 양 자의 구현 방법은 동일하지만, 병합(merge)이 인덱싱 전에 수행되느냐 인덱싱 후에 수행되느냐의 차이가 있다.
도 7은 본 발명의 또 다른 일실시예에 따른 검색 엔진에서 수행되는 웹사이트 정보 등록의 프로세스를 도시하는 블록도이다. 도 7에 도시된 본 발명의 또 다른 일실시예에 따른 웹사이트 정보 등록의 프로세스는 다음과 같다.
사용자는 자신의 웹사이트의 등록 요청과 웹사이트와 관련된 정보(검색어, 웹사이트 홍보 문구 등)를 검색 엔진으로 전송한다. 이러한 전송은 사용자 단말기를 통한 네트워크 상의 전송일 수도 있고, 우편을 이용하거나 전화를 통한 전송일 수 있다. 검색 엔진에서는 이러한 사용자의 등록 요청을 수신하고, 웹사이트의 등록과 관련된 데이터를 저장 수단에 저장한다. 서퍼 등과 같은 전문 검수자는 저장된 웹사이트의 등록과 관련된 데이터를 소정의 기준(과다 광고가 아닌지, 상기 관련 정보와 실제 웹사이트 사이에 괴리가 있는 것은 아닌지 등)에 따라 리뷰하여 상기 정보를 적절히 수정 및 보완하고, 이를 다시 저장 수단에 저장한다. 저장된 상기 새로운 웹사이트의 등록과 관련된 데이터는 소정의 시간 주기(1시간 단위 또는 실시간)마다 상기 저장 수단으로부터 추출되고, 다시 소정의 시간 주기(1시간 단위 또는 실시간)마다 인덱싱된다. 본 실시예에서는 이와 같이 새로이 등록되는 웹사이트 관련 데이터와는 별도로 일정 기간(통상 일별) 마다 추출되어 인덱싱되는 데이터를 별도로 관리하게 되는데, 이는 도 9에 도시된 본 발명의 바람직한 일실시예에 따른 검색 엔진에서 수행되는 검색 서비스에 대한 설명과 함께 상세히 후술한다.
도 8은 도 7에 도시된 본 발명의 또 다른 일실시예에 따른 검색 엔진에서 수행되는 웹사이트 정보 등록 절차의 흐름을 도시하는 흐름도이다. 도 8을 참조하면, 등록 절차가 시작(단계 810)되고, 사용자의 등록 요청 및 등록을 원하는 웹사이트와 관련된 정보를 수신(단계 820)한다. 수신된 웹사이트 등록과 관련된 데이터는 저장 수단에 저장(단계 830)되고, 전문 검수자의 리뷰(단계 840)를 거친다. 상기 저장 수단에 저장된 새로운 웹사이트 등록과 관련된 데이터는 소정의 시간 주기(1시간 단위 또는 실시간) 마다 상기 저장 수단으로부터 추출(단계 850)된다. 추출된 데이터는 다시 소정의 시간 주기(1시간 단위 또는 실시간) 마다 인덱싱(단계 860)되고, 등록 절차는 종료(단계 870)된다.
도 7 내지 도 8에 도시된 본 발명의 또 다른 일실시예에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법에서는 웹사이트 등록과 관련된 새로운 데이터를 일정 기간(통상적으로 일별) 마다 추출되는 데이터와 분리하여 인덱싱하는데, 이는 상기 일정 기간 마다 추출된 데이터보다 크기가 작은 상기 소정의 시간 주기(1시간 단위 또는 실시간 등) 마다 추출된 데이터만을 따로 인덱싱함으로써, 모든 추출 데이터를 인덱싱하는 경우 야기될 수 있는 시스템의 부하를 절감하기 위한 것이다. 또한, 본 발명에 따른 검색 엔진 등록 방법의 바람직한 일실시예에 의하면, 추출 및 인덱싱을 수행하기 위한 상기 소정의 시간 주기에 따라서 웹사이트의 등록을 원하는 사용자에게 과금 체계를 달리하도록 구현될 수 있음은 상기 도 5 내지 도 6에 설명한 것과 같다.
도 9는 도 7에 도시된 본 발명의 또 다른 일실시예에 따른 검색 엔진에서 수행되는 검색 서비스 제공 흐름을 도시하는 흐름도이다. 도 9를 참조하면, 본 발명의 또 다른 일실시예에 따른 검색 서비스 제공 프로세스는 다음과 같다.
사용자는 자신의 웹사이트의 등록 요청과 웹사이트와 관련된 정보(검색어, 웹사이트 홍보 문구 등)를 검색 엔진으로 전송(단계 910)한다. 이러한 전송은 사용자 단말기를 통한 네트워크 상의 전송일 수도 있고, 우편을 이용하거나 전화를 통한 전송일 수 있다. 검색 엔진에서는 이러한 사용자의 등록 요청을 수신(단계 920)하고, 웹사이트의 등록과 관련된 데이터를 저장 수단에 저장(단계 930)한다.서퍼 등과 같은 전문 검수자는 저장된 웹사이트의 등록과 관련된 데이터를 소정의 기준(과다 광고가 아닌지, 상기 관련 정보와 실제 웹사이트 사이에 괴리가 있는 것은 아닌지 등)에 따라 리뷰하여 상기 정보를 적절히 수정 및 보완(단계 940)하고, 이를 다시 저장 수단에 저장한다. 저장된 상기 새로운 웹사이트의 등록과 관련된 데이터는 소정의 시간 주기(1시간 단위 또는 실시간) 마다 상기 저장 수단으로부터 추출(단계 950)되고, 다시 소정의 시간 주기(1시간 단위 또는 실시간) 마다 인덱싱(단계 960)된다. 상기 인덱싱된 상기 새로운 웹사이트의 등록과 관련된 데이터는 상술한 도 3의 일정 기간(통상적으로 일별) 마다 인덱싱된 데이터와 함께 검색 엔진 이용자로부터 입력 받은 소정의 검색어에 대한 검색시 참조(단계 970)된다. 예를 들어, 새로 등록된 웹사이트에 대한 인덱싱된 데이터의 해당 키워드(keyword)가 네이버인 경우, 검색 엔진의 이용자가 검색어로서 네이버를 입력하게 되면 상기 인덱싱된 새로운 웹사이트의 등록과 관련된 데이터를 참조하여 키워드가 네이버인 웹사이트의 정보를 찾게 되고, 또한 상기 일정 기간(통상적으로 일별) 마다 인덱싱된 데이터를 참조하여 키워드가 네이버인 웹사이트의 정보를 찾게 된다. 이와 같이 인덱싱된 데이터를 이원화하여 유지하고, 데이터 검색시 양쪽을 모두 참조함으로써 소정의 쿼리(query)에 대한 검색을 수행하게 된다.
본 발명의 일실시예에 따르면, 소정의 쿼리에 대한 검색 결과는 다음의 기준에 따라 검색 엔진 이용자에게 반환될 수 있다.
(1) 상기 인덱싱된 새로운 웹사이트의 등록과 관련된 데이터를 참조하여 검색된 결과와, 상기 일정 기간(통상적으로 일별) 마다 인덱싱된 데이터를 참조하여검색된 결과의 우선 순위를 다르게 설정하여 디스플레이한다.
(2) 상기 인덱싱된 새로운 웹사이트의 등록과 관련된 데이터 및 상기 일정 기간(통상적으로 일별) 마다 인덱싱된 데이터 양자를 모두 참조한 다음, 검색된 데이터를 소정의 기준(검수자 및 일반 이용자들의 사이트 평가, 클릭 카운트수, 검색어와의 유사 정도, 사이트 존속 여부 등)에 따라 디스플레이한다.
(3) 상기 인덱싱된 새로운 웹사이트의 등록과 관련된 데이터를 참조하여 검색된 결과는 등록일로부터 일정 기간 동안 검색 결과 화면에 위치한 별도 박스에 표시한다.
위와 같은 다양한 방법들 중의 하나로 검색 결과를 검색 엔진 이용자에게 반환할 수 있고, 기타 다른 방식으로 검색 결과를 반환하는 것도 가능하다. 또한, 상기 (3)의 방법으로 검색 결과를 디스플레이하는 경우, 검색 결과 화면에 위치한 별도 박스에 표시되는 일정 기간에 따라 웹사이트를 등록한 사용자에게 달리 과금을 함으로써 각 사용자 별로 차별화된 서비스를 제공하는 것도 가능하다.
본 발명에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법에 의하면, 사용자가 등록을 요청한 웹사이트 정보를 실시간 또는 짧은 시간 내로 검색 엔진에 등록되도록 함으로써, 다양한 사용자의 요구에 부응할 수 있다는 기술적 효과를 얻을 수 있다.
또한, 본 발명에 따른 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 에 의하면, 사용자가 등록을 요청한 웹사이트 정보를 소정의 금액에 따른 시간 간격에따라 검색 엔진에 등록되도록 함으로써, 사용자의 선택의 폭을 넓힐 수 있을 뿐 아니라 검색 엔진을 통한 새로운 수익 모델을 만들 수 있다는 기술적 효과를 얻을 수 있다.
또한. 본 발명에 따른 검색 엔진에 웹사이트를 등록하여 검색 서비스를 제공하기 위한 방법에 의하면, 웹사이트 정보를 검색 엔진에 신속히 등록하여 제3자에게 등록된 상기 웹사이트 정보를 신속하게 제공할 수 있다는 기술적 효과를 얻을 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 상기 기재로부터 다양한 수정 및 변형이 가능하다는 점은 자명하다. 따라서, 본 발명 사상은 아래에 기재된 특허 청구 범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.

Claims (13)

  1. 검색 엔진에 웹사이트를 등록하기 위한 방법에 있어서,
    사용자로부터 상기 웹사이트 등록 요청을 수신하는 단계;
    상기 웹사이트 등록과 관련된 데이터를 저장하는 단계;
    상기 데이터를 소정의 시간 주기로 추출하는 단계;
    추출된 상기 데이터를 일정 기간 마다 추출되는 데이터와 병합(merge)하는 단계; 및
    상기 병합된 데이터를 소정의 시간 주기로 인덱싱하는 단계
    를 포함하는 것을 특징으로 하는 등록 방법.
  2. 검색 엔진에 웹사이트를 등록하기 위한 방법에 있어서,
    사용자로부터 상기 웹사이트 등록 요청을 수신하는 단계;
    상기 웹사이트 등록과 관련된 데이터를 저장하는 단계;
    상기 데이터를 소정의 시간 주기로 추출하는 단계;
    추출된 상기 데이터를 소정의 시간 주기로 인덱싱하는 단계; 및
    상기 인덱싱된 데이터와 일정 기간 마다 인덱싱된 데이터를 병합(merge)하는 단계
    를 포함하는 것을 특징으로 하는 등록 방법.
  3. 검색 엔진에 웹사이트를 등록하기 위한 방법에 있어서,
    사용자로부터 상기 웹사이트 등록 요청을 수신하는 단계;
    상기 웹사이트 등록과 관련된 데이터를 저장하는 단계;
    상기 데이터를 소정의 시간 주기로 추출하는 단계; 및
    상기 추출된 데이터를 소정의 시간 주기로 인덱싱하는 단계
    를 포함하는 것을 특징으로 하는 등록 방법.
  4. 제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 추출하는 단계의 상기 소정의 시간 주기는 0인 것을 특징으로 하는 등록 방법.
  5. 제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 인덱싱하는 단계의 상기 소정의 시간 주기는 0인 것을 특징으로 하는 등록 방법.
  6. 제1항 또는 제2항에 있어서, 상기 병합하는 단계의 상기 일정 기간은 일 단위인 것을 특징으로 하는 등록 방법.
  7. 제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 소정의 시간 주기에 따라 상기 등록에 대한 과금을 수행하는 것을 특징으로 하는 등록 방법.
  8. 검색 엔진에 웹사이트를 등록하여 검색 서비스를 제공하기 위한 방법에 있어서,
    사용자로부터 상기 웹사이트 등록 요청을 수신하는 단계;
    상기 웹사이트 등록과 관련된 데이터를 저장하는 단계;
    상기 데이터를 소정의 시간 주기로 추출하는 단계;
    상기 추출된 데이터를 소정의 시간 주기로 인덱싱하는 단계;
    일정 기간 마다 추출되는 데이터를 인덱싱하는 단계;
    검색 서비스 이용자로부터 소정의 검색어를 입력받는 단계;
    상기 인덱싱된 데이터와 상기 일정 기간 마다 추출되어 인덱싱된 데이터를 참조하여 상기 소정의 검색어에 대한 해당 데이터를 검색하는 단계; 및
    상기 검색된 해당 데이터를 소정의 기준에 따라 디스플레이하는 단계
    를 포함하는 것을 특징으로 하는 검색 서비스 제공 방법.
  9. 제8항에 있어서, 상기 소정의 시간 주기는 0인 것을 특징으로 하는 검색 서비스 제공 방법.
  10. 제8항에 있어서, 상기 인덱싱하는 단계에서 상기 일정 기간은 일 단위인 것을 특징으로 하는 검색 서비스 제공 방법.
  11. 제8항에 있어서, 상기 소정의 기준은 상기 일정 기간마다 추출되어 인덱싱된 데이터에서 검색된 상기 해당 데이터와 상기 인덱싱된 데이터에서 검색된 상기 해당 데이터의 우선 순위를 다르게 설정하는 것인 검색 서비스 제공 방법.
  12. 제8항에 있어서, 상기 소정의 기준은 상기 인덱싱된 데이터에서 검색된 상기 해당 데이터를 상기 일정 기간마다 추출되어 인덱싱된 데이터에서 검색된 상기 해당 데이터와 구별되도록 표시하는 것인 검색 서비스 제공 방법.
  13. 제1항 내지 제12항 중 어느 하나의 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
KR1020020075873A 2002-12-02 2002-12-02 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법 KR20040048103A (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020020075873A KR20040048103A (ko) 2002-12-02 2002-12-02 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법
AU2003284776A AU2003284776A1 (en) 2002-12-02 2003-11-27 A method of registering website information to a search engine and a method of searching a website by using the registering method
CNA200380104370XA CN1717684A (zh) 2002-12-02 2003-11-27 将网站信息登录到搜索引擎的方法及利用该方法的网站搜索服务方法
JP2004556949A JP2006508466A (ja) 2002-12-02 2003-11-27 ウェブサイト情報を検索エンジンに登録するための方法及びこれを用いたウェブサイト検索サービス方法
PCT/KR2003/002585 WO2004051515A1 (en) 2002-12-02 2003-11-27 A method of registering website information to a search engine and a method of searching a website by using the registering method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020075873A KR20040048103A (ko) 2002-12-02 2002-12-02 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020040003104A Division KR20040048384A (ko) 2004-01-15 2004-01-15 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법

Publications (1)

Publication Number Publication Date
KR20040048103A true KR20040048103A (ko) 2004-06-07

Family

ID=36113913

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020075873A KR20040048103A (ko) 2002-12-02 2002-12-02 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법

Country Status (5)

Country Link
JP (1) JP2006508466A (ko)
KR (1) KR20040048103A (ko)
CN (1) CN1717684A (ko)
AU (1) AU2003284776A1 (ko)
WO (1) WO2004051515A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9189548B2 (en) 2003-06-10 2015-11-17 Google Inc. Document search engine including highlighting of confident results
US9256694B2 (en) 2003-06-10 2016-02-09 Google Inc. Named URL entry

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095395A (zh) * 2015-06-30 2015-11-25 北京金山安全软件有限公司 一种信息处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10260886A (ja) * 1997-03-17 1998-09-29 Casio Comput Co Ltd ホームページ更新通知装置
JPH10340253A (ja) * 1997-06-09 1998-12-22 Chugoku Nippon Denki Software Kk ホームページ情報の登録方法および装置
KR20010047284A (ko) * 1999-11-19 2001-06-15 조광희 등록된 인터넷 웹사이트의 정보의 변동을 검출하여통보하는 방법
KR20010064736A (ko) * 1999-12-18 2001-07-11 이계철 인터넷 웹페이지 갱신정보 제공 시스템 및 그 방법
KR20010070874A (ko) * 2001-06-15 2001-07-27 이낙근 실시간업데이트방식 정보네트웍과 산업데이터베이스의구축방법
KR20020069869A (ko) * 2001-02-28 2002-09-05 애드플러스 커뮤니케이션 주식회사 인터넷 사이트의 웹 문서 갱신 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000030601A (ko) * 2000-03-08 2000-06-05 김세기 인터넷 공간에서의 도메인 검색방법
KR20010035310A (ko) * 2001-02-02 2001-05-07 이영우 클라이언트 피씨상에서의 도메인 검색/등록 시스템 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10260886A (ja) * 1997-03-17 1998-09-29 Casio Comput Co Ltd ホームページ更新通知装置
JPH10340253A (ja) * 1997-06-09 1998-12-22 Chugoku Nippon Denki Software Kk ホームページ情報の登録方法および装置
KR20010047284A (ko) * 1999-11-19 2001-06-15 조광희 등록된 인터넷 웹사이트의 정보의 변동을 검출하여통보하는 방법
KR20010064736A (ko) * 1999-12-18 2001-07-11 이계철 인터넷 웹페이지 갱신정보 제공 시스템 및 그 방법
KR20020069869A (ko) * 2001-02-28 2002-09-05 애드플러스 커뮤니케이션 주식회사 인터넷 사이트의 웹 문서 갱신 방법
KR20010070874A (ko) * 2001-06-15 2001-07-27 이낙근 실시간업데이트방식 정보네트웍과 산업데이터베이스의구축방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Catalogue 2001.01.31., 1338 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9189548B2 (en) 2003-06-10 2015-11-17 Google Inc. Document search engine including highlighting of confident results
US9256694B2 (en) 2003-06-10 2016-02-09 Google Inc. Named URL entry
US10002201B2 (en) 2003-06-10 2018-06-19 Google Llc Named URL entry

Also Published As

Publication number Publication date
CN1717684A (zh) 2006-01-04
WO2004051515A1 (en) 2004-06-17
AU2003284776A1 (en) 2004-06-23
JP2006508466A (ja) 2006-03-09

Similar Documents

Publication Publication Date Title
US11023513B2 (en) Method and apparatus for searching using an active ontology
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
JP4574356B2 (ja) 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
US8745067B2 (en) Presenting comments from various sources
US9165085B2 (en) System and method for publishing aggregated content on mobile devices
CA2583042C (en) Providing information relating to a document
Liu et al. Discovering unexpected information from your competitors' web sites
Wöber Domain-specific search engines.
US20010049674A1 (en) Methods and systems for enabling efficient employment recruiting
US8346764B1 (en) Information retrieval systems, methods, and software with content-relevancy enhancements
US20080071763A1 (en) Dynamic updating of display and ranking for search results
US20090228476A1 (en) Systems, methods, and software for creating and implementing an intellectual property relationship warehouse and monitor
WO2007090064A2 (en) Displaying facts on a linear graph
US20100125781A1 (en) Page generation by keyword
US7421416B2 (en) Method of managing web sites registered in search engine and a system thereof
US20040015485A1 (en) Method and apparatus for improved internet searching
CN107870915B (zh) 对搜索结果的指示
JP2003271609A (ja) 情報監視装置及び情報監視方法
US20100235342A1 (en) Tagging system using internet search engine
US20020062341A1 (en) Interested article serving system and interested article serving method
KR20040048103A (ko) 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법
KR20040048384A (ko) 웹사이트 정보를 검색 엔진에 등록하기 위한 방법 및 이를이용한 웹사이트 검색 서비스 방법
US20210295371A1 (en) Advanced search engine for business
JPWO2002044946A1 (ja) サーチエンジン、検索システム、検索システムにおけるデータベース作成方法、および記憶媒体
WO2008078884A1 (en) Retrieval system and method

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
A107 Divisional application of patent
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E801 Decision on dismissal of amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20050217

Effective date: 20060720