KR20050016407A - 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩방법 - Google Patents

데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩방법

Info

Publication number
KR20050016407A
KR20050016407A KR1020047018446A KR20047018446A KR20050016407A KR 20050016407 A KR20050016407 A KR 20050016407A KR 1020047018446 A KR1020047018446 A KR 1020047018446A KR 20047018446 A KR20047018446 A KR 20047018446A KR 20050016407 A KR20050016407 A KR 20050016407A
Authority
KR
South Korea
Prior art keywords
data
search
subroutine
information
search condition
Prior art date
Application number
KR1020047018446A
Other languages
English (en)
Inventor
편정범
박원준
Original Assignee
편정범
박원준
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 편정범, 박원준 filed Critical 편정범
Publication of KR20050016407A publication Critical patent/KR20050016407A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

전기통신망에 의하여 연결된 사용자단말기를 통하여 검색조건을 입력하는 검색조건 입력단계와; 상기 입력된 검색조건을 검색엔진을 가지는 하나 이상의 데이터베이스 서버에 전기통신망을 통하여 송신하는 송신 서브루틴과; 상기 검색조건에 따라서 상기 데이터베이스 서버의 검색엔진에 의하여 검색된 하나 이상의 검색결과 값들을 전기통신망을 통하여 수신하는 제 1 수신 서브루틴과; 상기 검색결과에 연결된 데이터들을 전기통신망을 통하여 수신하는 제 2 수신 서브루틴을 포함하는 일괄검색 단계;를 포함하는 것을 특징으로 하는 데이터 검색 방법을 제공한다.

Description

데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩 방법{DATA SEARCHING METHOD AND INFORMATION DATA SCRAPPING METHOD USING INTERNET}
본 발명은 데이터 검색 방법에 관한 것으로, 보다 상세하게는 정보통신망, 특히 인터넷을 통하여 데이터를 검색하는 데이터 검색 방법에 관한 것이다.
컴퓨터의 발달과 함께 인터넷으로 대표되는 전기통신망의 보급은 우리 사회 전반에 많은 영향을 미치고 있다. 소위 오프라인 상에서 이루어지던 일들이 점차 인터넷, 즉 온라인 상으로 이전하게 되면서 인터넷이 하나의 생활로 자리잡게 된 것이다.
예컨데, 정보를 수집하기 위해서는 기존에는 각종 자료가 구비된 도서관 등을 방문하여 책자, 신문, 잡지 등 수없이 많은 자료를 수집 및 취합하여야만 했다.
그러나 지금은 인터넷이 연결된 컴퓨터, 단말기를 통하여 찾고자 하는 사항을, 키워드 등을 입력함으로써 손쉽게 원하는 자료들을 입수할 수 있게 되었다.
이러한 온라인을 통한 각종 자료의 검색 및 수집에 관하여 도 1 을 참조하여 상세히 설명하면 다음과 같다.
먼저, 단계(S1)에서 사용자가 사용자단말기를 통하여 검색을 원하는 사이트(예를 들어, 신문이나 잡지 사이트, 또는 검색엔진을 가지고 있는 데이터베이스 사이트 등)에 접속을 한다. 이때 접속은 인터넷을 통하여 검색을 원하는 사이트에 접속을 하는 것이다. 단계(S2)에서는 원하는 사이트로의 접속이 이루어지면 사용자가 검색하고자 하는 사항을 키워드등으로 입력한다. 즉 해당하는 사이트의 검색 키워드 입력란에 검색을 원하는 키워드를 입력하는 것이다. 단계(S3)에서는 단계(S2)에서 입력한 키워드에 대한 검색이 수행되면 검색된 정보에 관한 리스트가 사용자단말기의 화면상에 출력된다.
단계(S4)에서 사용자는 사용자단말기의 화면상에 출력된 데이터에 링크된 리스트를 참조하여 원하는 하나의 리스트를 클릭하여 그 리스트에 링크된 데이터의 내용을 확인한다. 이때, 사용자는 리스트 중에서 임의의 리스트를 클릭하거나 사용자가 원하는 가장 유력한 리스트를 클릭하여 각각의 데이터들을 볼 수 있을 것이다. 단계(S5)에서는 상기 단계(S4)에서 클릭하여 열어본 그 리스트에 링크된 데이터의 내용을 읽어보고 사용자가 원하는 필요한 내용을 포함하고 있는 지를 판단한다. 단계(S6)에서는 사용자가 필요로 하는 정보가 포함되어 있을 경우에 입력장치인 키보드 또는 마우스 등을 이용하여 해당하는 내용을 선택한 후에 복사를 한다.
이렇게 복사한 내용은 단계(S7)에서 사용자가 원하는 워드프로세서(예를 들어, 한글 또는 MS워드 등)에 문자로서 붙여 넣는 등 편집을 수행한다.
이러한 과정, 즉 단계(S4)에서 단계(S7)까지의 작업을 순차적으로 반복하여 수행하게 된다. 이를 통하여 사용자가 원하는 정보를 수집하고 수집된 내용을 편집할 수 있다. 그리고 단계(S8)에서 사용자의 선택에 의하여 더 이상의 확인할 내용이 없는 지를 판단한 후에 단계(S9)에서 다른 검색사이트를 이용하여 동일한 작업을 할 것인지를 판단한다.
그리고 다른 검색사이트를 통한 정보 수집을 원하지 않을 경우에는 정보 수집 작업을 종료하게 된다.
이와 같이 기존에는 상기와 같은 과정을 통해서 얻어진 자료가 사용자의 손에 익숙한 워드 프로세서 등으로 이미지파일이나 텍스트파일등으로 저장되고 관리되는 경우가 대부분이다.
그러나 실제로 이러한 작업을 할 경우에 몇 가지 문제점이 야기된다. 그 중에서도 가장 큰 문제점은 이러한 작업에 소요되는 시간이 상당히 크다는 것이다. 실제로 온라인 검색에 소요되는 시간을 가상적으로 계산해 보면, 단 현재 가장 많이 사용되는 초고속 인터넷(ADSL) 이상의 환경을 대상으로 하였을 경우에 검색 사이트의 접속하는 시간 약 5∼10 초, 키워드의 입력시간 약 5∼10 초, 검색 결과를 기다리는 시간(각종 광고나 관련 링크 또는 선택창 등의 부수적인 자료포함) 약 2∼20 초, 검색 결과 중에서 사용자가 하나의 항목을 선택하여 클릭하는 시간 약 3∼5 초, 내용을 확인하고 필요여부를 판단하는 시간 약 10∼20 초, 필요할 경우에 내용을 선택해서 복사하는 시간 약 10 초 내외, 그리고, 선택한 내용을 워드 프로세서 등에 붙이기를 하는 시간 약 5 초가 소요된다.
상기와 같은 이러한 일련의 과정들을 거치게 되는데, 사용자가 사용자단말기를 통하여 정보를 수집하는 시간이 상당히 많이 소요된다는 것을 알 수 있다. 그 첫 번째 이유로는 사람과 네트워크, 그리고 사용자단말기 등, 여러 작업 주체의 기능이 혼재됨으로 작업 주체간 전환되는 시간이 많이 소요된다는 점이다. 즉 사용자의 조작 → 네트워크를 통한 접속의 대기 → 사용자의 조작 → 사용자단말기 작동 → 사용자의 판단 → 사용자의 조작 등으로 이루어지기 때문이다.
또한, 시간이 많이 소요되는 두 번째 이유로는 유용한 데이터, 즉 컨텐츠가 포함된 웹 화면에는 불필요한 광고, 링크 또는 이미지 등이 일반적으로 40∼50 개 가량 포함되어 있어 본문의 내용 확인을 위해서는 이러한 불필요한 내용이 포함된 화면이 뜨는 시간을 기다릴 수밖에 없다는 점이다. 또한 일반적으로 하나의 사이트만을 대상으로 검색을 수행하지 않는 관계로 다른 사이트에 접속해서 이러한 과정을 반복적으로 수행하여야 한다.
또한, 시간이 많이 소요된다는 것 이외에도 정보의 수집과정이 반복적이고 지루하다는 단점이 있다.
또한, 이러한 반복적 과정에서 정보의 누락이나 중복 등이 발생할 수 있으며, 이 경우에 재검색 등의 불필요한 작업이 추가로 발생될 수 있다. 또한 만일 이러한 작업이 매일 또는 자주 수행하는 경우에는 불편사항은 더욱 늘어나게 될 것이다.
현재 이러한 불편사항을 어느 정도는 해결한 메타엔진의 소프트웨어들이 등장하고 있으나, 이러한 소프트웨어들 역시 검색 결과를 한 곳에 모아 놓은 수준, 즉 검색 결과가 있는 URL(Uniform Resource Locator; URL 은 인터넷에서 접근 가능한 자원의 주소를 일관되게 표현할 수 있는 형식을 말한다.)만을 표시하는 정도의 서비스만을 제공하고 있는 실정이다.
더욱이 국내특허공개 제 10-2001-10807 호(인터넷을 이용한 뉴스정보 스크랩의 방법 및 시스템)는 신문기사 스크랩과 거의 동일한 형태로 인터넷을 이용하여 정보출처가 기록된 신문의 뉴스기사, 공고, 광고 등과 같은 관심이 있는 뉴스정보를 이미지파일과 텍스트파일로 제공하는 것으로, 검색된 결과는 사용자만의 데이터베이스 저장공간을 제공하는 것이다.
따라서, 사용자가 스크랩한 정보를 다시 볼 경우에는 인터넷을 접속하여 검색된 결과가 저장된 데이터베이스의 저장공간을 열람하여야 하는 것으로는 이는 자신의 고유한 서버를 필요로 하는 것이다.
또한, 국내특허공개 제 10-2001-102786 호 및 국내특허공개 제 10-2002-26082 호의 경우에도 스크랩서버나 데이터베이스 등의 저장공간을 통하여 해당하는 정보를 분류, 수정, 검색하는 서비스를 제공하는 것을 목적으로 하고 있는 것인바, 이 기술은 모두 인터넷을 통하여 해당하는 서버 및 데이터베이스에 가공된 정보를 열람할 수 있도록 되어 있어 오프라인 상태에서는 수집한 정보를 열람할 수 없도록 되어 있는 단점이 있다.
본 발명의 목적은 상기와 같은 문제점을 해결하기 위하여, 정보를 수집하는 데 소요되는 시간을 획기적으로 줄일 수 있는 데이터 검색방법을 제공하는 데 있다.
본 발명의 다른 목적은 전기통신망, 즉 인터넷을 통하여 검색된 정보를 효율적으로 수집, 분석 및 관리할 수 있는 데이터 검색 방법을 제공하는 데 있다.
본 발명은 상기와 같은 본 발명의 목적을 달성하기 위하여 창출된 것으로서, 본 발명에 따른 데이터 검색 방법은 전기통신망에 의하여 연결된 사용자단말기를 통하여 검색조건을 입력하는 검색조건 입력단계와; 상기 입력된 검색조건을 검색엔진을 가지는 하나 이상의 데이터베이스 서버에 전기통신망을 통하여 송신하는 송신 서브루틴과; 상기 검색조건에 따라서 상기 데이터베이스 서버의 검색엔진에 의하여 검색된 하나 이상의 검색결과 값들을 전기통신망을 통하여 수신하는 제 1 수신 서브루틴과; 상기 검색결과에 연결된 데이터들을 전기통신망을 통하여 수신하는 제 2 수신 서브루틴을 포함하는 일괄검색 단계;를 포함하는 것을 특징으로 한다.
또한 본 발명은 상기와 같은 데이터 검색 방법을 실행할 수 있는 컴퓨터 프로그램을 제공한다.
또한 본 발명은 상기 컴퓨터 프로그램을 저장하기 위한 저장매체를 제공한다.
또한 본 발명은 상기 컴퓨터 프로그램을 전기통신망을 이용하여 송신 또는 수신하는 방법을 제공한다.
또한 본 발명은 사용자용 컴퓨터에 접속된 온라인을 통하여 검색사이트의 검색 기능을 이용하여 원하는 검색 정보의 키워드를 입력하여 검색하는 단계; 상기 사용자용 컴퓨터에 설정된 프로그램이 자동으로 HTTP 프로토콜을 통하여 검색 사이트의 웹서버에 접속하는 단계; 상기 접속된 검색 사이트의 웹서버에 검색을 위한 쿼리(Query)를 송신하는 단계; 상기 웹서버가 수신한 쿼리에 대한 결과로서 연계된 하나 이상의 데이터서버로부터 검색한 결과물을 인터넷을 통하여 사용자용 컴퓨터로 송신하는 단계; 상기 검색된 자료를 HTTP 프로토콜을 이용하여 다운로드받는 단계; 상기 다운로드한 정보 중에서 불필요한 정보를 제거하는 단계; 상기 불필요한 정보가 제거된 결과를 로컬 저장매체에 저장하는 단계; 상기 로컬 저장매체에 정보를 사용자용 컴퓨터에 포함된 프로그램에 의하여 편집, 가공 및 관리하는 단계를 포함하여 이루어진 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법을 제공한다.
이하 본 발명에 따른 데이터 검색 방법 및 인터넷을 이용한 정보자료 스크랩 방법에 관하여 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다.
상기와 같은 본 발명의 목적을 달성하기 위해서는 첫째, 일괄 검색기능으로서, 여러 개의 검색 사이트를 한 번에 검색해서 그 결과를 한꺼번에 볼 수 있는 기능이 필요하다. 둘째, 검색 결과의 적절한 가공으로서, 현재 온라인 정보의 경우 각종 배너 및 광고로 인해 그 내용을 확인하는데 보다 많은 시간이 소요될 뿐만 아니라 자료의 보관 및 관리 등이 어려워진다. 이러한 불필요한 자료를 적절히 처리해 주는 기능이 필요하다. 셋째, 데이터의 확인 시의 속도 향상으로서, 특히 검색된 내용이 많을 경우 보다 빨리 그 내용을 확인할 수 있어야 한다. 즉 몇 천건 이상의 데이터를 확인할 경우에 현재의 온라인 상에서의 확인처럼 내용을 확인할 때마다 몇 초 이상이 소요된다면 그 시간의 소모가 커질 수밖에 없을 것이다. 이러한 내용의 확인을 보다 빠르게 할 필요가 있다. 넷째, 데이터 관리의 용이성으로서, 확인한 내용은 그 필요여부에 따라 보다 편리하게 관리될 수 있어야 한다. 즉 보관이 필요한 내용은 보관을, 필요치 않은 내용은 쉽게 삭제할 수 있어야 한다. 또한 워드 프로세서로의 변환 등 관리의 용이성이 필요하다. 그리고 다섯째, 검색된 내용의 자동적인 갱신 기능으로서, 검색된 내용을 사용자가 원할 경우에 일정한 주기로 자동으로 갱신할 수 있는 기능이 필요하다. 현대의 정보는 새로운 정보가 아니면 그 가치가 떨어질 수밖에 없으므로 항상 새로운 자료로 그 내용을 유지해야 하는데 이러한 사항을 모두 자동으로 처리할 경우 사용자의 시간적, 육체적, 정신적 만족도는 더욱 커질 수 있을 것이다.
도 2 는 본 발명에 따른 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩을 위한 시스템의 구성도로, 인터넷에 연결된 로컬의 사용자단말기(개인용 컴퓨터 등)에 설치된 데이터 프로세싱 엔진 소프트웨어(Data Processing Engine Software)가 인터넷을 통해서 검색하고자 하는 웹서버(Web Server)에 접속하여 검색 결과를 얻고, 얻어진 검색 결과를 로컬 저장매체(플로피디스크, 하드디스크, 컴팩트디스크 또는 플래쉬 메모리 등)에 저장하는 시스템의 구성도를 나타낸 것이다.
사용자단말기(10)는 데스크탑 컴퓨터, 휴대용 컴퓨터, PDA 또는 휴대폰 등 휴대용 단말기 등이고, 인터넷과 같은 전기통신망과, 연결, 즉 온라인을 통하여 통신이 가능한 것이어야 한다. 그리고 사용자단말기(10)에는 데이터 프로세싱 엔진 소프트웨어(12)가 설치되어 있어야 한다. 데이터 프로세싱 엔진 소프트웨어(12)는 인터넷을 통하여 검색을 하고 검색된 자료를 저장매체에 저장시키는 기능을 포함한 엔진으로 프리웨어, 셰어웨어, 또는 유료 소프트웨어일 수 있다. 또한, 데이터 프로세싱 엔진 소프트웨어는 다운로드되어 로컬 저장매체에 저장된 각각의 파일의 집합을 하나 이상의 파일로 변환 및 저장해 주는 기능을 포함하고 있다. 상기 데이터 프로세싱 엔진 소프트웨어(12)는 본 발명에 따른 데이터 검색 방법 및 정보 자료 스크랩 방법을 구현하기 위한 컴퓨터 프로그램이다.
출력장치(20)는 검색된 결과를 가시적으로 표시하거나 입 ·출력장치의 입 ·출력상태를 표시하는 모니터 또는 기타 출력을 위한 기기이다. 입력장치(30)는 검색에 필요한 키워드를 입력하거나 검색결과에 대한 편집 등을 할 수 있는 것으로 키보드나 마우스 등이 포함된다.
저장장치(40)는 상기 데이터 프로세싱 엔진 소프트웨어(12)로부터 검색된 데이터를 저장하기 위한 것으로, 플로피디스크(FD), 하드디스크(Hard Disk), 컴팩트디스크(Compact Disk) 또는 플래쉬 메모리(Flash Memory) 등의 저장매체들이 포함된다.
웹서버 또는 데이터베이스 서버(60)는 로컬의 사용자단말기(10)로부터 전기통신망, 즉 인터넷(50)을 통하여 연결된 해당 웹사이트(신문사 또는 잡지사 또는 기타 각종의 정보를 제공하는 사이트등)의 서버이다. 데이터베이스 서버(60)에는 데이터, 이미지 데이터 또는 각종의 데이터 정보를 제공하는 복수의 서브 데이터베이스 서버들이 연계될 수 있다. 그리고 바람직하게는 데이터베이스 서버(60)는 검색을 위한 검색엔진을 가지고 있다. 데이터베이스 서버(60)에 저장된 데이터로는 신문 또는 잡지 등은 물론 특허(실용신안), 의장, 상표, 저작권등의 지적재산권, 인터넷 쇼핑몰(가격정보, 상품 정보)들이 있다.
본 발명의 제 1 실시예에 따른 데이터 검색 방법은 도 3 에 도시된 바와 같이, 전기통신망(50)에 의하여 연결된 사용자단말기(10)를 통하여 검색조건을 입력하는 검색조건 입력단계(S100)와; 상기 입력된 검색조건을 검색엔진을 가지는 하나 이상의 데이터베이스 서버(60)에 전기통신망(50)을 통하여 송신하는 송신 서브루틴과(S210); 상기 검색조건에 따라서 상기 데이터베이스 서버(60)의 검색엔진에 의하여 검색된 하나 이상의 검색결과 값들을 전기통신망(50)을 통하여 수신하는 제 1 수신 서브루틴(S220)과; 상기 검색결과에 연결된 데이터들을 전기통신망(50)을 통하여 수신하는 제 2 수신 서브루틴(S230)을 포함하는 일괄검색 단계(S200);를 포함하여 구성된다.
상기 검색조건 입력단계(S100)는 상기 데이터베이스 서버(60)를 선택하는 서버선택단계(S110)를 추가로 포함할 수 있다.
또한 상기 서버선택단계(S110)는 도 4a 에 도시된 바와 같이, 각 데이터베이스 서버(60)의 도메인 주소를 직접 입력하거나, 데이터베이스 서버(60)들로 이루어진 서버 목록에서 하나 이상의 데이터베이스 서버(60)를 선택할 수 있다.
또한 상기 서버선택단계(S110)는 상기 서버 목록에 데이터베이스서버(60)를 추가하는 서버추가단계(S111)를 추가적으로 포함할 수 있다. 상기 데이터베이스 서버 목록은 별도의 파일로 저장할 수 있으며, 사용자들 사이에 상호 데이터를 주고 받을 수 있으며, 정기적으로 업데이트에 의하여 갱신이 가능하다.
데이터베이스 서버(60)를 선택하는 구체적인 방법으로는 해당 데이터베이스 서버의 선택란을 선택하거나, 팝업 형식 등을 활용하여 선택할 수 있다.
상기 검색조건 입력단계(S100)는 사용자가 검색을 위한 검색조건의 입력이 용이하도록 상기 데이터베이스 서버(60)의 검색엔진의 입력조건과 동일하게 입력할 수 있다. 특히 일정한 형식을 요구하는 데이터베이스서버(60)의 경우에는 그 데이터베이스 서버(60)의 검색창과 동일한 형식으로 검색 조건을 입력할 수 있다.
상기 검색조건은 단어, 문장 등의 키워드가 될 수 있으며, 특정한 검색을 수행할 수 있도록 시간 속성을 가지도록 할 수 있다.
또한 상기 검색조건은 데이터베이스 서버(60)의 검색엔진에 송신하는 송신 검색조건과; 상기 제 2 수신 서브루틴(S230)에서 수신된 데이터들에 부여되는 데이터 요구조건을 포함하여 구성될 수 있다.
상기 송신 검색조건은 데이터베이스 서버(60)에서 사용되는 검색조건이며, 데이터 요구조건은 데이터베이스 서버(60)에서 검색된 검색 데이터들을 선별 및 가공하기 위한 검색조건이다. 또한 상기 데이터 요구조건은 검색된 검색 데이터들에 대하여 다시 재분류, 소위 결과내 재검색할 수 있는 키워드 등이 될 수 있다(S260).
상기 데이터 요구조건으로는 파일형식 또는 데이터의 생성날짜, 그림이 없는 텍스트만의 서식 등 사용자가 임의로 설정할 수 있는 것이 바람직하다.
한편 데이터베이스 서버(60)에 따라서 검색조건의 입력 형식 또는 서식이 다를 수 있는데 이때 사용자의 편의를 위하여 각 데이터베이스서버(60)의 검색조건의 입력 형식으로 변환할 수 있도록, 상기 송신 서브루틴(S210)은 입력된 검색조건을 상기 데이터베이스 서버(60)의 검색엔진이 요구하는 형식으로 변환하는 변환 서브루틴을 추가로 포함할 수 있다. 물론 상기 변환 서브루틴은 해당 데이터베이스 서버(60)의 변동에 따라서 지속적으로 업데이트가 가능한 것이 바람직하다.
상기 일괄검색단계(S200)는 도 4b 에 도시된 바와 같이, 상기 제 2 수신 서브루틴(S230)에서 수신된 데이터들이 상기 입력된 검색조건에 해당되는지 판단하는 비교판단 서브루틴(S240)을 추가로 포함할 수 있다.
상기 일괄검색 단계(S200)는 상기 제 2 수신 서브루틴(S230)에서 수신된 데이터들을 상기 사용자단말기(10)에 저장하는 데이터 저장 서브루틴(S250)을 추가적으로 포함할 수 있다.
상기 데이터 저장 서브루틴(S250)은 상기 제 2 수신 서브루틴(S230)에서 수신된 데이터에서 가공하여 저장하거나, 상기 제 2 수신 서브루틴(S230)에서 수신된 데이터에서 광고부분을 제거하여 저장할 수 있다. 또한 상기 데이터 저장 서브루틴(S250)은 상기 제 2 수신 서브루틴(S230)에서 수신된 데이터들을 오프라인(offline) 상으로 사용이 가능하도록 온라인(online) 요소를 편집하여 저장할 수 있다.
상기 데이터 저장 서브루틴(S250)은 데이터들이 중복 저장되는 것을 방지하기 위하여 수신된 데이터들이 이전에 저장된 데이터들과 비교판단하여 수신된 데이터들이 이전에 저장된 데이터들과 다른 데이터들만 사용자단말기(10)에 저장하는 것이 바람직하다.
상기 데이터 저장 서브루틴(S250)은 또한 제 2 수신 서브루틴(S230)에서 수신된 데이터에 미리 설정된 값을 추가하여 저장하거나, 상기 데이터 저장 서브루틴은 제 2 수신 서브루틴(S230)에서 수신된 데이터에 상기 데이터를 송신한 데이터베이스 서버 정보, 상기 데이터의 저작권을 추가하여 저장할 수 있다.
한편 본 발명에 따른 데이터 검색 방법은 상기 일괄검색 단계(S200)후에는 상기 사용자단말기(10)에 저장된 상기 수신된 데이터들을 가공하기 위한 가공단계(S300)를 추가적으로 포함할 수 있다.
상기 가공단계(S300)는 상기 수신된 데이터들을 동일한 서식으로 변환하거나, 수신된 데이터들을 하나의 파일로 합치거나 사용자가 요구하는 조건으로 편집 등의 가공을 하게 된다.
데이터가 새로 검색되거나, 변화가 있는 경우 등, 데이터의 변화를 반영시키기 위하여 상기 일괄검색 단계(S200)는 미리 설정된 시간 간격을 두고 반복하거나, 실시간으로 반복하여 수행 할 수 있다.
한편 접속되는 데이터베이스 서버(60)가 로그인 과정 등을 요구할 수 있는 데, 본 발명에 따른 데이터 검색 방법의 상기 검색조건은 로그인 과정을 가지는 상기 데이터베이스 서버에 접속할 수 있도록 로그인 정보를 포함하여 구성될 수 있다.
상기 데이터베이스 서버(60)는 지적재산권 데이터베이스, 인터넷 쇼핑몰 데이터베이스, 상기 데이터베이스 서버는 신문, 잡지 등의 기사데이터베이스가 있다.
본 발명에 따른 데이터 검색 방법은 선택된 주소에 해당되는 웹페이지를 표시하는 웹페이지 표시단계를 추가적으로 포함할 수 있다.
또한 상기 웹페이지 표시단계는 사용자가 선호하는 웹페이지의 주소를 저장하는 즐겨찾기단계를 추가로 포함하거나, 웹페이지 주소를 입력하는 주소입력단계를 추가로 포함할 수 있다.
특히 상기 웹페이지 표시단계를 추가로 포함함으로써, 데이터의 검색 및 수집과 동시에 사용자는 접속하고자 하는 웹페이지를 검색함으로써 사용자의 업무상 효율을 증대시키는 이점이 있다. 또한 데이터베이스 서버(60)의 주소로 하여 검색결과를 해당 데이터베이스 서버(60)에 직접 접속할 수도 있다.
그리고 본 발명에 따른 데이터 검색 방법은 컴퓨터, 휴대용 단말기 등에서 실행될 수 있는 컴퓨터 프로그램으로 구현될 수 있으며, 상기 컴퓨터 프로그램은 하드디스크, 플로피디스크, 플래쉬 램, CD, DVD 등 다양한 저장매체에 의하여 저장이 가능하며, 전기통신망을 통하여 사용자단말기 또는 서버로 전송 또는 수신이 가능하다.
한편, 본 발명의 제 2 실시예의 기본적인 배경 기술은 스크린 스크랩핑(Screen Scrapping)이다. 여기서 스크린 스크랩핑은 인터넷 웹사이트의 내용을 읽어와서 그 중에서 필요한 내용만을 발췌해 내는 기술이다.
즉 스크린 스크랩핑의 예를 들면, 날씨 제공 사이트에서 날씨 정보를 읽어와서 사용하거나 뉴스 제공 사이트에서 뉴스를 읽어와서 사용하거나 또는 증권 정보 사이트에서 증권 정보를 읽어와서 사용하는 등의 예를 들 수 있을 것이다.
본 발명에 따른 제 2 실시예의 상기 스크린 스크랩핑 기능을 바탕으로 이루어지는 자료의 검색 및 수집절차는 도 5 를 참조하여 설명한다.
먼저, 단계(S400)에서 사용자단말기(10)에 접속된 온라인을 통하여 검색사이트(예를 들면, 뉴스정보를 제공하는 신문사, 일간지나 월간지 등을 제공하는 잡지사 또는 각종 정보를 제공하는 웹사이트 등)의 검색 기능을 이용하여 원하는 검색 정보의 키워드를 입력하여 검색을 수행한다. 이때 검색하고자 하는 키워드는 입력장치(30)를 이용하여 검색란에 입력한다. 즉 예를 들어, 온라인을 통하여 뉴스정보를 제공하는 신문사 등의 검색기능을 이용하여 원하는 내용을 검색하는 것이다. 이때 여러 개의 사이트를 동일한 검색어를 이용해서 한번에 검색할 수 있는 통합 검색기능도 제공한다.
단계(400) 이후 사용자단말기(10)에 설치된 일괄검색단계로(500)로서 다음과 같은 단계들을 일괄적을 수행하게 된다.
단계(S511)에서는 상기 사용자단말기(10)에 설정된 프로그램이 자동으로 HTTP 프로토콜을 통하여 인터넷(50)을 거쳐 검색 사이트의 데이터베이스 서버(60)에 접속한다.
상기 HTTP(Hypertext Transfer Protocol; 하이퍼텍스트 전송 규약)은 웹상에서 파일(텍스트, 그래픽 이미지, 사운드, 비디오 그리고 기타 멀티미디어 파일)을 주고받는데 필요한 프로토콜로서 TCP/IP(Transmission Control Protocol/Internet Protocol; TCP/IP 는 인터넷의 기본적인 통신프로토콜)와 관련된 하나의 응용 프로토콜이다.
그리고 단계(S512)에서 상기 접속된 검색 사이트의 데이터베이스 서버(60)에 검색을 위한 쿼리(Query)를 송신하고, 단계(S213)에서 상기 데이터베이스 서버(60)가 수신한 쿼리에 대한 결과로서 연계된 하나 이상의 데이터서버들로부터 검색한 결과물을 인터넷(50)을 통하여 사용자단말기(10)로 송신한다.
상기 검색된 내용을 이용하여 그 실제 내용을 읽어들인다. 즉 검색된 결과는 그 실제내용을 연결하기 위한 하이퍼링크(Hyperlink)인 경우가 대부분이기 때문이다. 따라서 본 발명은 검색된 링크 정보를 이용하여 실제 정보 내용을 읽어들이는 작업까지 수행하게 된다. 이 과정에서 스크린 스크랩핑 기술이 사용되게 된다. 즉 실제 내용과 연결된 링크를 분석해서 찾아내야 하는데 이 부분에서 스크린 스크랩핑 기술이 사용되게 된다. 즉 단계(S514)에서 상기 검색된 자료를 HTTP 프로토콜을 이용하여 다운로드받는다.
그리고 단계(S515)에서 상기 다운로드한 정보 중에서 불필요한 정보를 제거하게 된다. 이때 읽어들인 정보를 적절한 형태로 변형시키게 되는데, 여기서 적절한 형태는 다음과 같은 과정을 거친 다음의 형태를 말한다.
불필요한 정보의 제거로서 각종 광고 정보 및 불필요한 링크 등은 제거하고, 이미지 데이터 링크 등의 변환으로서 내용에 필요한 이미지인 경우에 그 링크 내역을 온라인 링크에서 오프라인 링크로 변경한다. 이때 링크의 변환 방법은 다음과 같다.
실제 이미지의 이름을 추출한다. 예를 들어, http://www.test.com/test.jpg 파일의 경우에는 "test.jpg" 라는 이름을 추출해 내게 된다. 추출된 이미지 이름의 앞 부분에 상대 위치를 추가한다. 이때 상대 위치를 img 폴더가 된다. 즉 test.jpg파일이 있는 경우 img/test.jpg 가 되게 된다. 그리고 절대 링크에 있는 이미지 파일을 img 폴더에 다운로드한다. 이로써 이미지를 포함한 로컬데이터의 생성이 가능하게 된다.
또한, 필요 정보의 추가로서 각종 HTML 링크를 추가하게 된다. 불필요한 정보를 제거하는 과정에서 주로 앞이나 뒤의 정보는 제거되고 중간 부분의 정보만이 남게 되는 경우가 많고, 이 과정에서 반드시 필요한 태그가 삭제되는 경우가 있다. 즉 HTML 문서임을 나타내는 <html> 태그등이 제거될 수 있는데 이러한 중요 태그 정보를 추가하게 된다.
단계(S516)에서는 상기 불필요한 정보가 제거된 결과를 로컬저장장치(40)에 저장한다. 즉 변형된 정보를 로컬의 저장장치(40)에 저장하고, 실제 내용은 개별 파일을 만들어서 저장한다. 그리고 그 링크내역을 데이터베이스에 저장한다. 이렇게 내용과 링크를 분리함으로써 데이터 검색 속도를 향상시킨다. 또한 데이터베이스에 문제가 생겼을 경우에 그 피해를 최소화한다. 또한 저장된 개별 파일을 따로 사용할 수도 있게 된다.
단계(S517)는 상기 로컬 저장장치(40)에 정보를 사용자단말기(10)에 포함된 프로그램(12)에 의하여 편집, 가공 및 관리한다.
상기 단계(S517)는 도 6 의 로컬 저장장치(40)에 저장된 자료를 관리하는 과정을 나타낸 흐름도이다. 즉 단계(S520)에서는 로컬 저장장치(40)에 저장된 자료를 읽어낸다. 그리고 단계(S521)에서 읽어들인 자료의 내용을 확인하고, 단계(S522)에서 자료의 내용이 필요한 내용인지를 판단한다. 필요하지 않은 내용일 경우에는 단계(S523) 및 (S524)과 같이 입력장치(30)를 통하여 삭제키를 입력하여 확인한 내용을 삭제한다. 하지만 필요한 내용일 경우에는 단계(S525)에서 확인하지 않은 자료가 있는지를 판단한다. 따라서, 단계(S522) 내지 단계(S525)의 과정을 반복하여 내용 확인을 하게 된다.
한편, 단계(S418)에서는 등록된 다른 검색사이트를 더 검색할 것인지를 판단하여 단계(S411) 내지 단계(S417)를 반복적으로 수행한다.
상기 단계(S417)와 단계(S418)는 사용자의 요구에 의하여 그 순서가 바뀔 수 있다. 즉 저장매체에 저장된 데이터를 가공한 후에 등록된 다른 검색사이트를 검색할 수도 있고, 다른 검색사이트를 검색한 후에 저장매체에 저장된 데이터를 가공할 수도 있다.
상기 과정을 거쳐 저장된 정보는 사용자가 용이하게 삭제하거나 합치기 등의 기능을 통해 관리될 수 있도록 하고, 저장된 정보는 백업기능을 통해 로컬의 저장매체에서 다른 저장매체로 쉽게 저장 및 복원이 가능하게 한다. 그리고 자동 갱신 기능을 통해 지정된 검색어에 관련된 정보를 일정 주기마다 자동으로 갱신할 수 있도록 하여 사용자의 편의를 도모한다.
도 7 은 본 발명을 이용한 프로그램의 메인 화면을 나타낸 것으로, 화면의 왼쪽에는 사용자가 검색한 키워드가 나열되어 있고, 우측에는 제목, 신문사, 날짜 등과 같은 특정 키워드에 대한 검색된 결과가 상단에 표시되고, 그 하단에는 현재 결과에 대하여 저장된 기사제목 및 관련정보등 상세정보가 표시되게 된다.
그리고 최하단에는 프로그램의 실행상황을 표시하는 창이 표시되며, 상기 프로그램의 실행상황으로는 전체 검색상황, 현재 사이트 검색상황, 현재 사이트 저장상황, 현재 사이트 및 검색된 자료의 수 등이 있다.
그리고 검색할 키워드를 미리 등록할 수 있는데, 등록사항으로는 검색할 키워드, 검색대상, 검색기간 지정 등이 있다. 한번 등록된 키워드는 사용자의 선택에 따라 삭제 또는 복구될 수 있다.
다음은 본 발명의 실시예로서, 온라인을 통한 뉴스정보를 제공하는 신문, 예를 들어, 조선일보 웹사이트를 대상으로 본 발명에 의한 정보 검색 프로그램을 활용한 것이다.
그 결과 실제 검색에 소요된 시간은 일반적인 방법, 즉 웹사이트에 접속해서 검색한 후에 내용을 확인하는 방법보다 대략 500%이상의 효율을 나타냈다. 특히 검색 결과가 많은 경우에는 그 효율이 더욱 높아졌다.
자료 검색 효율의 계산 예로서, 사용자용 컴퓨터에 Windows2000 운영체계의 초고속 인터넷환경(xDSL)에서 수행하였을 경우이다.
만약, "창업"이라는 키워드를 이용해서 검색을 수행하였을 경우에 약 6,000 건이 넘는 데이터가 검색되는데 이 사항을 일반적인 방법으로 모두 확인하려면, 1개당 확인 후 판단 시간이 약 5 초가 걸린다면 5초×6,000 건 = 약 8.3 시간이 소요된다.
그리고 이 중에서 필요한 자료를 복사하고 저장하는 시간은 이보다 최소 3∼4 배 이상 걸릴 것이다. 따라서 최소 20 시간 이상의 시간이 소요됨을 알 수 있다.
그러나 본 발명의 데이터 프로세싱 엔진 소프트웨어가 로컬의 사용자용 컴퓨터에 설치된 경우에는 6,000 건을 검색하는데 걸린 시간이 약 20∼30 분(초고속 인터넷의 상태에 따라 틀림)이고, 확인하는데 걸리는 시간은 개당 1.5초×6,000 = 약 2시간 30분이 소요된다. 또한 확인과 삭제, 그리고 저장이 동시에 이루어지므로 자료의 복사 및 저장 시간이 필요치 않게 된다. 따라서 전체 소요 시간은 약 3시간 가량이 되게 된다.
즉 객관적인 비교로 종래의 방식으로는 약 20 시간이 걸리던 것이 약 3 시간이면 충분하므로 그 효율로는 약 600%가 넘는 시간적 효율성을 보이게 된다.
또한 본 발명의 경우, 검색이 이루어지는 시간 동안은 다른 작업을 할 수 있으므로 실제 사용자가 소요하는 시간은 그보다 더 적다고 할 수 있겠다.
상술한 바와 같이 본 발명의 인터넷을 이용한 정보 자료 스크랩 방법은 분야별, 이용 대상별로 다양한 활용도를 가질 수 있고, 일반 기업의 기획부서나 홍보 부서의 경우 해당 제품, 경쟁 제품, 시장 동향등의 자료를 조사, 보관하는데 아주 효율적으로 이용될 수 있다. 그리고 영업부서의 경우 영업 대상이 되는 회사의 정보 조회 및 산업동향, 각종 인물의 대한 정보를 조사, 보관하는데 유용하게 사용되어 질 수 있고, 개인 사용자의 경우에는 일반적으로 창업 준비자의 경우 창업에 관련된 정보를 조사하는데 아주 유용하게 이용되어 질 수 있으며, 또한 주식 투자를 할 경우 주식을 소유한 해당 기업의 뉴스 및 동향, 산업의 전반적인 동향에 관련된 정보를 얻는데 사용될 수 있다.
그리고 학생의 경우에는 각종 리포트 자료 수집시 활용도를 향상시킬 수 있고, 좋아하는 연예인의 기사나 사진 등을 수집하는데 용이하게 활용할 수 있고, 취미생활이나 건강에 관련된 자료를 수집하는데도 사용될 수 있는 등, 검색한 자료를 유용하게 사용할 수 있을 것이다.
더욱이 본 발명은 데이터 프로세싱 엔진 소프트웨어 등에서 검색된 웹 문서를 최소한의 형태로 줄인 후에 그 모든 내용을 로컬저장매체에 저장함으로서, 온라인을 통한 인터넷의 연결 유무와는 상관없이 확인이 가능하고, 검색 및 검색내용의 확인에 소요되는 시간을 최소화하여 검색에 필요한 시간을 절감할 수 있는 효과가 있다.
또한 이미 최소화되어 저장되어 있는 자료들이기 때문에 자료의 삭제 및 합치기 등으로 자료의 관리가 용이한 장점도 있다.
도 1 은 종래의 인터넷을 통하여 데이터 검색 방법을 보여주는 순서도이다.
도 2 는 본 발명에 따른 데이터 검색 방법을 위한 시스템 구성도이다.
도 3 은 본 발명의 제 1 실시예에 따른 데이터 검색 방법을 보여주는 순서도이다.
도 4a 는 도 3 의 데이터 검색 방법 중 검색조건 입력단계의 서버추가단계를 보여주는 순서도이다.
도 4b 는 도 3 의 데이터 검색 방법 중 일괄검색을 보여주는 순서도이다.
도 5 는 본 발명의 제 2 실시예에 따른 정보자료 스크랩 방법을 보여주는 순서도이다.
도 6 은 도 5 의 정보자료 스크랩 방법에서 저장된 자료를 관리하는 과정을 나타낸 흐름도이다.
도 7 은 본 발명에 따른 데이터 검색 방법 및 정보자료 스크랩 방법을 실행하기 위한 프로그램을 표시하기 위한 창을 보여주는 개념도이다.

Claims (37)

  1. 전기통신망에 의하여 연결된 사용자단말기를 통하여 검색조건을 입력하는 검색조건 입력단계와;
    검색엔진을 가지는 하나 이상의 데이터베이스 서버를 선택하는 서버선택단계와;
    상기 입력된 검색조건을 상기 데이터베이스 서버에 전기통신망을 통하여 송신하는 송신 서브루틴과; 상기 검색조건에 따라서 상기 데이터베이스 서버의 검색엔진에 의하여 검색된 하나 이상의 검색결과 값들을 전기통신망을 통하여 수신하는 제 1 수신 서브루틴과; 상기 검색결과에 연결된 데이터들을 전기통신망을 통하여 수신하는 제 2 수신 서브루틴을 포함하며, 상기 서브루틴들은 상기 검색조건 입력단계 및 상기 서버선택단계 후에 사용자단말기에서 일괄적으로 수행되는 일괄검색 단계;를
    포함하는 것을 특징으로 하는 데이터 검색 방법.
  2. 제 1항에 있어서,
    상기 서버선택단계는
    각 데이터베이스 서버의 도메인 주소를 직접 입력하는 것을 특징으로 하는 데이터 검색 방법.
  3. 제 1항 또는 제 2항에 있어서,
    상기 서버선택단계는
    데이터베이스 서버들로 이루어진 서버 목록에서 하나 이상의 데이터베이스 서버를 선택하는 것을 특징으로 하는 데이터 검색 방법.
  4. 제 1항 또는 제 2항에 있어서,
    상기 서버선택단계에서는
    상기 서버 목록에 데이터베이스 서버를 추가하는 서버추가단계를 포함하는 것을 특징으로 하는 데이터 검색 방법.
  5. 전기통신망에 의하여 연결된 사용자단말기를 통하여 검색조건을 입력하는 검색조건 입력단계와;
    상기 입력된 검색조건을 검색엔진을 가지는 하나 이상의 데이터베이스 서버에 전기통신망을 통하여 송신하는 송신 서브루틴과; 상기 검색조건에 따라서 상기 데이터베이스 서버의 검색엔진에 의하여 검색된 하나 이상의 검색결과 값들을 전기통신망을 통하여 수신하는 제 1 수신 서브루틴과; 상기 검색결과에 연결된 데이터들을 전기통신망을 통하여 수신하는 제 2 수신 서브루틴을 포함하며, 상기 서브루틴들은 상기 검색조건 입력단계 후에 사용자단말기에서 일괄적으로 수행되는 일괄검색 단계;를 포함하며,
    상기 검색조건은 상기 데이터베이스 서버의 검색엔진에 송신하는 송신 검색조건과; 상기 제 2 수신 서브루틴에서 수신된 데이터들에 부여되는 데이터 요구조건을 포함하는 것을 특징으로 하는 데이터 검색 방법.
  6. 제 5항에 있어서,
    상기 데이터 요구조건은
    파일형식 또는 데이터의 생성날짜인 것을 특징으로 하는 데이터 검색 방법.
  7. 전기통신망에 의하여 연결된 사용자단말기를 통하여 검색조건을 입력하는 검색조건 입력단계와;
    상기 입력된 검색조건을 검색엔진을 가지는 하나 이상의 데이터베이스 서버에 전기통신망을 통하여 송신하는 송신 서브루틴과; 상기 검색조건에 따라서 상기 데이터베이스 서버의 검색엔진에 의하여 검색된 하나 이상의 검색결과 값들을 전기통신망을 통하여 수신하는 제 1 수신 서브루틴과; 상기 검색결과에 연결된 데이터들을 전기통신망을 통하여 수신하는 제 2 수신 서브루틴을 포함하며, 상기 서브루틴들은 상기 검색조건 입력단계 후에 사용자단말기에서 일괄적으로 수행되는 일괄검색 단계;를 포함하며,
    상기 일괄검색 단계는 미리 설정된 시간 간격을 두고 반복하는 것을 특징으로 하는 데이터 검색방법.
  8. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 검색조건 입력단계는
    상기 데이터베이스 서버의 검색엔진의 입력조건과 동일하게 입력하는 것을 특징으로 하는 데이터 검색 방법.
  9. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 검색조건은
    키워드인 것을 특징으로 하는 데이터 검색 방법.
  10. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 검색조건은
    시간 속성을 가지는 것을 특징으로 하는 데이터 검색 방법.
  11. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 송신 서브루틴은
    상기 입력된 검색조건을 상기 데이터베이스 서버의 검색엔진이 요구하는 형식으로 변환하는 변환 서브루틴을 추가로 포함하는 것을 특징으로 하는 데이터 검색 방법.
  12. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 일괄검색 단계는
    상기 제 2 수신 서브루틴에서 수신된 데이터들이 상기 입력된 검색조건에 해당되는지 판단하는 비교판단 서브루틴을 추가로 포함하는 것을 특징으로 하는 데이터 검색 방법.
  13. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 일괄검색 단계는 상기 제 2 수신 서브루틴에서 수신된 데이터들을 상기 사용자단말기에 저장하는 데이터 저장 서브루틴을 추가적으로 포함하는 것을 특징으로 하는 데이터 검색 방법.
  14. 제 13항에 있어서,
    상기 데이터 저장 서브루틴은
    상기 제 2 수신 서브루틴에서 수신된 데이터에서 가공하여 저장하는 것을 특징으로 하는 데이터 검색 방법.
  15. 제 13항에 있어서,
    상기 데이터 저장 서브루틴은
    상기 제 2 수신 서브루틴에서 수신된 데이터에서 광고부분을 제거하여 저장하는 것을 특징으로 하는 데이터 검색 방법.
  16. 제 13항에 있어서,
    상기 데이터 저장 서브루틴은
    상기 제 2 수신 서브루틴에서 수신된 데이터들을 오프라인(offline) 상으로 사용이 가능하도록 온라인(online) 요소를 편집하여 저장하는 것을 특징으로 하는 데이터 검색 방법.
  17. 제 13항에 있어서,
    상기 데이터 저장 서브루틴은
    상기 수신된 데이터들이 이전에 저장된 데이터들과 비교판단하여 상기 수신된 데이터들이 이전에 저장된 데이터들과 다른 데이터들만 상기 사용자단말기에 저장하는 것을 특징으로 하는 데이터 검색 방법.
  18. 제 13항에 있어서,
    상기 데이터 저장 서브루틴은 상기 제 2 수신 서브루틴에서 수신된 데이터에 미리 설정된 값을 추가하여 저장하는 것을 특징으로 하는 데이터 검색 방법.
  19. 제 18항에 있어서,
    상기 데이터 저장 서브루틴은 상기 제 2 수신 서브루틴에서 수신된 데이터에 상기 데이터를 송신한 데이터베이스 서버 정보, 상기 데이터의 저작권을 추가하여 저장하는 것을 특징으로 하는 데이터 검색 방법.
  20. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 일괄검색 단계 후에는
    상기 사용자단말기에 저장된 상기 수신된 데이터들을 가공하기 위한 가공단계를 추가적으로 포함하는 것을 특징으로 하는 데이터 검색 방법.
  21. 제 20항에 있어서,
    상기 가공단계는
    상기 수신된 데이터들을 동일한 서식으로 변환하는 것을 특징으로 하는 데이터 검색 방법.
  22. 제 20항에 있어서,
    상기 가공단계는
    상기 수신된 데이터들을 하나의 파일로 합치는 것을 특징으로 하는 데이터 검색 방법.
  23. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 검색조건은
    로그인 과정을 가지는 상기 데이터베이스 서버에 접속할 수 있도록 로그인 정보를 포함하는 것을 특징으로 하는 데이터 검색 방법.
  24. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 데이터베이스 서버는 지적재산권 데이터베이스인 것을 특징으로 하는 데이터 검색 방법.
  25. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 데이터베이스 서버는 인터넷 쇼핑몰 데이터베이스인 것을 특징으로 하는 데이터 검색 방법.
  26. 제 1항, 제 5항 또는 제 7항에 있어서,
    상기 데이터베이스 서버는 기사 데이터베이스 서버인 것을 특징으로 하는 데이터 검색 방법.
  27. 제 1항, 제 5항 또는 제 7항에 있어서,
    선택된 주소에 해당되는 웹페이지를 표시하는 웹페이지 표시단계를 추가적으로 포함하는 것을 특징으로 하는 데이터 검색 방법.
  28. 제 1항, 제 5항 또는 제 7항에 기재된 데이터 검색 방법을 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장매체.
  29. 사용자용 컴퓨터에 접속된 온라인을 통하여 검색 사이트의 검색 기능을 이용하여 원하는 검색 정보의 키워드를 입력하여 검색하는 제 1 단계;
    상기 사용자용 컴퓨터에 설정된 프로그램이 자동으로 HTTP 프로토콜을 통하여 검색 사이트의 웹서버에 접속하는 제 2 단계;
    상기 접속된 검색 사이트의 웹서버에 검색을 위한 쿼리(Query)를 송신하는 제 3 단계;
    상기 웹서버가 수신한 쿼리에 대한 결과로서 연계된 하나 이상의 데이터서버로부터 검색한 결과물을 인터넷을 통하여 사용자용 컴퓨터로 송신하는 제 4 단계;
    상기 검색된 자료를 HTTP 프로토콜을 이용하여 다운로드받는 제 5 단계;
    상기 다운로드한 정보 중에서 불필요한 정보를 제거하는 제 6 단계;
    상기 불필요한 정보가 제거된 결과를 로컬 저장매체에 저장하는 제 7 단계;
    상기 로컬 저장매체에 정보를 사용자용 컴퓨터에 포함된 프로그램에 의하여 편집, 가공 및 관리하는 제 8 단계를 포함하며,
    상기 제 2 단계 내지 제 8단계는 상기 제 1 단계 후에 일괄적으로 수행되는 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법.
  30. 제 29항에 있어서,
    상기 사용자용 컴퓨터에 포함된 프로그램(데이터 프로세싱 엔진 소프트웨어)은 관리하고자 하는 자료의 갱신을 사용자가 지정한 검색어에 관련된 정보를 일정 주기마다 자동으로 갱신이 이루어지도록 하는 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법.
  31. 제 29항에 있어서,
    상기 불필요한 정보의 제거는 각종 광고 정보 및 불필요한 관련 링크를 제거하는 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법.
  32. 제 29항에 있어서,
    상기 이미지 데이터 링크 등의 변환은 내용에 필요한 이미지의 경우에 그 링크 내역을 온라인 링크에서 오프라인 링크로 변경하는 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법.
  33. 제 29항에 있어서,
    상기 검색 정보는 온라인 신문, 온라인 잡지, 웹 문서 중에서 어느 하나인 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법.
  34. 제 29항에 있어서,
    상기 다운로드받은 자료 중에서 필요하지 않은 태그 부분을 제거하고 필요한 부분만을 저장함으로서 저장 시간 및 저장 공간을 최소화시킨 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법.
  35. 제29 항에 있어서, 상기 사용자용 컴퓨터에 포함된 프로그램(데이터 프로세싱 엔진 소프트웨어)은 이미지와 같은 부가 자료를 로컬 저장매체에서 사용하기 위하여 다운로드되어 저장된 HTML 문서의 내용을 자동으로 변경시키는 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법.
  36. 제 29항에 있어서,
    상기 사용자용 컴퓨터에 포함된 프로그램(데이터 프로세싱 엔진 소프트웨어)은 다운로드되어 로컬 저장매체에 저장된 각각의 파일의 집합을 하나 이상의 파일로 변환 및 저장해 주는 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법.
  37. 제 29항에 있어서, 상기 로컬 저장매체는 플로피디스크, 하드디스크, 컴팩트디스크 또는 플래쉬 메모리 중에서 어느 하나인 것을 특징으로 하는 인터넷을 이용한 정보 자료 스크랩 방법.
KR1020047018446A 2002-11-12 2003-10-31 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩방법 KR20050016407A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020020070187 2002-11-12
KR20020070187 2002-11-12

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020047000707A Division KR20040064686A (ko) 2002-11-12 2003-10-31 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩방법

Publications (1)

Publication Number Publication Date
KR20050016407A true KR20050016407A (ko) 2005-02-21

Family

ID=32310850

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020047000707A KR20040064686A (ko) 2002-11-12 2003-10-31 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩방법
KR1020047018446A KR20050016407A (ko) 2002-11-12 2003-10-31 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020047000707A KR20040064686A (ko) 2002-11-12 2003-10-31 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩방법

Country Status (4)

Country Link
US (1) US20060031193A1 (ko)
KR (2) KR20040064686A (ko)
AU (1) AU2003274799A1 (ko)
WO (1) WO2004044774A1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100896614B1 (ko) * 2007-01-29 2009-05-08 엔에이치엔(주) 검색 시스템 및 방법
KR101012170B1 (ko) * 2008-06-30 2011-02-07 엔에이치엔비즈니스플랫폼 주식회사 검색결과간의 유사성에 기초하여 추가 컨텐츠를 제공하는검색결과 제공 시스템 및 방법 그리고 추가 광고 컨텐츠를제공하는 광고 제공 시스템 및 방법
WO2015016503A1 (ko) * 2013-07-31 2015-02-05 티더블유모바일주식회사 맞춤형 검색 아이콘 출력 제어시스템 및 그 방법
KR102416254B1 (ko) 2022-02-24 2022-07-06 주식회사 케이엘케이소프트 키워드 기반의 뉴스 리스트 제공 시스템 및 방법

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060095377A1 (en) * 2004-10-29 2006-05-04 Young Jill D Method and apparatus for scraping information from a website
KR100643285B1 (ko) 2004-11-02 2006-11-10 삼성전자주식회사 멀티캐스트를 이용한 데이터 송수신 시스템 및 방법
CN100407647C (zh) * 2005-06-02 2008-07-30 华为技术有限公司 一种基于客户端/服务器端结构的数据浏览方法
GB0620855D0 (en) * 2006-10-19 2006-11-29 Dovetail Software Corp Ltd Data processing apparatus and method
KR100904515B1 (ko) * 2006-12-18 2009-06-26 네오콘소프트 주식회사 검색 및 광고효과를 높인 인터넷 검색시스템과 검색방법
JP5562328B2 (ja) * 2008-06-23 2014-07-30 ダブル ベリファイ インコーポレイテッド インターネットベースの広告の自動監視および照合
CN102129632A (zh) * 2010-01-13 2011-07-20 阿里巴巴集团控股有限公司 一种抓取网页信息的方法、装置及***
CN103971244B (zh) 2013-01-30 2018-08-17 阿里巴巴集团控股有限公司 一种商品信息的发布与浏览方法、装置及***
US20170169007A1 (en) * 2015-12-15 2017-06-15 Quixey, Inc. Graphical User Interface for Generating Structured Search Queries

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5951300A (en) * 1997-03-10 1999-09-14 Health Hero Network Online system and method for providing composite entertainment and health information
US6766315B1 (en) * 1998-05-01 2004-07-20 Bratsos Timothy G Method and apparatus for simultaneously accessing a plurality of dispersed databases
US6970602B1 (en) * 1998-10-06 2005-11-29 International Business Machines Corporation Method and apparatus for transcoding multimedia using content analysis
KR20010060361A (ko) * 1999-11-20 2001-07-06 주진용 웹 검색사이트의 검색결과 표시방법
KR20010063059A (ko) * 1999-12-21 2001-07-09 윤종용 데이터 베이스 검색 최적화 방법
US6996733B2 (en) * 2000-04-07 2006-02-07 Danger, Inc. System for preserving data on a portable device by notifying portal server the device reaches low power and saving data to the portal server thereafter
KR20020061443A (ko) * 2001-01-18 2002-07-24 (주)투비소프트 컴퓨터 통신망을 이용한 정보의 수집, 가공 및 표시방법과 그 시스템
KR20010107807A (ko) * 2001-10-08 2001-12-07 우제학 인터넷을 이용한 뉴스정보 스크랩의 방법 및 시스템
KR20030035261A (ko) * 2001-10-30 2003-05-09 송한범 구조분석을 이용한 선택적 웹페이지정보 추출 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100896614B1 (ko) * 2007-01-29 2009-05-08 엔에이치엔(주) 검색 시스템 및 방법
KR101012170B1 (ko) * 2008-06-30 2011-02-07 엔에이치엔비즈니스플랫폼 주식회사 검색결과간의 유사성에 기초하여 추가 컨텐츠를 제공하는검색결과 제공 시스템 및 방법 그리고 추가 광고 컨텐츠를제공하는 광고 제공 시스템 및 방법
WO2015016503A1 (ko) * 2013-07-31 2015-02-05 티더블유모바일주식회사 맞춤형 검색 아이콘 출력 제어시스템 및 그 방법
KR102416254B1 (ko) 2022-02-24 2022-07-06 주식회사 케이엘케이소프트 키워드 기반의 뉴스 리스트 제공 시스템 및 방법

Also Published As

Publication number Publication date
KR20040064686A (ko) 2004-07-19
US20060031193A1 (en) 2006-02-09
AU2003274799A1 (en) 2004-06-03
WO2004044774A1 (en) 2004-05-27

Similar Documents

Publication Publication Date Title
CA2410747C (en) System and method for saving browsed data
AU2008270836B2 (en) Collecting and presenting temporal-based action information
US8533199B2 (en) Intelligent bookmarks and information management system based on the same
JP4721740B2 (ja) 記事又は話題を管理するためのプログラム
US7788251B2 (en) System, method and computer program product for concept-based searching and analysis
US9858255B1 (en) Computer-implemented method and system for automated claim construction charts with context associations
US20060200455A1 (en) Search engine result reporter
JP3946934B2 (ja) ウェブページ部品統合処理装置、ウェブページ部品統合処理方法及びクライアント装置
US20080195495A1 (en) Notebook system
KR20050016407A (ko) 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩방법
US20060143242A1 (en) Content management device
CN101681370A (zh) 组合的个人及社区列表
JP2002073684A (ja) サムネイル表示による情報閲覧システム
KR100616152B1 (ko) 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법
JP5000801B2 (ja) インターネット補助システム
JP2000231570A (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
KR20110102052A (ko) 검색 결과 페이지에서 개별 컨텐츠를 이용하여 블로그를 생성하는 검색 시스템 및 검색 방법
US20070244861A1 (en) Knowledge management tool
JPWO2005006191A1 (ja) 複数種類の情報を登録する装置および方法
CN101840401A (zh) 词典辅助查询***及其方法
KR20000065614A (ko) 인터넷 정보를 자동 분류하는 웹스크랩 방법
KR20200103381A (ko) 다채널 온라인 쇼핑몰 데이터 자동 수집 방법
KR100371805B1 (ko) 관련 웹 사이트 제공 방법 및 시스템
US20100057816A1 (en) Organizing Internet/Intranet research with interactive Dynamic Research Diagrams and Lists
JP3867145B2 (ja) 突合せ検索装置および検索方法

Legal Events

Date Code Title Description
A107 Divisional application of patent
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid