KR970001907B1 - 적합율 또는 일치율을 제공하는 데이타 검색 방법 및 장치 - Google Patents

적합율 또는 일치율을 제공하는 데이타 검색 방법 및 장치 Download PDF

Info

Publication number
KR970001907B1
KR970001907B1 KR1019920018243A KR920018243A KR970001907B1 KR 970001907 B1 KR970001907 B1 KR 970001907B1 KR 1019920018243 A KR1019920018243 A KR 1019920018243A KR 920018243 A KR920018243 A KR 920018243A KR 970001907 B1 KR970001907 B1 KR 970001907B1
Authority
KR
South Korea
Prior art keywords
data
term
search
retrieved
item
Prior art date
Application number
KR1019920018243A
Other languages
English (en)
Other versions
KR930008659A (ko
Inventor
마사유끼 쯔지야
다까시 무라마쯔
가즈히로 사또
미쯔노부 다사까
히로시 후지세
Original Assignee
가나이 쯔도무
가부시끼가이샤 히다찌 세이사꾸쇼
세도라 쯔도무
히다찌 소프트웨어 엔지니어링 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가나이 쯔도무, 가부시끼가이샤 히다찌 세이사꾸쇼, 세도라 쯔도무, 히다찌 소프트웨어 엔지니어링 가부시끼가이샤 filed Critical 가나이 쯔도무
Publication of KR930008659A publication Critical patent/KR930008659A/ko
Application granted granted Critical
Publication of KR970001907B1 publication Critical patent/KR970001907B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Automation & Control Theory (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

내용 없음.

Description

적합율 또는 일치율을 제공하는 데이타 검색 방법 및 장치
제1도는 본 발명의 실시예에 따른 데이타 검색 장치의 개요를 도시한 개략선도.
제2도는 본 발명의 실시예에 따른 데이타 검색 방법에 의한 전체 동작을 도시한 플로우차트.
제3도는 제2도에 도시된 용어 정의를 지정하는 처리를 더 상세하게 도시한 플로우차트.
제4도는 디스플레이 스크린 상에 디스플레이된 용어 정의의 포맷을 도시한 도면.
제5도는 각 용어의 범위를 지정하는 방법을 도시한 도면.
제6도는 각 용어의 퍼지 설정 분포 곡선 또는 멤버쉽 함수를 도시한 도면.
제7도는 용어 정보표의 일례를 도시한 도면.
제8도는 제2도에 도시된 데이타 검색 처리를 도시한 플로우차트.
제9도는 검색 조건식을 산출하는 방법을 도시한 플로우차트.
제10도는 범위의 실제값을 계산하기 위한 식과 상품 과일을 도시한 도면.
제11도는 검색 조건식을 산출하는 일례를 도시하는 도면.
제12도는 검색된 결과 데이타로부터 적합율을 계산하는 처리를 도시하는 플로우차트.
제13도는 적합율을 계산하는 방법을 도시한 도면.
제14도는 총 적합율을 계산하는 방법을 도시한 도면.
제15도는 디스플레이 스크린 상에 검색된 데이타 및 계산된 적합율을 디스플레이하는 방법을 도시한 도면.
제16도는 검색 및 추출된 데이타의 범위를 좁히는 처리를 도시한 플로우차트.
제17도는 검색 및 추출된 데이타의 범위를 좁히는 동작을 도시한 도면.
* 도면의 주요부분에 대한 부호의 설명
1 : 콘솔 유니트 2 : 프로세서
3 : 디스크 유니트 4 : 제어기
5 : 내지 12 : 실행 프로그램 유니트
13 : 내지 19 : 정보기억 영역
본 발명은 데이타 검색 방법에 관한 것으로, 특히 소정의 검색 조건에 관련하여 디스플레이된 일치율 또는 적합율을 조회하는 중에 데이타를 검색하고 검색된 데이타의 범위를 좁히기 위한 데이타 검색 방법 및 장치에 관한 것이다.
종래의 데이타 검색 처리에 있어서, 검색될 항목의 수치값은 검색 조건으로 지정된다. 예를 들면, 최소한의 가격 및 중량 데이타를 기억하는 데이타 베이스 파일이 그것이라 하겠다. 이러한 데이타 베이스 파일로부터 값비싼 것 및 경량 상태를 검색할 때, 예를 들면 검색 조건식 가격>100 및 중량 ≤50이 데이타 검색용으로 사용된다. 이 경우에, 검색된 데이타는 100보다 더 높은 가격 범위와 50과 같거나 그 이하의 중량 범위내에 속하게 된다. 검색된 데이타의 범위가 더 좁아지면, 제1데이타 검색 결과를 조회하여 결정된 여러 가지 값을 할당한 새로운 검색 조건식이 사용된다. 검색 데이타로부터 보다 바람직한 데이타를 선택하려면, 사용자는 이러한 선택에 대한 종합적인 결정을 예지하고 있어야 한다.
JP-A-2-87275의 공고에는 퍼지 값을 포함하는 질문을 갖는 검색 조건식이 인텍스 유니트내에 기억된 것들과 동일한 속성을 할당한 새로운 검색 조건식으로 변환되는 것이 기술되어 있다. 속성 리스트는 디스플레이 스크린상에 디스플레이되어, 사용자가 속성 용어를 사용해 검색 조건을 지정할 수있도록 한다.
상술된 종래 기술에 따르면, 사용자가 검색 조건식에 할당될 수치값을 용이하게 결정할 수 없다면, 사용자는 검색된 데이타의 범위를 직감으로 결정한다. 검색된 데이타의 범위를 좁히는 처리는 검색된 결과를 검토하는 단계, 검색 조건식을 변경하는 단계 및 데이타를 다시 검색하는 단계를 포함하고, 다수의 경우에 이것이 반복되는 것이다. 짐작 도는 퍼지 검색 조건의 지정을 통해 데이타를 검색하는 것은 불가능하였다.
검색된 결과의 적합성을 결정할 때, 사용자의 직감에만 의존하였다. 그러므로 검색 조건식을 변경함으로써 데이타 검색을 다시 수행하고, 객관적인 판단을 하는 것은 곤란하다. 또한, 검색된 결과 또는 가중된(Weight-added) 검색 결과를 종합적으로 평가하기 위한 실질적 수단이 없어 검색할 데이타의 범위를 결정하는 것은 직감에 의존하여 왔다.
본 발명의 목적은 검색 조건식을 변경하지 않고서 검색된 데이타의 범위를 좁힐 수 있고, 상대 조건을 지정함으로써 데이타를 검색할 수 있으며, 사용자가 검색된 결과의 적합성을 판단하는데 도움을 줄 수 있는 지표를 제공할 수 있는 데이타 검색 방법 및 장치를 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명의 특징에 따르면, 우선 용어, 이 용어에 대한 범위, 및 검색된 데이타의 일치율 도는 적합율을 계산하는데 사용된 함수가 지정되어 있다. 데이타 검색 동작에서, 실제 검색 범위는 입력 검색 조건식에 포함되어 검색될 용어와, 데이타 베이스 파일에 기억된 항목 데이타의 최대 및 최소값, 및 이 용어에 대해 지정된 범위로부터 결정된다. 적합율은 검색된 항목 데이타 값을 함수에 대입함으로써 계산되고, 검색된 데이타와 함께 디스플레이 스크린상에 디스플레이된다. 검색될 다수의 항목들이 검색 조건식에 포함되며, 다수의 항목들에 대한 총 만족 인자는 각 용어에 가중함으로써 계산된다. 각 적합율에 대한 검색 데이타 수의 리스트는 대응하는 검색 데이타의 디스플레이를 위한 적합율들 중 하나를 사용자가 지정할 수 있도록 디스플레이된다. 검색된 데이타는 데이타 검색을 더 반복하는데 사용된다.
상술된 방식으로 배열된 데이타 검색 장치 및 방법에 있어서, 실제 검색 조건 값들은 데이타 베이스 파일내에 설정된 데이타로부터 검색될 각 항목의 최대 및 최소값과 각 용어에 할당된 계산된 범위값으로부터 결정될 수 있다. 그러므로, 수치값에 의해서가 아니라 용어들에 의해 검색 조건식을 지정할 수 있다.
적합율을 계산하는 함수가 각 용어에 제공되어, 각각 검색된 데이타에 대한 적합율 및 각 적합율에 대한 검색 데이타의 수는 검색된 결과 데이타를 사용함으로써 계산될 수 있다.
또한, 검색된 데이타는 적합율을 지정함으로서 추출될 수 있고, 같은 검색 조건식이 추출된 데이타에 반복적으로 사용될 수 있다.
또, 다수의 적합율로부터 계산된 총 적합율이 디스플레이되어, 데이타가 검색 조건식을 만족시키는지의 여부를 검색된 데이타의 종합적 평가로 결정할 수 있다.
본 발명의 실시예가 첨부된 도면을 참조하여 설명될 것이다.
제1도는 본 발명의 실시예에 따른 데이타 검색 장치의 전체 구조를 도시하고 있다. 데이타 검색 장치는 콘솔 유니트(1), 프로세서(2), 파일 및 처리된 정보를 기억하기 위한 디스크 유니트(3), 제어기(4), 다수의 실행 프로그램 유니트(5 내지 12), 및 다수의정보 기억 영역(13 내지 19)을 포함한다. 프로세서(2)의 조력으로, 용어 정의 유니트(6)는 주 제어 유니트(5)의 제어하에서 콘솔 유니트(1)로부터 입력된 용어 정의를 처리하여, 용어 정의 기억영역(13)에 기억시킨다.
그 다음, 콘솔 유니트(1)로부터 입력된 검색 조건은 조건 입력 유니트(14)의 제어하에서 조건 입력 영역(14)에 기억된다. 용어 정의 기억영역(13)에 기억된 용어 정의 정보에 따르면, 조건 분석 유니트(8)는 기본값(value-based) 검색 조건식을 산출하기 위해 조건 입력 영역(14)에 기억된 조건들을 분석한다. 이 산출된 식을 사용하여, 검색 실행 유니트(9)는 데이타 베이스 파일에 기억된 데이타의 데이타 검색을 수행한다. 검색된 결과 데이타는 검색 결과 기록 기억영역(16)에 기억된다.
다음에, 검색 결과 기록 기억영역(16)에 기억된 데이타에 따라서, 적합율 평가 유니트(10)는 용어 정의 기억영역(13)에 기억된 데이타를 사용하여 작업영역(19)에서의 적합율을 계산하고, 그것을 적합율 표 기억 영역(17)에 기억시킨다. 검색 결과 데이타 디스플레이 유니트(11)는 계산된 결과를 디스플레이 스크린 상에 디스플레이한다. 필요하다면, 사용자는 검색된 데이타의 범위를 좁히기 위해 다시 데이타 검색을 수행 할 수 있다. 데이타 기억 유니트(12)는 검색 및 좁아진 데이타 기억영역(18)에 좁아진 범위의 검색 데이타를 기억시킨다.
제2도는 본 발명의 실시예에 따른 데이타 검색 동작의 개요를 도시하는 플로우차트이다. 전체 절차는 예비 처리와 데이타 검색 처리로 나누어진다. 단계(201 및 202)는 예비처리를 도시한다.
단계(201)에서, 검색될 항목의 각 용어의 범위와, 분포 곡선(맴버쉽 함수), 및 가중치가 정의되거나 지정된다. 이들 검색 파라메터들은 차후에 상세하게 설명될 것이다. 단계(202)에서, 정의된 정보는 용어 정의 정보 파일(203)에 기억된다.
단계(204 내지 207)는 데이타 검색 처리를 도시하고 있다. 단계(204)에서, 사용자에 의해 입력된 검색 조건식은 용어 정의 정보 파일(203)에 기억된 용어 정의 정보를 사용함으로써 접수 및 분석된 다음, 데이타 검색을 시작한다. 단계(205)에서, 검색된 결과 및 적합율이 디스플레이이 된다. 단계(206)에서, 원하는 결과가 얻어졌는지 검토된다. 얻어졌다면, 검색된 결과는 단계(207)에 기억된다.
제3도는 제2도에 도시된 단계(201 및 202)에서 실행되는 상태는 상세하게 도시한 플로우차트이다. 예비처리는 제3도에 도시된 플로우차트 및 제4도에 도시된 포맷을 참조하여 더 상세히 설명될 것이다.
단계(301)에서, 검색 조건식에 사용될 항목 명(402)이 지정된다.
단계(302)에서, 검색 조건식에 의해 검색될 목표물의 지정된 항목에 대한 용어들이 지정된다. 단계(303)에서 각 지정된 용어들의 범위가 지정된다. 본 발명의 실시예에서, 범위(405) 또는 3개 포인트의 값(407)이 지정된다. 범위(405)는 백분율로 지정되고, 그것은 지정된 항목(402)의 값이 데이타 베이스에 기억된 모든 데이타 값이 A%에서 B%까지의 범위내에 속해야 한다는 것을 나타낸다. 3개의 포인트의 값은 분포 곡선[y=f(x)]의 최대, 중간, 및 최소 값이고, 이 값(x)는 백분율값이 아니라, 실제값으로 나타낸다.
단계(304)에서, 각 용어에 대한 분포 곡선이 선택된다. 단계(305)에서, 각 용어에 대한 가중치가 설정된다. 가중치는 검색 조건식에 포함되는 각 용어가 확장되는 정도를 나타내는 계수이다. 예를 들면, (상품 단가=비싸다) 및 (중량=가볍다)라는 검색 조건식이 주어지고, 상품 단가 항목이 중량 항목보다 더 강조 된다면, 사용자의 뛰어난 인식력과 의지를 반영하여 일용품 단위 가격 항목의 가중치는 1.2로 설정되고 중량 항목의 가중치는 0.8로 설정된다. 이 두가지 검색 항목이 동등하게 처리된다면, 분명히 동일한 가중치 1.0이 설정된다.
단계(306)에서, 검색 조건식에서 사용될 모든 항목이 지정되었는지의 여부가 검토된다. 지정되었다면, 지정된 검색 파라메터들은 용어 정의 정보 파일(203)로 출력된다.
제4도를 참조하면, 지정된 항목은 용어의 행(402)에서 설정된다. 단계(307)에서 지정된 가중치는 용어의 행(403)에서 설정된다. 지정된 용어들은 용어의 행(404)에서 설정된다. 각 지정된 용어의 범위는 범위의 행(405)에서 설정된다. 각 지정된 분포 곡선의 형태는 곡선 행(406)에서 설정된다. 이미 알려진 것이라면, 검색 조건식의 범위가 아니라 실제 조건값이 3개 포인트 값의 행(407)에서 설정된다. 이 경우에, 용어에 대한 범위는 3가지 포인트 , 즉 최대, 중간, 최소 포인트 값으로 지정된다. 사용자는 백분율 또는 3개의 포인트 값으로 범위를 지정할 수 있다.
제5도는 지정된 용어 및 범위들의 예를 도시하고 있다. 참조 번호(501)로 나타낸 용어들은 단계(301 내지 307)에서 지정된 것들이다. 각 용어는 참조 번호(502)로 나타낸 0 내지 100%의 전체 범위 내에서 참조번호(503)로 지정된 것과 같은 범위로 할당된다. 용어들에 할당된 범위는 범위는 참조 번호(504)로 나타낸바와 같이 중첩되어도 된다. 범위는 각 용어에 독립적으로 할당되어, 범위들을 중첩되게 한다. 참조 번호(501)로 지정된 용어들은 사용자가 원하는 대로 지정될 수 있다.
제6도는 단계(304)에서 각 용어에 대해 지정될 분포 곡선의 예를 도시하고 있다. 각 분포 곡선은 사용자가 탁월한 인식력에 따라 결정되고, 실제로 퍼지 세트에 대한 멤버쉽 함수에 대응한다. 파형이 항목값의 분포를 만족시키는 원하는 분포 곡선은 이미 준비된 곡선(601 내지 605)에서 선택된다. 각 분포 곡선의 파형은 사용자의 숙달된 기술과 노우-하우에 따라 정교하게 수정될 수 있다. 각 곡선은 참조 번호(606)로 표시된 함수에 의해 정의된다. 적합율은 각 분포 곡선의 대응 함수에 검색 파라메터들을 입력시킴으로서 얻어진다. 적합율은 검색 결과에 관련하여 사용자의 적합율을 나타낸다.
분포 곡선에 대하여, 상·하 한계치(607,608)는 백분율로 표시된다. 분포곡선(3)에 대해 50%에서 40%까지의 범위를 지정할 때, 50%는 상한치(607)에 대응하고 40%는 하한치(608)에 대응한다. 선택적으로, 분포곡선에 대해, 3개의 포인트 값(609 내지 611)은 최대,중간, 최소 포인트 값에 대응해 나타낸다. 분포 곡선은 파형은 이들 포인트 값에 따라 변한다.
제7도는 단계(301 내지 307)에서 지정된 정도를 기억하기 위한 용어 정보표(701)를 도시한다. 용어 정보표(701)는 모든 항목들에 대한 제1용어 정보표 및 각 항목에 대한 제2용어 정보표(706)를 포함한다. 제2용어 정보표(706)는 용어(707), 범위(708), 및 분포 곡선(709)의 정보를 기억한다. 표의 정보는 용어 정의 정보로서 파일(203)에 기억된다.
제8도는 데이타 검색 처리를 도시하는 플로우차트이다. 단계(801)에서 검색 조건식은 콘솔 유니트(1)로부터 입력된다. 이 검색 조건식은 검색될 값의 용어를 갖는다. 단계(802)에서 입력된 검색 조건식은 수치 검색 파라메터 값에 의해 정해지는 용어를 갖는 다른 검색 조건식을 산출하기 위해 분석된다. 단계(803)에서, 분석된 값에 기초한 검색 조건식은 데이타 베이스 파일로부터의 데이타를 검색하는데 사용된다. 단계(804)에서, 검색 조건이 용어의 검색 파라메터 값으로 지정된 각 항목에 대한 각 검색 데이타의 적합율은 용어 정보표(701)에 기억된 대응 분포 곡선을 사용함으로써 계산된다. 이러한 경우에, 각 항목에 대한 적합율 뿐만 아니라 전체적인 일치율을 계산될 수 있고, 그 결과는 최대의 총 적합율로부터 시작되는 순서로 디스플레이 스크린상에 디스플레이된다. 또한, 각 적합율에 대한 검색 데이타의 수도 디스플레이된다. 사용자가 데이타 검색을 더 수행하도록 지시하면, 단계(801 내지 806)이 반복된다. 검색 데이타의 범위를 더 좁혀지려면, 단계(803 내지 808)이 반복된다. 데이타 검색을 다시 실행하거나 검색 범위를 좁힐 필요가 없다면, 검색된 결과는 단계(810)에서 파일에 기억된다.
제9도는 검색 조건식을 분석하는 처리의 세부 내용을 도시하고 있다.
우선, 단계(901)에서 항목들 및 용어들이 사용자에 의해 지정된 검색 조건식에서 추출된다. 참조 번호(908)로 지정된 예시적인 검색 조건식에서, 항목들은 참조 번호(909)로 지정되고, 용어들은 참조 번호(910)로 표시된다. 단계(902)에서 백분율 또는 3개 포인트 값에 의한 범위는 용어 정보표(701)로부터 얻어진다. 표(701)로부터 얻어진 범위의 예는 참보 번호(911)로 표시된다. 백분율 3개 포인트값 중 하나를 선택한 다음, 단계(903)에서 각각 추출된 항목의 최대 및 최소값이 데이타 베이스 파일로부터 얻어진다. 단계(904)에서 범위의 실제값은 최대 및 최소 항목값과 지정된 범위값을 사용하여 계산된다. 단게(905)에서, 검색 조건식으로부터 추출된 모든 용어들이 처리되었는지를 검토한다. 단계(907)에서, 산출된 검색 조건식은 메모리의 특정 기억 영역 또는 파일로 기억된다.
제10도는 상품 파일(1001)로부터 최대 및 최소 항목값을 얻고 범위의 실제값을 계산하는 처리를 도시하는 도면이다.
범위의 실제값은 상품 단가 항목 행(1002) 및 중량 항목 행(1003)에 기억된 최대 및 최소 값으로부터 참조 번호(1004)로 표시된 식에 의해 계산된다.
제11도는 제10도에 도시된 데이타를 사용하여 실제값의 범위를 계산하는 처리를 도시하고 있다.
상품 단가의 최대 및 최소 값은 제11도에서 참조 번호(1101)로 표시되어 있다. 용어의 범위(1102)가 100%에서 80%까지이면, 범위의 실제값을 계산하기 위한 식은 참조 번호 (1103 및 1104)로 표시된 바와 같다. 결과적으로, 상품 단가=비싸다의 지정 검색 조건(1105)에 대해, 이 값에 기초한 검색 조건식(1106)이 산출된다. 이 방식으로, 예를 들어, 상품 단가=비싸다 및 중량=가벼움이란 지정된 검색 조건식(1103)에 대해, 식(1103 및 1104)에 의해 계산되는 최소 250에서 최대 300까지의 실제 상품 단가 검색 범위가 얻어지고, 동일한 방식으로, 제10도에 도시된 파일 내의 데이타로부터 계산된 최소 1에서 최대 10까지의 실제 중량 검색 범위가 얻어진다. 상기 방식으로, 지정된 용어의 검색 범위는 참조 번호(1108)로 나타낸바와 같은 값에 기초한 검색 조건식을 얻기 위해 실제 수치값으로 변화된다. 데이타는 이 식을 사용하여 검색된다.
제12도는 데이타 검색후에 적합율 및 다른 데이타를 계산하는 처리를 도시하는 플로우차트이다.
단계(1201)에서, 검색 조건식에 포함된 각 항목에 대한 검색된 결과 데이타의 적합율은 용어 정보표(701)에 기억된 분포 곡선을 사용함으로써 계산된다. 예를 들어, 검색된 결과 데이타 기록(1206)중, 상품 단가(1207) 및 중량(1208)을 각각 포함하는 모든 상품 기록의 적합율이 계산된다. 각 기록의 각 용어에 대한 적합율 및 각 기록의 모든 항목에 대한 총 적합율이 계산되어, 후자는 항목들에 할당되고 용어 정보표에 기억된 중량을 사용함으로써 계산된다. 단계(1203)에서는, 각 용어 및 각 기록의 모든 항목에 대한 적합율 및 총 적합율이 얻어졌는지 검토된다. 단계(1204)에서는, 각각의 총 적합율에 대한 검색 데이타의 수가 얻어진다. 이들 결과는 디스플레이 스크린 상에 검색 결과로서 디스플레이된다.
제13도는 적합율을 얻는 방법을 설명하는 도면이다. 참조 번호(1301)로 지정된 분포 곡선을 고려하여, 검색된 항목값은 결과 값(y)를 얻익위해 이 분포 곡선에 대한 식(1302)으로 대입된다. 우선, 이 분포 곡선의 참조 번호(1305)로 나타낸 최대값(y)은 곡선의 최고값에 대응하는 조건값(X)을 식(1302)에 대입하으로써 얻어진다. 검색 범위가 참조 번호(1304)로 지정된 바와 같다고 가정하면, 적합율 100%에 대응하는 이 분포 곡선의 최대값(y)이 범위의 중간값에서 얻어진다. 검색 결과 데이타 값(1307)은 값(y1)을 얻기 위해 식(1302)으로 대입된다. 이 경우, 적합율은 참조 번호(1303)로 나타낸 식(y1/y)*100%로서 계산된다. 분포 곡선(1308)의 경우에 대하여, 지정된 검색 범위(1309)의 최대값에 대응하는 이 곡선의 값[y(1310)]에서 적합율 100%가 얻어진다. 각 검색 결과 데이타 값[y1(1311)]에 대해 값[y1(1311)]을 사용해, 식(y1/y)*100%로부터 적합율 값이 계산될 수 있다.
제14도는 총 적합율을 계산하는 방법을 설명하는 도면이다. 적합율 표(1402)에 도시된 각 항목(1403,1404)에 대한 적합율은 검색된 데이타 값(1401)을 사용하여 식(1303)으로부터 계산된다. 총 적합율은 모든 상품의 평균(각 항목 적합율*각 항목 가중치)으로 계산된다. 각 기록에 대한 각 항목의 가중치가 제7도에 도시된 표(701)과 동일한 용어 정보표(1406)로부터 얻어진다.
총 적합율을 계산하기 위한 식은 참조 번호(1406)로 지정된다. 각 기록에 대해 얻어진 총 적합율은 적합율표(1402) 내의 총 적합율 행(1405)에 기억된다.
제15도는 적합율표의 내용을 디스플레이 스크린 상에 디스플레이하는 흐름을 도시하고 있다.
단계(1501)에서 데이타 검색 및 적합율 계산을 완료한 후, 각 기록에 대한 적합율은 참조 번호(1502)로 나타낸 디스플레이 스크린 상에 디스플레이된다. 참조 번호(1503)로 나타낸 안내문 다음에 분포 상태를 디스플레이하기를 요청받은때 참조 번호(1504)로 나타낸 바와 같이 각 총 적합율 범위 내의 검색된 데이타의 수와 모든 검색된 데이타의 수에 대한 검색된 데이타의 수의 백분율을 나타내는 막대 그래프가 디스플레이 스크린 상에 디스플레이된다. 사용자는 디스플레이 스크린을 관찰하는 동안 원하는 대로 검색된 데이타를 추출할 수있다. 원하는 검색된 데이타를 추출할 때, 그것의 적합율 범위는 원하는 검색된 데이타가 참조 번호(1510)로 나타낸 대로 디스플레이되도록 디스플레이 스크린 상의 영역(1509)에 입력된다. 추출 및 디스플레이된 데이타가 파일과 메모리에 기억되면, 기억 키(도시되지 않음)가 참조 번호(1511)에서 활성화된다.
추출된 검색 데이타에 대한 총 집합율을 변화되려면, 재추출키(도시되지 않음)가 단계(1512)에서 활성화된다. 동일한 검색 조건을 사용하고, 데이타 검색을 다시 수행하여 검색 및 추출된 데이타의 범위를 좁힐 수 있다.
데이타 검색 범위(조건)를 좁히는 흐름이 제16도에 도시된 플로우차트를 참조하여 기술된 것이다.
우선, 단계(1601)에서, 데이타 검색 조건식이 지정되고 분석된다. 이 데이타 검색 조건식은 기본값 검색 조건식으로 변환된다. 이 식을 사용하여, 단계(1602)에서 데이타가 데이타 베이스 파일(1609)로부터 검색된다. 단계(1603)에서, 검색된 데이타 값 및 적합율이 디스플레이 스크린 상에 디스플레이된다. 단계(1604)에서, 원하는 총 적합율이 디스플레이 스크린 상에 디스플레이된다. 단계(1604)에서, 원하는 총 적합율 범위내의 검색된 기록 데이타가 추출되어 파일(1605)에 기억된다. 단계(1601)에 사용된 동일 검색 조건을 사용하거나 검색 조건을 더 지정하고, 데이타 검색을 다시 수행함으로써 검색 및 추출된 데이타의 범위를 좁히는 것이 가능하다. 이 동작은 검색 및 추출된 데이타의 범위를 좁히기 위해 반복된다.
제17도에는 검색된 결과 데이타의 범위를 좁히는 방법이 도시되어 있다. 데이타 베이스 파일내의 데이타 세트는 참조 번호(1701)로 지정되어 있다. 이 데이타 세트로부터, 50%에서 70%까지의 범위내의 데이타(1702)는 검색되어 추출된다. 검색 및 추출된 데이타를 사용하면, 참조 번호(1704)로 나타낸 바와 같이 동일 검색 조건을 사용하여 원하는 대로 검색 및 추출된 데이타의 범위를 좁히는 데이타 검색이 다시 수행된다.
상기 실시예의 데이타 검색 장치는 본 명세서에 참고로 사용된 ETOILE/OP라는 상품으로 본 양수인에 의해 판매되고 있다.
본 발명에 따르면, 검색 조건은 수치값에 의해서가 아니라 용어에 의해 지정될 수 있다. 따라서, 초심자라도 원하는 데이타를 신뢰성있게 검색할 수 잇다.
각 용어에 대한 범위는 데이타베이스 파일내의 모든 데이타의 항목값의 백분율 범위로서 지정될 수 있다. 그러므로, 사용자가 데이타베이스 파일내에 기억된 모든 항목값의 범위를 알 수 없다 하더라도, 데이타를 검색할 수 있다. 또한, 데이타베이스 파일내에 기억된 항목값이 변하더라도, 데이타 검색 또는 검색된 데이타의 범위를 좁히기 위한 검색 조건식을 변경할 필요는 없다. 검색된 결과 데이타가 적합율과 함께 디스플레이됨으로써, 사용자는 직감에 의존할 필요없이 디스플레이된 적합율을 참고하여 원하는 데이타를 검색할 수 있다. 또, 검색 및 추출 데이타 세트의 범위는 검색 및 추출된 데이타로부터의 데이타를 반복적으로 검색함으로써 좁아질 수 있다.
각 지정된 조건 또는 용어에 대한 적합율 뿐만아니라 각 기록의 모든 항목에 대한 총 적합율이 디스플레이되어, 사용자는 종합적으로 검색 조건을 평가 할 수 있고, 보다 객관적인 데이타 검색을 할 수 있다.
총 적합율이 항목에 할당될 가중치를 고려하여 계산됨으로써, 사용자는 대응하는 총 적합율을 점검하기 위해 가중치를 변화시킬 수 있다. 이 방식으로, 사용자는 직감에 의존하지 않고 신뢰성있고 객관적으로 검색할 데이타의 범위를 좁힐 수 있다.

Claims (12)

  1. 사용자 요구를 만족시키는 데이타를 컴퓨터 파일에 저장된 데이타로부터 검색하기 위한 데이타 검색 컴퓨터 장치에 있어서, 비율 범위의 형태로 검색될 각 항목에 할당된 내부에 양적으로 정의된 퍼지용어, 상기 용어 각각에 대해 미리 설정된 검색 조건 범위 및 이와 관련된 함수를 구비하여 상기 용어 각각에 대한 상기 검색 조건 범위 내에서 만족 데이타 분포를 나타내는 분포 곡선을 구비하는 용어 정의 수단과, 검색될 항목이 입력 퍼지 용어에 응답하여, 상기 입력 퍼지 용어를 포함하는 입력 검색 조건식을 값을 기본으로 하는 검색 조건식으로 변환하기 위한 조건 분석 수단을 포함하며, 상기 입력 검색 조건색에 포함된 입력 퍼지 용어가 상기 값을 기본으로 하는 검색 조건식에서 수치값으로 변경되며; 상기 조건 분석 수단으로 부터 공급된 상기 값을 기본으로 하는 검색 조건식에 따라 상기 컴퓨터 파일로부터 데이타를 검색하기 위한 데이타 검색 수단; 상기 데이타 검색 수단에 결합되어, 대응하는 상기 분포 곡선을 사용해서 상기 데이타 검색 수단으로부터 각각의 검색된 데이타에 대한 적합율을 계산하고, 상기 계산된 적합율을 출력하기 위한 적합율 평가 수단과, 상기 상기 검색된 데이타에 대해 상기 값을 기본으로 하는 동일한 검색 조건식을 사용하여, 검색된 데이타의 보조 세트를 나타내는 좁아진 데이타를 얻도록 상기 데이타 검색 수단으로부터의 상기 검색된 데이타를 좁히는 데이타 좁힘 수단을 포함하는 것을 특징으로하는 데이타 검색 장치.
  2. 제1항에 있어서, 상기 용어 정의 수단이 상기 용어 정의 수단에 의해 설정된 정보를 기억하기 위한 용어 정보표와 검색될 다수의 상기 각각의 항목에 대해 각각 얻어진 적합율부터 총 적합율을 계산하고, 상기 계산된 총 적율을 출력하기 위한 계산 수단을 포함하는 것을 특징으로 하는 데이타 검색 장치.
  3. 제1항에 있어서, 상기 용어 정의 수단에 의해 설정된 대응하는 상기 분포 곡선에 따라 각 항목에 대한 항목 데이타의 분포를 지정하기 위해 상기 용어 정의 수단에 결합된 지정 수단과, 상기 지정 수단으로부터 지정된 상기 분포와 상기 총 적합율로서 상기 다수의 항목들 각 항목에 대한 상기 적합율 각각을 평가함으로써 다수의 항목들을 전체적으로 평가하기 위한 평가 수단과 상기 총 평가의 결과에 따라 각 항목에 대한 총 적합율과 상기 적합율중 하나를 선택하기 위한 선택 수단을 더 구비하는 것을 특징으로 하는 데이타 검색 장치.
  4. 사용자 요구를 만족시키는 데이타를 컴퓨터를 사용하여 컴퓨터 파일에 저장된 데이타로부터 검색하는 데이타 검색 방법에 있어서, 정의표를 제공하고, 사용자에 의해 백분율 형태로 검색될 각 항목에 지정된 퍼지 용어를 상기 표에 양적으로 정의하고, 상기 용어 각각에 대한 검색 조건 범위 및 그와 관련된 함수를 가지며 상기 정의표의 상기 용어 각각에 대한 상기 검색 조건 범위내에서 만족 데이타 분포를 나타내는 분포 곡선을 설정하는 단계, 항목을 검색하기 위해 사용자가 퍼지 용어를 입력하는 것에 응답하여, 상기 정의표를 참조하면서 사용자에 의해 입력된 상기 퍼지 용어를 포함하는 검색 조건식을 분석하고, 상기 정의표를 사용하여 상기 검색 조건식을 값을 기본으로 하는 검색 조건식으로 변환하는 단계; 상기 값을 기본으로하는 검색 조건식에 따라 상기 컴퓨터 파일로부터 데이타를 검색하는 단계; 대응하는 상기 분포 곡선을 사용하여 상기 검색 단계로부터의 검색된 각 데이타에 대한 적합율을 계산하고, 계산된 상기 적합율을 출력하는 단계; 및 상기 검색된 데이타에 대해 상기 값을 기본으로 하는 동일한 검색 조건식을 사용하여, 상기 검색된 데이타의 보조 세트를 나타내는 좁아진 데이타를 얻도록 상기 검색 단계로부터의 상기 검색된 데이타를 좁히는 단계를 포함하는 것을 특징으로 하는 데이타 검색 방법.
  5. 제4항에 있어서, 입력된 상기 퍼지 용어에 대한 상기 검색된 데이타의 상기 적합율과 상기 검색 단계에서 얻어진 결과들을 동시에 디스플레이하는 단계를 더 구비하는 것을 특징으로 하는 데이타 검색 장치.
  6. 제4항에 있어서, 사용자에 의해 지정된 다수의 항목들에 대해, 상기 각 용어들의 상기 검색 조건 범위가 각 용어의 중량에 따라 다른 용어들의 범위들중 상기 용어의 상기 범위를 나타내는 계수에 의해 표시되는 것을 특징으로 하는 데이타 검색 방법.
  7. 제4항에 있어서, 상기 용어 정의 단계에서 설정된 정보가 용어 정보표에 저장되고, 총 적합율이 검색될 다수의 항목들에 대해 각각 계산된 적합율로부터 계산되는 것을 특징으로 하는 데이타 검색 방법.
  8. 제4항에 있어서, 상기 용어 정의 단계에서 설정된 대응하는 상기 분포 곡선에 따라 각 항목에 대해 항목 데이타의 분포를 지정하는 단계; 지정된 상기 분포와 총 적합율로서 상기 다수의 항목들각 항목에 대한 각각의 상기 적합율을 평가함으로써 상기 다수의 항목들을 전체적으로 평가하는 단계; 및 상기 전체적인 평가 결과에 따라 총 적합율과 각 항목에 대한 적합율중 하나를 선택하는 단계를 더 구비하는 것을 특징으로 하는 데이타 검색 방법.
  9. 제4항에 있어서, 다수의 각 항목들에 대한 상기 적합율이 검색 조건을 만족하는 상기 검색된 데이타의 범위를 좁히도록 검토되는 것을 특징으로 하는 데이타 검색 방법.
  10. 소망의 조건을 만족시키는 정보를 컴퓨터 데이타 베이스 파일로부터 검색하기 위한 정보 검색 컴퓨터 장치에 있어서, 비율 범위의 형태로 검색될 각 항목에 대해 사용자가 지정되는 퍼지 검색 조건을 나타내는 내부에 양적으로 규정된 속성 용어, 상기 용어 각각에 대해 미리 서정된 검색 조건 범위 및 이와 관련된 함수를 가지며 상기 용어 각각에 대한 상기 검색 조건 범위내에서 적합율 분포를 나타내는 분포 파형을 구비하는, 용어 정보표를 포함하는 용어 정의 수단, 검색될 항목에서 속성을 나타내는 퍼지 용어의 입력에 응답하여, 상기 입력된 퍼지 용어를 포함하는 검색 조건식을 상기 용어 정의 수단으로부터의 정보를 사용하여 값을 기본으로 하는 검색 조건식으로 변환하기 위한 조건 분석 수단; 상기 조건 분석 수단으로부터 공급된 상기 값을 기본으로 하는 검색 조건식에 따라 상기 컴퓨터 데이타 베이스 파일로부터 데이타를 검색하기 위한 검색 수단; 대응하는 상기 분포 파형을 사용해서 상기 검색 수단으로부터 공급된 상기 각각의 검색된 데이타에 대한 적합율을 계산하고, 상기 계산된 적합율을 출력하기 위한 적합율 평가 수단; 상기 적합율 평가 수단 및 상기 검색 수단의 출력을 디스플레이하여 사용자로 하여금 상기 검색된 데이타를 인티랙티브하게 선택하게 하는 수단; 및 상기 검색된 데이타에 대해 상기 값을 기본으로 하는 동일한 검색 조건식을 사용하여, 상기 검색된 데이타의 보조 세트를 나타내는 좁아진 데이타를 얻도록 상기 검색 수단으로부터의 상기 검색된 데이타를 좁히는 데이타 좁힘 수단을 포함하는 것을 특징으로 하는 정보 검색 컴퓨터 장치.
  11. 제10항에 있어서, 상기 적합율 평가 수단이 다수의 항목들에 대한 총 적합율과 가중된 적합율들을 계산하기 위해 검색될 다수의 항목들에 상대 가중치를 지정하기 위한 수단을 포함하는 것을 특징으로 하는 데이타 검색 장치.
  12. 제10항에 있어서, 상기 각 분포 파형이 사용자의 지식에 따라 가변적으로 변화되는 것을 특징으로 하는 데이타 검색 장치.
KR1019920018243A 1991-10-07 1992-10-06 적합율 또는 일치율을 제공하는 데이타 검색 방법 및 장치 KR970001907B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP3258878A JPH05101107A (ja) 1991-10-07 1991-10-07 適合率を用いた絞り込みデータ検索装置及び方法
JP91-258878 1991-10-07

Publications (2)

Publication Number Publication Date
KR930008659A KR930008659A (ko) 1993-05-21
KR970001907B1 true KR970001907B1 (ko) 1997-02-18

Family

ID=17326289

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019920018243A KR970001907B1 (ko) 1991-10-07 1992-10-06 적합율 또는 일치율을 제공하는 데이타 검색 방법 및 장치

Country Status (3)

Country Link
US (1) US5517640A (ko)
JP (1) JPH05101107A (ko)
KR (1) KR970001907B1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129622A (ja) * 1993-11-01 1995-05-19 Nippon Steel Corp 文書検索装置
JPH09101991A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
US5826260A (en) * 1995-12-11 1998-10-20 International Business Machines Corporation Information retrieval system and method for displaying and ordering information based on query element contribution
US5978800A (en) * 1997-03-14 1999-11-02 Dainippon Screen Mfg. Co., Ltd. Method of searching data for a given character string
US6311178B1 (en) * 1997-09-29 2001-10-30 Webplus, Ltd. Multi-element confidence matching system and the method therefor
KR20010097705A (ko) * 2000-04-25 2001-11-08 이황근 웹 문서 수집과 정보 구현 방법
JP2002024340A (ja) * 2000-07-12 2002-01-25 Be Free Soft:Kk 旅行商品組立システム、旅行商品組立方法、およびプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4334793B2 (ja) * 2001-09-28 2009-09-30 太田 美津枝 選択支援演算装置
KR20020023737A (ko) * 2001-12-14 2002-03-29 최범기 퍼지 관계 방법을 이용한 검색 방법 및 장치
US7111000B2 (en) * 2003-01-06 2006-09-19 Microsoft Corporation Retrieval of structured documents
JP2007265293A (ja) * 2006-03-29 2007-10-11 Fujitsu Frontech Ltd 商品検索システム、商品検索方法及び商品検索プログラム
JP5630275B2 (ja) * 2011-01-11 2014-11-26 ソニー株式会社 検索装置、検索方法、及びプログラム
US9819533B2 (en) * 2013-06-11 2017-11-14 International Business Machines Corporation Wirelessly syncing content of an application without requiring device to be plugged into power source

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4267568A (en) * 1975-12-03 1981-05-12 System Development Corporation Information storage and retrieval system
JPH01145721A (ja) * 1987-12-02 1989-06-07 Hitachi Ltd 文献の検索妥当性判定方式
JPH0287275A (ja) * 1988-09-22 1990-03-28 Nec Corp あいまい値データ検索処理方式
US5303361A (en) * 1989-01-18 1994-04-12 Lotus Development Corporation Search and retrieval system
JPH02235176A (ja) * 1989-03-09 1990-09-18 Ricoh Co Ltd 概念検索装置
JPH033075A (ja) * 1989-05-31 1991-01-09 Hitachi Ltd フアジー・データベース問合せ処理システム
JPH03122770A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd キーワード連想文書検索方法
JPH03168869A (ja) * 1989-11-29 1991-07-22 Matsushita Electric Ind Co Ltd ファジィ検索装置
US5321833A (en) * 1990-08-29 1994-06-14 Gte Laboratories Incorporated Adaptive ranking system for information retrieval

Also Published As

Publication number Publication date
US5517640A (en) 1996-05-14
KR930008659A (ko) 1993-05-21
JPH05101107A (ja) 1993-04-23

Similar Documents

Publication Publication Date Title
US11663230B2 (en) Interface including graphic representation of relationships between search results
US6269325B1 (en) Visual presentation technique for data mining software
KR970001907B1 (ko) 적합율 또는 일치율을 제공하는 데이타 검색 방법 및 장치
KR100432070B1 (ko) 풀텍스트문서검색을위한사용자인터페이스
US5774121A (en) User interface method and system for graphical decision making with categorization across multiple criteria
US5544352A (en) Method and apparatus for indexing, searching and displaying data
US6473080B1 (en) Statistical comparator interface
US6460049B1 (en) Method system and computer program product for visualizing an evidence classifier
US6484168B1 (en) System for information discovery
US6014661A (en) System and method for automatic analysis of data bases and for user-controlled dynamic querying
US6191792B1 (en) Scheme for automatic data conversion definition generation according to data feature in visual multidimensional data analysis tool
US7809717B1 (en) Method and apparatus for concept-based visual presentation of search results
JP4388301B2 (ja) 画像検索装置、画像検索方法、画像検索プログラム及びそのプログラムを記録した記録媒体
US20060179051A1 (en) Methods and apparatus for steering the analyses of collections of documents
WO1998035297A1 (en) Consumer profiling system with analytic decision processor
JPH10240716A (ja) 時系列データ解析装置及びプログラムを記録した機械読み取り可能な記録媒体
US7779018B2 (en) Presentation of data using meta-morphing
JPH0612554B2 (ja) 電子化文書検索装置
CA2151654A1 (en) Graphical display method and apparatus
JPH07262172A (ja) データ分析装置
JP3452308B2 (ja) データ分析装置
JPH0612553B2 (ja) 電子化文書検索装置
US11500906B1 (en) Constraint optimization problem solving on subfeatures of a subgraph of a network with classification of features of verbal elements in subgraphs
CA2164954C (en) Method and apparatus for indexing searching and displaying data
JPH07129601A (ja) 情報検索装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20001215

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee