KR100880531B1 - 단일 데이터 검색을 위한 파일 생성 방법 및 단일 데이터파일의 검색방법 그리고 단일 파일 검색을 위한 rat파일이 저장된 기록매체 - Google Patents
단일 데이터 검색을 위한 파일 생성 방법 및 단일 데이터파일의 검색방법 그리고 단일 파일 검색을 위한 rat파일이 저장된 기록매체 Download PDFInfo
- Publication number
- KR100880531B1 KR100880531B1 KR1020080067778A KR20080067778A KR100880531B1 KR 100880531 B1 KR100880531 B1 KR 100880531B1 KR 1020080067778 A KR1020080067778 A KR 1020080067778A KR 20080067778 A KR20080067778 A KR 20080067778A KR 100880531 B1 KR100880531 B1 KR 100880531B1
- Authority
- KR
- South Korea
- Prior art keywords
- file
- data
- rat
- single data
- rvr
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/32—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
- G11B27/327—Table of contents
- G11B27/329—Table of contents on a disc [VTOC]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
- G11B20/1217—Formatting, e.g. arrangement of data block or words on the record carriers on discs
- G11B20/1252—Formatting, e.g. arrangement of data block or words on the record carriers on discs for discontinuous data, e.g. digital information signals, computer programme data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2508—Magnetic discs
- G11B2220/2516—Hard disks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
따라서 본 발명은 대규모 파일을 빠르고 효과적으로 검색할 수 있도록 함에 의해, 대규모 데이터의 군집화 연구에 필수적인 데이터 처리 방법을 제시하고자 하는 것이다.
*이후, 저장된 RAT 파일을 검색하여 상기 검색정보에 대응하는 기록위치를 독출한다(S220).
한 예로 이론적으로 100 K bytes x 100 K bytes 데이터 레코드들의 유사성(혹은 상동성) 메트릭스를 생성하고 이 메트릭스를 사용하여 데이터를 완전 군집화 (exhaustive clustering)을 수행하려면 정상적으로 위의 100 K bytes x 100 K bytes 메트릭스를 DRAM에 올려 놓아야 하는데 위의 경우 C/C++에서 두배수 정밀한 정수형 변수 (double)를 사용하면 8 Giga Bytes (TB)의 DRAM이 필요하다.
따라서 이러한 대규모 군집화연구에 하드디스크를 사용하는 RVR-RAT방식은 절대적으로 필요하다.
Claims (19)
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 비정형 단일 데이터 파일을 검색하기 위한 방법에 있어서,(A) 데이터의 구분 단위를 입력받는 단계와;(B) 상기 입력된 구분단위로 상기 비정형 단일 데이터 파일을 구분하여 RVR 파일을 생성하는 단계와;(C) 상기 RVR 파일의 구분 단위별 기록위치를 검출하여 RAT 파일을 생성하는 단계; 그리고(D) 상기 RVR 파일 및 RAT 파일을 저장하는 단계를 포함하여 수행됨을 특징으로 하는 단일 데이터 검색을 위한 파일 생성 방법.
- 제 7 항에 있어서,상기 데이터는 비정형 데이터이고,상기 구분 단위는 [page], [paragraph], [line] 또는 [word] 중 어느 하나임을 특징으로 하는 단일 데이터 검색을 위한 파일 생성 방법.
- 정형 단일 데이터 파일을 검색하기 위한 방법에 있어서,(a) 정형 단일 데이터의 행과 열을 구분하여 RVR 파일을 생성하는 단계와;(b) 상기 RVR 파일의 행 또는 열 별 기록위치를 검출하여 RAT 파일을 생성하는 단계; 그리고(c) 상기 RVR 파일 및 RAT 파일을 저장하는 단계를 포함하여 수행됨을 특징으로 하는 단일 데이터 검색을 위한 파일 생성 방법.
- 제 7 항 내지 제 9 항 중 어느 한 항에 있어서,상기 기록 위치는,상기 단일 데이터 내에서 상기 해당 데이터가 기록된 위치까지의 누적된 데이터 크기임을 특징으로 하는 단일 데이터 검색을 위한 파일 생성 방법.
- 제 7 항 내지 제 9 항 중 어느 한 항에 있어서,상기 기록위치는,상기 해당 부분의 데이터가 기록된 하드 디스크 클러스터 넘버임을 특징으로 하는 단일 데이터 검색을 위한 파일 생성 방법.
- 삭제
- 단일 데이터 파일을 검색하는 방법에 있어서,(Ⅰ) 검색정보를 입력받는 단계와;(Ⅱ) RAT 파일로부터 상기 검색정보에 해당하는 상기 단일 데이터 내의 기록위치를 검출하는 단계와;(Ⅲ) 상기 기록위치로부터 상기 검색정보에 해당하는 데이터의 저장매체 내의 물리적 저장위치를 검출하는 단계; 그리고(Ⅳ) 상기 데이터의 물리적 위치의 데이터를 검색하여 결과를 출력하는 단계를 포함하여 수행됨을 특징으로 하는 단일 데이터 파일의 검색방법.
- 제 13 항에 있어서,상기 단일 데이터가 비정형 데이터인 경우,상기 검색정보는 구분단위의 순번을 의미함을 특징으로 하는 단일 데이터 파 일의 검색방법.
- 제 13 항에 있어서,상기 단일 데이터가 정형 데이터인 경우,상기 검색정보는 정형 데이터 중 해당 데이터의 행 또는 열 번호임을 특징으로 하는 단일 데이터 파일의 검색방법.
- 제 13 항 내지 제 15 항 중 어느 한 항에 있어서,상기 기록 위치는,상기 단일 데이터 내에서 상기 해당 데이터가 기록된 위치까지의 누적된 데이터 크기임을 특징으로 하는 단일 데이터 파일의 검색방법.
- 제 16 항에 있어서,상기 저장위치의 검출은,상기 각각의 구분 단위의 데이터 크기를 이용하여 상기 기록위치로부터 클러스터 위치를 산출하고, 상기 클러스터 위치의 물리적 저장위치를 FAT으로부터 독출하여 검출함을 특징으로 하는 단일 데이터 파일의 검색방법.
- 제 13 항 내지 제 15 항 중 어느 한 항에 있어서,상기 기록위치는,상기 해당 부분의 데이터가 기록된 하드 디스크 클러스터 넘버임을 특징으로 하는 단일 데이터 파일의 검색방법.
- 삭제
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080067778A KR100880531B1 (ko) | 2008-07-11 | 2008-07-11 | 단일 데이터 검색을 위한 파일 생성 방법 및 단일 데이터파일의 검색방법 그리고 단일 파일 검색을 위한 rat파일이 저장된 기록매체 |
PCT/KR2009/003790 WO2010005261A2 (ko) | 2008-07-11 | 2009-07-10 | 데이터 검색을 위한 파일 생성 방법 및 데이터 파일의 검색방법 그리고 데이터 파일 검색을 위한 데이터베이스 관리 시스템 |
US13/003,649 US8423513B2 (en) | 2008-07-11 | 2009-07-10 | File generation and search methods for data search, and database management system for data file search |
US13/845,999 US20130275462A1 (en) | 2008-07-11 | 2013-03-18 | File creating method for searching of data, searching method of data file and managing system for searching of data file |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080067778A KR100880531B1 (ko) | 2008-07-11 | 2008-07-11 | 단일 데이터 검색을 위한 파일 생성 방법 및 단일 데이터파일의 검색방법 그리고 단일 파일 검색을 위한 rat파일이 저장된 기록매체 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100880531B1 true KR100880531B1 (ko) | 2009-01-28 |
Family
ID=40483165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080067778A KR100880531B1 (ko) | 2008-07-11 | 2008-07-11 | 단일 데이터 검색을 위한 파일 생성 방법 및 단일 데이터파일의 검색방법 그리고 단일 파일 검색을 위한 rat파일이 저장된 기록매체 |
Country Status (3)
Country | Link |
---|---|
US (2) | US8423513B2 (ko) |
KR (1) | KR100880531B1 (ko) |
WO (1) | WO2010005261A2 (ko) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180069651A (ko) | 2016-12-15 | 2018-06-25 | (주)신테카바이오 | 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법 |
KR20190000341A (ko) | 2018-12-20 | 2019-01-02 | (주)신테카바이오 | 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법 |
KR20190000342A (ko) | 2018-12-20 | 2019-01-02 | (주)신테카바이오 | 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법 |
KR20190000340A (ko) | 2018-12-20 | 2019-01-02 | (주)신테카바이오 | 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법 |
US10540324B2 (en) | 2016-07-29 | 2020-01-21 | Syntekabio Co., Ltd. | Human haplotyping system and method |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9201916B2 (en) * | 2012-06-13 | 2015-12-01 | Infosys Limited | Method, system, and computer-readable medium for providing a scalable bio-informatics sequence search on cloud |
US9087459B2 (en) | 2012-11-30 | 2015-07-21 | The Nielsen Company (Us), Llc | Methods, apparatus, and articles of manufacture to encode auxilary data into text data and methods, apparatus, and articles of manufacture to obtain encoded data from text data |
US9990478B2 (en) | 2012-11-30 | 2018-06-05 | The Nielsen Company (Us), Llc | Methods, apparatus, and articles of manufacture to encode auxiliary data into relational database keys and methods, apparatus, and articles of manufacture to obtain encoded data from relational database keys |
US9042554B2 (en) * | 2012-11-30 | 2015-05-26 | The Nielsen Company (Us), Llc | Methods, apparatus, and articles of manufacture to encode auxilary data into text data and methods, apparatus, and articles of manufacture to obtain encoded data from text data |
KR102020446B1 (ko) | 2013-01-10 | 2019-09-10 | 삼성전자주식회사 | 에피텍시얼막 형성 방법 및 이를 수행하기 위한 장치 및 시스템 |
CN104053015A (zh) * | 2013-03-11 | 2014-09-17 | 中兴通讯股份有限公司 | 一种传输媒体数据的方法及虚拟桌面服务器 |
KR102094934B1 (ko) * | 2014-11-19 | 2020-03-31 | 한국전자통신연구원 | 자연어 질의 응답 시스템 및 방법 |
CN112459329B (zh) * | 2020-11-13 | 2022-05-13 | 重庆中科建设(集团)有限公司 | 一种叠合楼板桁架及底筋排布方法 |
US11797600B2 (en) * | 2020-11-18 | 2023-10-24 | Ownbackup Ltd. | Time-series analytics for database management systems |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040079470A (ko) * | 2003-03-07 | 2004-09-16 | 삼성전자주식회사 | 랜덤 액세스가 가능한 영상 및 음향 기록/재생 장치 및 그제어방법 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5473584A (en) * | 1992-01-29 | 1995-12-05 | Matsushita Electric Industrial Co., Ltd. | Recording and reproducing apparatus |
JP3647885B2 (ja) * | 1993-05-07 | 2005-05-18 | 日本電信電話株式会社 | 画像処理装置 |
US7124302B2 (en) * | 1995-02-13 | 2006-10-17 | Intertrust Technologies Corp. | Systems and methods for secure transaction management and electronic rights protection |
US6226710B1 (en) * | 1997-11-14 | 2001-05-01 | Utmc Microelectronic Systems Inc. | Content addressable memory (CAM) engine |
US7289723B2 (en) * | 1997-12-12 | 2007-10-30 | Kabushiki Kaisha Toshiba | Digital recording system using variable recording rate |
JP3597690B2 (ja) * | 1998-01-21 | 2004-12-08 | 株式会社東芝 | デジタル情報記録再生システム |
US7197534B2 (en) * | 1998-09-01 | 2007-03-27 | Big Fix, Inc. | Method and apparatus for inspecting the properties of a computer |
US6233666B1 (en) * | 1998-09-17 | 2001-05-15 | International Business Machines Corporation | Deferred disk drive space allocation for virtual memory pages with management of disk address recording in multipage tables without external process interrupts for table for input/output to memory |
US6381656B1 (en) * | 1999-03-10 | 2002-04-30 | Applied Microsystems Corporation | Method and apparatus for monitoring input/output (“I/O”) performance in I/O processors |
KR100361028B1 (ko) * | 1999-07-21 | 2002-11-18 | 주식회사 하빈 | 디지털 오디오 데이터의 파일명 지정 방법 |
KR20010094691A (ko) * | 2000-04-01 | 2001-11-01 | 최진근 | 인터넷 웹사이트에서 매트릭스 검색창을 이용한 광고방법및 시스템 및 컴퓨터에서 실행시키기 위한 프로그램을기록한 컴퓨터로 읽을수 있는 기록매체 |
EP3522163A1 (en) | 2003-01-02 | 2019-08-07 | Samsung Electronics Co., Ltd. | Multimedia apparatus with "slide-show" accompanied audio output |
US7814554B1 (en) * | 2003-11-06 | 2010-10-12 | Gary Dean Ragner | Dynamic associative storage security for long-term memory storage devices |
US20050132161A1 (en) * | 2003-12-15 | 2005-06-16 | Nokia Corporation | Creation of virtual memory space in a memory |
FR2868572B1 (fr) | 2004-04-05 | 2006-06-09 | Francois Lebrat | Procede de recherche de contenu, notamment d'extraits communs entre deux fichiers informatiques |
US7778972B1 (en) * | 2005-12-29 | 2010-08-17 | Amazon Technologies, Inc. | Dynamic object replication within a distributed storage system |
-
2008
- 2008-07-11 KR KR1020080067778A patent/KR100880531B1/ko active IP Right Grant
-
2009
- 2009-07-10 WO PCT/KR2009/003790 patent/WO2010005261A2/ko active Application Filing
- 2009-07-10 US US13/003,649 patent/US8423513B2/en active Active
-
2013
- 2013-03-18 US US13/845,999 patent/US20130275462A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040079470A (ko) * | 2003-03-07 | 2004-09-16 | 삼성전자주식회사 | 랜덤 액세스가 가능한 영상 및 음향 기록/재생 장치 및 그제어방법 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10540324B2 (en) | 2016-07-29 | 2020-01-21 | Syntekabio Co., Ltd. | Human haplotyping system and method |
KR20180069651A (ko) | 2016-12-15 | 2018-06-25 | (주)신테카바이오 | 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법 |
KR20190000341A (ko) | 2018-12-20 | 2019-01-02 | (주)신테카바이오 | 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법 |
KR20190000342A (ko) | 2018-12-20 | 2019-01-02 | (주)신테카바이오 | 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법 |
KR20190000340A (ko) | 2018-12-20 | 2019-01-02 | (주)신테카바이오 | 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법 |
Also Published As
Publication number | Publication date |
---|---|
WO2010005261A2 (ko) | 2010-01-14 |
US20110246505A1 (en) | 2011-10-06 |
US20130275462A1 (en) | 2013-10-17 |
US8423513B2 (en) | 2013-04-16 |
WO2010005261A3 (ko) | 2010-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100880531B1 (ko) | 단일 데이터 검색을 위한 파일 생성 방법 및 단일 데이터파일의 검색방법 그리고 단일 파일 검색을 위한 rat파일이 저장된 기록매체 | |
JP2849788B2 (ja) | データベース・キーワード・インデクシング方法 | |
US7689574B2 (en) | Index and method for extending and querying index | |
US8161240B2 (en) | Cache management | |
CN104246764B (zh) | 利用非均匀散列函数在非均匀访问存储器中放置记录的方法和装置 | |
CN111324750B (zh) | 一种大规模文本相似度计算及文本查重方法 | |
US6330567B1 (en) | Searching system for searching files stored in a hard disk of a personal computer | |
US20100235359A1 (en) | File retrieval method and device and time stream file processor | |
WO1998055929A1 (en) | Creating a perfect hash using offset table | |
JP2005267600A5 (ko) | ||
JP2008516347A (ja) | インタロックツリーデータストアの保存および復元 | |
JP2001028009A (ja) | データ値の集合の形成、記憶及び使用のための方法とシステム | |
EP1315103B1 (en) | File search method and apparatus, and index file creation method and device | |
JP2017532690A (ja) | 重複ウェブページを除去する方法および装置 | |
Baeza-Yates et al. | Hierarchies of indices for text searching | |
CN102609531B (zh) | 一种根据关键字反查文件的方法 | |
US20200278980A1 (en) | Database processing apparatus, group map file generating method, and recording medium | |
Park et al. | FAST: Flash-aware external sorting for mobile database systems | |
US20070050396A1 (en) | Fast algorithm for building multimedia library database | |
JP5440235B2 (ja) | オントロジーの類似性行列の効率的な計算 | |
US7870138B2 (en) | File storage and retrieval method | |
US20210224240A1 (en) | Augmentation to the succinct trie for multi-segment keys | |
CN111566627B (zh) | 信息蓄积装置、数据处理***及记录介质 | |
CN117290390B (zh) | 一种基于特殊索引内存映射在大数据检索上的方法 | |
JP3260706B2 (ja) | パーソナルコンピュータのハードディスクに記憶されたファイルを検索する検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130118 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20131113 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20141124 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20151216 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20181119 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20191021 Year of fee payment: 12 |