KR102418865B1 - 기록물의 디지털화를 위한 기록물 db 구축 방법 - Google Patents

기록물의 디지털화를 위한 기록물 db 구축 방법 Download PDF

Info

Publication number
KR102418865B1
KR102418865B1 KR1020220035315A KR20220035315A KR102418865B1 KR 102418865 B1 KR102418865 B1 KR 102418865B1 KR 1020220035315 A KR1020220035315 A KR 1020220035315A KR 20220035315 A KR20220035315 A KR 20220035315A KR 102418865 B1 KR102418865 B1 KR 102418865B1
Authority
KR
South Korea
Prior art keywords
information
original
sub
index
original image
Prior art date
Application number
KR1020220035315A
Other languages
English (en)
Inventor
민태영
심경원
Original Assignee
(주)디앤디기술
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)디앤디기술 filed Critical (주)디앤디기술
Priority to KR1020220035315A priority Critical patent/KR102418865B1/ko
Application granted granted Critical
Publication of KR102418865B1 publication Critical patent/KR102418865B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/95Pattern authentication; Markers therefor; Forgery detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Security & Cryptography (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 종이 서류 형식으로 보관 중인 비전자 기록물을 디지털 정보로 전자화할 때 작업절차를 간소화하여 신속하게 전자화 작업을 진행하도록 하고, 전자화 과정에서 발생할 수 있는 위변조의 위험을 방지하도록 정확히 검증하고, 검증된 원본 이미지 정보와 색인 정보를 해당 기관의 시스템에 업로드 하는 발명으로, 기록물 디지털화 단계(S300), 검증 단계(S400), 시스템 업로드 단계(S500)를 포함하는 것을 특징으로 한다.

Description

기록물의 디지털화를 위한 기록물 DB 구축 방법{A database building method to digitize for public literature files}
본 발명은 기록물의 디지털화를 위한 기록물 DB 구축 방법에 관한 것으로, 상세하게는 종이 서류 형식으로 작성하여 보관 중인 비전자 기록물을 디지털 정보로 전자화할 때 작업절차를 간소화하여 신속하게 전자화 작업을 진행하도록 하고, 전자화 과정에서 발생할 수 있는 위변조의 위험을 방지하도록 정확히 검증하고, 검증된 원본 이미지 정보와 색인 정보를 해당 기관의 시스템에 업로드 하는 기술에 관한 것이다.
현대사회는 컴퓨터 기술과 전자통신기술을 기반으로 하는 디지털 정보화 사회로서, 각종 데이터를 포함하고 있는 수많은 정보가 컴퓨터와 스마트폰, 인터넷을 통해 전송되고 있다.
디지털 정보는 아날로그 정보에 비해 관리, 보관, 전송이 용이한 장점이 있어, 아날로그 방식으로 작성하여 보관 중인 비전자 기록물을 디지털 정보로 전자화하여 보관하는 추세이다.
한편, 각종 공공기관의 경우, 서류 형태의 많은 비전자 기록물이 생산되고 있으며, 전자화라는 시대적 추세에 따라 생산된 비전자 기록물을 디지털 정보로 전자화하여 관리 보관하고 있으며, 공공정보 제공 시스템을 통해 국민들에게 전자화된 각종 정보를 제공하고 있다.
이때, 각종 공공기관에서는 국가기록원 DB 구축 지침(NAK23 2017)을 준수하여 비전자 기록물을 디지털 정보로 전자화하고 있는데, 상기 국가기록원 DB 구축 지침에 따른 비전자 기록물의 전자화 작업절차는 복잡하여 장시간의 작업시간이 소요되어 비용이 크게 발생하고, 특히 비전자 기록물의 전자화 시, 기록물의 위변조 위험에 노출되는 문제가 있다.
따라서 본 발명은 종이 서류 형식으로 작성하여 보관 중인 비전자 기록물을 디지털 정보로 전자화할 때 작업절차를 간소화하여 신속하게 전자화 작업을 진행하도록 하고, 전자화 과정에서 발생할 수 있는 위변조의 위험을 방지하도록 정확히 검증하고, 검증된 원본 이미지 정보와 색인 정보를 해당 기관의 시스템에 업로드 하는 기술을 제안하고자 한다.다음은 이와 관련한 종래의 선행기술들이다.
1. 대한민국 등록특허공보 제10-1991087호 검증 및 보정 효율성이 개선된 비 전자 기록물의 디지털화 시스템 및 방법 2. 대한민국 등록특허공보 제10-2016998호 개인정보를 포함하는 비공개 처리 기록물의 효율적 관리를 위한 비전자 기록물의 디지털화 시스템 및 방법 3. 대한민국 등록특허공보 제10-2162528호 기록물 DB 구축 방법
본 발명은 종이 서류 형식으로 작성하여 보관 중인 비전자 기록물을 디지털 정보로 전자화할 때 작업절차를 간소화하여 신속하게 전자화 작업을 진행하도록 하는 것을 목적으로 한다.
또한, 본 발명은 전자화 과정에서 발생할 수 있는 위변조의 위험을 방지하도록 정확히 검증하고, 검증된 원본 이미지 정보와 색인 정보만을 해당 기관의 시스템에 업로드 하는 것을 목적으로 한다.
상기와 같은 목적을 달성하기 위해 본 발명인 기록물의 디지털화를 위한 기록물 DB 구축 방법은,
분류 정리된 원본 기록물을 스캔하여 원본 이미지 정보를 생성하고, 생성된 원본 이미지 정보가 관련 정보들이 매칭된 상태로 DB에 저장 처리되도록 하는 기록물 디지털화 단계(S300)와;
DB에 저장된 원본 이미지 정보의 위변조 여부와 색인 정보의 정확성 여부를 검증하는 검증 단계(S400)와;
위변조가 없고 색인이 정확한 것으로 검증된 원본 이미지 정보와 색인 정보를 해당 기관의 시스템에 업로드 하는 시스템 업로드 단계(S500)를 포함하는 것을 특징으로 한다.
본 발명은 종이 서류 형식으로 작성하여 보관 중인 비전자 기록물을 디지털 정보로 전자화할 때 작업절차를 간소화하여 신속하게 전자화 작업을 진행하도록 하여, 종래 방식에 비해 작업인력, 작업시간, 작업비용을 절약할 수 있는 효과를 제공한다.
또한, 본 발명은 전자화 과정에서 발생할 수 있는 위변조의 위험을 방지하도록 정확히 검증하고, 검증된 원본 이미지 정보와 색인 정보만을 해당 기관의 시스템에 업로드 하여, 전자화 문서의 위변조 가능성을 낮추고 전자화 문서에 위변조가 시도되어도 신속하게 위변조를 파악하여 조치할 수 있는 효과를 제공한다.
도 1은 본 발명의 순서도
도 2는 본 발명의 DB 구축시스템 개념도
도 3은 본 발명의 DB 구축시스템 기능 블록도
도 4는 본 발명의 DB 모듈 예시도
도 5는 본 발명의 원본 이미지 정보 위변조 검증 단계 세부 순서도
도 6은 본 발명의 원본 이미지 정보 위변조 검증 예시도
도 7은 본 발명의 원본 이미지 정보 위변조 검증 시 태그 사용 예시도
도 8은 본 발명의 색인 검증 단계 세부 순서도 1
도 9는 본 발명의 색인 검증 예시도 1
도 10은 본 발명의 색인 정보 검증 시 태그 사용 예시도
도 11은 본 발명의 색인 검증 단계 세부 순서도 2
도 12은 본 발명의 색인 검증 예시도 2
본 발명의 실시예를 첨부된 도 1 내지 도 12를 참조하여 상세히 설명한다.
본 발명인 기록물의 디지털화를 위한 기록물 DB 구축 방법(10, 이하 ‘본 발명’)은 종이 서류 형식으로 작성하여 보관 중인 비전자 기록물을 디지털 정보로 전자화할 때 작업절차를 간소화하여 신속하게 전자화 작업을 진행하도록 하고, 전자화 과정에서 발생할 수 있는 위변조의 위험을 방지하도록 정확히 검증하고, 검증된 원본 이미지 정보와 색인 정보를 해당 기관의 시스템에 업로드하여, 종래 방식에 비해 작업인력, 작업시간, 작업비용을 절약할 수 있는 효과와 전자화 문서의 위변조 가능성을 낮추고 전자화 문서에 위변조가 시도되어도 신속하게 위변조를 파악하여 조치할 수 있는 효과를 제공하는 발명으로, 도 1과 같이, 기록물 디지털화 단계(S300), 검증 단계(S400), 시스템 업로드 단계(S500)를 포함하여 구성된다.
구체적으로, 본 발명의 기록물의 디지털화를 위한 기록물 DB 구축 방법은, 도 1에 도시된 바와 같이,
분류 정리된 원본 기록물을 스캔하여 원본 이미지 정보를 생성하고, 생성된 원본 이미지 정보가 관련 정보들이 매칭된 상태로 DB에 저장 처리되도록 하는 기록물 디지털화 단계(S300)와;
DB에 저장된 원본 이미지 정보의 위변조 여부와 색인 정보의 정확성 여부를 검증하는 검증 단계(S400)와;
위변조가 없고 색인이 정확한 것으로 검증된 원본 이미지 정보와 색인 정보를 해당 기관의 시스템에 업로드 하는 시스템 업로드 단계(S500)를 포함하는 것을 특징으로 한다.
도 1에 도시된, 기록물 반출 단계(S100)와 기록물 정리 단계(S200)는 전자화를 위한 사전 준비 단계이다.
전자화 사전 준비 단계인 상기 기록물 반출 단계(S100)는 기록물의 디지털화를 진행하기로 결정한 해당 기관에서 전자화 대상인 원본 기록물을 외부로 반출하는 단계이다.
일반적으로, 공공기관에서 보관 중인 원본 기록물은 내용이 인쇄 또는 수기로 기록된 종이 형태의 서류로서, 서류철에 철된 상태로 보관되고, 종이 형태의 서류들은 해당 기관의 정보 공개 대민 서비스 차원에서 전자화가 필요하다.
전자화를 위한 종이 형태의 서류인 원본 기록물 반출 시, 상호 혼합되지 않도록 신중하게 분류하여 포장하여 반출시키고, 전자화 작업이 완료되면 다시 반입 받는다.
전자화 사전 준비 단계인 상기 기록물 정리 단계(S200)는 후술할 기록물 디지털화 단계(S300)에서 스캐너를 이용하여 기록물에 대한 스캔 작업을 진행하기 전에 준비하는 단계로서, 해당 기관에서 반출된 원본 기록물을 작업자가 해철하고 분류 정리하는 단계이다.
즉, 서류철에 철된 상태의 원본 기록물들을 스캔하기 위해 서류철에 철된 원본 기록물을 해철하여 스캔 작업이 가능하도록 준비하는 과정이다.
도 2를 참조하면, 상기 기록물 반출 단계(S100)와 기록물 정리 단계(S200)를 통해 준비된 원본 기록물을 전자화하기 위해, 작업자는 DB 구축시스템(20)에 자신의 ID로 로그인하여 전자화 작업을 하게 되는데, 상기 DB 구축시스템(20)은 작업자 단말기(100), 스캐너(200), DB 구축 지원 장치(300)를 포함하여 구성된다.
상기 작업자 단말기(100)는 작업자가 기록물의 전자화 작업을 진행할 때 사용하는 컴퓨터로서, 작업자는 작업자 단말기(100)를 통해 DB 구축시스템(20)에 자신의 ID로 로그인하여 전자화 작업을 수행한다.
전자화 작업 시, 사용한 작업자 ID 정보는 전자화 작업을 통해 생성되는 원본 정보에 포함된다.
이때, 작업자 ID는 작업자별로 할당되므로, 각기 다른 ID를 갖는 작업자들이 상기 DB 구축시스템(20)에 각각 로그인하여 전자화 작업을 수행하게 되는 것이다.
상기 스캐너(200)는 해철된 원본 기록물들을 스캔하여 원본 이미지 정보를 생성하는 구성으로, 원본 기록물에 기록된 정보들을 효과적으로 스캔하여 원본 이미지 정보를 생성하도록 고해상도를 갖는 것이 바람직하다.
상기 DB 구축 지원 장치(300)는 기록물 디지털화 단계(S300), 검증 단계(S400), 시스템 업로드 단계(S500)가 수행되도록 지원하는 구성으로, 기록 저장 모듈(310), 검증 모듈(320), 시스템 업로드 모듈(330), DB 모듈(340)을 포함한다.
상기 기록 저장 모듈(310)은 기록물 디지털화 단계(S300)에서 원본 기록물이 스캔되어 생성된 원본 이미지 정보가 디지털 정보로 DB에 저장 처리되도록 지원하는 구성이다.
상기 검증 모듈(320)은 검증 단계(S400)에서 DB에 저장된 원본 이미지 정보의 위변조 여부와 색인 정보의 정확성 여부가 검증되도록 지원하는 구성이다.
상기 시스템 업로드 모듈(330)은 시스템 업로드 단계(S500)에서 위변조가 없고 색인이 정확한 것으로 검증된 원본 이미지 정보와 색인 정보를 전자화를 요청한 해당 기관의 시스템에 업로드되도록 지원하는 구성이다.
상기 DB 모듈(340)은 저장수단으로서, 원본 정보가 저장되는 제1 DB(341), 서브 정보가 저장되는 제2 DB(342), 색인 정보가 저장되는 제3 DB(343)를 포함하여 구성된다.
본 발명에서 사용되는 용어에 대해 정의한다.
원본 정보는 원본 기록물을 전자화(스캔 등)한 원본 이미지 정보에 연관 정보(작업자 ID 정보, 타임스탬프 정보, 해시값 정보)가 매칭된 정보로 제1 DB(341)에 저장되는 정보이고, 서브 정보는 원본 정보에 대응된 정보로 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 포함하는 정보로 제2 DB(342)에 저장되는 정보이다.
상기 원본 정보에 포함된 작업자 ID 정보와 타임스탬프 정보와 해시값 정보는 해당 원본 정보에 포함된 원본 이미지 정보가 수정을 통해 위변조되어 다시 저장되는 경우, 정보 값이 변하는 가변 정보이이나, 상기 서브 정보에 포함된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보는 원본 정보에 포함된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보와 내용은 동일한 정보이나 원본 정보에 포함된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보와는 달리 원본 정보에 포함된 원본 이미지 정보가 위변조되어 원본 정보에 포함된 작업자 ID 정보와 타임스탬프 정보와 해시값 정보의 정보 값이 변하더라도 정보 값이 변하지 않도록 최초 저장 시 암호화 처리된 정보이다.
상기 작업자 ID 정보는 가변 정보로 스캐너(200)를 통해 원본 기록물의 전자화(스캔 등) 작업을 수행한 작업자의 ID 정보이거나 원본 이미지 정보에 대해 위변조를 시도한 작업자의 ID 정보로서 제1 DB(341)에 저장되는 정보이고, 상기 서브 작업자 ID 정보는 암호화 처리된 불변 정보로 스캐너(200)를 통해 원본 기록물의 전자화(스캔 등) 작업을 수행한 작업자의 ID 정보로서 제2 DB(342)에 저장되는 정보이다.
즉, 원본 기록물의 최초 전자화(스캔 등) 작업 수행 시, 제1 DB(341)에 원본 기록물의 전자화(스캔 등) 작업을 수행한 작업자의 ID 정보가 저장됨과 동시에 제2 DB(342)에 원본 기록물의 전자화(스캔 등) 작업을 수행한 작업자의 ID가 서브 작업자 ID 정보로 암호화 처리되어 저장된다. 이후, 다른 작업자가 제1 DB(341)에 저장된 원본 이미지 정보에 대해 위변조를 시도하는 경우, 제1 DB(341)에 저장된 작업자 ID 정보는 위변조를 시도한 다른 작업자의 ID로 변경되지만 제2 DB(342)에 저장된 서브 작업자 ID 정보는 암호화 처리된 상태여서 원본 기록물의 최초 전자화(스캔 등) 작업을 수행한 작업자의 ID정보를 원래 그대로 유지하게 된다.
상기 타임스탬프 정보는 원본 이미지 정보가 제1 DB(341)에 최초 저장될 때의 시간 정보로 원본 이미지 정보가 위변조되는 경우 위변조시의 시간으로 변경되는 가변 정보이고, 상기 서브 타임스탬프 정보는 제1 DB(341)에 최초 저장되는 타임스탬프 정보와 동일 내용의 정보이나 가변 특성을 갖는 타임스탬프 정보와는 달리 타임스탬프 정보값이 변하더라도 정보 값이 변하지 않도록 최초 저장 시 암호화 처리되어 원본 이미지 최초 저장 시간 정보를 원래 그대로 유지하는 정보이다.
상기 해시값 정보는 해시함수를 적용하여 생성된 원본 이미지 정보에 대한 고유 정보로 원본 이미지 정보가 위변조되는 경우 해시값이 변경되는 가변 정보이고, 상기 서브 해시값 정보는 제1 DB(341)에 최초 저장되는 해시값 정보와 동일 내용의 정보이나 가변 특성을 갖는 제1 DB(341)에 저장되는 해시값 정보와는 달리 제1 DB(341)에 저장된 해시값 정보가 변하더라도 정보 값이 변하지 않도록 최초 저장 시 암호화 처리되어 최초 저장시의 해쉬값 정보를 원래 그대로 유지하는 정보이다.
색인 정보는 원본 이미지 정보가 공공기관 시스템에 업로드되어 서비스될 때, 공공기관 직원이나 서비스 이용자들이 해당 원본 이미지를 찾거나 검색할 때 사용할 검색어(keyword)를 포함하는 정보이다. 예를 들어, 원본 이미지 정보가 우리나라의 일별/월별 미세먼지 농도에 관련된 통계 정보인 경우, 색인 정보는 미세 먼지, 통계란 키워드를 포함할 수 있다.
상기 기록물 디지털화 단계(S300)는 상술할 기록물 정리 단계(S200)를 통해 분류 정리된 원본 기록물을 스캔하여 원본 이미지 정보를 생성하고, 생성된 원본 이미지 정보에 관련 정보들이 매칭된 상태로 DB에 저장 처리되도록 하는 단계로서, 제1-1 단계(S310), 제1-2 단계(S320), 제1-3 단계(S330), 제1-4 단계(S340)를 포함하여 구성된다.
구체적으로, 상기 기록물 디지털화 단계(S300)는, 도 1에 도시된 바와 같이,
원본 기록물을 스캔하여 원본 이미지 정보를 생성하는 제1-1 단계(S310)와,
생성된 원본 이미지 정보에 연관 정보가 매칭된 정보인 원본 정보가 제1 DB(341)에 저장되도록 하되, 식별자가 부여되어 저장되도록 하는 제1-2 단계(S320)와,
상기 원본 정보 저장 시, 원본 정보에 대응된 서브 정보가 제2 DB(342)에 자동 저장되도록 하되, 식별자가 부여되어 자동 저장되도록 하는 제1-3 단계(S330)와,
상기 제1 DB(341)에 저장된 원본 정보로부터 원본 이미지 정보를 추출하고, 추출된 원본 이미지 정보에 대한 색인 정보를 생성하고, 생성된 색인 정보에 식별자를 부여한 후, 식별자가 부여된 색인 정보가 제3 DB(343)에 저장되도록 하는 제1-4 단계(S340)를 포함하는 것을 특징으로 한다.
도 3을 참조하면, 상기 제1-1 단계(S310)는 스캐너(200)를 통해 원본 기록물을 스캔하여 원본 이미지 정보를 생성하는 단계이다.
이때, 상기 제1-1 단계(S310)를 통해 생성된 원본 이미지 정보는 PDF, JPEG, TIFF와 같은 이미지 정보용 전자파일로 생성되며, 생성된 원본 이미지 정보는 해상도가 높을수록 원본 기록물에 최대한 유사해진다.
도 3, 4를 참조하면, 상기 제1-2 단계(S320)는 제1-1 단계(S310)를 통해 생성된 원본 이미지 정보에 연관 정보가 매칭된 원본 정보를 생성하고, 생성된 원본 정보가 식별자가 부여된 상태로 DB 모듈(340)의 제1 DB(341)에 저장되도록 하는 단계로서, DB 구축 지원 장치(300)의 기록 저장 모듈(310)에 의해 수행된다.
원본 이미지 정보에 매칭되는 상기 연관 정보는 작업자 ID 정보, 타임스탬프(time-stamp) 정보, 해시값(hash value) 정보를 포함한다.
상기 작업자 ID 정보는 스캐너(200)를 통해 원본 기록물의 전자화(스캔 등) 작업을 수행한 작업자의 ID 정보이고, 작업자가 DB 구축시스템(20)에 로그인 시, 사용한 작업자 자신의 ID이고, 타임스탬프 정보는 원본 이미지 정보가 DB 모듈(340)의 제1 DB(341)에 저장될 때의 시간 정보이다.
특히, 상기 해시값 정보는 해시함수를 적용하여 생성된 정보로서, 원본 이미지 정보가 DB 모듈(340)의 제1 DB(341)에 저장될 때 기록 저장 모듈(310)이 해시함수를 이용해 자동 생성하는 원본 이미지 정보에 대한 고유 정보이다. 해시값 정보는 해시함수를 적용하여 생성되는데, 해시함수를 적용해 해시값을 생성하는 기술은 종래의 일반적이고 공지된 기술인바 구체적 설명은 생략하기로 한다.
상기 원본 정보에 부여되는 식별자는 DB 구축시스템(20)에 사전 설정된 식별자 부여 기준 매뉴얼에 따라 원본 정보에 부여되며, 원본 정보뿐만 아니라 서브 정보, 색인 정보에도 식별자 부여 기준 매뉴얼에 따라 식별자가 부여된다.
특히, 식별자 부여 기준 매뉴얼은 동일 원본 기록물에 관련된 원본 정보, 서브 정보, 색인 정보에 동일한 식별자가 부여되도록 한다.
도 4에서는 원본 정보, 서브 정보, 색인 정보에 각기 다른 식별자가 부여된 예가 도시되어 있으며, 예를 들어, 식별자 #1이 부여된 원본 정보, 서브 정보, 색인 정보는 동일한 원본 기록물에 대한 정보들이다.
도 3, 4를 참조하면, 상기 제1-3 단계(S330)도 기록 저장 모듈(310)에 의해 진행되며, 상기 제1-3 단계(S330)는 제1-2 단계(S320)를 통해 원본 정보가 제1 DB(341)에 저장 시, 상기 원본 정보에 대응되는 서브 정보가 제2 DB(342)에 자동 저장되도록 하는 단계이다.
이때, 상기 서브 정보가 제2 DB(342)에 자동 저장 시, 서브 정보에도 식별자가 부여되어 자동 저장되는데, 원본 정보에 부여된 식별자와 동일한 식별자가 상기 서브 정보에 부여된다.
즉, 기록 저장 모듈(310)은 DB 구축시스템(20)에 사전 설정된 식별자 부여 기준 매뉴얼에 따라 원본 정보가 제1 DB(341)에 저장 시, 상기 원본 정보에 대응되는 서브 정보가 원본 정보와 동일한 식별자로 제2 DB(342)에 자동 저장되도록 한다.
특히, 원본 정보와 동일한 식별자가 부여된 상기 서브 정보는 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 포함하며, 상기 서브 정보에 포함된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보는 제1-2 단계(S320)에서 생성된 원본 정보에 포함된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보와 각각 동일한 정보이다.
한편, 상기 제1 DB(341)에 저장된 원본 정보에 포함된 작업자 ID 정보와 타임스탬프 정보와 해시값 정보는 해당 원본 정보에 포함된 원본 이미지 정보가 수정을 통해 위변조되어 다시 저장되는 경우, 정보 값이 변하는 가변 정보이고, 상기 제2 DB(342)에 저장된 서브 정보에 포함된 서브 작업자 ID 정보와 서브 타임스탬프 정보와 서브 해시값 정보는 제1 DB(341)에 저장된 원본 정보에 포함된 원본 이미지 정보가 위변조되어 원본 정보에 포함된 작업자 ID 정보와 타임스탬프 정보와 해시값 정보의 정보 값이 변하더라도 정보 값이 변하지 않도록 최초 저장 시 암호화 처리된다.
즉, 제1 DB(341)에 저장된 원본 정보에 포함된 작업자 ID 정보와 타임스탬프 정보와 해시값 정보는 원본 정보의 위변조시 가변되는 정보이고, 제2 DB(342)에 저장된 서브 정보에 포함된 서브 작업자 ID 정보와 서브 타임스탬프 정보와 서브 해시값 정보는 원본 정보의 위변조시 가변되지 않는 불변 정보인 것을 특징으로 한다.
좀더 구체적으로, 제1 DB(341)에 저장된 원본 정보에 포함된 작업자 ID 정보와 타임스탬프 정보와 해시값 정보는 누군가가 불법적으로 제1 DB(341)에 접근해 원본 정보를 건드려 위변조하는 경우 최초 저장된 상태와는 다르게 가변되도록 하는 가변 정보이고, 제2 DB(342)에 저장된 서브 정보에 포함된 서브 작업자 ID 정보와 서브 타임스탬프 정보와 서브 해시값 정보는 누군가가 불법적으로 제1 DB(341)에 접근해 원본 정보를 건드려 위변조하는 경우 최초 저장된 상태가 그대로 보존되도록 하는 불변 정보인 것이며, 제2 DB(342)에 저장된 서브 정보에 포함된 서브 작업자 ID 정보와 서브 타임스탬프 정보와 서브 해시값 정보는 불변 정보의 특성을 갖도록 최초 저장 시 암호화 처리되는 것이다.
제2 DB(342)에 저장된 서브 정보에 포함된 서브 작업자 ID 정보와 서브 타임스탬프 정보와 서브 해시값 정보를 암호화 처리하는 기술은 일반적인 암호화 기술을 사용하는 것이어서 종래의 어떠한 암호화 기술을 이용하든 상관 없으며, 일반적인 종래의 암호화 처리 기술은 공지된 기술인바 이에 대한 구체적 설명은 생략한다.
따라서 후술할 검증 단계(S400)의 위변조 검증 단계(S410)에서 제1 DB(341)에 저장된 위변조 시 가변 되는 정보인 원본 정보와 제2 DB(342)에 저장된 불변 정보인 서브 정보를 상호 비교하여 제1 DB(341)에 저장된 원본 정보에 포함된 원본 이미지 정보의 위변조 여부를 검증하게 되는 것이다.
도 3, 4를 참조하면, 상기 제1-4 단계(S340)는 기록 저장 모듈(310)에 의해 진행되는데, 제1-4 단계(S340)는 제1 DB(341)에 저장된 원본 정보로부터 원본 이미지 정보가 추출되고, 추출된 원본 이미지 정보에 대한 색인 정보가 생성되면, 생성된 색인 정보에 식별자를 부여한 후, 식별자가 부여된 색인 정보가 제3 DB(343)에 저장되도록 하는 단계이다.
이때, 상기 색인 정보는 원본 기록물을 스캔하여 생성된 원본 이미지 정보를 구분하고 분류하는 정보로서, 기록물 명칭, 기록물 생산연도, 기록물 종류, 기록자 정보를 포함한다.
즉, 색인 정보는 원본 이미지 정보가 공공기관 시스템에 업로드되어 서비스될 때, 공공기관 직원이나 서비스 이용자들이 해당 원본 이미지를 찾거나 검색할 때 사용되는 일종의 검색어(keyword) 기능을 수행한다.
즉, 작업자가 색인 작업을 위해 제1 DB(341)에 저장된 원본 정보로부터 원본 이미지 정보를 추출하고, 추출한 원본 이미지 정보에 해당하는 색인 정보를 생성하게 되면, 기록 저장 모듈(310)은 DB 구축시스템(20)에 사전 설정된 식별자 부여 기준 매뉴얼에 따라 생성된 색인 정보에 식별자를 부여한 후, 식별자가 부여된 색인 정보가 제3 DB(343)에 저장되도록 한다.
이때, 상기 색인 정보에 부여되는 식별자는 원본 정보에 부여된 식별자와 동일한 식별자이다.
따라서 후술할 검증 단계(S400)의 색인 검증 단계(S420)에서 제1 DB(341)에 저장된 원본 정보의 원본 이미지를 OCR 방식으로 리딩한 기록물 원문 정보와 제3 DB(343)에 저장된 색인 정보를 상호 비교하여 색인 정보의 정확성 여부를 검증하게 되는 것이다.
도 1, 3을 참조하면, 상기 검증 단계(S400)는 DB에 저장된 원본 이미지 정보의 위변조 여부와 색인 정보의 정확성 여부를 검증하는 단계로, 검증 모듈(320)에 의해 수행된다.
상기 검증 단계(S400)는 제1 DB(341)에 저장된 원본 이미지 정보의 위변조 여부를 검증하는 위변조 검증 단계(S410)와,
제3 DB(343)에 저장된 색인 정보의 정확성 여부를 검증하는 색인 검증 단계(S420)를 포함한다.
도 5를 참조하면, 상기 위변조 검증 단계(S410)는,
원본 이미지 정보의 위변조 여부를 검증하기 위해, 검증할 원본 이미지 정보에 매칭된 연관 정보인 작업자 ID 정보, 타임스탬프 정보, 해시값 정보를 제1 DB(341)에서 추출하는 제2-1 단계(S411)와,
상기 제2-1 단계(S411)를 통해 연관 정보가 추출된 원본 정보와 동일한 식별자를 갖는 서브 정보에 포함된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 제2 DB(342)에서 추출하는 제2-2 단계(S412)와,
상기 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보와 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 상호 비교하여 일치 여부를 판단하되, 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보 중 적어도 하나 이상이 제2-2 단계를 통해 추출된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보와 일치하지 않으면 위변조 있는 것으로 판단하고, 판단 결과에 따라 원본 이미지 정보의 위변조 여부에 관한 검증 결과 정보를 화면에 표시하는 제2-3 단계(S413)를 포함하는 것을 특징으로 한다.
또한, 상기 위변조 검증 단계(S410)는,
검증 대상인 원본 이미지 정보에 위변조가 없는 것으로 판단되는 경우, 진본임을 표시하는 태그 정보를 해당 원본 정보에 표시하여 제1 DB(341)에 저장 처리하고, 검증 대상인 원본 이미지 정보에 위변조가 있는 것으로 판단되는 경우, 변조본임을 표시하는 태그 정보를 해당 원본 정보에 표시하여 제1 DB(341)에 저장 처리하는 제2-4 단계(S414)를 더 포함하는 것을 특징으로 한다.
또한, 상기 위변조 검증 단계(S410)는,
제2-3 단계(S413)를 통한 판단 결과, 위변조가 있는 것으로 판단된 경우, 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보에 해당하는 작업자와 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보에 해당하는 작업자에게 위변조가 발생한 것으로 판단된 원본 이미지 정보에 관련된 식별자 정보(원본 이미지 정보가 포함된 원본 정보의 식별자 정보)를 제공하면서 위변조에 대한 사실관계 확인을 요청하는 제2-5 단계(S415)를 더 포함하는 것을 특징으로 한다.
도 5, 6을 참조하면, 상기 제2-1 단계(S411)는 원본 이미지 정보의 위변조 여부를 검증하기 위해 검증 대상인 원본 이미지 정보에 매칭된 연관 정보인 작업자 ID 정보, 타임스탬프 정보, 해시값 정보를 제1 DB(341)로부터 추출하는 단계이다.
예를 들어, 검증 대상인 원본 이미지가 속한 원본 정보의 식별자가 #24라면 #24라는 식별자를 갖는 원본 정보에 속한 연관 정보인 작업자 ID 정보, 타임스탬프 정보, 해시값 정보를 제1 DB(341)로부터 추출하는 것이다.
상기 제1 DB(341)에 저장된 원본 정보에 포함된 연관 정보인 작업자 ID 정보, 타임스탬프 정보, 해시값 정보는 원본 정보에 포함된 원본 이미지 정보가 수정을 통해 위변조되어 다시 저장되는 경우에는 정보 값이 변하는 가변 정보이다.
따라서 만약 검증 대상인 원본 이미지에 위변조가 발생한 경우, 추출되는 연관 정보인 작업자 ID 정보, 타임스탬프 정보, 해시값 정보는 최초 저장 시와는 다른 정보 값으로 추출된다.
상기 제2-2 단계(S412)는 제2-1 단계(S411)를 통해 연관 정보가 추출된 원본 정보와 동일한 식별자를 갖는 서브 정보에 포함된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 제2 DB(342)에서 추출한다.
예를 들어, 제2-1 단계(S411)를 통해 #24라는 식별자를 갖는 원본 정보에 속한 연관 정보인 작업자 ID 정보, 타임스탬프 정보, 해시값 정보가 추출되었으면 #24라는 식별자를 갖는 서브 정보에 속한 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 추출하는 것이다.
이때, 상기 제2 DB(342)에 저장된 서브 정보에 포함된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보는 최초 저장 시 암호화 불변 처리되어, 원본 정보에 포함된 원본 이미지 정보가 위변조되어 원본 정보에 포함된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보의 정보 값이 변하더라도 정보 값이 변하지 않는 불변 정보로서, 위변조 여부에 상관없이 최초 저장 시 저장된 정보 값 그대로 저장되어 있다가 추출된다.
상기 제2-3 단계(S413)는 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보와 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 상호 비교하여 일치 여부를 판단한다.
이때, 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보 중 적어도 하나 이상이 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보와 일치하지 않으면 위변조 있는 것으로 판단한다.
또한, 판단 결과에 따라 원본 이미지 정보의 위변조 여부에 관한 검증 결과 정보를 화면에 표시한다.
도 6의 하단에는, 판단 결과에 따라 원본 이미지 정보의 위변조 여부에 관한 검증 결과정보가 화면에 표시된 예가 도시되어 있다.
예를 들어, 2-1 단계(S411)를 통해 추출된 식별자 #1의 원본 정보에 속한 작업자 ID 정보, 타임스탬프 정보, 해시값 정보 모두가 제2-2 단계(S412)를 통해 추출된 식별자 #1의 서브 정보에 속한 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보와 일치하는 경우 제1 DB에 저장된 #1의 원본 정보는 판단 결과 진본이라는 검증 결과정보를 화면에 표시하거나, 2-1 단계(S411)를 통해 추출된 식별자 #2의 원본 정보에 속한 작업자 ID 정보, 타임스탬프 정보, 해시값 정보 중 적어도 하나 이상이 제2-2 단계(S412)를 통해 추출된 식별자 #2의 서브 정보에 속한 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보와 일치하지 않는 경우 제1 DB에 저장된 #2의 원본 정보는 판단 결과 변조본이라는 검증 결과정보를 화면에 표시하여 검증자가 검증 결과를 인지하도록 한다.
한편, 상기 제2-3 단계(S413)의 검증 결과를 화면에 표시하는 것 이외에 검증 결과를 제1 DB(341)에 저장된 원본 정보에 표시할 필요성이 있다.
이를 위해, 상기 위변조 검증 단계(S410)는 검증 대상인 원본 이미지 정보에 위변조가 없는 것으로 판단되는 경우, 진본임을 표시하는 태그 정보를 해당 원본 정보에 표시하여 제1 DB(341)에 저장 처리하고, 검증 대상인 원본 이미지 정보에 위변조가 있는 것으로 판단되는 경우, 변조본임을 표시하는 태그 정보를 해당 원본 정보에 표시하여 제1 DB(341)에 저장 처리하는 제2-4 단계(S414)를 더 포함할 수 있다.
도 7을 참조하면, 상기 검증 모듈(320)은 제1 DB(341)에 저장된 #1 원본 정보가 진본으로 검증된 경우 #1 원본 정보에 진본이라는 태그 정보를 표시하여 저장 처리하고, #2 원본 정보가 진본으로 검증된 경우 #2 원본 정보에 진본이라는 태그 정보를 표시하여 저장 처리하고, #3 원본 정보가 변조본으로 검증된 경우 #3 원본 정보에 변조본이라는 태그 정보를 표시하여 저장 처리한다.
한편, 상기 제2-3 단계(S413)의 검증 결과, 원본 이미지 정보의 위변조 여부가 확인되면, 관리자 입장에서는 위변조가 발생한 사유를 확인할 필요성이 있다.
이를 위해, 상기 위변조 검증 단계(S410)는 제2-3 단계(S413)를 통한 판단 결과, 위변조가 있는 것으로 판단된 경우, 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보에 해당하는 작업자와 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보에 해당하는 작업자에게 위변조가 발생한 것으로 판단된 원본 이미지 정보에 관련된 식별자 정보를 제공하면서 위변조에 대한 사실관계 확인을 요청하는 제2-5 단계(S415)를 더 포함할 수 있다.
예를 들어, #2 원본 정보에 위변조가 발생된 경우, 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보에 해당하는 작업자 A와 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보에 해당하는 작업자 B에게 위변조가 발생한 것으로 판단된 원본 이미지 정보에 관련된 식별자 정보 #2를 제공하여 #2 원본 정보에 대한 위변조가 누구에 의해 발생 된 것인지에 대한 사실관계 확인을 요청하게 된다.
상술한 바와 같이, 제2 DB(342)에 저장된 서브 정보는 최초 저장 시 암호화 불변 처리된 정보이어서 최초 저장된 정보 값 그대로 저장된 상태이고, 제1 DB(341)에 저장된 원본 정보는 누군가가 원본 이미지 정보를 위변조할 때, 최초 저장된 정보 값과는 다른 정보값으로 저장된 상태일 것이다.
따라서 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보(불변 정보인 서브 정보에 속한 정보)에 해당하는 작업자 B는 #2 원본 정보와 #2 서브 정보를 최초 저장 처리한 작업자이고, 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보에 해당하는 작업자 A는 위변조를 시도한 작업일 것이다.
따라서 작업자 A에 의해 위변조가 발생한 것으로 추측되지만, 정확한 사실관계를 확인하기 위해, 위변조가 발생된 원본 이미지 정보에 관련된 식별자 정보 #2를 작업자 A와 B에게 제공하여 #2 원본 정보에 대한 위변조가 누구에 의해 발생 된 것인지에 대한 사실관계를 관리자는 정확히 확인할 수 있게 된다.
상기 색인 검증 단계(S420)는 제3 DB(343)에 저장된 색인 정보의 정확성 여부를 검증하는 단계로, 실시예 1과 실시예 2로 구분된다.
구체적으로, 상기 색인 검증 단계(S420)의 실시예 1은, 도 8에 도시된 바와 같이,
검증할 색인 정보를 제3 DB(343)에서 추출하고, 추출된 검증 대상인 색인 정보와 동일한 식별자를 갖는 원본 정보를 제1 DB(341)에서 추출하고, 추출된 원본 정보에 포함된 원본 이미지 정보를 추출하는 제3-1 단계(S421)와,
추출된 원본 이미지를 OCR 방식으로 리딩하여 기록물 원문 정보를 생성하고, 검증할 색인 정보와 동일한 단어가 생성된 기록물 원문 정보에 존재하는지 판단하고, 판단 결과에 따라 검증 대상인 색인 정보의 정확성 여부에 관한 검증 결과 정보를 화면에 표시하는 제3-2 단계(S422)와,
검증 대상인 색인 정보가 정확한 것으로 판단되는 경우, 색인 정보가 정확함을 표시하는 태그 정보를 해당 색인 정보에 표시하여 제3 DB(343)에 저장 처리하고, 검증 대상인 색인 정보가 정확하지 않은 것으로 판단되는 경우, 색인 정보가 부정확함을 표시하는 태그 정보를 해당 색인 정보에 표시하여 제3 DB(343)에 저장 처리하는 제3-3 단계(S423)를 포함하는 것을 특징으로 한다.
도 9를 참조하면, 상기 제3-1 단계(S421)는 검증할 색인 정보를 제3 DB(343)에서 추출하고, 추출된 검증 대상인 색인 정보와 동일한 식별자를 갖는 원본 정보를 제1 DB(341)에서 추출하고, 추출된 원본 정보에 포함된 원본 이미지 정보를 추출한다.
상기 제3-2 단계(S422)는 제3-1 단계(S421)를 통해 추출된 원본 이미지를 OCR 방식으로 리딩하여 기록물 원문 정보를 생성하고, 검증할 색인 정보와 동일한 단어 또는 문장이 생성된 기록물 원문 정보에 존재하는지 판단하고, 판단 결과에 따라 검증 대상인 색인 정보의 정확성 여부에 관한 검증 결과 정보를 화면에 표시한다.
예를 들어, 검증을 위해 제3-1 단계(S421)를 통해 추출된 식별자가 #1인 색인 정보의 내용이 “ 관내 생활보호대상자 현황 보고서, 2000년 10월 ” 인 경우, 제3-1 단계(S421)를 통해 추출된 식별자가 #1인 원본 정보에 속한 원본 이미지를 OCR 방식으로 리딩하여 생성한 기록물 원문 정보에 상기 색인 정보의 내용인 “ 관내 생활보호대상자 현황 보고서, 2000년 10월 ” 이라는 단어 또는 문장이 존재하는지 판단한다.
판단 결과, 색인 정보의 내용에 해당하는 단어 또는 문장이 기록물 원문 정보에 모두 존재하면, 제3 DB(343)에 저장된 #1의 원본 정보에 대한 색인 정보는 정확하다는 검증 결과정보를 도 9의 하단 그림과 같이 화면에 표시하거나, 색인 정보의 내용에 해당하는 단어 또는 문장 모두 또는 일부가 기록물 원문 정보에 존재하지 않으면 제3 DB(343)에 저장된 #2의 원본 정보에 대한 색인 정보는 부정확하다는 검증 결과정보를 도 9의 하단 그림과 같이 화면에 표시하여 검증자가 검증 결과를 인지하도록 한다.
한편, 상기 제3-2 단계(S422)의 색인 정보에 대한 검증 결과를 화면에 표시하는 것 이외에 검증 결과를 제3 DB(343)에 저장된 색인 정보에 표시할 필요성이 있다.
이를 위해, 상기 색인 검증 단계(S420)는 검증 대상인 색인 정보가 정확한 것으로 판단되는 경우, 색인 정보가 정확함을 표시하는 태그 정보를 해당 색인 정보에 표시하여 제3 DB(343)에 저장 처리하고, 검증 대상인 색인 정보가 정확하지 않은 것으로 판단되는 경우, 색인 정보가 부정확함을 표시하는 태그 정보를 해당 색인 정보에 표시하여 제3 DB(343)에 저장 처리하는 제3-3 단계(S423)를 포함할 수 있다.
도 10을 참조하면, 검증 모듈(320)은 제3 DB(343)에 저장된 #1 색인 정보가 정확한 것으로 검증된 경우 #1 색인 정보에 정확이라는 태그 정보를 표시하여 저장 처리하고, #2 색인 정보가 정확한 것으로 검증된 경우 #2 색인 정보에 정확이라는 태그 정보를 표시하여 저장 처리하고, #3 색인 정보가 정확한 것으로 검증된 경우 #3 색인 정보에 정확이라는 태그 정보를 표시하여 저장 처리하고, #4 색인 정보가 부정확한 것으로 검증된 경우 #4 색인 정보에 부정확이라는 태그 정보를 표시하여 저장 처리한다.
한편, 상기 색인 검증 단계(S420)의 실시예 2는 제3-1 단계(S421), 제3-4 단계(S424), 제3-3 단계(S423)를 포함하여 구성된다.
구체적으로, 상기 색인 검증 단계(S420)의 실시예 2는, 도 11에 도시된 바와 같이,
검증할 색인 정보를 제3 DB(343)에서 추출하고, 추출된 검증 대상인 색인 정보와 동일한 식별자를 갖는 원본 정보를 제1 DB(341)에서 추출하고, 추출된 원본 정보에 포함된 원본 이미지 정보를 추출하는 제3-1 단계(S421)와,
추출된 원본 이미지에 대한 다른 작업자가 생성한 검증 색인 정보와 추출된 검증 대상인 색인 정보를 비교해 상호 일치하는지를 판단하고, 판단 결과에 따라 검증 대상인 색인 정보의 정확성 여부에 관한 검증 결과 정보를 화면에 표시하는 제3-4 단계(S424)와,
검증 대상인 색인 정보가 정확한 것으로 판단되는 경우, 색인 정보가 정확함을 표시하는 태그 정보를 해당 색인 정보에 표시하여 제3 DB(343)에 저장 처리하고, 검증 대상인 색인 정보가 정확하지 않은 것으로 판단되는 경우, 색인 정보가 부정확함을 표시하는 태그 정보를 해당 색인 정보에 표시하여 제3 DB(343)에 저장 처리하는 제3-3 단계(S423)를 포함하는 것을 특징으로 한다.
여기서, 상기 제3-1 단계(S421)와 제3-3 단계(S423)는 실시예 1과 동일하므로 설명을 생략하고, 상기 제3-4 단계(S424)만 설명한다.
상기 제3-4 단계(S424)는 제3-1 단계(S421)를 통해 추출된 원본 이미지에 대한 다른 작업자가 생성한 검증 색인 정보와 추출된 검증 대상인 색인 정보를 비교해 상호 일치하는지를 판단하고, 판단 결과에 따라 검증 대상인 색인 정보의 정확성 여부에 관한 검증 결과 정보를 화면에 표시한다.
예를 들어, 검증을 위해 제3-1 단계(S421)를 통해 추출된 식별자가 #1인 색인 정보의 내용이 “ 관내 생활보호대상자 현황 보고서, 2000년 10월 ” 인 경우, 추출된 색인 정보 내용에 해당하는 “ 관내 생활보호대상자 현황 보고서, 2000년 10월 ” 이라는 단어나 문장이 제3-1 단계(S421)를 통해 추출된 식별자가 #1인 원본 정보에 속한 원본 이미지에 대해 다른 작업자가 생성한 검증 색인 정보에 존재하는지를 판단한다.
판단 결과, 색인 정보의 내용에 해당하는 단어 또는 문장이 다른 작업자가 생성한 검증 색인 정보에 모두 존재하면, 제3 DB(343)에 저장된 #1의 원본 정보에 대한 색인 정보는 정확하다는 검증 결과정보를 도 9의 하단 그림과 같이 화면에 표시하거나, 색인 정보의 내용에 해당하는 단어 모두 또는 일부가 다른 작업자가 생성한 검증 색인 정보에 존재하지 않으면 제3 DB(343)에 저장된 #2의 원본 정보에 대한 색인 정보는 부정확하다는 검증 결과정보를 도 9의 하단 그림과 같이 화면에 표시하여 검증자가 검증 결과를 인지하도록 한다.
상기 시스템 업로드 단계(S500)는 상술한 검증 단계(S400)를 통해 위변조가 없고 색인이 정확한 것으로 검증된 원본 이미지 정보와 색인 정보를 해당 기관의 시스템에 업로드 하는 단계로서, 제4-1 단계(S510), 제4-2 단계(S520)를 포함하여 구성되며 시스템 업로드 모듈(330)을 통해 수행된다.
상기 제4-1 단계(S510)는 동일한 식별자를 갖는 원본 정보와 색인 정보를 제1 DB(341)과 제3 DB(343)로부터 각각 추출한다.
예를 들어, 제1 DB(341)로부터 #1 원본 정보를 추출하고 제3 DB(343)로부터 #1 색인 정보를 추출하는 것이다.
상기 제4-2 단계(S520)는 제4-1 단계(S510)를 통해 추출된 원본 정보에 위변조가 없고 추출된 색인 정보가 정확한 색인인 것으로 검증되었으면(상술한 태그 정보를 이용해 검증할 수 있음), 추출된 원본 정보에 포함된 원본 이미지 정보를 추출하고, 추출된 원본 이미지 정보와 제4-1 단계(S510)를 통해 추출된 색인 정보를 매칭시켜 해당 기관의 시스템에 업로드 한다.
예를 들어, 위변조가 없는 것으로 검증된 #1 원본 정보에 속한 원본 이미지와 색인이 정확한 것으로 검증된 동일한 식별자를 갖는 #1 색인 정보를 매칭시켜 해당 기관의 시스템에 업로드 하는 것이다.
즉, 원본 기록물에 대한 전자화를 요청한 해당 기관으로 최종적으로 제공되는 대상은 원본 기록물을 스캔한 원본 이미지와 해당 원본 이미지에 대한 색인 정보이다.
따라서 상기 제4-2 단계(S520)를 통해 원본 정보에 위변조가 없고 색인 정보가 정확한 색인인 것으로 검증된 원본 이미지와 색인 정보만을 해당 기관의 시스템에 업로드 하는 것이다.
이상에서 본 발명에 대한 기술사상을 첨부도면과 함께 서술하였지만, 이는 본 발명의 바람직한 실시예를 예시적으로 설명한 것이지 본 발명을 한정하는 것은 아니다. 또한, 이 기술분야의 통상의 지식을 가진 자라면 누구나 본 발명의 기술사상의 범주를 이탈하지 않는 범위 내에서 다양한 변형 및 모방이 가능함은 명백한 사실이다.
10 : 기록물의 디지털화를 위한 기록물 DB 구축 방법
20 : DB 구축시스템

Claims (11)

  1. 기록물의 디지털화를 위한 기록물 DB 구축 방법에 있어서,
    스캐너(200)를 이용해, 분류 정리된 원본 기록물을 스캔하여 원본 이미지 정보를 생성하고, 기록 저장 모듈(310)을 이용해, 생성된 원본 이미지 정보가 관련 정보들이 매칭된 상태로 DB에 저장 처리되도록 하는 기록물 디지털화 단계(S300)와;
    검증 모듈(320)을 이용해, DB에 저장된 원본 이미지 정보의 위변조 여부와 색인 정보의 정확성 여부를 검증하는 검증 단계(S400)와;
    시스템 업로드 모듈(330)을 이용해, 위변조가 없고 색인이 정확한 것으로 검증된 원본 이미지 정보와 색인 정보를 해당 기관의 시스템에 업로드 하는 시스템 업로드 단계(S500)를 포함하되,

    상기 검증 단계(S400)는,
    제1 DB(341)에 저장된 원본 이미지 정보의 위변조 여부를 검증하는 위변조 검증 단계(S410)와,
    제3 DB(343)에 저장된 색인 정보의 정확성 여부를 검증하는 색인 검증 단계(S420)를 포함하고,

    상기 위변조 검증 단계(S410)는,
    원본 이미지 정보의 위변조 여부를 검증하기 위해, 검증할 원본 이미지 정보에 매칭된 연관 정보인 작업자 ID 정보, 타임스탬프 정보, 해시값 정보를 제1 DB(341)에서 추출하는 제2-1 단계(S411)와,
    상기 제2-1 단계(S411)를 통해 연관 정보가 추출된 원본 정보와 동일한 식별자를 갖는 서브 정보에 포함된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 제2 DB(342)에서 추출하는 제2-2 단계(S412)와,
    상기 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보와 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 상호 비교하여 일치 여부를 판단하되, 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보 중 적어도 하나 이상이 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보와 일치하지 않으면 위변조가 있는 것으로 판단하고, 판단 결과에 따라 원본 이미지 정보의 위변조 여부에 관한 검증 결과 정보를 화면에 표시하는 제2-3 단계(S413)를 포함하고,

    상기 색인 검증 단계(S420)는,
    검증할 색인 정보를 제3 DB(343)에서 추출하고, 추출된 검증 대상인 색인 정보와 동일한 식별자를 갖는 원본 정보를 제1 DB(341)에서 추출하고, 추출된 원본 정보에 포함된 원본 이미지 정보를 추출하는 제3-1 단계(S421)와,
    추출된 원본 이미지를 OCR 방식으로 리딩하여 기록물 원문 정보를 생성하고, 검증할 색인 정보와 동일한 단어가 생성된 기록물 원문 정보에 존재하는지 여부로 색인 정보의 정확성을 판단하거나, 또는 추출된 원본 이미지에 대한 다른 작업자가 생성한 검증 색인 정보와 추출된 검증 대상인 색인 정보를 비교해 상호 일치하는지여부로 색인 정보의 정확성을 판단하고, 판단 결과에 따라 검증 대상인 색인 정보의 정확성 여부에 관한 검증 결과 정보를 화면에 표시하는 제3-2 단계(S422)와,
    검증 대상인 색인 정보가 정확한 것으로 판단되는 경우, 색인 정보가 정확함을 표시하는 태그 정보를 해당 색인 정보에 표시하여 제3 DB(343)에 저장 처리하고, 검증 대상인 색인 정보가 정확하지 않은 것으로 판단되는 경우, 색인 정보가 부정확함을 표시하는 태그 정보를 해당 색인 정보에 표시하여 제3 DB(343)에 저장 처리하는 제3-3 단계(S423)를 포함하고

    상기 색인 정보는 원본 이미지 정보가 해당 기관의 시스템에 업로드되어 서비스될 때, 해당 원본 이미지를 찾거나 검색할 때 사용할 검색어(keyword)를 포함하는 정보인 것을 특징으로 하는 기록물의 디지털화를 위한 기록물 DB 구축 방법.
  2. 제1항에 있어서,
    상기 기록물 디지털화 단계(S300)는,
    원본 기록물을 스캔하여 원본 이미지 정보를 생성하는 제1-1 단계(S310)와,
    생성된 원본 이미지 정보에 연관 정보가 매칭된 정보인 원본 정보가 제1 DB(341)에 저장되도록 하되, 식별자가 부여되어 저장되도록 하는 제1-2 단계(S320)와,
    상기 원본 정보 저장 시, 원본 정보에 대응된 서브 정보가 제2 DB(342)에 자동 저장되도록 하되, 식별자가 부여되어 자동 저장되도록 하는 제1-3 단계(S330)와,
    상기 제1 DB(341)에 저장된 원본 정보로부터 원본 이미지 정보가 추출되고, 추출된 원본 이미지 정보에 대한 색인 정보가 생성되면, , 생성된 색인 정보에 식별자를 부여한 후, 식별자가 부여된 색인 정보가 제3 DB(343)에 저장되도록 하는 제1-4 단계(S340)를 포함하는 것을 특징으로 하는 기록물의 디지털화를 위한 기록물 DB 구축 방법.
  3. 제2항에 있어서,
    하나의 원본 기록물에 대한 원본 정보, 서브 정보, 색인 정보에 부여되는 식별자는 동일한 식별자로서, 사전 설정된 식별자 부여 기준 매뉴얼에 따라 원본 정보, 서브 정보, 색인 정보에 동일 식별자가 부여되도록 하는 것을 특징으로 하는 기록물의 디지털화를 위한 기록물 DB 구축 방법.
  4. 제2항에 있어서,
    식별자가 부여된 상기 원본 정보는 원본 이미지 정보에 연관 정보가 매칭된 정보이고,
    상기 연관 정보는 작업자 ID 정보, 타임스탬프 정보, 해시값 정보를 포함하고,
    식별자가 부여된 상기 서브 정보는 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보를 포함하고,
    상기 서브 정보에 포함된 서브 작업자 ID 정보, 서브 타임스탬프 정보, 서브 해시값 정보는 상기 원본 정보에 포함된 작업자 ID 정보, 타임스탬프 정보, 해시값 정보와 각각 동일한 정보인 것을 특징으로 하는 기록물의 디지털화를 위한 기록물 DB 구축 방법.
  5. 제4항에 있어서,
    상기 제1 DB(341)에 저장된 상기 원본 정보에 포함된 작업자 ID 정보와 타임스탬프 정보와 해시값 정보는, 원본 정보에 포함된 원본 이미지 정보가 수정을 통해 위변조되어 다시 저장되는 경우, 정보 값이 변하는 정보이고,
    상기 제2 DB(342)에 저장된 상기 서브 정보에 포함된 서브 작업자 ID 정보와 서브 타임스탬프 정보와 서브 해시값 정보는, 제1 DB(341)에 저장된 원본 정보에 포함된 원본 이미지 정보가 위변조되어 원본 정보에 포함된 작업자 ID 정보와 타임스탬프 정보와 해시값 정보의 정보 값이 변하더라도 정보 값이 변하지 않도록 최초 저장 시 암호화 처리된 정보인 것을 특징으로 하는 기록물의 디지털화를 위한 기록물 DB 구축 방법.
  6. 삭제
  7. 제1항에 있어서,
    상기 위변조 검증 단계(S410)는,
    검증 대상인 원본 이미지 정보에 위변조가 없는 것으로 판단되는 경우, 진본임을 표시하는 태그 정보를 해당 원본 정보에 표시하여 제1 DB(341)에 저장 처리하고, 검증 대상인 원본 이미지 정보에 위변조가 있는 것으로 판단되는 경우, 변조본임을 표시하는 태그 정보를 해당 원본 정보에 표시하여 제1 DB(341)에 저장 처리하는 제2-4 단계(S414)를 더 포함하는 것을 특징으로 하는 기록물의 디지털화를 위한 기록물 DB 구축 방법.
  8. 제1항에 있어서,
    상기 위변조 검증 단계(S410)는,
    제2-3 단계(S413)를 통한 판단 결과, 위변조가 있는 것으로 판단된 경우, 제2-1 단계(S411)를 통해 추출된 작업자 ID 정보에 해당하는 작업자와 제2-2 단계(S412)를 통해 추출된 서브 작업자 ID 정보에 해당하는 작업자에게 위변조가 발생한 것으로 판단된 원본 이미지 정보에 관련된 식별자 정보를 제공하면서 위변조에 대한 사실관계 확인을 요청하는 제2-5 단계(S415)를 더 포함하는 것을 특징으로 하는 기록물의 디지털화를 위한 기록물 DB 구축 방법.
  9. 삭제
  10. 삭제
  11. 제1항에 있어서,
    상기 시스템 업로드 단계(S500)는,
    동일한 식별자를 갖는 원본 정보와 색인 정보를 제1 DB(341)과 제3 DB(343)에서 각각 추출하는 제4-1 단계(S510)와,
    상기 제4-1 단계(S510)를 통해 추출된 원본 정보에 위변조가 없고 추출된 색인 정보가 정확한 색인인 것으로 검증되었으면 추출된 원본 정보에 포함된 원본 이미지 정보를 추출하고, 추출된 원본 이미지 정보와 제4-1 단계(S510)를 통해 추출된 색인 정보를 매칭시켜 해당 기관의 시스템에 업로드 하는 제4-2 단계(S520)를 포함하는 것을 특징으로 하는 기록물의 디지털화를 위한 기록물 DB 구축 방법.
KR1020220035315A 2022-03-22 2022-03-22 기록물의 디지털화를 위한 기록물 db 구축 방법 KR102418865B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220035315A KR102418865B1 (ko) 2022-03-22 2022-03-22 기록물의 디지털화를 위한 기록물 db 구축 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220035315A KR102418865B1 (ko) 2022-03-22 2022-03-22 기록물의 디지털화를 위한 기록물 db 구축 방법

Publications (1)

Publication Number Publication Date
KR102418865B1 true KR102418865B1 (ko) 2022-07-08

Family

ID=82407281

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220035315A KR102418865B1 (ko) 2022-03-22 2022-03-22 기록물의 디지털화를 위한 기록물 db 구축 방법

Country Status (1)

Country Link
KR (1) KR102418865B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110030054A (ko) * 2009-09-17 2011-03-23 (주)브릿지디엔에스 공인전자문서보관소용 전자화 문서 작성을 위한 시스템 및 그 방법
KR101991087B1 (ko) 2017-05-12 2019-06-19 이세희 검증 및 보정 효율성이 개선된 비 전자 기록물의 디지털화 시스템 및 방법
KR102016998B1 (ko) 2017-05-12 2019-09-03 이세희 개인정보를 포함하는 비공개 처리 기록물의 효율적 관리를 위한 비전자 기록물의 디지털화 시스템 및 방법
KR102162528B1 (ko) 2020-03-09 2020-10-07 (주)쇼우테크 기록물 db 구축 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110030054A (ko) * 2009-09-17 2011-03-23 (주)브릿지디엔에스 공인전자문서보관소용 전자화 문서 작성을 위한 시스템 및 그 방법
KR101991087B1 (ko) 2017-05-12 2019-06-19 이세희 검증 및 보정 효율성이 개선된 비 전자 기록물의 디지털화 시스템 및 방법
KR102016998B1 (ko) 2017-05-12 2019-09-03 이세희 개인정보를 포함하는 비공개 처리 기록물의 효율적 관리를 위한 비전자 기록물의 디지털화 시스템 및 방법
KR102162528B1 (ko) 2020-03-09 2020-10-07 (주)쇼우테크 기록물 db 구축 방법

Similar Documents

Publication Publication Date Title
US9002838B2 (en) Distributed capture system for use with a legacy enterprise content management system
US20060268352A1 (en) Digitized document archiving system
US7734834B2 (en) Multi-function peripheral and information acquisition system including a plurality of the multi-function peripherals
US9390089B2 (en) Distributed capture system for use with a legacy enterprise content management system
US20060085442A1 (en) Document image information management apparatus and document image information management program
US20080030800A1 (en) Electronic document management system
CN112463726A (zh) 一种移动财务票据的自动化归档方法
KR20180124529A (ko) 개인정보를 포함하는 비공개 처리 기록물의 효율적 관리를 위한 비전자 기록물의 디지털화 시스템 및 방법
CN112487490A (zh) 篡改识别方法、设备和介质
JP3918023B2 (ja) 個人情報管理システム
CN114218467B (zh) 一种数字档案管理方法和***
CN102012999B (zh) 机读信息卡的电子档案及其实现方法与***
CN114610777A (zh) 基于区块链的民生档案智慧管理***
JP2008165323A (ja) 個人情報管理端末および個人情報管理システムならびに個人情報管理プログラム
JP2020181369A (ja) 書類読取システム
KR102418865B1 (ko) 기록물의 디지털화를 위한 기록물 db 구축 방법
CN116343210B (zh) 档案数字化的管理方法及装置
US8712155B2 (en) Device for identifying types of document files
JP2009301272A (ja) 証憑管理装置および証憑管理方法
US20160259957A1 (en) System And Method For Monitoring And Protecting Healthcare Data
CN112395476A (zh) 一种工程资料管理的方法
US10140369B2 (en) Computer implemented system and method for collating and presenting multi-format information
JP2008186473A (ja) 個人情報管理システムおよび個人情報管理プログラム
JP5436040B2 (ja) 画像入出力装置および監視システム
US20240104950A1 (en) Systems and methods for secure management of document execution

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant