KR101635675B1 - 파쇄된 문서를 복구 하는 장치 및 방법 - Google Patents

파쇄된 문서를 복구 하는 장치 및 방법 Download PDF

Info

Publication number
KR101635675B1
KR101635675B1 KR1020140104888A KR20140104888A KR101635675B1 KR 101635675 B1 KR101635675 B1 KR 101635675B1 KR 1020140104888 A KR1020140104888 A KR 1020140104888A KR 20140104888 A KR20140104888 A KR 20140104888A KR 101635675 B1 KR101635675 B1 KR 101635675B1
Authority
KR
South Korea
Prior art keywords
sample
digital image
length
samples
shredded
Prior art date
Application number
KR1020140104888A
Other languages
English (en)
Other versions
KR20140107163A (ko
Inventor
최승규
Original Assignee
최승규
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 최승규 filed Critical 최승규
Priority to KR1020140104888A priority Critical patent/KR101635675B1/ko
Publication of KR20140107163A publication Critical patent/KR20140107163A/ko
Application granted granted Critical
Publication of KR101635675B1 publication Critical patent/KR101635675B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

각 파쇄된 종이로 부터 개별적으로 N개의 디지털화상 샘플을 취득하는 제1 단계;
취득한 상기 N개의 디지털화상 샘플로 부터 각 샘플의 좌변과 우변 모서리를 기준으로 색이 존재하는 부분(B)과 존재하지 않는 부분(H)을 세로로 구획하여 구분되어지는 길이 값인 복수의(B,H) 배열를 구하는 제2 단계;
상기 N개의 디지털 화상 샘플 중 특정한 제1 디지털화상 샘플을 선택하고, 상기 제2단계에서 구한 복수의(B,H) 배열를 이용하여 제1 디지털 화상 샘플의 우변 모서리의 B,H길이 배열과 동일한 좌변 B,H길이 배열 및 제1 디지털 화상 샘플의 좌변 모서리의 B,H길이 배열과 동일한 우변 B,H길이 배열을 갖는 디지털화상 샘플을 찾아 이미지를 순차적으로 병합하는 것을 반복으로 시행하여 최종적으로 파쇄된 문서를 복원하는 제3 단계;
를 특징으로 하는 파쇄된 문서 복원하는 방법

Description

파쇄된 문서를 복구 하는 장치 및 방법{The method and device to recover a shredded document}
본 발명은 파쇄된 문서를 복원할 수 있는 방법 및 장치에 관한 것이다.
일반적으로 문서 파쇄기는 사용자나 기업 등 에서 보안을 이유로 기밀이 되는 사항을 담고 있는 문서를 파기하기 위해 사용된다. 그러나 최근에 일부 기업들은 불법을 행위한 후 이를 담고 있는 문서들을 증거 인멸의 목적으로 사용하기도 한다. 특히 불법을 저지르는 정황이 포착되어 수사기관에서 업체를 방문하면 수사기관의 출입을 저지하는 잠깐의 사이에 증거의 핵심이 되는 문서들을 모두 파쇄하여 수사의 어려움을 겪는 문제점이 있었다
파쇄된 문서의 내용이 하드디스크에 남아 있더라도 사용자가 이를 물리적으로 파손하거나 'WIPER'와 같은 완전삭제 프로그램을 이용하여 삭제함으로써 복구할 수 없도록 만들고 최근 이런 완전삭제 프로그램이 지능적으로 발달함에 따라 하드웨어 복원방식만으로는 수사에 한계가 있는 문제점이 있었다.
실용신안 KR2020100004535U '문서 등 폐기물 파쇄 장치'는 기존의 파쇄기에 관한 발명에 관한 것이다. 공개특허 KR1020140030361A '휴대단말기의 문자 인식장치 및 방법'에는 촬상되는 이미지에서 문자를 인식하는 발명에 관한 것이다.
상기 문제점을 해결하기 위해, 파쇄된 문서를 복원하는 장치를 제공하는 것이다
각 파쇄된 종이로 부터 개별적으로 N개의 디지털화상 샘플을 취득하는 다계
취득한 상기 N개의 디지털화상 샘플로 부터 각 샘플의 좌변,우변 모서리의 색이 존재하는 부분(B)과 존재하지 않는 부분(H)을 구획하여 각각 길이를 구하는 단계 후
N개의 디지털 화상 샘플 중 특정한 제1 디지털화상 샘플을 선택하고, 제1 디지털 화상 샘플의 좌우변 모서리의 상기 B,H구획 길이와 동일한 디지털화상 샘플을 찾아 이미지를 순차적으로 병합하는 단계를 반복으로 시행하여 최종적으로 파쇄된 문서를 복원하는 단계
를 특징으로 하는 파쇄된 문서 복원하는 방법
파쇄된 문서를 복원함으로써, 불법을 저지르는 정황이 포착되어 수사기관에서 업체를 방문하였을때 수사기관의 출입을 저지하는 잠깐의 사이에 파쇄되어 인멸되는 핵심의 증거문서들을 복원하여 수사에 큰 도움을 줄 수 있다.
또한 완전삭제 프로그램이 사용되어 하드디스크에서 파쇄된 내용을 복구할 수 없는 경우에도 파쇄된 문서 샘플로부터 원본문서를 복원할 수 있어 효과적으로 증거문서들을 복구 할 수 있는 효과가 있다.
도1은 파쇄된 문서가 각 문자의 중간 영역을 기준으로 파쇄된 경우를 나타낸 경우를 도시
도2는 파쇄된 문서가 일부 훼손 되 경우를 도시
도3 은 파쇄된 문서가 각 문자의 공백 영역을 기준으로 파쇄된 경우를 나타낸 경우를 도시.
본 발명은 파쇄된 낱개의 샘플을 추출하는 기계, 추출된 샘플을 촬영하여 디지털 화상데이터로 변환하는 촬상장치, 저장된 디지털 화상데이터를 비교 처리하는 프로그램 으로 구성된다.
샘플을 추출하는 한정적인 실시예는, 하나의 샘플을 픽업(PICKUP)하여 샘플을 하나씩 수집하는(예를 들면 로봇손) 복수의 기계장치에 의해 각각 하나씩 추출되어 디지털 화상데이터로 변환처리 할 수도 있고, 또는 한면에 복수의 파쇄된 샘플들이 중첩되지 않게 흩뿌려지도록 한 후 사직을 찍어 화상데이터를 얻은 후 프로그램적으로 낱개 처리하여 분할함으로써 각각의 디지털 화상데이터 샘플을 얻는 일괄적 처리 방법이 있을 수 있다.
이때 일괄적 처리방법은 촬상용 화상장치로 디지털 화상샘플을 취득하기 전 화상이 존재하는지 검사하고(파쇄된 샘플에 내용이 인쇄된면이 거꾸로 뒤집어 져있는 경우를 대비) 검사 결과 화상이 없는 경우 파쇄된 샘플이 후면인 경우로 판단하여 샘플을 턴(TURN)하는 단계를 추가적으로 구성하고
파쇄된 샘플의 화상을 취득 전 모든 샘플들이 동일한 각도로 화상을 얻을 수 있게 하기 위해 특정한 각도로 회전시켜 정렬하는 과정을 포함한다
또한 수집된 후 촬영전에 파쇄된 샘플들이 심하게 구겨져 있는 경우를 대비하여 핫프레스(열과 압력)처리를 통해 반듯한 형태로 피는 작업이 추가될 수 있다.
각 파쇄된 종이로 부터 개별적으로 N개의 디지털화상 샘플을 취득하는 단계에서 취득한 상기 N개의 디지털화상 샘플로 부터 각 샘플의 좌변,우변 모서리를 기준으로 색이 존재하는 부분(B)과 존재하지 않는 부분(H)을 구획하여 각각 길이 배열을 구하는 단계는, 도면1을 참고하면 파쇄된 샘플의 한측면을 기준으로 세로로 구획된 길이B1,H1,B2,H2,B3,H3..와 배열을 얻을 수 있고 이때, 타 파쇄된 샘플에서 기준이 되는 샘플의 측면에 대응되면 타측면에서 동일한 길이 배열을 가진 데이터를 검색하여 동일한 샘플을 찾는 과정이다.
동일한 타 파쇄된 샘플을 얻으면, 두 파쇄된 샘플은 병합하여 결합하고 다시 병합된 샘플을 기준으로 위와 같은 과정을 동일하게 수행한다.
그러나, 취득한 상기 N개의 디지털화상 샘플로 부터 각 샘플의 좌변,우변 모서리가 모두 공백으로써 색이 존재하지 않는 부분만 존재하는 경우에는 위 과정으로도 파쇄된 문서를 복원할 수가 없는데 이를 위해 디지털 화상 샘플의 이미지에서 문자를 추출하여 인식하고 이를 세로순으로 매칭하여 사전적으로 존재하는 단어의 수가 많은 경우의 디지털 화상샘플을 병합할 디지털화상 샘플로 선택하는 사전적 매칭 방법을 반복시행하여 최종적으로 파쇄된 문서를 복원할 수 있다.
예를 들어 도3을 참고하면 세로를 볼때 수식어를 제외하고 '기존','격리','수신'과 같은 단어들은 사전적으로 존재하는 단어이다 따라서 사적적으로 단어가 존재하는 유무에 따라 병합할 샘플로 판단할 수 있는 기준이 될 수 있다. 다시 예를 들어 도3에서 첫번째세로줄과 세번째세로줄을 대비해본다면 기-의,격-도,수-안과 같은 경우로 사전적으로 존재할 수 없는 단어들이기 때문에 병합할 샘플이 될 수 없다. 위에서 수식어를 제외한다고 하였으나, 수식어를 사전을 추가하여 사전적으로 병합할 수 있는 범위를 확대할 수도 있다.
또 다른 경우로, 파쇄된 종이가 일부 훼손되어 제1 샘플의 우변의 B,H길이 배열과와 완전히 동일한 좌변의B,H길이 배열을 갖는 샘플이 존재하지 않을때에는 B,H길이 배열이 유사한 순으로 먼저 후보를 정하는데 이때도 후보가 중복하여 발생하는 경우에도 마찬가지로 사전적 매칭방법을 적용하여 문서를 복원한다.
상기 사전적 매칭방법에 대한 기술적인 설명은 '공개특허 KR1020140030361A휴대단말기의 문자 인식장치 및 방법'에 이미 공지된 기술이므로 생략하도록 한다.
두번째 실시예로,
사람이 직접 손을 이용하여 문서를 파쇄하는 경우, 각 패쇄샘플의 모양이 일정하지 못하는데 이런 불규칙한 모서리 경계형상들을 이용하여 복원할 수 있다.
우선 기계장치는 각 샘플의 글씨영역을 기준으로 정면을 향하도록 회전하여 사진을 찍으므로써 화상데이터 샘플을 얻을 수 있고
얻어진 화상데이터 샘플을 이용하여 각 모서리의 경계를 일정한 각도로 놔눈 후 그 모서리의 경계형상에 대응되는 샘플을 검색하는 1단계
및 대응되는 샘플들 중에 색깔이 있는 부분(글씨 등이 인쇄된 부분을 의미)이 서로 연속하는 판단 함으로써 최종적으로 병합할 샘플로 판단하는 단계로 이루어 질 수 있다.
또한 찢어질 때 중첩되는 부분이 반반씩 놔누어지는 경우 경계가 중복되는 현상이 있는데 이런 경우를 대비하여, 형성된 반반의 경계영역중 글씨가 없는쪽의 경계를 제거하도록 한다.
이상으로 본 발명의 기술적 사상을 예시하기 위한 바람직한 실시예와 관련하여 설명하고 도시하였지만, 본 발명은 이와 같이 도시되고 설명된 그대로의 구성 및 작용에만 국한되는 것이 아니며, 기술적 사상의 범주를 일탈함이 없이 본 발명에 대해 다수의 변경 및 수정이 가능함을 당업자들은 잘 이해할 수 있을 것이다. 따라서, 그러한 모든 적절한 변경 및 수정과 균등물들도 본 발명의 범위에 속하는 것으로 간주되어야 할 것이다.
B(BLACK): 디지털 화상샘플의 각 모서리에서 색이 존재하는 부분을 구획으로 구분되어 정해지는 길이
H(WHITE): 디지털 화상샘플의 각 모서리에서 색이 존재하지 않는 부분을 구획으로 구분되어 정해지는 길이
(B',H'은 N개의 다른 샘플들의 길이를 나타내는 기호로 칭함)

Claims (4)

  1. 각 파쇄된 종이로부터 개별적으로 N 개의 디지털화상 샘플을 취득하는 제1 단계;
    취득한 상기 N 개의 디지털화상 샘플로 부터 각 샘플의 좌변과 우변 모서리를 기준으로 색이 존재하는 부분(B)과 존재하지 않은 부분(H)을 세로로 구획하여 구분되어지는 길이 값인 복수의(B,H) 배열을 구하는 제2 단계;
    상기 N 개의 디지털 화상 샘플 중 특정한 제1 디지털화상 샘플을 선택하고, 상기 제2단계에서 구한 복수의(B, H) 배열을 이용하여 제1 디지털 화상 샘플의 우변 모서리의 B, H 길이 배열과 동일한 좌변 B, H 길이 배열 및 제1 디지털 화상 샘플의 좌변 모서리의 B, H 길이 배열과 동일한 우변 B, H 길이 배열을 갖는 디지털화상 샘플을 찾아 이미지를 순차적으로 병합하는 것을 반복으로 시행하여 최종적으로 파쇄된 문서를 복원하는 제3 단계를 포함하고,
    상기 제1 단계에서 취득한 N 개의 디지털화상 샘플들의 모서리 경계가 불규칙한 형상인 경우, 각 파쇄된 샘플의 글씨 인식하여 상기 각 샘플이 정면을 향하도록 회전정렬하여 화상데이터 샘플을 취득하고 취득한 상기 화상데이터 샘플에서 각 모서리의 경계를 일정한 각도로 놔눈 후 상기 놔누어진 각 각도의 모서리 경계형상에 대응되는 샘플을 검출하는 검출 단계;
    상기 검출단계 후 동일한 경계형상에 대응되는 샘플이 복수인 경우 검색된 상기 샘플들 중 병합하였을 때 색깔이 있는 부분이 서로 연속하는지 판단함으로써 최종적으로 병합할 샘플로 판단하는 단계;
    를 포함하는 것을 특징으로 하는 파쇄된 문서 복원하는 방법
  2. 청구항 1항에 있어서,
    취득한 상기 N개의 디지털화상 샘플로 부터 각 샘플의 좌변,우변 모서리가 모두 공백으로써 색이 존재하지 않는 부분만 존재하는 경우 또는 파쇄된 종이가 일부 훼손되어 제1 샘플의 우변의 B,H길이 배열과와 완전히 동일한 좌변의B,H길이 배열을 갖는 샘플이 존재하지 않을때 B,H길이 배열이 유사한 순으로 먼저 후보를 정하는데 이때 후보가 중복하여 발생하는 경우, 상기 디지털 화상 샘플의 이미지에서 문자를 추출하여 인식하고 이를 세로순으로 매칭하여 사전적으로 존재하는 단어의 수가 많은 경우의 디지털 화상샘플을 병합할 디지털화상 샘플로 선택하는 것을 반복시행하여 최종적으로 파쇄된 문서를 복원하는 단계
    를 특징으로 하는 파쇄된 문서 복원하는 방법
  3. 삭제
  4. 삭제
KR1020140104888A 2014-08-13 2014-08-13 파쇄된 문서를 복구 하는 장치 및 방법 KR101635675B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140104888A KR101635675B1 (ko) 2014-08-13 2014-08-13 파쇄된 문서를 복구 하는 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140104888A KR101635675B1 (ko) 2014-08-13 2014-08-13 파쇄된 문서를 복구 하는 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20140107163A KR20140107163A (ko) 2014-09-04
KR101635675B1 true KR101635675B1 (ko) 2016-07-01

Family

ID=51755172

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140104888A KR101635675B1 (ko) 2014-08-13 2014-08-13 파쇄된 문서를 복구 하는 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101635675B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011216070A (ja) 2010-03-31 2011-10-27 Fujitsu Ltd 隠蔽された文字の復元方法及び画像処理装置
JP2012084132A (ja) 2010-09-16 2012-04-26 Toshiba Corp 文字認識装置、文字認識方法および区分装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200451856Y1 (ko) 2008-07-04 2011-01-14 주식회사 유사미 손잡이를 구비하는 캘린더 보호용 케이스
TWI394098B (zh) * 2009-06-03 2013-04-21 Nat Univ Chung Cheng Shredding Method Based on File Image Texture Feature
US20120072013A1 (en) * 2010-09-16 2012-03-22 Kabushiki Kaisha Toshiba Character recognition apparatus, sorting apparatus, sorting control apparatus, and character recognition method
KR20140030361A (ko) 2012-08-27 2014-03-12 삼성전자주식회사 휴대단말기의 문자 인식장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011216070A (ja) 2010-03-31 2011-10-27 Fujitsu Ltd 隠蔽された文字の復元方法及び画像処理装置
JP2012084132A (ja) 2010-09-16 2012-04-26 Toshiba Corp 文字認識装置、文字認識方法および区分装置

Also Published As

Publication number Publication date
KR20140107163A (ko) 2014-09-04

Similar Documents

Publication Publication Date Title
KR101585029B1 (ko) 문서 인식 분류 시스템
EP3734506A1 (en) Automated authentication region localization and capture
US6886136B1 (en) Automatic template and field definition in form processing
CN103942757B (zh) 基于内容特征的图像碎片匹配方法和***
US20150095769A1 (en) Layout Analysis Method And System
US20120087537A1 (en) System and methods for reading and managing business card information
US8873863B2 (en) System and method for fingerprinting for comics
JP2009506393A5 (ko)
Agrawal et al. An algorithmic approach for text recognition from printed/typed text images
Iqbal et al. Automatic signature extraction from document images using hyperspectral unmixing: Automatic signature extraction using hyperspectral unmixing
Sirajudeen et al. Forgery document detection in information management system using cognitive techniques
Kaundilya et al. Automated text extraction from images using OCR system
Sudhakar et al. Speeding-up SIFT based copy move forgery detection using level set approach
CN104598881A (zh) 基于特征压缩与特征选择的歪斜场景文字识别方法
WO2018107574A1 (zh) 一种对印防伪特征的检测方法及装置
CN103559251B (zh) 基于信息隐藏的数据安全保护方法
KR101676000B1 (ko) 은행, 통신사 또는 보험사와 개인 사이에서 생성된 디지털 문서 내의 지문 감지 및 보안처리 방법
KR101635675B1 (ko) 파쇄된 문서를 복구 하는 장치 및 방법
Chakraborty et al. Review of various image processing techniques for currency note authentication
CN111008387A (zh) 基于数字签名和文档dna的打印文档防伪溯源***及方法
Shejwal et al. Segmentation and extraction of text from curved text lines using image processing approach
Kaur et al. State-of-the-art techniques for passive image forgery detection: a brief review
Pugliese et al. A novel model-based dewarping technique for advanced Digital Library systems
Jahan et al. A study on preprocessing and feature extraction in offline handwritten signatures
CN107609595A (zh) 一种线裁剪图像检测方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
AMND Amendment
E601 Decision to refuse application
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
X701 Decision to grant (after re-examination)