KR101805844B1 - 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법 - Google Patents

인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법 Download PDF

Info

Publication number
KR101805844B1
KR101805844B1 KR1020160125764A KR20160125764A KR101805844B1 KR 101805844 B1 KR101805844 B1 KR 101805844B1 KR 1020160125764 A KR1020160125764 A KR 1020160125764A KR 20160125764 A KR20160125764 A KR 20160125764A KR 101805844 B1 KR101805844 B1 KR 101805844B1
Authority
KR
South Korea
Prior art keywords
character
masking
information
personal information
print
Prior art date
Application number
KR1020160125764A
Other languages
English (en)
Inventor
김영균
Original Assignee
주식회사 엘아이텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘아이텍 filed Critical 주식회사 엘아이텍
Priority to KR1020160125764A priority Critical patent/KR101805844B1/ko
Application granted granted Critical
Publication of KR101805844B1 publication Critical patent/KR101805844B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1238Secure printing, e.g. user identification, user rights for device usage, unallowed content, blanking portions or fields of a page, releasing held jobs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1242Image or content composition onto a page

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Document Processing Apparatus (AREA)
  • Record Information Processing For Printing (AREA)
  • Storage Device Security (AREA)

Abstract

본 발명은 인쇄위치에 기반하여 개인정보를 검출하고 마스킹하는 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법에 관한 것으로서, 본 발명의 인쇄위치 기반 개인정보 검출 및 마스킹 시스템은, 인쇄 어플리케이션으로부터 인쇄 명령이 발생되는지를 감지하는 인쇄 감시모듈; 상기 인쇄 어플리케이션에서 출력되는 문서로부터 페이지 단위로 글자의 위치 및 크기 정보를 포함하는 글자 정보를 추출하는 글자정보 추출모듈; 상기 글자 정보에 근거하여 운영체제의 그래픽 함수에서 사용하는 상기 글자 각각의 논리좌표를 인식하고, 상기 논리좌표를 인쇄물 상의 절대 좌표인 인쇄좌표와 매칭하여 인쇄좌표로 변환하는 좌표 변환모듈; 상기 글자 정보의 인쇄좌표에 근거하여 상기 글자 간의 상호 위치관계를 연산하고, 상기 상호 위치관계 및 미리 정해진 개인정보 검출정책에 근거하여 개인정보를 검출하는 개인정보 검출모듈; 및 상기 개인정보를 나타내는 개인정보 문자 중 적어도 일부를 설정된 마스킹 문자로 변환하되, 상기 개인정보 문자의 인쇄좌표 상에 동일한 위치 및 크기로 마스킹하는 마스킹 모듈을 포함한다.
본 발명에 따르면, 글자의 위치 및 크기를 포함하여 글자 정보를 추출하고 추출된 글자의 논리좌표를 인쇄좌표로 변환하여 개인정보를 검출함으로써 개인정보의 오탐지 및 과탐지를 방지할 수 있으며, 개인정보를 나타내는 글자를 마스킹 문자로 변환할 때 추출된 글자 정보에 기반하여 인쇄좌표 상의 동일 위치 및 동일한 문자의 크기로 마스킹 함으로써 인쇄물의 레이아웃이 망가지는 현상을 방지하고 높은 품질의 개인정보 보호 인쇄물을 얻을 수 있는 효과가 있다.

Description

인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법{PERSONAL DATA DETECTING AND MASKING SYSTEM AND METHOD BASED ON PRINTED POSITION}
본 발명은 인쇄위치에 기반하여 인쇄물 상에서 개인정보를 검출하고 마스킹하여 개인정보의 보안을 관리할 수 있도록 한 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법에 관한 것이다.
일반적으로, 프린터 등으로 출력되는 인쇄물을 통해 개인정보가 유출되는 것을 방지하기 위해, 개인정보를 마스킹하여 인쇄하는 인쇄 보안 시스템이 공지되어 있다. 통상적으로 알려진 인쇄 보안 시스템은 프린터로 출력되는 데이터로부터 주민등록번호, 전화번호, 신용카드번호, 운전면허번호, 여권번호, 이메일 주소, 및 집주소 등의 개인정보를 추출하고, 추출된 개인정보를 마스킹 문자로 치환하여 출력하도록 구성된다. 이와 같은 인쇄 보안 시스템은 개인정보 유출가 유출되어 경제적 피해가 발생되거나 범죄 수단으로 악용되는 것을 방지한다.
도 1은 종래 기술에 따른 인쇄 보안 시스템을 예시한 블록도이다. 도 1을 참조하면, 종래 인쇄 보안 시스템은 데이터 제공부(10), 그래픽 인터페이스부(20), 인쇄 스풀러 서비스부(30), 프린터(40) 및 보안부(50)를 포함한다.
데이터 제공부(10)는 개인정보가 포함될 수 있는 파일 등의 데이터를 제공하기 위한 것으로서, PC, 태블릿 기기, 랩탑, 휴대 단말, 네트워킹 시스템, 및 각종 어플리케이션 등 인쇄물을 출력하기 위한 데이터 정보를 제공하는 모든 수단을 의미한다. 그래픽 인터페이스부(20)는 데이터 제공부(10)로부터 제공되는 데이터를 인쇄 스풀러 서비스부(30)로 제공하기 위한 것이며, 도 2에서와 같이 벡터 그래픽 처리된 데이터로부터 텍스트를 구성하는 점들의 위치 정보를 얻어 인쇄 데이터를 인식할 수 있다. 인쇄 스풀러 서비스부(30)는 입력장치 측과 프린터(40) 사이에서 보조 기억장치를 완충장치로 사용하여 데이터 전송를 전송할 때 처리 지연을 단축시키는 장치이다.
보안부(50)는 데이터에 포함된 텍스트를 검사하여 개인정보를 검출하고 미리 정해진 설정에 따라 개인정보를 마스킹하거나 삭제하여 인쇄 스풀러 서비스부(30)로 전송되도록 함으로써, 출력되는 인쇄물 상에서 개인정보를 은폐시키는 역할을 수행한다.
여기서, 개인정보의 검출은 대부분 정규표현식(Regular Expression)을 이용한 패턴을 사용하고 있다. 정규표현식이라 함은 특정한 규칙을 가진 문자열의 집합을 표현하는 형식 언어로서, 많은 텍스트 편집기와 프로그래밍 언어에서 문자열의 검색과 치환을 위해 지원하고 있는 표현 방식을 일컫는다.
그런데, 종래의 인쇄 보안 시스템에서 정규표현식 패턴을 이용하여 개인정보를 검출하는 것은, 번호의 개수, 번호의 규칙과 같은 패턴형성 기준, 지정 키워드 등과 같은 텍스트 내용 자체만으로 패턴 매칭 여부를 판단한다. 정규표현식 패턴을 이용하는 경우, 상당한 오픈 소스들이 존재하지만 여기에 글자 여부, 숫자, 글자/숫자의 개수 등을 판단하는 패턴을 입히고 키워드를 지정하는 절차가 복잡한 문제가 있다. 예를 들어, 주민번호를 표현하는 양식은 "123456-1234567", "123456 - 1234567", "1234561234567", "123456 1234567" 등 어플리케이션의 종류 및 문서의 종류마다 다양하며, 여기에 더 많은 스페이스 입력이 존재하는 경우, 표현식이 더욱 복잡해지는 문제가 있다.
나아가, 종래의 정규표현식 패턴을 이용하는 방식에서는, 글자의 위치를 고려하지 아니하므로 엑셀 시트에서와 같이 서로 다른 영역에 개인정보가 존재하는 경우, 이를 오탐지하거나 과탐지하는 문제가 발생될 수 있다. 또한, 글자의 크기를 고려하지 아니하므로 개인정보를 마스킹하는 과정에서 마스킹 문자가 다른 문자의 영역을 침범하여 인쇄물의 레이아웃이 망가지는 등의 문제가 발생된다.
대한민국 등록특허 제10-1183575호
본 발명은 인쇄될 문서로부터 글자 정보를 추출할 때 글자의 위치 및 크기 정보를 추출하고, 글자의 논리좌표를 인쇄좌표로 변환하여 개인정보를 검출하며, 개인정보를 나타내는 글자를 마스킹 문자로 변환하는 경우 마스킹 문자의 크기 및 위치를 개인정보를 나타내는 글자에 대응하여 확대/축소하여 마스킹함으로써, 개인정보 검출의 오탐지 및 과탐지를 방지하고 마스킹 정책의 자유도를 높이며 마스킹 이후 인쇄물의 레이아웃이 망가지는 현상을 방지할 수 있는 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법을 제공함에 그 목적이 있다.
본 발명의 일실시예에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 시스템은, 인쇄 어플리케이션으로부터 인쇄 명령이 발생되는지를 감지하는 인쇄 감시모듈; 상기 인쇄 어플리케이션에서 출력되는 문서로부터 페이지 단위로 글자의 위치 및 크기 정보를 포함하는 글자 정보를 추출하는 글자정보 추출모듈; 상기 글자 정보에 근거하여 운영체제의 그래픽 함수에서 사용하는 상기 글자 각각의 논리좌표를 인식하고, 상기 논리좌표를 인쇄물 상의 절대 좌표인 인쇄좌표와 매칭하여 인쇄좌표로 변환하는 좌표 변환모듈; 상기 글자 정보의 인쇄좌표에 근거하여 상기 글자 간의 상호 위치관계를 연산하고, 상기 상호 위치관계 및 미리 정해진 개인정보 검출정책에 근거하여 개인정보를 검출하는 개인정보 검출모듈; 및 상기 개인정보를 나타내는 개인정보 문자 중 적어도 일부를 설정된 마스킹 문자로 변환하되, 상기 개인정보 문자의 인쇄좌표 상에 동일한 위치 및 크기로 마스킹하는 마스킹 모듈을 포함한다.
본 발명의 다른 실시예에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 시스템은, 상기 글자정보 추출모듈에서 추출하는 글자 정보는 상기 글자의 글꼴 정보를 더 포함하며, 상기 마스킹 모듈은 상기 마스킹 문자를 상기 개인정보 문자와 동일한 글꼴로 마스킹한다.
본 발명의 또 다른 실시예에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 시스템은, 상기 글자정보 추출모듈에서 추출하는 글자 정보는 상기 글자의 색상 정보를 더 포함하며, 상기 마스킹 모듈은 상기 마스킹 문자를 상기 개인정보 문자와 동일한 색상으로 마스킹한다.
본 발명의 일실시예에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 방법은, (a) 인쇄 어플리케이션으로부터 인쇄 명령이 발생되는지를 감시하는 단계; (b) 상기 단계(a)에서 인쇄 명령을 감지하면, 상기 인쇄 어플리케이션에서 출력되는 문서로부터 페이지 단위로 글자의 위치 및 크기 정보를 포함하는 글자 정보를 추출하는 단계; (c) 상기 단계(b)에서 추출된 글자 정보에 근거하여 운영체제의 그래픽 함수에서 사용하는 상기 글자 각각의 논리좌표를 인식하고, 상기 논리좌표를 인쇄물 상의 절대 좌표인 인쇄좌표와 매칭하여 인쇄좌표로 변환하는 단계; (d) 상기 글자 정보의 인쇄좌표에 근거한 상기 글자 간의 상호 위치관계와 미리 정해진 개인정보 검출정책에 근거하여 상기 문서로부터 개인정보를 검출하는 단계; 및 (e) 개인정보를 나타내는 개인정보 문자 중 적어도 일부를 설정된 마스킹 문자로 변환하여 마스킹 동작을 수행하되, 상기 개인정보 문자의 인쇄좌표 상에 동일한 위치 및 크기로 상기 마스킹 문자를 마스킹하는 단계를 포함한다.
삭제
본 발명의 또 다른 실시예에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 방법은, 상기 단계(b)의 글자 정보 추출 단계는 상기 글자의 글꼴 정보를 더 추출하며, 상기 단계(e)의 마스킹 단계에서는 상기 개인정보 문자와 동일한 글꼴로 상기 마스킹 문자를 마스킹한다.
본 발명의 또 다른 실시예에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 방법은, 상기 단계(b)의 글자 정보 추출 단계는 상기 글자의 색상 정보를 더 추출하며, 상기 단계(e)의 마스킹 단계에서는 상기 개인정보 문자와 동일한 색상으로 상기 마스킹 문자를 마스킹한다.
본 발명의 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법에 따르면, 글자의 위치 및 크기를 포함하여 글자 정보를 추출하고 추출된 글자의 논리좌표를 인쇄좌표로 변환하여 개인정보를 검출함으로써 개인정보의 오탐지 및 과탐지를 방지할 수 있으며, 개인정보를 나타내는 글자를 마스킹 문자로 변환할 때 추출된 글자 정보에 기반하여 인쇄좌표 상의 동일 위치 및 동일한 문자의 크기로 마스킹 함으로써 인쇄물의 레이아웃이 망가지는 현상을 방지하고 높은 품질의 개인정보 보호 인쇄물을 얻을 수 있는 효과가 있다.
도 1은 종래 기술에 따른 인쇄 보안 시스템을 예시한 블록도,
도 2는 벡터 그래픽 정보로부터 텍스트 정보를 추출하는 예를 보인 도면,
도 3은 본 발명에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 시스템을 예시한 블록도,
도 4는 본 발명에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 방법을 예시한 흐름도, 및
도 5 및 6은 본 발명에 따라 마스킹 처리된 문자열을 예시한 도면이다.
이하에서는 첨부된 도면을 참조하여 본 발명에 따른 구체적인 실시예가 설명된다. 그러나 이는 본 발명을 특정한 실시 형태에 대하여 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물, 대체물을 포함하는 것으로 이해되어야 한다.
명세서 전체에 걸쳐 유사한 구성 및 동작을 갖는 부분에 대해서는 동일한 도면 부호를 붙였다. 그리고 본 발명에 첨부된 도면은 설명의 편의를 위한 것으로서, 그 형상과 상대적인 척도는 과장되거나 생략될 수 있다.
실시예를 구체적으로 설명함에 있어서, 중복되는 설명이나 당해 분야에서 자명한 기술에 대한 설명은 생략되었다. 또한, 이하의 설명에서 어떤 부분이 다른 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 기재된 구성요소 외에 구성요소를 더 포함할 수 있는 것을 의미한다.
또한, 명세서에 기재된 "~부", "~기", "~모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 어떤 부분이 다른 부분과 전기적으로 연결되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐만 아니라 그 중간에 다른 구성을 사이에 두고 연결되어 있는 경우도 포함한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제2 구성요소는 제1 구성요소로 명명될 수 있고, 유사하게 제1 구성요소도 제2 구성요소로 명명될 수 있다.
도 3은 본 발명에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 시스템을 예시한 블록도이다. 도 3에서 실선으로 도시된 블록들은 일반적인 인쇄 시스템을 나타내며, 점선으로 도시된 블록들은 본 발명에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 시스템을 나타는 것으로, 발명의 이해를 돕기 위해 실선과 점선으로 구분해 표시하였다.
인쇄 어플리케이션(310)은 PC, 태블릿 기기, 랩탑, 휴대 단말, 네트워킹 시스템 등에 설치되어 인쇄물을 출력하기 위한 데이터를 제공하는 어플리케이션이다. 인쇄 어플리케이션(310)은 인쇄를 위한 문서(312)를 생성하며, 사용자의 인쇄 명령이나 외부 기기로부터의 인쇄 요청 등에 의해 생성된 문서(312)를 인쇄 처리부(314)로 전송한다.
인쇄 처리부(314)는 입력장치 측과 프린터(316) 사이에 설치되어, 인쇄 어플리케이션(310)으로부터 인쇄 명령을 수신하고, 수신된 인쇄 페이지를 프린터(316)에 제공하는 수단이다. 인쇄 처리부(314)는 인쇄될 문서(312)를 그래픽 처리하는 수단, 보조 기억장치를 이용하여 인쇄 데이터를 임시 저장하는 스풀러 등을 포함할 수 있다.
도 3을 참조하면, 본 발명의 인쇄위치 기반 개인정보 검출 및 마스킹 시스템은 인쇄 어플리케이션(310) 및 인쇄 처리부(314)의 사이에 설치되는 것으로, 인쇄 감시모듈(352), 글자정보 추출모듈(354), 좌표 변환모듈(356), 개인정보 검출모듈(358), 및 마스킹 모듈(360)을 포함한다.
인쇄 감시모듈(352)은 인쇄 어플리케이션으로부터 인쇄 명령이 발생되는지를 감지한다. 예를 들어, 클라이언트 단말기에서 인쇄 어플리케이션(310)이 동작되고 사용자에 의해 인쇄 명령이 입력되는 경우, 인쇄 감시모듈(352)은 사용자의 인쇄 명령을 인식할 수 있다. 다른 예로서, 서버로부터 클라이언트 단말기에 대한 인쇄 호출이 수신되는 경우, 서버로부터의 인쇄 호출을 인식할 수도 있다.
글자정보 추출모듈(354)은 인쇄 어플리케이션(310)에서 출력되는 문서(312)로부터 페이지 단위로 글자 정보를 추출한다. 이때, 글자정보 추출모듈(354)은 단순히 글자의 내용만을 추출하는 것이 아니라, 글자의 위치, 크기, 글꼴, 및 색상 정보를 함께 추출한다. 추출한 글자 정보는 도시 안된 메모리 수단에 저장한다.
좌표 변환모듈(356)은 추출한 글자의 논리좌표를 인식하고, 논리좌표를 인쇄물 상의 절대 좌표인 인쇄좌표로 변환한다. 논리좌표라 함은 윈도우즈와 같은 운영체제 내에서 사용하는 좌표로서, 주로 그래픽 함수들이 사용하는 좌표이다. 인쇄좌표라 함은 프린터(316)에서 출력되는 실제 인쇄물 상의 절대 좌표를 의미한다. 좌표 변환모듈(356)이 추출한 글자의 논리좌표를 매핑하여 인쇄좌표로 변환함으로써, 서로 다른 글자의 상호 위치관계를 연산하여 개인정보를 검출하는 것을 가능하게 함은 물론, 개인정보를 나타내는 문자 상의 정확한 좌표 위치에 마스킹 문자를 인쇄할 수 있게 된다.
개인정보 검출모듈(358)은 글자정보 추출모듈(354)에 의해 추출된 글자 정보를 메모리 수단으로부터 읽어들이고, 글자 정보에 근거하여 글자 간의 상호 위치관계를 연산한다. 그리고 미리 정해진 개인정보 검출정책과 글자 간의 상호 위치관계에 근거하여 개인정보를 검출한다. 여기서, '개인정보'라 함은 주민등록번호, 전화번호, 신용카드번호, 운전면허번호, 여권번호, 이메일 주소, 및 집주소 등과 같은 개인의 신상과 관련된 정보를 의미한다. 개인정보 검출정책은 위와 같은 개인정보를 나타내는 문자열을 검출하기 위한 정책으로서, 통상 알려진 표현식 매칭 등의 검출정책이거나 사용자에 의해 자체적으로 설정된 검출정책일 수 있으며, 여기에 키워드(Keyword)를 이용한 검색식이 추가될 수도 있다.
마스킹 모듈(360)은 개인정보 검출모듈(358)에 의해 검출된 개인정보를 마스킹하는 수단이다. 마스킹 모듈(360)은 개인정보를 나타내는 개인정보 문자 중 적어도 일부를 설정된 마스킹 문자로 변환한다. 예를 들어, 마스킹 문자는 "*"이거나 "#"이며, 주민등록번호를 마스킹하는 경우 뒤에 일곱자리를 마스킹 문자로 대체하여 입력한다.
이때, 마스킹 모듈(360)은 개인정보 문자의 인쇄좌표 상에 마스킹 문자를 기입하되, 글자 정보에 근거하여 개인정보 문자와 동일한 위치, 크기, 글꼴, 및 색상으로 마스킹 문자를 기입한다. 이에 따라 마스킹 이후에도 인쇄물의 레이아웃이 망가지는 것을 방지할 수 있다.
도 4는 본 발명에 따른 인쇄위치 기반 개인정보 검출 및 마스킹 방법을 예시한 흐름도이다. 도 4를 참조하여 본 발명에서 인쇄위치 기반으로 개인정보를 검출하고 마스킹하는 과정을 설명하면 다음과 같다.
먼저, 인쇄 어플리케이션(310)으로부터 인쇄 명령이 발생되는지를 감시한다(ST410). 단계 ST410에서 인쇄 명령이 발생되는 것을 감지하면, 글자정보 추출모듈(354)은 인쇄 어플리케이션(310)에서 출력되는 문서(312)로부터 페이지 단위로 글자의 위치, 크기, 글꼴, 및 색상 정보를 포함하는 글자 정보를 추출한다(ST420). 추출된 글자 정보는 도시 안된 메모리 수단에 저장되며, 추후 개인정보의 검출 및 마스킹 단계에서 참조된다.
다음으로, 좌표 변환모듈(356)에서 추출된 글자 정보에 근거하여 각 글자의 논리좌표를 인식하고, 논리좌표를 인쇄물 상의 절대 좌표인 인쇄좌표로 변환한다(ST430). 각 글자의 논리좌표를 인쇄좌표로 변환함으로써, 논리좌표 상에서는 서로 다른 영역에 위치한 글자여도, 인쇄좌표 상에서 근접된 위치에 배치되는지 여부를 판단할 수 있다. 예를 들어, 엑셀 시트 등에서는 서로 다른 셀에 개인정보가 나뉘어져 기입될 수 있다. 또 다른 예로서, 문서 작성 파일에서는 개인정보의 중간에 엔터 키나 스페이스 키가 삽입될 수 있다. 본 발명에서는 개인정보를 포함하는 문서 내 모든 글자의 논리좌표를 인쇄좌표로 변환하여 개인정보를 검출함에 따라 개인정보를 나타내는 문자들의 상호 위치관계를 파악하는 것이 용이하며, 추후 인쇄좌표 상에서 개인정보 문자를 마스킹 문자로 대체하는 것이 달성될 수 있다.
다음으로, 단계 ST440에서 개인정보 검출모듈(358)이 개인정보 검출정책과 글자 간의 상호 위치관계에 근거하여 개인정보를 검출한다. 개인정보 검출정책은 상술한 바와 같이 알려진 정책을 사용할 수 있으며, 여기에 사용자가 지정한 키워드가 포함될 수 있다. 개인정보 검출정책으로 검출이 불가능한 글자들은 글자 간의 상호 위치관계로부터 인식될 수 있다. 예를 들어, 문서(312) 내의 개인정보가 정규표현식 또는 사용자가 지정한 표현식에 포함되지 않는 경우, 또는, 사용자가 오입력하여 개인정보의 중간에 엔터 키나 스페이스 키 혹은 다른 오기가 포함되는 경우라도, 글자 간의 상호 위치관계 정보를 이용하여 당해 정보가 개인정보임을 인식할 수 있을 것이다.
마스킹 모듈(360)은 개인정보를 나타내는 글자를 마스킹 문자로 변환한다(ST450). 그리고 미리 정해진 마스킹 정책에 따라 개인정보를 나타내는 개인정보 문자 중 일부를 삭제하고 해당 위치에 마스킹 문자를 기입하여 마스킹 동작을 수행한다(ST460). 마스킹이 완료되면, 인쇄 처리부(314)를 통해 인쇄 동작이 수행되도록 진행된다.
개인정보 문자를 마스킹 문자로 변환하여 마스킹 동작을 수행하는 것은, 개인정보 문자의 인쇄좌표 상에 대체될 글자와 동일한 위치, 크기, 글꼴, 및 색상으로 마스킹 문자를 대체 기입하는 것으로 수행된다. 마스킹 정책은 개인정보에 따라 마스킹 대상 객체를 미리 지정하는 것으로서, 예컨대, 주민등록번호를 마스킹하는 경우 뒤의 일곱 자리를 "*"로 대체하는 정책일 수 있다. 다른 예로서, 전화번호의 뒤 네 자리를 마스킹 문자로 대체할 수도 있다.
도 5 및 6은 본 발명에 따라 마스킹 처리된 문자열을 예시한 도면이다.
도 5를 참조하면, 문서(312) 상에 포함된 개인정보가 "iiiiiiii-AAAAAA"이고, 마스킹 정책이 하이픈(-) 앞의 뒤 네 자리를 마스킹하는 것으로 정해진 경우, 좌측 하단에서와 같이 종래 마스킹 방법에서는 단지 표현식만을 이용하므로 글꼴에 따른 글자의 크기나 위치를 인식하지 못하여 마스킹 문자 "*"가 하이픈이 인쇄되는 영역 및 뒤의 문자열을 침범하여 인쇄될 수 있다. 즉, 종래 마스킹 방법에서는 인쇄물의 레이아웃이 망가지는 현상이 발생될 수 있다.
반면에, 도 5의 우측 하단에서와 같이 본 발명에 따른 마스킹 방법에서는, 개인정보를 나타내는 글자 각각의 위치, 크기, 글꼴, 및 색상과 동일한 위치, 크기, 글꼴, 및 색상의 마스킹 문자로 마스킹을 수행할 수 있다. 이와 같은 방법의 마스킹에 따르면, 개인정보를 나타내는 원래의 글자와 마스킹 문자의 장평 및 자간 등을 일치시킬 수 있음은 물론, 동일한 글꼴과 색상으로 표현되므로, 도 5에서와 같이 마스킹 이후에도 인쇄물의 레이아웃이 망가지는 것을 방지할 수 있고 고품질의 인쇄물을 얻을 수 있다.
도 6에서와 같이, 문서(312) 상에 포함된 개인정보가 "010-1111-1234"와 같이 휴대전화번호인 경우를 가정해 보자. 이 경우, 텍스트에 대한 벡터 그래픽 처리가 수행되는 경우, 인쇄 처리부(314)에서는 첫 번째로 "010", 두 번째로 "-", 세 번째로 "1111", 네 번째로 "-", 다섯 번째로 "1234"를 호출하여 인쇄 처리가 진행될 수 있다. 종래와 같이 표현식만을 이용하는 경우, 첫 번째에서 네 번째까지의 텍스트 내용은 이미 호출되어 텍스트 그리기 명령이 수행된 후이므로, 좌측 하단에서와 같이 뒤의 네 자리에 대해서만 숫자를 마스킹 문자로 치환하여 마스킹 동작을 수행할 수 있다. 즉, 종래의 마스킹 방법에서는 개인정보 항목들이 구분되어 텍스트 그리기 명령이 수행되는 경우 마스킹 정책을 제한적으로 사용할 수밖에 없다.
반면에, 본 발명의 마스킹 방법에서는 글자 정보를 추출하여 저장한 후, 저장된 글자 정보의 위치에 기반하여 마스킹 동작을 수행함으로써, 도 6의 우측 하단에서와 같이 세 번째로 호출되는 "1111"에 대하여도 마스킹 문자로의 대체가 가능하게 된다. 즉, 본 발명의 마스킹 방법은 마스킹 정책에 대한 자유도를 높일 수 있는 이점이 있다.
위에서 개시된 발명은 기본적인 사상을 훼손하지 않는 범위 내에서 다양한 변형예가 가능하다. 즉, 위의 실시예들은 모두 예시적으로 해석되어야 하며, 한정적으로 해석되지 않는다. 따라서 본 발명의 보호범위는 상술한 실시예가 아니라 첨부된 청구항에 따라 정해져야 하며, 첨부된 청구항에 한정된 구성요소를 균등물로 치환한 경우 이는 본 발명의 보호범위에 속하는 것으로 보아야 한다.
310 : 인쇄 어플리케이션 312 : 문서
314 : 인쇄 처리부 316 : 프린터
352 : 인쇄 감시모듈 354 : 글자정보 추출모듈
356 : 좌표 변환모듈 358 : 개인정보 검출모듈
360 : 마스킹 모듈

Claims (7)

  1. 인쇄 어플리케이션으로부터 인쇄 명령이 발생되는지를 감지하는 인쇄 감시모듈;
    상기 인쇄 어플리케이션에서 출력되는 문서로부터 페이지 단위로 글자의 위치 및 크기 정보를 포함하는 글자 정보를 추출하는 글자정보 추출모듈;
    상기 글자 정보에 근거하여 운영체제의 그래픽 함수에서 사용하는 상기 글자 각각의 논리좌표를 인식하고, 상기 논리좌표를 인쇄물 상의 절대 좌표인 인쇄좌표와 매칭하여 인쇄좌표로 변환하는 좌표 변환모듈;
    상기 글자 정보의 인쇄좌표에 근거하여 상기 글자 간의 상호 위치관계를 연산하고, 상기 상호 위치관계 및 미리 정해진 개인정보 검출정책에 근거하여 개인정보를 검출하는 개인정보 검출모듈; 및
    상기 개인정보를 나타내는 개인정보 문자 중 적어도 일부를 설정된 마스킹 문자로 변환하되, 상기 개인정보 문자의 인쇄좌표 상에 동일한 위치 및 크기로 마스킹하는 마스킹 모듈
    을 포함하는 것을 특징으로 하는 인쇄위치 기반 개인정보 검출 및 마스킹 시스템.
  2. 제1항에 있어서,
    상기 글자정보 추출모듈에서 추출하는 글자 정보는 상기 글자의 글꼴 정보를 더 포함하며, 상기 마스킹 모듈은 상기 마스킹 문자를 상기 개인정보 문자와 동일한 글꼴로 마스킹하는 것을 특징으로 하는 인쇄위치 기반 개인정보 검출 및 마스킹 시스템.
  3. 제1항 또는 제2항에 있어서,
    상기 글자정보 추출모듈에서 추출하는 글자 정보는 상기 글자의 색상 정보를 더 포함하며, 상기 마스킹 모듈은 상기 마스킹 문자를 상기 개인정보 문자와 동일한 색상으로 마스킹하는 것을 특징으로 하는 인쇄위치 기반 개인정보 검출 및 마스킹 시스템.
  4. (a) 인쇄 어플리케이션으로부터 인쇄 명령이 발생되는지를 감시하는 단계;
    (b) 상기 단계(a)에서 인쇄 명령을 감지하면, 상기 인쇄 어플리케이션에서 출력되는 문서로부터 페이지 단위로 글자의 위치 및 크기 정보를 포함하는 글자 정보를 추출하는 단계;
    (c) 상기 단계(b)에서 추출된 글자 정보에 근거하여 운영체제의 그래픽 함수에서 사용하는 상기 글자 각각의 논리좌표를 인식하고, 상기 논리좌표를 인쇄물 상의 절대 좌표인 인쇄좌표와 매칭하여 인쇄좌표로 변환하는 단계;
    (d) 상기 글자 정보의 인쇄좌표에 근거한 상기 글자 간의 상호 위치관계와 미리 정해진 개인정보 검출정책에 근거하여 상기 문서로부터 개인정보를 검출하는 단계; 및
    (e) 개인정보를 나타내는 개인정보 문자 중 적어도 일부를 설정된 마스킹 문자로 변환하여 마스킹 동작을 수행하되, 상기 개인정보 문자의 인쇄좌표 상에 동일한 위치 및 크기로 상기 마스킹 문자를 마스킹하는 단계
    를 포함하는 것을 특징으로 하는 인쇄위치 기반 개인정보 검출 및 마스킹 방법.
  5. 삭제
  6. 제4항에 있어서,
    상기 단계(b)의 글자 정보 추출 단계는 상기 글자의 글꼴 정보를 더 추출하며,
    상기 단계(e)의 마스킹 단계에서는 상기 개인정보 문자와 동일한 글꼴로 상기 마스킹 문자를 마스킹하는 것을 특징으로 하는 인쇄위치 기반 개인정보 검출 및 마스킹 방법.
  7. 제4항 또는 제6항에 있어서,
    상기 단계(b)의 글자 정보 추출 단계는 상기 글자의 색상 정보를 더 추출하며,
    상기 단계(e)의 마스킹 단계에서는 상기 개인정보 문자와 동일한 색상으로 상기 마스킹 문자를 마스킹하는 것을 특징으로 하는 인쇄위치 기반 개인정보 검출 및 마스킹 방법.
KR1020160125764A 2016-09-29 2016-09-29 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법 KR101805844B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160125764A KR101805844B1 (ko) 2016-09-29 2016-09-29 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160125764A KR101805844B1 (ko) 2016-09-29 2016-09-29 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR101805844B1 true KR101805844B1 (ko) 2017-12-07

Family

ID=60920355

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160125764A KR101805844B1 (ko) 2016-09-29 2016-09-29 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101805844B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013061835A (ja) * 2011-09-14 2013-04-04 Seiko Epson Corp 記録制御装置、記録装置の制御方法、及び、プログラム
KR101585029B1 (ko) * 2015-05-13 2016-01-13 (주)코드원시스템 문서 인식 분류 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013061835A (ja) * 2011-09-14 2013-04-04 Seiko Epson Corp 記録制御装置、記録装置の制御方法、及び、プログラム
KR101585029B1 (ko) * 2015-05-13 2016-01-13 (주)코드원시스템 문서 인식 분류 시스템

Similar Documents

Publication Publication Date Title
US7623710B2 (en) Document content and structure conversion
US6940617B2 (en) Printing control interface system and method with handwriting discrimination capability
JP4461769B2 (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
WO2019237549A1 (zh) 验证码识别方法、装置、计算机设备及存储介质
KR101794169B1 (ko) Hwp 파일의 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법
US10482280B2 (en) Structured text and pattern matching for data loss prevention in object-specific image domain
US20080037065A1 (en) Computer readable medium storing printing program, electronic device, electronic device control method, and computer data signal
EP2890100B1 (en) Image processing apparatus
US20180260376A1 (en) System and method to create searchable electronic documents
US10489685B1 (en) Image data identifiers and validators for data loss prevention
KR102089797B1 (ko) 인공지능 기반의 홈페이지 개인정보유출차단시스템
CN101071462A (zh) 一种对用户输入的信息进行风险提示的***及方法
CN111738901A (zh) 存储介质以及图像处理装置
KR101805844B1 (ko) 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법
KR101794168B1 (ko) Pdf 파일의 인쇄위치 기반 개인정보 검출 및 마스킹 시스템 및 방법
JP5089524B2 (ja) 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム
CN112799609A (zh) 竖排打印图像生成装置、方法、移动设备及竖排打印***
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
Ramteke et al. Tesseract OCR Recognition Based on Arabic Machine-Printed Document
CN115455473A (zh) 电子文档敏感词自动处理方法、装置、设备和存储介质
US11153454B2 (en) Handling a document having content marked using one or more identifiers
US7995869B2 (en) Information processing apparatus, information processing method, and information storing medium
KR20010081226A (ko) 프린터의 데이타 저장방법
JP2008071316A (ja) 印刷情報監視装置、印刷情報監視方法及びプログラム

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant