KR102035796B1 - 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 - Google Patents
데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 Download PDFInfo
- Publication number
- KR102035796B1 KR102035796B1 KR1020180086929A KR20180086929A KR102035796B1 KR 102035796 B1 KR102035796 B1 KR 102035796B1 KR 1020180086929 A KR1020180086929 A KR 1020180086929A KR 20180086929 A KR20180086929 A KR 20180086929A KR 102035796 B1 KR102035796 B1 KR 102035796B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- original data
- learning model
- original
- identification processing
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000006870 function Effects 0.000 claims description 31
- 238000013503 de-identification Methods 0.000 claims description 16
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 26
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/12—Protecting executable software
- G06F21/14—Protecting executable software against software analysis or reverse engineering, e.g. by obfuscation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/606—Protecting data by securing the transmission between two devices or processes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G06T3/0068—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/14—Transformations for image registration, e.g. adjusting or mapping for alignment of images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7747—Organisation of the process, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2209/00—Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
- H04L2209/16—Obfuscation or hiding, e.g. involving white box
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Technology Law (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Facsimile Transmission Control (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Image Analysis (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
본 발명의 일 태양에 따르면, 데이터를 비식별(anonymization) 처리하는 방법으로서, 원본 데이터를 획득하는 단계, 및 상기 원본 데이터로부터 변조(obfuscation)되는 변조 데이터로서, 학습 모델(learning model)에 입력되면, 상기 학습 모델에 상기 원본 데이터가 입력됨에 따라 출력되는 결과와 서로 동일하거나 유사한 결과가 출력되는 변조 데이터를 비식별 처리된 데이터로서 생성하는 단계를 포함하는 방법이 제공된다.
Description
본 발명은 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체에 관한 것이다.
빅데이터(big data)란, 기존의 기업 환경이나 공공 기관에서 사용되는 정형화된 데이터는 물론, 전자 상거래 데이터, 메타 데이터, 웹 로그 데이터, 무선 식별(RFID; Radio Frequency Identification) 데이터, 센서 네트워크 데이터, 소셜 네트워크 데이터, 인터넷 텍스트와 문서에 관한 데이터, 인터넷 검색 인덱싱 데이터 등 기존에 미처 활용되지 못하던 비정형화 또는 반정형화된 데이터를 모두 포함하는 데이터로서, 이와 같은 데이터는 일반적으로 보통의 소프트웨어 툴 및 컴퓨터 시스템으로는 다루기 어려운 수준의 데이터 양을 갖게 된다는 의미에서 빅데이터라 칭하고 있다.
또한, 이러한 빅데이터는 그 자체만으로는 의미가 없을 수 있으나, 패턴 등에 대한 기계 학습을 통해 다양한 분야에서 새로운 데이터를 만들어내거나 판단 또는 예측을 하는데 유용하게 사용될 수 있다.
근래에 들어, 개인 정보 보호법 강화 등으로 인해 이러한 빅데이터를 거래 또는 공유하기 위해서는 해당 데이터의 개인 식별이 가능한 정보를 삭제하거나 해당 개인의 동의를 받는 것이 요구되었다. 하지만, 상당한 양의 빅데이터 중 개인 식별이 가능한 정보가 있는지 여부를 일일이 확인하기도 어려울 뿐만 아니라 개인의 동의를 일일이 받는 것도 불가능하였기 때문에 이를 지원하기 위한 다양한 기술들이 등장하고 있다.
이에 관한 종래 기술의 일 예로서, 한국등록특허공보 제1861520호에 개시된 기술을 예로 들 수 있는데, 이에 따르면, 입력된 변형 대상 이미지에서 사람의 얼굴 영역을 검출하는 검출 단계, 상기 변형 대상 이미지에서 사람이 비식별되도록 상기 검출된 얼굴 영역을 사람의 얼굴 형상이 아닌 왜곡된 제1 이미지로 변형하는 제1 비식별화 단계, 및 상기 제1 이미지를 토대로 소정의 얼굴 형상을 갖는 제2 이미지를 생성하고, 상기 변형 대상 이미지에서 상기 제1 이미지를 상기 제2 이미지로 변형시키되, 상기 제2 이미지는 상기 검출 단계에서 검출된 얼굴 영역의 형상과 상이한 얼굴 형상을 갖도록 생성되는 제2 비식별화 단계를 포함하는 얼굴 비식별화 방법이 제공된다.
하지만, 위와 같은 종래 기술을 비롯하여 지금까지 소개된 기술에 의하면, 데이터 상에 얼굴, 텍스트 등의 식별 정보를 포함하는지 여부를 확인하고, 식별 정보에 해당하는 부분을 마스킹(masking) 또는 블러(blur) 처리하여 지우거나 가리는 방식이었기 때문에, 원본 데이터의 손상으로 인해 기계 학습에서 사용되기 어려웠고, 데이터 상에 예측하기 못한 식별 정보가 포함되어 이를 비식별화하지 못하는 경우도 종종 발생하였다. 특히, 종래의 보안 카메라(security camera)는 영상 이미지 내에서 프레임 간 변화가 있는 모든 픽셀을 블러(blur) 처리하는 방식으로 비식별 처리를 수행하게 되는데, 이러한 방식으로 비식별 처리를 수행하게 되면, 비식별 처리된 얼굴의 표정 등 주요 정보가 원본 영상 이미지에 담긴 정보와 달라지게 될 뿐만 아니라 얼굴 검출 과정에서 누락된 개인 식별 정보가 원본 영상 이미지 상에 그대로 남게 되는 문제가 있었다.
이에 본 발명자(들)는, 원본 데이터와 상이하게 변조(obfuscation)된 변조 데이터를 생성하되, 학습 모델에 원본 데이터가 입력됨에 따라 출력되는 결과와 해당 학습 모델에 위의 변조 데이터가 입력됨에 따라 출력되는 결과가 서로 동일하거나 유사하게 되는 기술을 제안하는 바이다.
본 발명은, 전술한 종래 기술의 문제점을 모두 해결하는 것을 그 목적으로 한다.
또한, 본 발명은, 데이터 내에서 개인 식별 정보를 찾는 작업이 요구되지 않으므로, 비교적 간편하면서도 정확하게 비식별(anonymization) 처리를 수행할 수 있도록 하는 것을 또 다른 목적으로 한다.
또한, 본 발명은, 원본 데이터로부터 비가역적으로 변조(obfuscation)하여 비식별(anonymization) 처리된 데이터를 생성함으로써, 원본 데이터의 보안 및 프라이버시를 지킬 수 있는 것을 또 다른 목적으로 한다.
또한, 본 발명은, 인간에게는 전혀 다르게 보이는 데이터이지만, 컴퓨터에게는 서로 동일하거나 유사하게 보이는 데이터를 생성하는 것을 또 다른 목적으로 한다.
또한, 본 발명은, 빅데이터 거래 시장을 보다 활성화시키는 것을 또 다른 목적으로 한다.
상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.
본 발명의 일 태양에 따르면, 데이터를 비식별(anonymization) 처리하는 방법으로서, 원본 데이터를 획득하는 단계, 및 상기 원본 데이터로부터 변조(obfuscation)되는 변조 데이터로서, 학습 모델(learning model)에 입력되면, 상기 학습 모델에 상기 원본 데이터가 입력됨에 따라 출력되는 결과와 서로 동일하거나 유사한 결과가 출력되는 변조 데이터를 비식별 처리된 데이터로서 생성하는 단계를 포함하는 방법이 제공된다.
본 발명의 다른 태양에 따르면, 데이터를 비식별(anonymization) 처리하는 시스템으로서, 원본 데이터를 획득하는 원본 데이터 획득부, 및 상기 원본 데이터로부터 변조(obfuscation)되는 변조 데이터로서, 학습 모델(learning model)에 입력되면, 상기 학습 모델에 상기 원본 데이터가 입력됨에 따라 출력되는 결과와 서로 동일하거나 유사한 결과가 출력되는 변조 데이터를 비식별 처리된 데이터로서 생성하는 비식별 처리 데이터 생성부를 포함하는 시스템이 제공된다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 비일시성의 컴퓨터 판독 가능한 기록 매체가 더 제공된다.
본 발명에 의하면, 데이터 내에서 개인 식별 정보를 찾는 작업이 요구되지 않으므로, 비교적 간편하면서도 정확하게 비식별(anonymization) 처리를 수행할 수 있게 된다.
또한, 본 발명에 의하면, 원본 데이터로부터 비가역적으로 변조(obfuscation)하여 비식별(anonymization) 처리된 데이터를 생성함으로써, 데이터의 보안 및 프라이버시를 지킬 수 있게 된다.
또한, 본 발명에 의하면, 인간에게는 전혀 다르게 보이는 데이터이지만, 컴퓨터에게는 서로 동일하거나 유사하게 보이는 데이터를 생성할 수 있게 된다.
또한, 본 발명에 의하면, 빅데이터 거래 시장을 보다 활성화시킬 수 있게 된다.
도 1은 본 발명의 일 실시예에 따라 데이터를 비식별(anonymization) 처리하기 위한 전체 시스템의 구성을 개략적으로 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 비식별 처리 시스템의 내부 구성을 예시적으로 나타내는 도면이다.
도 3 및 도 4는 본 발명의 일 실시예에 따라 데이터가 비식별 처리되는 과정의 일부를 예시적으로 나타내는 도면이다.
도 5 및 도 6은 본 발명의 일 실시예에 따라 원본 이미지 데이터가 비식별 처리되는 과정을 예시적으로 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 비식별 처리 시스템의 내부 구성을 예시적으로 나타내는 도면이다.
도 3 및 도 4는 본 발명의 일 실시예에 따라 데이터가 비식별 처리되는 과정의 일부를 예시적으로 나타내는 도면이다.
도 5 및 도 6은 본 발명의 일 실시예에 따라 원본 이미지 데이터가 비식별 처리되는 과정을 예시적으로 나타내는 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이러한 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 본 명세서에 기재되어 있는 특정 형상, 구조 및 특성은 본 발명의 정신과 범위를 벗어나지 않으면서 일 실시예로부터 다른 실시예로 변경되어 구현될 수 있다. 또한, 각각의 실시예 내의 개별 구성요소의 위치 또는 배치도 본 발명의 정신과 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 행하여지는 것이 아니며, 본 발명의 범위는 특허청구범위의 청구항들이 청구하는 범위 및 그와 균등한 모든 범위를 포괄하는 것으로 받아들여져야 한다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 구성요소를 나타낸다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 여러 바람직한 실시예에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
전체 시스템의 구성
도 1은 본 발명의 일 실시예에 따라 데이터를 비식별(anonymization) 처리하기 위한 전체 시스템의 구성을 개략적으로 나타내는 도면이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 전체 시스템은 통신망(100), 비식별(anonymization) 처리 시스템(200) 및 디바이스(300)를 포함할 수 있다.
먼저, 본 발명의 일 실시예에 따르면, 통신망(100)은 유선 통신이나 무선 통신과 같은 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metropolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 바람직하게는, 본 명세서에서 말하는 통신망(100)은 공지의 인터넷 또는 월드와이드웹(WWW; World Wide Web)일 수 있다. 그러나, 통신망(100)은, 굳이 이에 국한될 필요 없이, 공지의 유무선 데이터 통신망, 공지의 전화망 또는 공지의 유무선 텔레비전 통신망을 그 적어도 일부에 있어서 포함할 수도 있다.
예를 들면, 통신망(100)은 무선 데이터 통신망으로서, 와이파이(WiFi) 통신, 와이파이 다이렉트(WiFi-Direct) 통신, 롱텀 에볼루션(LTE, Long Term Evolution) 통신, 블루투스 통신(더 구체적으로는, 저전력 블루투스(BLE; Bluetooth Low Energy)), 적외선 통신, 초음파 통신 등과 같은 종래의 통신 방법을 적어도 그 일부분에 있어서 구현하는 것일 수 있다.
다음으로, 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)은 통신망(100)을 통하여 후술할 디바이스(300)와 통신을 수행할 수 있고, 원본 데이터를 획득하고, 위의 원본 데이터로부터 변조(obfuscation)되는 변조 데이터로서, 학습 모델(learning model)에 입력되면, 그 학습 모델에 위의 원본 데이터가 입력됨에 따라 출력되는 결과와 서로 동일하거나 유사한 결과가 출력되는 변조 데이터를 비식별 처리된 데이터로서 생성하는 기능을 수행할 수 있다. 예를 들어, 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)은 서버 시스템일 수 있다.
또한, 본 발명의 일 실시예에 따르면, 위의 학습 모델에는 기계 학습(machine learning) 모델, 강화 학습(reinforcement learning) 모델, 딥 러닝(deep learning) 모델, 신경망 학습(neural network learning) 모델 등이 포함될 수 있다.
비식별 처리 시스템(200)의 기능에 관하여는 아래에서 더 자세하게 알아보기로 한다. 한편, 비식별 처리 시스템(200)에 관하여 위와 같이 설명되었으나, 이러한 설명은 예시적인 것이고, 비식별 처리 시스템(200)에 요구되는 기능이나 구성요소의 적어도 일부가 필요에 따라 후술할 디바이스(300) 내에서 실현(예를 들어, 비식별 처리 시스템(200)에 요구되는 기능이나 구성요소의 적어도 일부가 IC 칩(구체적으로는, 디바이스(300)에 포함된 IC 칩)에 의해 구현될 수 있다.)되거나 외부 시스템(미도시됨) 내에 포함될 수도 있음은 당업자에게 자명하다.
다음으로, 본 발명의 일 실시예에 따른 디바이스(300)는 통신망(100)을 통해 비식별 처리 시스템(200)에 접속한 후 통신할 수 있도록 하는 기능을 포함하는 디지털 기기로서, 스마트폰, 태블릿 PC 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기라면 얼마든지 본 발명에 따른 디바이스(300)로서 채택될 수 있다.
한편, 본 발명의 일 실시예에 따르면, 디바이스(300)에는 본 발명에 따른 데이터의 비식별 처리를 지원하기 위한 애플리케이션이 포함되어 있을 수 있다. 이와 같은 애플리케이션은 비식별 처리 시스템(200) 또는 외부의 애플리케이션 배포 서버(미도시됨)로부터 다운로드된 것일 수 있다.
비식별 처리 시스템의 구성
이하에서는, 본 발명의 구현을 위하여 중요한 기능을 수행하는 비식별 처리 시스템(200)의 내부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.
도 2는 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)의 내부 구성을 예시적으로 나타내는 도면이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)은 원본 데이터 획득부(210), 비식별 처리 데이터 생성부(220), 통신부(230) 및 제어부(240)를 포함할 수 있다. 본 발명의 일 실시예에 따르면, 원본 데이터 획득부(210), 비식별 처리 데이터 생성부(220), 통신부(230) 및 제어부(240)는 그 중 적어도 일부가 외부 시스템(미도시됨)과 통신하는 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 비식별 처리 시스템(200)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다. 또한, 이러한 프로그램 모듈들은 비식별 처리 시스템(200)과 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.
먼저, 본 발명의 일 실시예에 따른 원본 데이터 획득부(210)는 원본 데이터를 획득하는 기능을 수행할 수 있다.
예를 들어, 본 발명의 일 실시예에 따른 원본 데이터 획득부(210)는 문자, 이미지 및 소리 중 적어도 하나에 관한 데이터를 원본 데이터로서 획득할 수 있다.
한편, 본 발명의 일 실시예에 따르면, 위의 원본 데이터는 기계 학습 모델을 통해 학습을 시키는데 사용되는 데이터를 포함할 수 있다.
다음으로, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 원본 데이터로부터 변조(obfuscation)되는 변조 데이터로서, 학습 모델(learning model)에 입력되면, 해당 학습 모델에 위의 원본 데이터가 입력됨에 따라 출력되는 결과와 서로 동일하거나 유사한 결과가 출력되는 변조 데이터를 비식별 처리된 데이터로서 생성할 수 있다. 본 발명의 일 실시예에 따르면, 위의 결과는 위의 데이터(즉, 원본 데이터 또는 변조 데이터) 내 소정 특징과 연관된 확률(probability), 벡터(vector), 행렬(matrix) 및 좌표(coordinate) 중 적어도 하나에 관한 값을 포함할 수 있다. 예를 들어, 본 발명의 일 실시예에 따르면, 원본 데이터가 얼굴 이미지 데이터인 경우에, 위의 결과는 얼굴 특징점(landmark point, 예를 들어, 눈의 양 끝점)에 관한 좌표 또는 얼굴 특징점에 관한 확률 분포(probability distribution)값 또는 로짓(logits)값일 수 있다.
구체적으로, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 원본 데이터를 변조하여 후보 변조 데이터를 생성할 수 있다. 또한, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 적어도 하나의 학습 모델에서 위의 후보 변조 데이터가 입력됨에 따라 출력되는 결과 및 위의 원본 데이터가 입력됨에 따라 출력되는 결과 사이의 차이를 산출하고, 그 산출되는 차이에 기초하여 위의 후보 변조 데이터를 보정할 수 있다.
예를 들어, 도 3을 참조하면, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 원본 데이터 x를 변조하여(예를 들어, 정규분포 N(0, σ)를 노이즈로서 부가하여) 후보 변조 데이터 x'을 생성할 수 있다(310). 그 다음에, 본 발명의 일 실시예에 따른 제1 학습 모델 F1에서 위의 후보 변조 데이터 x'이 입력됨에 따라 출력되는 결과 및 위의 원본 데이터 x가 입력됨에 따라 출력되는 결과 사이의 차이의 노름(norm)(즉, "||F1(x)-F1(x')||")을 에러값(err)으로서 산출할 수 있다(320). 그 다음에, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 위의 에러값에 기초하여 역전파된 그라디언트(back propagated-gradient from err)를 산출하여 위의 후보 데이터 x'에 반영(예를 들어, 위의 후보 데이터 x'와 위의 역전파된 그라디언트의 합을 위의 후보 데이터 x'로 함)시킴으로써, 위의 후보 변조 데이터 x'을 보정할 수 있다(330). 그 다음에, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 제2 학습 모델 F2에서 위의 보정된 후보 변조 데이터 x'이 입력됨에 따라 출력되는 결과 및 위의 원본 데이터 x가 입력됨에 따라 출력되는 결과 사이의 차이의 노름(norm)(즉, "||F2(x)-F2(x')||")을 에러값(err)으로서 산출할 수 있다(320). 그 다음에, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 위의 에러값에 기초하여 역전파된 그라디언트(back propagated-gradient from err)를 산출하여 위의 보정된 후보 변조 데이터 x'을 재보정할 수 있다(330). 또한, 본 발명의 일 실시예에 따르면, 비식별 처리 데이터 생성부(220)는 위의 재보정 이후에 제3 내지 제N 학습 모델(즉 F3 내지 FN)에 대하여도 위와 동일한 과정을 반복하여 수행할 수 있고, 이를 통해 위의 재보정된 후보 변조 데이터 x'을 재차 보정할 수 있다. 한편, 본 발명의 일 실시예에 따르면, 위의 에러값(err)을 산출함에 있어서, 위의 제N 학습 모델 FN에서의 에러값은, 제1 내지 제N 학습 모델 각각에서의 노름의 합에 기초하여 산출될 수도 있다. 예를 들어, 본 발명의 일 실시예에 따르면, 위의 제N 학습 모델 FN에서의 에러값은 ∑N||FN(x)-FN(x')||에 기초하여 산출될 수 있다.
한편, 앞서 살펴본 예에서는 결과 사이의 차이에 기초하여 에러값을 구하는 과정에서 노름(구체적으로는 L1 노름(norm))을 이용하였으나, 이에 한정되지 않고, 코사인 유사도(cosine similarity), L2 노름(norm) 등 거리 차이를 산출하는 다른 방식 또한 본 발명의 목적을 달성할 수 있는 범위 내에서 얼마든지 사용될 수 잇다.
또한, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 위의 학습 모델에 원본 데이터가 입력됨에 따라 출력되는 결과와 위의 학습 모델에 비식별 처리된 데이터가 입력됨에 따라 출력되는 결과 사이의 차이를 감소(또는 최소화)시키고, 원본 데이터와 비식별 처리된 데이터 사이의 차이를 증가(또는 최대화)시키도록 하여 위의 비식별 처리된 데이터를 생성할 수 있다.
예를 들어, 도 4를 참조하면, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 원본 데이터 x를 변조하여(예를 들어, 정규분포 N(0, σ)를 노이즈로서 부가하여) 후보 변조 데이터 x'을 생성할 수 있다(410). 이 경우에, 본 발명의 일 실시예에 따르면, 위의 원본 데이터 x를 위의 후보 변조 데이터 x'로 변조하는 목적 함수를 O(x)로 가정해 볼 수 있다. 또한, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 제1 학습 모델 F1에서 위의 후보 변조 데이터 x'이 입력됨에 따라 출력되는 결과 및 위의 원본 데이터 x가 입력됨에 따라 출력되는 결과 차이의 노름(norm)에 기초하여 에러값(err)을 산출할 수 있다(예를 들어, 이러한 에러값은 앞서 살펴본 ∑N||FN(x)-FN(x')|| 수식을 통해 ∑1||F1(x)-F1(x')||로 산출될 수도 있다.)(420).
그 다음에, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는, 후보 변조 데이터 x'으로부터 원본 데이터 x와 연관된 시각적(예를 들어, 원본 데이터가 문자 또는 이미지에 관한 데이터인 경우) 또는 청각적(예를 들어, 원본 데이터가 소리에 관한 데이터인 경우) 특징을 제거하는 방해 모델 D에 기초하여 위의 에러값(err)을 보정할 수 있다(430).
예를 들어, 본 발명의 일 실시예에 따르면, 위의 방해 모델 D는 적대적 트레이닝(adversarial training)을 이용한 학습(예를 들어, 실제(real)/가짜(fake) 학습)에 기초하여 특정되는 모델일 수 있고, 그 모델로부터 원본 데이터 x 및 후보 변조 데이터 x' 사이의 차이를 소정 수준 이상으로 증가(또는 최대화)시키기 위한 출력값이 산출될 수 있으며, 비식별 처리 데이터 생성부(220)가 그 출력값을 위의 에러값에 반영시킴으로써, 위의 에러값을 보정할 수 있다. 즉, 위의 에러값에 위의 출력값을 반영시킴으로써, 원본 데이터 x와 후보 변조 데이터 x' 사이의 차이를 증가시키고, 이를 통해, 원본 데이터 x와 후보 변조 데이터 x'가 시각적 또는 청각적으로 서로 상이하게 될 수 있다.
한편, 본 발명의 일 실시예에 따르면, 이러한 방해 모델 D는 후보 변조 데이터 x'에서 원본 데이터 x로 복구가 될 수 없도록 위의 에러값을 더 보정함으로써, 비가역(irreciprocal) 처리를 더 수행하는 모델일 수 있다.
그 다음에, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 위의 보정된 에러값에 기초하여 위의 제1 학습 모델 F1에 원본 데이터가 입력됨에 따라 출력되는 결과와 위의 제1 학습 모델 F1에 후보 변조 데이터 x'이 입력됨에 따라 출력되는 결과 사이의 차이를 감소(또는 최소화)시키도록 위의 O(x) 함수를 보정할 수 있다(440).
예를 들어, 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 위의 보정된 에러값이 소정 수준 이하로 작아지도록 O(x) 함수를 보정할 수 있고, 이를 통해, 위의 제1 학습 모델 F1에 원본 데이터가 입력됨에 따라 출력되는 결과와 위의 제1 학습 모델 F1에 후보 변조 데이터 x'이 입력됨에 따라 출력되는 결과 사이의 차이가 작아지도록(또는 최소화) 할 수 있다.
그 다음에, 위의 본 발명의 일 실시예에 따른 비식별 처리 데이터 생성부(220)는 위의 보정 이후에 제2 내지 제N 학습 모델(즉 F2 내지 FN)에 대하여도 위와 동일한 과정을 반복하여 수행할 수 있고, 위의 과정을 반복하여 N회 보정된 O(x)에 원본 데이터 x가 입력됨에 따라 출력되는 결과를 비식별 처리된 데이터로서 생성할 수 있다(450).
다음으로, 본 발명의 일 실시예에 따르면, 통신부(230)는 원본 데이터 획득부(210) 및 비식별 처리 데이터 생성부(220)로부터의/로의 데이터 송수신이 가능하도록 하는 기능을 수행할 수 있다.
마지막으로, 본 발명의 일 실시예에 따르면, 제어부(240)는 원본 데이터 획득부(210), 비식별 처리 데이터 생성부(220) 및 통신부(230) 간의 데이터의 흐름을 제어하는 기능을 수행할 수 있다. 즉, 본 발명에 따른 제어부(240)는 비식별 처리 시스템(200)의 외부로부터의/로의 데이터 흐름 또는 비식별 처리 시스템(200)의 각 구성요소 간의 데이터 흐름을 제어함으로써, 원본 데이터 획득부(210), 비식별 처리 데이터 생성부(220) 및 통신부(230)에서 각각 고유 기능을 수행하도록 제어할 수 있다.
도 5 및 도 6은 본 발명의 일 실시예에 따라 원본 이미지 데이터가 비식별 처리되는 과정을 예시적으로 나타내는 도면이다.
도 5의 (a)는 캐나다 고등 연구소(CIFAR; Canadian Institute for Advanced Research)에서 이미지 분류 문제 해결을 위해 수집해 정리한 데이터인 CIFAR-10 분류 데이터 세트로부터 선정된 64개의 이미지 샘플을 예시적으로 나타내는 도면이다.
먼저, 도 5의 (a) 및 도 6을 참조하면, 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)은 위의 64개의 이미지 샘플을 원본 이미지 데이터로서 획득할 수 있다.
그 다음에, 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)은 위의 원본 이미지 데이터 x에 정규 분포 N(0, σ)를 노이즈로서 부가하여 후보 변조 이미지 데이터 x'을 생성할 수 있다(610). 이 경우에, 본 발명의 일 실시예에 따르면, 위의 원본 이미지 데이터 x를 위의 후보 변조 이미지 데이터 x'로 변조하는 목적 함수를 O(x)로 가정해 볼 수 있다.
그 다음에, 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)은 제1 학습 모델 F1에서 위의 후보 변조 이미지 데이터 x'이 입력됨에 따라 출력되는 결과 및 위의 원본 이미지 데이터 x가 입력됨에 따라 출력되는 결과 차이의 노름(norm)에 기초하여 에러값(err)을 산출할 수 있다(620).
그 다음에, 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)은, 후보 변조 이미지 데이터 x'으로부터 원본 이미지 데이터 x와 연관된 시각적 특징을 소정 수준 이상 변형 또는 제거(즉, 시각적으로 다르게 보이도록)하고 후보 변조 이미지 데이터 x'에서 원본 이미지 데이터 x로 복구가 불가능하도록 하는 방해 모델 D에 기초하여 위의 에러값(err)을 보정할 수 있다(640). 한편, 본 발명의 일 실시예에 따르면, 위의 방해 모델 D는 적대적 트레이닝(adversarial training)을 이용한 학습(예를 들어, 실제(real)/가짜(fake) 학습)에 기초하여 특정되는 모델일 수 있다. 예를 들어, 방해 모델 D와 위의 O(x) 사이의 관계는 아래 수학식 1과 같이 설정될 수 있다.
이 경우에, 본 발명의 일 실시예에 따르면, V(O, D)는 O(x)의 최소 및 D(x)의 최대를 만족시키는 값을 찾는 가치 함수(value function)일 수 있고, pdesired 및 px는 각각 원하는 분포(desired distribution) 및 데이터 분포(data distribution)를 의미할 수 있다.
그 다음에, 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)은 위의 보정된 에러값에 기초하여 위의 제1 학습 모델 F1에 원본 이미지 데이터가 입력됨에 따라 출력되는 결과와 위의 제1 학습 모델 F1에 후보 변조 이미지 데이터 x'이 입력됨에 따라 출력되는 결과 사이의 차이가 최소화되도록 위의 O(x) 함수를 보정할 수 있다(650).
그 다음에, 본 발명의 일 실시예에 따르면, 비식별 처리 시스템(200)은 제2 내지 제N 학습 모델(즉 F2 내지 FN)에 대하여도 위와 동일한 과정을 반복하여 수행함으로써, O(x) 함수를 재차 보정할 수 있다. 한편, 본 발명의 일 실시예에 따르면, 위의 N은 제N 학습 모델 FN에 원본 이미지 데이터가 입력됨에 따라 출력되는 결과와 N-1회 보정된 후보 변조 이미지 데이터 x'이 입력됨에 따라 출력되는 결과 사이의 차이가 소정 수준 이하가 되는 값으로 결정될 수 있다.
그 다음에, 본 발명의 일 실시예에 따르면, 비식별 처리 시스템(200)은 위의 N회(또는 N-1회) 보정된 O(x)에 원본 이미지 데이터 x가 입력됨에 따라 출력되는 결과를 비식별 처리된 이미지 데이터로서 생성할 수 있다(660).
도 5의 (b)는 본 발명의 일 실시예에 따라 위의 64개의 원본 이미지 데이터가 비식별 처리된 결과를 예시적으로 나타내는 도면이다.
도 5의 (a) 및 도 5의 (b)를 참조하면, 본 발명의 일 실시예에 따른 도 5의 (b)의 64개의 비식별 처리된 이미지 데이터는 도 5의 (a)의 64개의 원본 이미지 데이터와는 시각적으로 서로 상이하지만, 어떠한 학습 모델에 입력되든지 동일하거나 유사한 결과를 산출할 수 있는 데이터일 수 있다.
한편, 본 발명의 일 실시예에 따른 비식별 처리 시스템(200)에 의해 비식별 처리된 이미지 데이터는 이미지 빅데이터 구매를 원하는 구매자에게 제공(또는 판매)될 수 있다.
또한, 본 발명의 일 실시예에 따르면, 위의 구매자에게 비식별 처리된 이미지 데이터가 제공(또는 판매)되면서, 비식별 처리 시스템(200)에 의해 산출된 목적 함수 O(x)의 기능을 수행하는 변환 디바이스가 함께 제공될 수 있다. 본 발명의 일 실시예에 따르면, 구매자는 위의 변환 디바이스를 이용하여 자신이 별도로 보유하고 있는 원본 이미지 데이터로부터 비식별 처리된 데이터를 생성할 수 있게 된다. 즉, 목적 함수 O(x)의 기능을 수행하는 변환 디바이스에 기초하여 학습 모델 F(구체적으로는, 구매자에 의해 임의로 선정되는 학습 모델 F)에 원본 이미지 데이터 x가 입력됨에 따라 출력되는 결과(즉, F(x))와 해당 학습 모델 F에 비식별 처리된 이미지 데이터 x'(즉, O(x))가 입력됨에 따라 출력되는 결과(즉, F(O(x))가 서로 동일하거나 유사할 수 있게 되므로, 구매자는 위의 제공 받은 변환 디바이스를 통해 자신이 보유하거나 다른 출처 또는 경로로부터 획득된 원본 이미지 데이터를 변환하여 비식별 처리된 이미지 데이터를 생성할 수 있고, 그 비식별 처리된 이미지 데이터를 자신의 학습 모델(즉, 임의의 학습 모델)에서 이용할 수 있게 된다. 또한, 구매자는 그 비식별 처리된 이미지 데이터, 자신이 보유하거나 다른 출처 또는 경로로부터 획득된 원본 이미지 데이터, 및 위의 제공(또는 판매)받은 비식별 처리된 이미지 데이터 중 적어도 둘 이상을 자신의 학습 모델에서 함께 사용할 수도 있게 된다. 한편, 본 발명의 일 실시예에 따르면, 위의 변환 디바이스는 스마트폰, 태블릿 PC 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기일 수 있다.
한편, 본 발명의 일 실시예에 따르면, 위의 비식별 처리 시스템(200)에 의해 산출되는 목적 함수 O(x)는 정확도가 높게 설정되어 구매자의 변환 디바이스에서는 컴퓨팅 오버 헤드(computational overhead)를 발생시킬 수 있으므로, 컴퓨팅 연산을 보다 감소시킨 O'(x)의 기능으로 위의 변환 디바이스에서 수행될 수 있다. 본 발명의 일 실시예에 따르면, 학습 모델에 원본 데이터가 입력됨에 따라 출력되는 결과와 해당 학습 모델에 비식별 처리된 데이터가 입력됨에 따라 출력되는 결과 사이의 차이를 감소시키는 정도를 보다 완화하거나 O(x)보다 낮은 차수로 근사화함으로써, O'(x)가 결정될 수 있다.
또한, 본 발명의 일 실시예에 따르면, 위의 비식별 처리 시스템(200)에 의해 산출되는 목적 함수 O(x)를 이용하여 기계 학습(machine learning)을 수행함으로써, 학습 모델 G가 생성될 수 있고, 이러한 학습 모델 G는 G(O(x)), G(O'(x)) 및 G(x)가 동일하거나 유사한 결과를 산출할 수 있도록 학습된 모델일 수 있다. 즉, 이 경우에, 위의 구매자는 위의 목적 함수 O(x) 기능을 수행하는 변환 디바이스를 사용하지 않고, 구매자 자신이 보유하거나 다른 출처 또는 경로로부터 획득된 원본 이미지 데이터를 위의 학습 모델 G에 바로 입력하여 사용할 수 있다.
이상 설명된 본 발명에 따른 실시예는 다양한 컴퓨터 구성요소를 통하여 실행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위하여 하나 이상의 소프트웨어 모듈로 변경될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항과 한정된 실시예 및 도면에 의하여 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위하여 제공된 것일 뿐, 본 발명이 상기 실시예에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정과 변경을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.
100: 통신망
200: 비식별 처리 시스템
210: 원본 데이터 획득부
220: 비식별 처리 데이터 생성부
230: 통신부
240: 제어부
300: 디바이스
200: 비식별 처리 시스템
210: 원본 데이터 획득부
220: 비식별 처리 데이터 생성부
230: 통신부
240: 제어부
300: 디바이스
Claims (9)
- 데이터를 비식별(anonymization) 처리하기 위한 비식별 처리 시스템에서 구현되는 방법으로서 - 상기 비식별 처리 시스템은 원본 데이터 획득부 및 비식별 처리 데이터 생성부를 포함함 - ,
상기 원본 데이터 획득부가, 원본 데이터를 획득하는 단계, 및
상기 비식별 처리 데이터 생성부가, 상기 원본 데이터로부터 변조(obfuscation)되는 변조 데이터로서, 학습 모델(learning model)에 입력되면, 상기 학습 모델에 상기 원본 데이터가 입력됨에 따라 출력되는 결과와 서로 동일하거나 유사한 결과가 출력되는 변조 데이터를 비식별 처리된 데이터로서 생성하는 단계를 포함하고,
상기 생성 단계에서, 상기 비식별 처리 데이터 생성부는, 목적 함수를 이용하여 상기 원본 데이터를 상기 변조 데이터로 변조(obfuscation)하고,
상기 생성 단계는, 상기 비식별 처리 데이터 생성부가, 상기 원본 데이터를 변조(obfuscation)하여 후보 변조 데이터를 생성하는 단계,
상기 비식별 처리 데이터 생성부가, 적어도 하나의 학습 모델에서 상기 후보 변조 데이터가 입력됨에 따라 출력되는 결과 및 상기 원본 데이터가 입력됨에 따라 출력되는 결과 사이의 차이에 기초하여 에러값을 산출하는 단계, 및
상기 비식별 처리 데이터 생성부가, 상기 에러값이 소정 수준 이하가 되도록 상기 목적 함수를 보정하는 단계를 포함하는
방법. - 제1항에 있어서,
상기 결과는, 상기 원본 데이터 또는 상기 변조 데이터 내 소정 특징과 연관된 확률(probability), 벡터(vector), 행렬(matrix) 및 좌표(coordinate) 중 적어도 하나에 관한 값을 포함하는
방법. - 제1항에 있어서,
상기 생성 단계에서, 상기 학습 모델에 상기 원본 데이터가 입력됨에 따라 출력되는 결과와 상기 학습 모델에 상기 비식별 처리된 데이터가 입력됨에 따라 출력되는 결과 사이의 차이를 감소시키고, 상기 원본 데이터와 상기 비식별 처리 데이터 사이의 차이를 증가시켜 상기 비식별 처리된 데이터를 생성하는
방법. - 삭제
- 제1항에 있어서,
상기 비식별 처리된 데이터는, 상기 원본 데이터로부터 비가역적으로 변조되는 변조 데이터인
방법. - 제1항에 있어서,
상기 비식별 처리된 데이터는, 상기 원본 데이터와 시각적 또는 청각적으로 소정 수준 이상 다른
방법. - 제1항에 있어서,
상기 학습 모델에는, 기계 학습(machine learning) 모델 및 신경망 학습(neural network learning) 모델 중 적어도 하나가 포함되는
방법. - 제1항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 비일시성의 컴퓨터 판독 가능 기록 매체.
- 데이터를 비식별(anonymization) 처리하는 시스템으로서,
원본 데이터를 획득하는 원본 데이터 획득부, 및
상기 원본 데이터로부터 변조(obfuscation)되는 변조 데이터로서, 학습 모델(learning model)에 입력되면, 상기 학습 모델에 상기 원본 데이터가 입력됨에 따라 출력되는 결과와 서로 동일하거나 유사한 결과가 출력되는 변조 데이터를 비식별 처리된 데이터로서 생성하는 비식별 처리 데이터 생성부를 포함하고,
상기 비식별 처리 데이터 생성부는, 목적 함수를 이용하여 상기 원본 데이터를 상기 변조 데이터로 변조(obfuscation)하고,
상기 비식별 처리 데이터 생성부는, 상기 원본 데이터를 변조(obfuscation)하여 후보 변조 데이터를 생성하고, 적어도 하나의 학습 모델에서 상기 후보 변조 데이터가 입력됨에 따라 출력되는 결과 및 상기 원본 데이터가 입력됨에 따라 출력되는 결과 사이의 차이에 기초하여 에러값을 산출하고, 상기 에러값이 소정 수준 이하가 되도록 상기 목적 함수를 보정하는
시스템.
Priority Applications (12)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180086929A KR102035796B1 (ko) | 2018-07-26 | 2018-07-26 | 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
PCT/KR2019/005364 WO2020022619A1 (ko) | 2018-07-26 | 2019-05-03 | 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
US16/513,715 US10747854B2 (en) | 2018-07-26 | 2019-07-17 | Method for concealing data and data obfuscation device using the same |
US16/513,725 US10635788B2 (en) | 2018-07-26 | 2019-07-17 | Method for training and testing obfuscation network capable of processing data to be concealed for privacy, and training device and testing device using the same |
EP19765400.7A EP3827365A4 (en) | 2018-07-26 | 2019-07-19 | METHOD OF HIDING DATA AND DATA OBJECTION DEVICE USING THEM |
JP2020562066A JP7040712B2 (ja) | 2018-07-26 | 2019-07-19 | 個人情報保護のために原本データをコンシーリング処理する変調ネットワークを学習する方法及びテストする方法、そして、これを利用した学習装置及びテスト装置 |
EP19765402.3A EP3827366B1 (en) | 2018-07-26 | 2019-07-19 | Method for training and testing obfuscation network capable of processing data to be concealed for privacy, and training device and testing device using the same |
JP2020564388A JP7041823B2 (ja) | 2018-07-26 | 2019-07-19 | データをコンシール処理する方法及びこれを利用したデータ変調装置 |
CN201980005836.1A CN111373403B (zh) | 2018-07-26 | 2019-07-19 | 一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法和测试方法,以及其学习装置和测试装置 |
PCT/KR2019/008937 WO2020022703A1 (en) | 2018-07-26 | 2019-07-19 | Method for concealing data and data obfuscation device using the same |
PCT/KR2019/008939 WO2020022704A1 (en) | 2018-07-26 | 2019-07-19 | Method for training and testing obfuscation network capable of processing data to be concealed for privacy, and training device and testing device using the same |
US16/807,168 US10896246B2 (en) | 2018-07-26 | 2020-03-03 | Method for concealing data and data obfuscation device using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180086929A KR102035796B1 (ko) | 2018-07-26 | 2018-07-26 | 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102035796B1 true KR102035796B1 (ko) | 2019-10-24 |
Family
ID=68423357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180086929A KR102035796B1 (ko) | 2018-07-26 | 2018-07-26 | 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
Country Status (6)
Country | Link |
---|---|
US (3) | US10635788B2 (ko) |
EP (2) | EP3827366B1 (ko) |
JP (2) | JP7040712B2 (ko) |
KR (1) | KR102035796B1 (ko) |
CN (1) | CN111373403B (ko) |
WO (3) | WO2020022619A1 (ko) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102184787B1 (ko) * | 2019-10-24 | 2020-12-01 | 주식회사 딥핑소스 | 개인 정보를 보호하기 위하여 원본 데이터를 컨실링 처리하여 생성된 변조 데이터를 인식하기 위해 사용되는 사용자 러닝 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치 |
KR20210019914A (ko) * | 2019-08-13 | 2021-02-23 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치 |
WO2022065817A1 (en) * | 2020-09-25 | 2022-03-31 | Deeping Source Inc. | Methods for training and testing obfuscation network capable of performing distinct concealing processes for distinct regions of original image and learning and testing devices using the same |
KR20220052839A (ko) * | 2020-10-21 | 2022-04-28 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 |
KR20220052838A (ko) * | 2020-10-21 | 2022-04-28 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 |
KR20220073582A (ko) * | 2020-11-26 | 2022-06-03 | 주식회사 딥핑소스 | 원본 의료 이미지의 영역별로 서로 다른 컨실링 프로세스가 수행되도록 하여 원본 의료 이미지를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치 |
US11886955B2 (en) | 2022-02-16 | 2024-01-30 | Protopia AI, Inc. | Self-supervised data obfuscation in foundation models |
KR102648905B1 (ko) | 2023-02-21 | 2024-03-18 | (주)이지서티 | 프라이버시 보호 수준을 설정할 수 있는 데이터 변조 방법 및 장치 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7353032B2 (ja) * | 2018-11-15 | 2023-09-29 | 株式会社Preferred Networks | データ生成装置、データ生成方法及びプログラム |
WO2020137728A1 (ja) * | 2018-12-26 | 2020-07-02 | 国立大学法人筑波大学 | 分散データ統合装置、分散データ統合方法、及びプログラム |
JP7268368B2 (ja) * | 2019-01-30 | 2023-05-08 | 富士通株式会社 | 学習装置、学習方法および学習プログラム |
US11562134B2 (en) * | 2019-04-02 | 2023-01-24 | Genpact Luxembourg S.à r.l. II | Method and system for advanced document redaction |
CN111078825A (zh) * | 2019-12-20 | 2020-04-28 | 北京百度网讯科技有限公司 | 结构化处理方法、装置、计算机设备及介质 |
US11363029B2 (en) * | 2020-01-08 | 2022-06-14 | Bank Of America Corporation | Big data distributed processing and secure data transferring with hyper fencing |
US11334408B2 (en) * | 2020-01-08 | 2022-05-17 | Bank Of America Corporation | Big data distributed processing and secure data transferring with fault handling |
US11321430B2 (en) * | 2020-01-08 | 2022-05-03 | Bank Of America Corporation | Big data distributed processing and secure data transferring with obfuscation |
US11314874B2 (en) * | 2020-01-08 | 2022-04-26 | Bank Of America Corporation | Big data distributed processing and secure data transferring with resource allocation and rebate |
US11379603B2 (en) * | 2020-01-08 | 2022-07-05 | Bank Of America Corporation | Big data distributed processing and secure data transferring with fallback control |
WO2021178911A1 (en) * | 2020-03-06 | 2021-09-10 | The Regents Of The University Of California | Methods of providing data privacy for neural network based inference |
US20210303662A1 (en) * | 2020-03-31 | 2021-09-30 | Irdeto B.V. | Systems, methods, and storage media for creating secured transformed code from input code using a neural network to obscure a transformation function |
US10956598B1 (en) * | 2020-04-24 | 2021-03-23 | Deeping Source Inc. | Method for preventing breach of original data for deep learning and data breach preventing device using them |
EP3905087B1 (en) * | 2020-04-27 | 2023-01-18 | Brighter AI Technologies GmbH | Method and system for selective and privacy-preserving anonymization |
US11709954B2 (en) * | 2020-05-01 | 2023-07-25 | Microsoft Technology Licensing, Llc | Image content obfuscation using a neural network |
US11017319B1 (en) * | 2020-06-23 | 2021-05-25 | Deeping Source Inc. | Method for training obfuscation network which conceals original data to be used for machine learning and training surrogate network which uses obfuscated data generated by obfuscation network and method for testing trained obfuscation network and learning device and testing device using the same |
US11017320B1 (en) * | 2020-06-24 | 2021-05-25 | Deeping Source Inc. | Method for training obfuscation network which conceals original data to be used for machine learning and training surrogate network which uses obfuscated data generated by obfuscation network and learning device using the same and method for testing trained obfuscation network and testing device using the same |
US11334773B2 (en) | 2020-06-26 | 2022-05-17 | Amazon Technologies, Inc. | Task-based image masking |
CN112019502B (zh) * | 2020-07-20 | 2021-06-29 | 北京邮电大学 | 一种环形守卫网络用户节点匿名保护方法及电子设备 |
US11200342B1 (en) * | 2020-10-21 | 2021-12-14 | Deeping Source Inc. | Method for training and testing obfuscation network capable of processing data to be obfuscated for privacy, and training device and testing device using the same |
US20220129582A1 (en) * | 2020-10-22 | 2022-04-28 | Robert Bosch Gmbh | Data anonymization for data labeling and development purposes |
US11164046B1 (en) | 2020-12-07 | 2021-11-02 | Deeping Source Inc. | Method for producing labeled image from original image while preventing private information leakage of original image and server using the same |
US20240088961A1 (en) | 2021-01-13 | 2024-03-14 | Lg Electronics Inc. | Image display device |
US11366930B1 (en) * | 2021-08-23 | 2022-06-21 | Deeping Source Inc. | Method for training and testing obfuscation network capable of obfuscating data to protect personal information, and learning device and testing device using the same |
US11308359B1 (en) * | 2021-10-27 | 2022-04-19 | Deeping Source Inc. | Methods for training universal discriminator capable of determining degrees of de-identification for images and obfuscation network capable of obfuscating images and training devices using the same |
US11423643B1 (en) * | 2021-11-29 | 2022-08-23 | Deeping Source Inc. | Method for generating obfuscated image to be used in training learning net work and labeling device using the same |
US11669635B1 (en) * | 2021-11-29 | 2023-06-06 | Deeping Source Inc. | Learning method and learning device for training obfuscation network capable of obfuscating original data for privacy and testing method and testing device using the same |
EP4266216A1 (en) * | 2022-04-20 | 2023-10-25 | Deeping Source Inc. | Learning method and learning device for training obfuscation network capable of obfuscating original data for privacy to achieve information restriction obfuscation and testing method and testing device using the same |
CN116049840B (zh) * | 2022-07-25 | 2023-10-20 | 荣耀终端有限公司 | 一种数据保护方法、装置、相关设备及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080085731A (ko) * | 2007-03-19 | 2008-09-24 | 소니 가부시끼 가이샤 | 화상 처리 장치, 화상 처리 방법 |
KR101784265B1 (ko) * | 2016-06-09 | 2017-10-12 | 주식회사 그리즐리 | 빅데이터의 비식별화 처리 방법 |
KR101861520B1 (ko) * | 2017-03-15 | 2018-05-28 | 광주과학기술원 | 얼굴 비식별화 방법 |
JP2018106216A (ja) * | 2016-12-22 | 2018-07-05 | 日本電信電話株式会社 | 学習データ生成装置、開発データ生成装置、モデル学習装置、それらの方法、及びプログラム |
KR101877372B1 (ko) * | 2017-05-19 | 2018-07-13 | 주식회사 하루컴퍼니 | 워터마크 데이터의 임베딩 및 추출 방법 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5671335A (en) | 1991-05-23 | 1997-09-23 | Allen-Bradley Company, Inc. | Process optimization using a neural network |
JPH07105165A (ja) * | 1993-09-30 | 1995-04-21 | Nri & Ncc Co Ltd | ニューラルネットワーク情報処理装置 |
JP3974763B2 (ja) | 2000-10-25 | 2007-09-12 | 富士通株式会社 | 予測分析装置及び予測分析プログラム |
JP4591211B2 (ja) | 2005-05-31 | 2010-12-01 | 富士ゼロックス株式会社 | 画像処理装置、画像処理方法、媒体、符号読取装置、及びプログラム |
US8577387B2 (en) | 2009-03-17 | 2013-11-05 | Qualcomm Incorporated | Position location using multiple carriers |
US8667301B2 (en) * | 2010-04-01 | 2014-03-04 | Apple Inc. | Obfuscating transformations on data array content and addresses |
US9105119B2 (en) * | 2013-05-02 | 2015-08-11 | Emotient, Inc. | Anonymization of facial expressions |
US9275308B2 (en) * | 2013-05-31 | 2016-03-01 | Google Inc. | Object detection using deep neural networks |
US10043035B2 (en) * | 2013-11-01 | 2018-08-07 | Anonos Inc. | Systems and methods for enhancing data protection by anonosizing structured and unstructured data and incorporating machine learning and artificial intelligence in classical and quantum computing environments |
JP6286329B2 (ja) * | 2014-09-19 | 2018-02-28 | 株式会社沖データ | 画像形成装置及び情報提供方法 |
US9454713B2 (en) | 2014-12-30 | 2016-09-27 | Ebay Inc. | Similar item detection |
US10410118B2 (en) * | 2015-03-13 | 2019-09-10 | Deep Genomics Incorporated | System and method for training neural networks |
US9773196B2 (en) * | 2016-01-25 | 2017-09-26 | Adobe Systems Incorporated | Utilizing deep learning for automatic digital image segmentation and stylization |
US9847974B2 (en) * | 2016-04-28 | 2017-12-19 | Xerox Corporation | Image document processing in a client-server system including privacy-preserving text recognition |
US20180129900A1 (en) * | 2016-11-04 | 2018-05-10 | Siemens Healthcare Gmbh | Anonymous and Secure Classification Using a Deep Learning Network |
US10733530B2 (en) | 2016-12-08 | 2020-08-04 | Resurgo, Llc | Machine learning model evaluation in cyber defense |
CN110506262A (zh) * | 2017-06-12 | 2019-11-26 | 谷歌有限责任公司 | 使用机器学习模型的情境感知聊天历史协助 |
US11023593B2 (en) * | 2017-09-25 | 2021-06-01 | International Business Machines Corporation | Protecting cognitive systems from model stealing attacks |
US10796228B2 (en) * | 2017-09-29 | 2020-10-06 | Oracle International Corporation | Machine-learning-based processing of de-obfuscated data for data enrichment |
US10475169B2 (en) * | 2017-11-28 | 2019-11-12 | Adobe Inc. | High dynamic range illumination estimation |
US10535120B2 (en) * | 2017-12-15 | 2020-01-14 | International Business Machines Corporation | Adversarial learning of privacy protection layers for image recognition services |
US10748247B2 (en) * | 2017-12-26 | 2020-08-18 | Facebook, Inc. | Computing high-resolution depth images using machine learning techniques |
US10475538B2 (en) * | 2018-01-11 | 2019-11-12 | Siemens Healthcare Gmbh | System for predicting computed tomography data from surface data |
US10709394B2 (en) * | 2018-01-15 | 2020-07-14 | Siemens Healthcare Gmbh | Method and system for 3D reconstruction of X-ray CT volume and segmentation mask from a few X-ray radiographs |
US10535141B2 (en) * | 2018-02-06 | 2020-01-14 | Google Llc | Differentiable jaccard loss approximation for training an artificial neural network |
-
2018
- 2018-07-26 KR KR1020180086929A patent/KR102035796B1/ko active IP Right Grant
-
2019
- 2019-05-03 WO PCT/KR2019/005364 patent/WO2020022619A1/ko active Application Filing
- 2019-07-17 US US16/513,725 patent/US10635788B2/en active Active
- 2019-07-17 US US16/513,715 patent/US10747854B2/en active Active
- 2019-07-19 CN CN201980005836.1A patent/CN111373403B/zh active Active
- 2019-07-19 WO PCT/KR2019/008937 patent/WO2020022703A1/en active Application Filing
- 2019-07-19 WO PCT/KR2019/008939 patent/WO2020022704A1/en unknown
- 2019-07-19 JP JP2020562066A patent/JP7040712B2/ja active Active
- 2019-07-19 EP EP19765402.3A patent/EP3827366B1/en active Active
- 2019-07-19 EP EP19765400.7A patent/EP3827365A4/en active Pending
- 2019-07-19 JP JP2020564388A patent/JP7041823B2/ja active Active
-
2020
- 2020-03-03 US US16/807,168 patent/US10896246B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080085731A (ko) * | 2007-03-19 | 2008-09-24 | 소니 가부시끼 가이샤 | 화상 처리 장치, 화상 처리 방법 |
KR101784265B1 (ko) * | 2016-06-09 | 2017-10-12 | 주식회사 그리즐리 | 빅데이터의 비식별화 처리 방법 |
JP2018106216A (ja) * | 2016-12-22 | 2018-07-05 | 日本電信電話株式会社 | 学習データ生成装置、開発データ生成装置、モデル学習装置、それらの方法、及びプログラム |
KR101861520B1 (ko) * | 2017-03-15 | 2018-05-28 | 광주과학기술원 | 얼굴 비식별화 방법 |
KR101877372B1 (ko) * | 2017-05-19 | 2018-07-13 | 주식회사 하루컴퍼니 | 워터마크 데이터의 임베딩 및 추출 방법 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210019914A (ko) * | 2019-08-13 | 2021-02-23 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치 |
KR102260039B1 (ko) | 2019-08-13 | 2021-06-03 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치 |
KR102184787B1 (ko) * | 2019-10-24 | 2020-12-01 | 주식회사 딥핑소스 | 개인 정보를 보호하기 위하여 원본 데이터를 컨실링 처리하여 생성된 변조 데이터를 인식하기 위해 사용되는 사용자 러닝 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치 |
WO2022065817A1 (en) * | 2020-09-25 | 2022-03-31 | Deeping Source Inc. | Methods for training and testing obfuscation network capable of performing distinct concealing processes for distinct regions of original image and learning and testing devices using the same |
KR20220052839A (ko) * | 2020-10-21 | 2022-04-28 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 |
KR20220052838A (ko) * | 2020-10-21 | 2022-04-28 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 |
KR102395452B1 (ko) | 2020-10-21 | 2022-05-10 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 비식별 처리한 변조 데이터를 인식하기 위한 사용자 러닝 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 |
KR102412832B1 (ko) | 2020-10-21 | 2022-06-27 | 주식회사 딥핑소스 | 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 |
KR20220073582A (ko) * | 2020-11-26 | 2022-06-03 | 주식회사 딥핑소스 | 원본 의료 이미지의 영역별로 서로 다른 컨실링 프로세스가 수행되도록 하여 원본 의료 이미지를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치 |
KR102531368B1 (ko) | 2020-11-26 | 2023-05-12 | 주식회사 딥핑소스 | 원본 의료 이미지의 영역별로 서로 다른 컨실링 프로세스가 수행되도록 하여 원본 의료 이미지를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치 |
US11886955B2 (en) | 2022-02-16 | 2024-01-30 | Protopia AI, Inc. | Self-supervised data obfuscation in foundation models |
KR102648905B1 (ko) | 2023-02-21 | 2024-03-18 | (주)이지서티 | 프라이버시 보호 수준을 설정할 수 있는 데이터 변조 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
US10635788B2 (en) | 2020-04-28 |
EP3827366A1 (en) | 2021-06-02 |
JP7041823B2 (ja) | 2022-03-25 |
US10747854B2 (en) | 2020-08-18 |
US20200201957A1 (en) | 2020-06-25 |
WO2020022703A1 (en) | 2020-01-30 |
US20200034520A1 (en) | 2020-01-30 |
JP2021523489A (ja) | 2021-09-02 |
EP3827366C0 (en) | 2024-02-07 |
JP2021512442A (ja) | 2021-05-13 |
US10896246B2 (en) | 2021-01-19 |
WO2020022704A1 (en) | 2020-01-30 |
CN111373403B (zh) | 2024-04-23 |
CN111373403A (zh) | 2020-07-03 |
EP3827365A1 (en) | 2021-06-02 |
EP3827366A4 (en) | 2022-06-08 |
EP3827366B1 (en) | 2024-02-07 |
EP3827365A4 (en) | 2022-04-27 |
JP7040712B2 (ja) | 2022-03-23 |
US20200034565A1 (en) | 2020-01-30 |
WO2020022619A1 (ko) | 2020-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102035796B1 (ko) | 데이터를 비식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 | |
KR102183335B1 (ko) | 프라이버시를 위하여 데이터를 컨실링 처리할 수 있는 변조 네트워크에 대응되는 적응 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치 | |
KR102184787B1 (ko) | 개인 정보를 보호하기 위하여 원본 데이터를 컨실링 처리하여 생성된 변조 데이터를 인식하기 위해 사용되는 사용자 러닝 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고 이를 이용한 학습 장치 및 테스트 장치 | |
US11017319B1 (en) | Method for training obfuscation network which conceals original data to be used for machine learning and training surrogate network which uses obfuscated data generated by obfuscation network and method for testing trained obfuscation network and learning device and testing device using the same | |
KR102412832B1 (ko) | 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 | |
EP4009278A1 (en) | Method for producing labeled image from original image while preventing private information leakage of original image and server using the same | |
KR102412829B1 (ko) | 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조 네트워크를 학습하는 방법 및 테스팅하는 방법, 그리고, 이를 이용한 학습 장치 및 테스팅 장치 | |
KR102107021B1 (ko) | 데이터를 식별 처리하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 | |
US11244248B1 (en) | Method for training and testing user learning network to be used for recognizing obfuscated data created by obfuscating original data to protect personal information and user learning device and testing device using the same | |
US11366930B1 (en) | Method for training and testing obfuscation network capable of obfuscating data to protect personal information, and learning device and testing device using the same | |
US11423643B1 (en) | Method for generating obfuscated image to be used in training learning net work and labeling device using the same | |
KR20230121974A (ko) | 개인 정보 보호를 위하여 원본 데이터를 변조하는 변조네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치 | |
KR102244190B1 (ko) | 데이터를 컨실링 처리하는 방법 및 이를 이용한 데이터 변조 장치 | |
KR102260039B1 (ko) | 개인 정보 보호를 위하여 원본 데이터를 컨실링 처리하는 변조 네트워크를 학습하는 방법 및 테스트하는 방법, 그리고, 이를 이용한 학습 장치 및 테스트 장치 | |
KR20200072760A (ko) | 이미지 분석 기반 객체 인식을 이용한 사용자 인증 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |