KR101711882B1

KR101711882B1 - 악성 취약점 파일을 검출하기 위한 방법, 장치 및 단말기

Info

Publication number: KR101711882B1
Application number: KR1020150166482A
Authority: KR
Inventors: 즈앙 장; 창쿤 즈하오; 리앙 카오; 지키앙 동
Original assignee: 이윤티안 시오., 엘티디.
Priority date: 2015-06-30
Filing date: 2015-11-26
Publication date: 2017-03-03
Also published as: JP6138896B2; US10176323B2; JP2017016626A; CN106295337B; CN106295337A; KR20170003356A; US20170004306A1

Abstract

본 발명은 악성 취약점 파일을 검출하기 위한 방법, 장치 및 단말기를 개시한다. 상기 방법의 일 구체적 실시예는, 검출할 파일을 획득하고, 상기 검출할 파일의 엔트로피 벡터를 확정하며, 트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하여 상기 검출할 파일이 악성 취약점 파일인지 확정하되, 상기 검출할 파일의 파일 유형과 상기 검출 모형에 대응하는 파일 유형은 동일하다. 해당 실시예는 검출할 파일의 엔트로피 벡터를 추출하고, 검출할 파일의 엔트로피 벡터를 기반으로 해당 검출할 파일이 악성 취약점 파일인지 확정한다. 기존의 기술에서의 악성 취약점 파일에 대한 스캐닝 속도가 늦고, 스캐닝 능력 및 효율이 낮은 기술적 문제들을 해소하고 악성 취약점 파일의 스캐닝 효율을 향상 시킨다.

Description

악성 취약점 파일을 검출하기 위한 방법, 장치 및 단말기{METHOD, DEVICE AND TERMINAL DEVICE FOR DETECTING A MALICIOUS VULNERABILITY FILE}

본 발명은 통상적으로 컴퓨터 기술 분야에 관한 것으로, 보다 상세하게는 취약점 검출 기술 분야에 관한 것이며, 특히 악성 취약점 파일을 검출하기 위한 방법, 장치 및 단말기이다.

현재, 컴퓨터 기술이 부단히 발전함에 따라, 컴퓨터는 사람들의 일상생활 속에 광범위하게 응용되고 있으며, 그의 기능 또한 점점 다양해짐으로써 사람들의 생활과 공작에 없어서는 안 될 중요한 도구로 자리 매김을 하였다. 그러나, 일부 사람 또는 단체에서는 선진적 공격 수단을 이용하여 특정 목표물에 대해 장기적이고 지속적인 인터넷 공격을 진행함으로써 악성 코드의 실행 및 민감 정보의 노출을 초래하여 인터넷 안전을 위협하였다.

기존의 악성 취약점 파일을 검출하는 방법은 정적 검출 방법과, 동적으로 실행하는 검출 방법과 같은 두 가지 유형으로 구분되고 있다. 정적 특징을 검출하는 방법은 비교적 자주 이용되는 방법으로, A) 파일 형식의 이상 여부를 통하여 이상 문서를 검출하는 방법; 및 B) 취약점이 이용하는 파일의 고정 특징을 검출하여 이상 문서를 검출하는 방법과 같은 두 가지 방법이 존재한다. 동적으로 검출하는 방법은 일종의 계발적 검출 방법이다. 비교적 고급의 계발적 환경에서는 시뮬레이션 환경을 이용하여 실행할 문서를 실행하고 정상적인 문서에 존재하지 않을 동작들을 검출한다. 문서가 쉘코드(shellcode)(기입 데이터, 취약점 코드에 속함)를 유발할 경우는, 예를 들면, 인터넷을 연결하는 동작, 프로그램을 실행하는 동작, 프로세스를 주입하는 동작 등 문서 자체에 존재하지 않을 동작들이 존재함을 의미한다.

그러나, 정적 검출 방법에 있어서, 문서 구조를 구성하고 쉘코드(shellcode)를 변화함으로써 정적 검출 방법을 아주 쉽게 우회할 수 있다. 따라서, 정적 검출 방법의 계발적 스캐닝 능력은 매우 낮으며, 새로 발생한 악성 취약점 파일에 대해 아무런 스캐닝 능력도 구비하지 못한다. 동적으로 검출을 실행하는 방법에 있어서, 여러 가지 방법으로 동적으로 실행되는 시뮬레이션 환경을 검출할 수 있어, 상응한 바이러스 코드를 유발하지 않으므로 검출 실패를 초래한다. 따라서, 동적으로 검출을 실행하는 방법은 일정한 계발 능력을 구비하나, 효율이 낮고, 속도가 느리며 계발 능력이 너무 높지 못하다.

본 발명은 기존의 기술 중 악성 취약점 파일에 대한 스캐닝 속도가 늦고, 스캐닝 능력 및 효율이 낮은 기술적 문제들을 해소하는 악성 취약점 파일을 검출하기 위한 방법, 장치 및 단말기를 제공하고자 한다.

제1 방면에 있어서, 본 발명은 악성 취약점 파일을 검출하기 위한 방법을 제공한다. 상기 방법은, 검출할 파일을 획득하는 단계; 상기 검출할 파일의 엔트로피 벡터를 확정하는 단계; 및 트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하여 상기 검출할 파일이 악성 취약점 파일인지 확정하는 단계를 포함하되, 상기 검출할 파일의 파일 유형과 상기 검출 모형에 대응하는 파일 유형은 동일하다.

일부 실시예에 있어서, 상기 검출 모형은, 파일 유형이 동일하고 안전 유형이 알려진 다수의 파일을 트레이닝 파일로 획득하고, 상기 안전 유형에 따라 상기 트레이닝 파일에 대해 안전 유형의 표시를 진행하고, 상기 트레이닝 파일의 엔트로피 벡터를 확정하고, 상기 트레이닝 파일의 엔트로피 벡터 및 안전 유형 표시를 기반으로 상기 검출 모형을 트레이닝하여 출력하는 방식으로 획득하되, 상기 안전 유형은 악성 취약점 파일 유형 및 비악성 취약점 파일 유형을 포함한다.

일부 실시예에 있어서, 상기 검출 모형을 트레이닝하여 출력하는 단계는, 상기 트레이닝 파일의 엔트로피 벡터 및 안전 유형 표시를 기반으로 초기 검출 모형을 획득하는 단계; 상기 초기 검출 모형의 오판율이 기정 역치보다 작은지 측정하는 단계; 상기 오판율이 상기 기정 역치보다 작지 않을 경우, 현재 검출 모형을 수정하는 단계 및 수정된 검출모형의 오판율이 상기 기정 역치보다 작은지 측정하는 단계를 순환적으로 진행하는 단계; 및 상기 수정된 검출 모형의 오판율이 상기 기정 역치보다 작음에 대응하여, 순환을 정지하고 상기 수정된 검출 모형을 출력하는 단계를 포함한다.

일부 실시예에 있어서, 상기 초기 검출 모형을 획득하는 단계는, 제1 파일로 트레이닝 파일로부터 부분적 파일을 획득하는 단계; 상기 제1 파일의 엔트로피 벡터에 대해 특징 분류를 진행하는 단계; 및 상기 특징 분류의 결과 및 상기 제1 파일의 안전 유형 표시를 기반으로 상기 초기 검출 모형을 습득하는 단계를 포함한다.

일부 실시예에 있어서, 검출 모형의 오판율이 상기 기정 역치보다 작은지 측정하는 단계는, 제2 파일로 상기 트레이닝 파일로부터 부분적 파일을 획득하는 단계; 측정할 검출 모형을 이용하여 상기 제2 파일의 엔트로피 벡터를 검출하는 단계; 검출 결과 및 상기 제2 파일의 안전 유형 표시에 의하여 오판율을 확정하는 단계; 및 상기 오판율과 상기 기정 역치를 비교하여 상기 오판율이 상기 기정 역치보다 작은지 확정하는 단계를 포함하되, 상기 제2 파일은 상기 제1 파일을 포함하지 않는다.

일부 실시예에 있어서, 상기 현재 검출 모형을 수정하는 단계는, 상기 제1 파일의 수량을 증가하여 검출 모형을 다시 습득하는 단계; 및 엔트로피 벡터의 차원 수를 조정하여 검출 모형을 다시 습득하는 단계 중 적어도 하나를 포함한다.

일부 실시예에 있어서, 파일의 엔트로피 벡터는, 파일을 기정 수량의 섹션으로 분할하고, 각 섹션의 엔트로피를 획득하고, 상기 섹션의 수량을 엔트로피 벡터의 차원 수로 하고, 각 섹션을 하나의 엔트로피 벡터의 방향에 대응하고, 각 섹션의 엔트로피를 기반으로 파일의 엔트로피 벡터를 확정하는 방식으로 확정한다.

제2 방면에 있어서, 본 발명은 악성 취약점 파일을 검출하기 위한 장치를 제공한다. 상기 장치는, 검출할 파일을 획득하는 획득 유닛; 상기 검출할 파일의 엔트로피 벡터를 확정하는 확정 유닛; 트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하여 상기 검출할 파일이 악성 취약점 파일인지 확정하는 검출 유닛을 포함하되, 상기 검출할 파일의 파일 유형과 상기 검출 모형에 대응하는 파일 유형은 동일하다.

일부 실시예에 있어서, 상기 검출 모형은, 트레이닝 파일로 파일 유형이 동일하고 안전 유형이 알려진 다수의 파일을 획득하고, 상기 안전 유형에 따라 상기 트레이닝 파일에 대해 안전 유형의 표시를 진행하고, 상기 트레이닝 파일의 엔트로피 벡터를 확정하고, 상기 트레이닝 파일의 엔트로피 벡터 및 안전 유형 표시를 기반으로 상기 검출 모형을 트레이닝하여 출력하는 방식으로 획득하되, 상기 안전 유형은 악성 취약점 파일 유형 및 비악성 취약점 파일 유형을 포함한다.

일부 실시예에 있어서, 상기 확정 유닛은, 파일을 기정 수량의 섹션으로 분할하고, 각 섹션의 엔트로피를 획득하고, 상기 섹션의 수량을 엔트로피 벡터의 차원 수로 하고, 각 섹션을 하나의 엔트로피 벡터의 방향에 대응하고, 각 섹션의 엔트로피를 기반으로 파일의 엔트로피 벡터를 확정한다.

제3 방면에 있어서, 본 발명은 악성 취약점 파일을 검출하기 위한 단말기를 제공한다. 상기 단말기는, 프로세서 및 메모리 장치를 포함하되, 상기 메모리 장치는 트레이닝 된 검출 모형을 저장하고, 상기 프로세서는 검출할 파일을 획득하고, 상기 검출할 파일의 엔트로피 벡터를 확정하고, 트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하여 상기 검출할 파일이 악성 취약점 파일인지 확정하되, 상기 검출할 파일의 파일 유형과 상기 검출 모형에 대응하는 파일 유형은 동일하다.

본 발명은 악성 취약점 파일을 검출하기 위한 방법, 장치 및 단말기를 제공한다. 본 발명에 있어서, 검출할 파일의 엔트로피 벡터를 추출하고, 검출할 파일의 엔트로피 벡터를 기반으로 해당 검출할 파일이 악성 취약점 파일인지 확정한다. 기존의 기술 중 악성 취약점 파일에 대한 스캐닝 속도가 늦고, 스캐닝 능력 및 효율이 낮은 기술적 문제들을 해소하고 악성 취약점 파일의 스캐닝 효율을 향상 시킨다.

본 발명의 기타 특징, 목적 및 장점들은 하기 도면을 결합하여 진행하는 비제한적 실시예들에 대한 구제적인 설명을 통하여 더욱 명확해 질 것이다.
도1은 본 발명의 실시예가 제공하는 악성 취약점 파일을 검출하기 위한 방법의 일 실시예의 흐름도이다.
도2는 본 발명의 실시예가 제공하는 악성 취약점 파일 내용의 엔트로피 곡선 변화의 예시도이다.
도3은 본 발명의 실시예가 제공하는 쉘코드(shellcode)를 포함하는 파일의 내용의 엔트로피 곡선 변화의 예시도이다.
도4는 본 발명의 실시예가 제공하는 검출 모형을 획득하는 방법의 일 실시예의 흐름도이다.
도5는 본 발명의 실시예가 제공하는 악성 취약점 파일을 검출하기 위한 장치의 일 실시예의 예시적 구조도이다.
도6은 본 발명의 실시예가 제공하는 단말기의 일 실시예의 예시적 구조도이다.

이하, 첨부된 도면 및 실시예들을 결합하여 본 발명을 상세히 설명하기로 한다. 본 명세서에 설명된 구체적인 실시예들은 오직 해당 발명을 설명하기 위한 것일 뿐, 해당 발명을 한정하기 위한 것이 아님을 이해하여야 할 것이다. 또한, 설명의 편의를 위하여, 도면에는 오직 본 발명에 관련된 부분만이 도시되어 있다.

본 발명의 실시예 및 실시예의 특징들은 서로 모순되지 않는 한 상호 조합될 수 있다. 이하, 첨부된 도면을 참조하여 본 발명의 실시예들을 상세히 설명하기로 한다.

본 발명에 관한 단말기는 스마트 폰, 태블릿 PC, PDA, 랩톱 휴대용 컴퓨터 및 데스크톱 컴퓨터를 포함할 수 있으나, 이에 한정된 것은 아니다. 설명의 목적 및 간명을 위하여, 이하의 설명에서는 데스크톱 컴퓨터를 결합하여 본 발명의 예시적 실시예를 설명하고자 한다.

도1은 본 발명에 따른 악성 취약점 파일을 검출하기 위한 방법의 일 실시예의 흐름(100)을 도시한다.

도1에 도시된 바와 같이, 단계(101)에서, 검출할 파일을 획득한다.

다음, 단계(102)에서, 검출할 파일의 엔트로피 벡터를 확정한다.

일반적으로, 악성 취약점 파일은 문서에서 대량의 중복된 문자열을 구성하고 ROP(Return-oriented programming, 반환 지향 프로그래밍)을 구성하며 기타 모듈 중의 코드를 실행함으로써, DEP(Data Execution Prevention, 데이터 실행 방지)를 우회하여 비리온을 방출한다.

본 실시예에서, 일부 악성 취약점 파일에 대해 심도 깊은 분석을 진행함으로써, 구성된 의심스러운 파일이 바이러스 파일의 암호화를 파일의 종단에 위치시켜 이 부분 내용의 엔트로피가 필연코 매우 크며 대량의 중복된 데이터가 기입됨으로 인하여 파일의 엔트로피 곡선이 종단에 돌연 증가함을 발견하였다.

예를 들면, 도2는 악성 취약점 파일 내용의 엔트로피 곡선 변화의 예시도이다. 도2에 도시된 바와 같이, 횡좌표는 파일 내용의 세그먼트의 위치를 표시하고, 횡좌표의 원점은 파일 헤더의 위치를 표시하며, 횡좌표의 값이 클수록 문서의 내용 세그먼트가 더욱 뒤로 미치게 된다. 종좌표는 파일 중 횡좌표 위치의 내용 세그먼트에 대응되는 엔트로피를 표시한다. 도2로부터 알 수 있는바, 악성 취약점 파일 내용은 종단 위치의 세그먼트의 엔트로피에 돌연 증가한다.

또한 예를 들면, 도3은 쉘코드(shellcode)를 포함한 파일의 내용 엔트로피 곡선 변화의 예시도이다. 도3에 도시된 바와 같이, 횡좌표는 파일 내용의 세그먼트의 위치를 표시하고, 횡좌표의 원점은 파일 헤더의 위치를 표시하며, 횡좌표의 값이 클수록 문서의 내용 세그먼트가 더욱 뒤로 미치게 된다. 종좌표는 파일 중 횡좌표 위치의 내용 세그먼트에 대응되는 엔트로피를 표시한다. 도3으로부터 알 수 있는 바와 같이, 쉘코드(shellcode)를 포함하는 파일의 내용 엔트로피는 대량의 연속되는 4 근처의 데이터를 포함한다.

따라서, 본 실시예에서, 검출할 파일의 엔트로피 벡터의 특징에 의하여 검출할 파일이 악성 취약점 파일인지 판단할 수 있다.

파일 세그먼트의 엔트로피는 해당 파일 세그먼트의 무질서 정도, 문자, 그래픽, 코드, 압축 패키지, 응용 프로그램 등을 표시하고, 조직하는 방식이 부동함에 따라 엔트로피도 부동함을 설명하고자 한다. 예를 들면, 그래픽이 압축되고 압축 패키지도 압축되었으므로 그의 엔트로피는 매우 높을 것이고, 일정한 규율이 있을 것이다. 데이터 코드의 정보 엔트로피를 이용하여 코드의 상태를 표시할 수 있다.

본 실시예에서, 하기와 같은 방식으로 파일의 엔트로피 벡터를 확정할 수 있다. 먼저, 파일을 기정 수량의 섹션으로 등가 분할하고, 각 섹션의 메세지 엔트로피를 산출하여 전체 파일 코드의 변화 정황을 표시한다. 여기서, 기정 수량은 사용자가 미리 설정한 하나의 값일 수 있고, 본 발명은 기정 수량의 구체적 수치를 한정하지 않음을 이해하여야 한다. 상기 섹션의 수량을 엔트로피 벡터의 차원 수로 하고, 각 섹션은 하나의 엔트로피 벡터의 방향에 대응되며, 각 섹션의 엔트로피를 기반으로 파일의 엔트로피 벡터를 확정한다. 예를 들면, 파일을 각각 섹션i, 섹션j, 섹션k과 같은 3개의 섹션으로 등가 분할한다고 가정하면, 이 3개의 섹션에 대응되는 엔트로피를 산출한 결과가 각각 a, b, c일 경우, 해당 파일의 엔트로피 벡터는 3 차원 벡터이고, 엔트로피 벡터는

으로 표시할 수 있다.

마지막으로, 단계(103)에서, 트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하여 검출할 파일이 악성 취약점 파일인지 확정한다.

본 실시예에서, 트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하고, 검출할 파일의 엔트로피 벡터의 특징을 분석하며, 검출할 파일의 엔트로피 벡터의 특징에 의하여 해당 검출할 파일이 악성 취약점 파일인지 확정할 수 있다.

악성 취약점 파일의 파일 유형이 부동하면, 그들의 엔트로피 벡터의 특징도 부동함을 설명하고자 한다. 따라서, 각종 파일 유형은 일종의 검출 모형에 대응되고, 검출할 파일을 검출할 경우, 선택된 검출 모형에 대응하는 파일 유형은 검출할 파일의 파일 유형과 동일하다.

본 발명의 상기 실시예가 제공하는 방법은, 검출할 파일의 엔트로피 벡터를 추출하고, 검출할 파일의 엔트로피 벡터를 기반으로 해당 검출할 파일이 악성 취약점 파일인지 확정한다. 기존의 기술에서의 악성 취약점 파일에 대한 스캐닝 속도가 늦고, 스캐닝 능력 및 효율이 낮은 기술적 문제들을 해소하고 악성 취약점 파일의 스캐닝 효율을 향상 시킨다.

도4는 검출 모형을 획득하는 방법의 일 실시예를 보여주기 위한 흐름도(400)이다.

도4에 도시된 바와 같이, 단계(401)에서, 트레이닝 파일로 파일 유형이 동일하고 안전 유형이 알려진 다수의 파일들을 획득한다.

본 실시예에서, 트레이닝 파일로 파일 유형이 동일한 다수의 파일들을 임의로 획득하고, 이러한 파일들의 안전 유형은 이미 알려지되, 안전 유형은 악성 취약점 파일 유형 및 비악성 취약점 파일 유형을 포함한다. 상기 트레이닝 파일의 안전 유형은 기타 방법으로 획득할 수도 있음을 설명하고자 한다. 본 발명은 상기 트레이닝 파일의 안전 유형을 확정하는 구체적 방법을 한정하지 않음을 이해하여야 한다.

다음, 단계(402)에서, 안전 유형에 따라 상기 트레이닝 파일에 대해 안전 유형의 표시를 진행한다.

본 실시예에서, 트레이닝 파일의 안전 유형에 따라 상기 트레이닝 파일에 대해 표시를 진행하고, 본 실시예의 일 구현에서, 특수한 색상을 이용하여 트레이닝 파일에 대해 안전 유형의 표시를 진행할 수 있고, 부동한 색상은 부동한 안전 유형을 표시한다. 본 실시예의 다른 일 구현에서, 특수 부호를 이용하여 안전 유형을 표시할 수 있고, 부동한 부호는 부동한 안전 유형을 표시한다. 기타 방식을 이용하여 상기 트레이닝 파일에 대해 안전 유형의 표시를 진행할 수 있으며 본 발명은 이를 한정하지 않음을 이해하여야 한다.

다음, 단계(403)에서, 상기 트레이닝 파일의 엔트로피 벡터를 확정한다.

마지막으로, 단계(404)에서, 상기 트레이닝 파일의 엔트로피 벡터와 안전 유형 표시를 기반으로 검출 모형을 트레이닝하여 출력한다.

본 실시예에서, 먼저, 상기 트레이닝 파일의 엔트로피 벡터와 안전 유형 표시를 기반으로 초기 검출 모형을 획득한다. 구체적으로, 제1 파일로 트레이닝 파일로부터 부분적 파일을 획득하고, 제1 파일의 엔트로피 벡터를 특징 분류한다. SVM(Support Vector Machine, 서포트 벡터 머신) 함수를 이용하여 제1 파일의 엔트로피 벡터를 특징 분류할 수 있다. 기타 방식을 이용하여 제1 파일의 엔트로피 벡터를 특징 분류할 수도 있으며, 본 발명은 특징 분류에 이용되는 구체적 방식, 방면을 한정하지 않음을 이해하여야 한다. 다음, 특징 분류의 결과 및 제1 파일의 안전 유형 표시를 기반으로 초기 검출 모형 습득한다.

다음, 상기 초기 검출 모형의 오판율이 기정 역치보다 작은지 측정한다. 구체적으로, 제2 파일(제2 파일은 제1 파일을 포함하지 않음)로 트레이닝 파일 중 제1 파일을 포함하지 않는 부분적 파일로부터 다수의 파일을 획득하고, 초기 검출 모형(측정할 검출 모형)을 이용하여 각 제2 파일의 엔트로피 벡터를 검출하고, 각 제2 파일의 안전 유형을 판단한다. 다음, 초기 검출 모형 판단 결과와 각 제2 파일의 안전 유형 표시를 비교한다. 초기 검출 모형의 판단 결과가 해당 제2 파일의 안전 유형 표시에 대응하는 안전 유형과 일치할 경우, 해당 판단 결과는 정확한 것이다. 초기 검출 모형의 판단 결과가 해당 제2 파일의 안전 유형 표시에 대응하는 안전 유형과 일치하지 않을 경우, 해당 판단 결과는 잘못된 것이다. 측정한 총 횟수에서 잘못된 판단 결과가 발생하는 횟수를 나누어 해당 초기 검출 모형의 오판율을 획득한다. 오판율과 기정 역치를 비교하여 오판율이 기정 역치보다 작은지 확정한다.

따라서, 초기 검출 모형의 오판율이 기정 역치보다 크거나 같을 경우, 해당 모형의 정확도가 부족함을 설명하고, 따라서, 현재 검출 모형을 수정하는 단계 및 수정된 검출 모형의 오판율이 기정 역치보다 작은지 측정하는 단계를 순환적으로 진행한다. 구체적으로, 현재 검출 모형을 수정하는 단계는, 제1 파일의 수량을 증가하여 검출 모형을 다시 습득하는 단계 및 엔트로피 벡터의 차원 수를 조정하고 검출 모형을 다시 습득하는 단계 중 적어도 하나를 포함할 수 있다.

마지막으로 수정된 검출 모형의 오판율이 기정 역치보다 작으면, 해당 모형의 정확도가 이미 조건에 만족함을 설명하므로 순환을 정지하고 수정된 검출 모형을 출력한다.

도면에는 특정 순서로 본 발명 방법의 조작을 설명하였으나, 상기 특정 순서로 이러한 조작을 진행하여야 하는 것을 요구하거나 암시하는 것이 아니며 또한 도시된 모든 조작을 실행하여야만 기대하는 결과를 실현할 수 있는 것이 아님에 주의하여야 한다. 반대로, 흐름도에 도시된 단계의 실행 순서는 바뀔 수 있다. 예를 들면, 도4의 흐름도(400)에서, 단계(403)을 먼저 진행하여 상기 트레이닝 파일의 엔트로피 벡터를 확정하고, 단계(402)를 진행하여 안전 유형에 따라 상기 트레이닝 파일에 대해 각각 안전 유형의 표시를 진행할 수 있다. 부가적으로 또는 대안으로, 일부 단계를 생략할 수 있으며 다수의 단계를 한 단계로 병합하여 실행할 수 있으며, 및/또는 한 단계를 다수의 단계로 분할하여 실행할 수 있다.

도5는 본 발명에 따른 악성 취약점 파일을 검출하기 위한 장치의 일 실시예의 예시적 구조도이다.

도5에 도시된 바와 같이, 본 실시예의 장치(500)는, 획득 유닛(501)，확정 유닛(502) 및 검출 유닛(503)을 포함한다. 여기서, 획득 유닛(501)은 검출할 파일을 획득한다. 확정 유닛(502)은 검출할 파일의 엔트로피 벡터를 확정한다. 검출 유닛(503)은 트레이닝 된 검출 모형을 이용하여 검출할 파일의 엔트로피 벡터를 검출하여 검출할 파일이 악성 취약점 파일인지 확정하되, 검출할 파일의 파일 유형과 검출 모형에 대응하는 파일 유형은 동일하다.

일부 선택적 실시예에서, 검출 모형은 하기와 같은 방식으로 획득한다. 트레이닝 파일로 파일 유형이 동일하고 안전 유형이 알려진 다수의 파일들을 획득한다. 여기서, 안전 유형은 악성 취약점 파일 유형 및 비악성 취약점 파일 유형을 포함한다. 안전 유형에 따라 트레이닝 파일에 대해 안전 유형의 표시를 진행한다. 트레이닝 파일의 엔트로피 벡터를 획득한다. 트레이닝 파일의 엔트로피 벡터와 안전 유형 표시를 기반으로 검출 모형을 트레이닝하여 출력한다.

일부 선택적 실시예에서, 검출 모형을 트레이닝하여 출력하는 단계는, 트레이닝 파일의 엔트로피 벡터와 안전 유형 표시를 기반으로 초기 검출 모형을 획득하는 단계를 포함한다. 초기 검출 모형의 오판율이 기정 역치보다 작은지 측정한다. 작지 않을 경우, 현재 검출 모형을 수정하는 단계 및 수정된 검출 모형이 오판율이 기정 역치보다 작은지 측정하는 단계를 순환적으로 진행한다. 수정된 검출 모형의 오판율이 기정 역치보다 작음에 대응하여 순환을 정지하고 상기 수정된 검출 모형을 출력한다.

일부 선택적 실시예에서, 초기 검출 모형을 획득하는 단계는, 제1 파일로 트레이닝 파일로부터 부분적 파일을 획득하는 단계를 포함한다. 제1 파일의 엔트로피 벡터에 대해 특징 분류를 진행한다. 특징 분류의 결과 및 제1 파일의 안전 유형 표시를 기반으로 초기 검출 모형을 습득한다.

일부 선택적 실시예에서, 검출 모형의 오판율이 기정 역치보다 작은지 측정하는 단계는, 제2 파일로 트레이닝 파일로부터 부분적 파일을 획득하는 단계를 포함한다. 측정할 검출 모형을 이용하여 제2 파일의 엔트로피 벡터를 검출한다. 검출한 경과 및 제2 파일의 안전 유형 표시에 의하여 오판율을 확정한다. 오판율과 기정 역치를 비교하여 오판율이 기정 역치보다 작은지 확정한다. 여기서, 제2 파일은 제1 파일을 포함하지 않는다.

일부 선택적 실시예에서, 현재 검출 모형을 수정하는 단계는, 제1 파일의 수량을 증가하여 검출 모형을 다시 습득하는 단계 및 엔트로피 벡터의 차원 수를 조정하고 검출 모형을 다시 습득하는 단계 중의 적어도 하나를 포함할 수 있다.

일부 선택적 실시예에서, 확정 유닛은 파일을 기정 수량의 섹션으로 분할하고, 각 섹션의 엔트로피를 획득하고, 섹션의 수량을 엔트로피 벡터의 차원 수로 하고, 각 섹션이 하나의 엔트로피 벡터의 방향에 대응하고, 각 섹션의 엔트로피를 기반으로 파일의 엔트로피 벡터를 확정하도록 설정된다.

장치(500)에 기재된 모듈 또는 유닛은 도1 내지 도4를 참조하여 설명한 방법 중의 각 단계에 대응되는 것이 응당 자명할 것이다. 따라서, 상기 방법에 대해 설명한 조작 및 특징 또한 장치(500) 및 이에 포함된 모듈에 적용될 수 있으므로, 중복된 설명은 생략한다. 장치(500)은 단말기에 미리 설치될 수 있고, 다운로드 등의 방식을 통하여 단말기에 로딩될 수도 있다. 장치(500) 중의 상응하는 모듈 또는 유닛은 단말기 중의 유닛과 서로 조합되어 본 발명의 실시예의 방안을 실현할 수 있다.

도6은 본 발명에 따른 단말기의 일 실시예의 예시적 구조도이다.

도6에 도시된 바와 같이, 본 실시예의 단말기(600)는, 적어도 하나의 프로세서(601) (예를 들면, CPU(Central Processing Unit, 중앙 처리 유닛), 적어도 하나의 통신 인터페이스(602), 적어도 하나의 사용자 인터페이스(603), 메모리 장치(604), 적어도 하나의 통신 버스라인(605)을 포함한다. 통신 버스라인(605)은 상기 어셈블리 사이의 연결 통신을 실현한다. 단말기(600)는 표시 어셈블리, 키보드 또는 클릭 장치(예를 들면, 마우스, 트랙 볼(trackball), 터치 패널 또는 터치 스크린) 등과 같은 사용자 인터페이스(603)를 선택적으로 포함할 수 있다. 메모리 장치(604)는 고속 RAM(Random Access Memory, 랜덤 액세스 메모리 장치)을 포함할 수 있고, 불휘발성 메모리 장치(non-volatile memory), 예를 들면, 적어도 하나의 자기 디스크 메모리 장치를 포함할 수도 있다. 메모리 장치(604)는 전술한 프로세서(601)로부터 이격된 메모리 장치를 선택적으로 포함할 수 있다.

일부 실시예에서, 메모리 장치(604)는 실행 가능한 모듈 또는 데이터 구조 또는 이들의 서브 집합 또는 이들의 확장 집합을 저장한다.

운영 시스템(614)은 각종 시스템 프로그램을 포함하고 각종 기초 업무를 실현하고 하드웨어에 따른 임무를 처리한다.

응용 프로그램(624)은 각종 응용 프로그램을 포함하고 각종 응용 업무를 실현한다.

본 실시예에서, 메모리 장치(604)는 트레이닝 된 검출 모형을 저장한다. 프로세서(601)는 검출할 파일을 획득하고, 검출할 파일의 엔트로피 벡터를 확정하고, 트레이닝 된 검출 모형을 이용하여 검출할 파일의 엔트로피 벡터를 검출하여 검출할 파일이 악성 취약점 파일인지 확정하되, 검출할 파일의 파일 유형과 상기 검출 모형에 대응하는 파일 유형은 동일하다.

실시예들에서, 검출 모형은 하기와 같은 방식으로 획득한다. 트레이닝 파일로 파일 유형이 동일하고 안전 유형이 알려진 다수의 파일들을 획득한다. 여기서, 안전 유형은 악성 취약점 파일 유형 및 비악성 취약점 파일 유형을 포함한다. 안전 유형에 따라 트레이닝 파일에 대해 안전 유형의 표시를 진행한다. 트레이닝 파일의 엔트로피 벡터를 확정한다. 트레이닝 파일의 엔트로피 벡터와 안전 유형 표시를 기반으로 검출 모형을 트레이닝하여 출력한다.

본 발명에 설명된 관련된 유닛 모듈은 소프트웨어 방식으로 실현할 수 있으며, 하드웨어 방식으로 실현할 수도 있다. 설명된 유닛 모듈은 프로세서에 설치될 수 있으며, 예를 들면, 프로세서가 획득 유닛, 확정 유닛, 검출 유닛을 포함한다고 설명할 수 있다. 여기서, 이러한 유닛의 명칭은 일부 경우에 해당 유닛 모듈 자체를 한정하지 않는다. 예를 들면, 획득 유닛은 "검출할 파일을 획득하는 유닛"으로 설명할 수도 있다.

한편, 본 발명은 또한 컴퓨터 판독 가능한 기록 매체를 제공한다. 이러한 컴퓨터 판독 가능한 기록 매체는 상기 실시예 중 상기 장치에 포함되는 컴퓨터 판독 가능한 기록 매체이거나, 장치에 설치되지 않은 독립적으로 존재하는 컴퓨터 판독 가능한 기록 매체일 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에는 하나 이상의 프로그램이 저장되어 있을 수 있고, 하나 이상의 프로세서는 이러한 프로그램으로 본 발명에 설명된 악성 취약점 파일을 검출하기 위한 방법을 실행한다.

이상의 설명은 오직 본 발명의 바람직한 실시예 및 이용하는 기술 원리에 대한 설명일 뿐이다. 본 발명의 청구 범위는 상기 기술적 특징의 특정 조합으로 이루어진 기술적 방안에 한정되는 것이 아니라, 본 발명의 사상을 벗어나지 않는 한 상기 기술적 특징 또는 그의 등가 특징들의 임의의 조합으로 이루어진 기타 기술적 방안도 포함하는 것이 본 분야에서 통상 지식을 가진 자에게 자명할 것이다. 상기 특징과 본 발명에 개시된 유사한 기능을 구비한 기술적 특징을 서로 교체하여 형성된 기술적 방안을 예로 들 수 있으나, 이에 한정된 것은 아니다.

Claims

검출할 파일을 획득하는 단계;
상기 검출할 파일을 기정 수량의 섹션으로 분할하는 단계;
각 섹션의 엔트로피를 획득하는 단계;
상기 각 섹션의 엔트로피를 기반으로 상기 검출할 파일의 엔트로피 벡터를 확정하는 단계; 및
트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하여 상기 검출할 파일이 악성 취약점 파일인지 확정하는 단계를 포함하되,
상기 검출할 파일의 파일 유형과 상기 검출 모형에 대응하는 파일 유형은 동일한 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 방법.
제 1 항에 있어서,
상기 검출 모형은, 파일 유형이 동일하고 안전 유형이 알려진 다수의 파일을 트레이닝 파일로 획득하고, 상기 안전 유형에 따라 상기 트레이닝 파일에 대해 안전 유형의 표시를 진행하고, 상기 트레이닝 파일의 엔트로피 벡터를 확정하고, 상기 트레이닝 파일의 엔트로피 벡터 및 안전 유형 표시를 기반으로 상기 검출 모형을 트레이닝하여 출력하는 방식으로 획득하되,
상기 안전 유형은 악성 취약점 파일 유형 및 비악성 취약점 파일 유형을 포함하는 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 방법.
제 2 항에 있어서,
상기 검출 모형을 트레이닝하여 출력하는 단계는,
상기 트레이닝 파일의 엔트로피 벡터 및 안전 유형 표시를 기반으로 초기 검출 모형을 획득하는 단계;
상기 초기 검출 모형의 오판율이 기정 역치보다 작은지 측정하는 단계;
상기 오판율이 상기 기정 역치보다 작지 않을 경우, 현재 검출 모형을 수정하는 단계 및 수정된 검출 모형의 오판율이 상기 기정 역치보다 작은지 측정하는 단계를 순환적으로 진행하는 단계; 및
상기 수정된 검출 모형의 오판율이 상기 기정 역치보다 작음에 대응하여, 순환을 정지하고 상기 수정된 검출 모형을 출력하는 단계를 포함하는 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 방법.
제 3 항에 있어서,
상기 초기 검출 모형을 획득하는 단계는,
제1 파일로 트레이닝 파일로부터 부분적 파일을 획득하는 단계;
상기 제1 파일의 엔트로피 벡터에 대해 특징 분류를 진행하는 단계; 및
상기 특징 분류의 결과 및 상기 제1 파일의 안전 유형 표시를 기반으로 상기 초기 검출 모형을 습득하는 단계를 포함하는 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 방법.
제 4 항에 있어서,
검출 모형의 오판율이 상기 기정 역치보다 작은지 측정하는 단계는,
제2 파일로 상기 트레이닝 파일로부터 부분적 파일을 획득하는 단계;
측정할 검출 모형을 이용하여 상기 제2 파일의 엔트로피 벡터를 검출하는 단계;
검출 결과 및 상기 제2 파일의 안전 유형 표시에 의하여 오판율을 확정하는 단계; 및
상기 오판율과 상기 기정 역치를 비교하여 상기 오판율이 상기 기정 역치보다 작은지 확정하는 단계를 포함하되,
상기 제2 파일은 상기 제1 파일을 포함하지 않는 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 방법.
제 5 항에 있어서,
상기 현재 검출 모형을 수정하는 단계는,
상기 제1 파일의 수량을 증가하여 검출 모형을 다시 습득하는 단계; 및
엔트로피 벡터의 차원 수를 조정하여 검출 모형을 다시 습득하는 단계 중 적어도 하나를 포함하는 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 방법.
제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
파일의 엔트로피 벡터는,
상기 섹션의 수량을 엔트로피 벡터의 차원 수로 하고, 각 섹션을 하나의 엔트로피 벡터의 방향에 대응하는 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 방법.
검출할 파일을 획득하는 획득 유닛;
상기 검출할 파일을 기정 수량의 섹션으로 분할하고, 각 섹션의 엔트로피를 획득하며, 상기 각 섹션의 엔트로피를 기반으로 상기 검출할 파일의 엔트로피 벡터를 확정하는 확정 유닛; 및
트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하여 상기 검출할 파일이 악성 취약점 파일인지 확정하는 검출 유닛을 포함하되,
상기 검출할 파일의 파일 유형과 상기 검출 모형에 대응하는 파일 유형은 동일한 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 장치.
제 8 항에 있어서,
상기 검출 모형은,
트레이닝 파일로 파일 유형이 동일하고 안전 유형이 알려진 다수의 파일을 획득하고, 상기 안전 유형에 따라 상기 트레이닝 파일에 대해 안전 유형의 표시를 진행하고, 상기 트레이닝 파일의 엔트로피 벡터를 확정하고, 상기 트레이닝 파일의 엔트로피 벡터 및 안전 유형 표시를 기반으로 상기 검출 모형을 트레이닝하여 출력하는 방식으로 획득하되,
상기 안전 유형은 악성 취약점 파일 유형 및 비악성 취약점 파일 유형을 포함하는 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 장치.
제 8 항 또는 제 9 항에 있어서,
상기 확정 유닛은,
상기 섹션의 수량을 엔트로피 벡터의 차원 수로 하고, 각 섹션을 하나의 엔트로피 벡터의 방향에 대응하는 것을 특징으로 하는 악성 취약점 파일을 검출하기 위한 장치.
프로세서 및 메모리 장치를 포함하되,
상기 메모리 장치는 트레이닝 된 검출 모형을 저장하고,
상기 프로세서는 검출할 파일을 획득하고, 상기 검출할 파일을 기정 수량의 섹션으로 분할하고, 각 섹션의 엔트로피를 획득하며, 상기 각 섹션의 엔트로피를 기반으로 상기 검출할 파일의 엔트로피 벡터를 확정하고, 트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하여 상기 검출할 파일이 악성 취약점 파일인지 확정하되, 상기 검출할 파일의 파일 유형과 상기 검출 모형에 대응하는 파일 유형은 동일한 것을 특징으로 하는 단말기.
제 11 항에 있어서,
상기 검출 모형은,
트레이닝 파일로 파일 유형이 동일하고 안전 유형이 알려진 다수의 파일을 획득하고, 상기 안전 유형에 따라 상기 트레이닝 파일에 대해 안전 유형의 표시를 진행하고, 상기 트레이닝 파일의 엔트로피 벡터를 확정하고, 상기 트레이닝 파일의 엔트로피 벡터 및 안전 유형 표시를 기반으로 상기 검출 모형을 트레이닝하여 출력하는 방식으로 획득하되, 상기 안전 유형은 악성 취약점 파일 유형 및 비악성 취약점 파일 유형을 포함하는 것을 특징으로 하는 단말기.
컴퓨터 판독 가능한 명령을 저장하는 비휘발성 컴퓨터 기록 매체에 있어서,
프로세서로 상기 컴퓨터 판독 가능한 명령을 실행할 경우, 상기 프로세서는,
검출할 파일을 획득하고,
상기 검출할 파일을 기정 수량의 섹션으로 분할하고,
각 섹션의 엔트로피를 획득하며,
상기 각 섹션의 엔트로피를 기반으로 상기 검출할 파일의 엔트로피 벡터를 확정하고,
트레이닝 된 검출 모형을 이용하여 상기 검출할 파일의 엔트로피 벡터를 검출하여 상기 검출할 파일이 악성 취약점 파일인지 확정하도록 작동 가능하되,
상기 검출할 파일의 파일 유형과 상기 검출 모형에 대응하는 파일 유형은 동일한 것을 특징으로 하는 비휘발성 컴퓨터 기록 매체.
제 13 항에 있어서,
상기 프로세서는,
트레이닝 파일로 파일 유형이 동일하고 안전 유형이 알려진 다수의 파일을 획득하고, 상기 안전 유형에 따라 상기 트레이닝 파일에 대해 안전 유형의 표시를 진행하고, 상기 트레이닝 파일의 엔트로피 벡터를 확정하고, 상기 트레이닝 파일의 엔트로피 벡터 및 안전 유형 표시를 기반으로 검출 모형을 트레이닝하여 출력하는 방식으로 상기 검출 모형을 획득하도록 작동 가능하되,
상기 안전 유형은 악성 취약점 파일 유형 및 비악성 취약점 파일 유형을 포함하는 것을 특징으로 하는 비휘발성 컴퓨터 기록 매체.