KR102499182B1 - Loan regular auditing system using artificia intellicence - Google Patents

Loan regular auditing system using artificia intellicence Download PDF

Info

Publication number
KR102499182B1
KR102499182B1 KR1020200162697A KR20200162697A KR102499182B1 KR 102499182 B1 KR102499182 B1 KR 102499182B1 KR 1020200162697 A KR1020200162697 A KR 1020200162697A KR 20200162697 A KR20200162697 A KR 20200162697A KR 102499182 B1 KR102499182 B1 KR 102499182B1
Authority
KR
South Korea
Prior art keywords
fraud
insolvency
household
audit
model
Prior art date
Application number
KR1020200162697A
Other languages
Korean (ko)
Other versions
KR20220074327A (en
Inventor
유현식
박태영
유환민
김동욱
Original Assignee
주식회사 국민은행
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 국민은행 filed Critical 주식회사 국민은행
Priority to KR1020200162697A priority Critical patent/KR102499182B1/en
Publication of KR20220074327A publication Critical patent/KR20220074327A/en
Application granted granted Critical
Publication of KR102499182B1 publication Critical patent/KR102499182B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템은, 사용자가 소정의 서류를 제출하여 가계대출 사기/부실 신청을 한 경우 신용등급 및 가계대출 사기/부실가능금액 등을 조사하여 가계대출 사기/부실거래를 시행하는 가계대출 사기/부실시스템과, 상기 가계대출 사기/부실시스템이 수행하는 가계대출 사기/부실거래에 대해서 주기적인 감사 외에 유무선 인터넷을 매개로 사기 또는 부실 거래 위험률과 그 근거항목을 고려하여 상시감사를 실시하며, 고위험군에 대하여 효율적인 영업감사를 수행할 수 있도록 지원하는 감사정보시스템과, 상기 가계대출 사기/부실시스템의 제 1 데이터베이스로부터 유무선 인터넷을 거쳐 데이터를 수집, 학습을 위한 전처리를 수행하며, 데이터를 분석 및 학습, 모델링하여 감사단말의 도움을 받아 이상거래 예측 모델을 생성, 저장하고, 이상거래 예측모델을 이용하여 상기 가계대출 사기/부실시스템의 가계대출 사기/부실거래 데이터에 대해 이상거래인지 여부를 예측하여 상기 감사정보시스템에 제공하여 상기 감사단말이 상기 감사정보시스템의 사기/부실 가계대출 사기/부실탐지 모니터링을 이용하여 가계대출 사기/부실에 대하여 상시 감사를 효율적으로 수행할 수 있게 해주는 인공지능감사분석시스템을 포함하는 것을 특징으로 한다.In the household loan fraud/insolvency regular audit support system using artificial intelligence according to an embodiment of the present invention, when a user submits a predetermined document to apply for household loan fraud/insolvency, the credit rating and the possible amount of household loan fraud/insolvency In addition to the household loan fraud/insolvency system that conducts fraudulent/insolvent transactions in household loans by investigating fraudulent/insolvent transactions, etc. An audit information system that conducts regular audits in consideration of the risk rate of insolvent transactions and its basis items, and supports efficient business audits for high-risk groups, and the first database of the above household loan fraud / insolvency system through wired and wireless Internet Collect data, perform preprocessing for learning, analyze, learn, and model data to create and store an abnormal transaction prediction model with the help of an audit terminal, and use the abnormal transaction prediction model to perform the household loan fraud/insolvency system Household loan fraud/non-performing transaction data is predicted to be an abnormal transaction and provided to the audit information system, so that the audit terminal detects household loan fraud/insolvency using the fraud/insolvent household loan fraud/insolvency detection monitoring of the audit information system. It is characterized by including an artificial intelligence audit analysis system that enables efficient regular auditing for insolvency.

Description

인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템{LOAN REGULAR AUDITING SYSTEM USING ARTIFICIA INTELLICENCE}Household loan fraud/insolvency regular audit support system using artificial intelligence {LOAN REGULAR AUDITING SYSTEM USING ARTIFICIA INTELLICENCE}

본 발명은 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템에 관한 것으로, 보다 상세하게는 이상거래 예측 정교화를 위한 머신러닝 예측 모형을 개발하고, 머신러닝 기술을 활용하여 비즈니스룰을 최적화, 신규개발하고 머신러닝 예측모형 및 비즈니스룰 자동학습 시스템을 구축하고, 기존의 규칙에서 발견되지 않는 새로운 유형의 이상거래를 연구개발할 수 있으며, 머신러닝 탑재된 분석서버와 감사시스템간 연계개발을 목적으로 하는 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템에 관한 것이다.The present invention relates to a household loan fraud/insolvency regular audit support system using artificial intelligence. It is possible to develop a machine learning prediction model and an automatic business rule learning system, to research and develop new types of abnormal transactions that are not found in existing rules, and to develop a connection between an analysis server equipped with machine learning and an audit system. It is about a household loan fraud/insolvency regular audit support system using artificial intelligence.

일반적으로 감사는 영업점 등과 같은 피감사조직의 횡령이나 유용 또는 과실 등의 각종 사고를 적발 및 예방하는 것으로써, 피감사조직 각각에 대한 일대일 방식으로 수행되었다. In general, audits were carried out on a one-to-one basis for each audited organization by detecting and preventing various accidents such as embezzlement, misappropriation, or negligence of audited organizations such as branch offices.

그러나, 일대일 감사 방식은 조직이 거대화되어 피감사조직이 증가함에 따라, 좀 더 체계적이고 효율적으로 개선될 필요성이 제기되었고, 그 결과 각 조직별로 다양한 감사 시스템이 도입되었다. However, as the number of organizations to be audited increased due to the large size of the organization, the need for more systematic and efficient improvement of the one-on-one audit method was raised. As a result, various audit systems were introduced for each organization.

그러나, 종래의 감사 시스템은 피감사조직에 대한 정보를 수집 및 취합하여 감사자에게 단순히 제공하는 것에 그치고 있는 실정이다. 게다가, 각 감사자는 장기간 미수감한 피감사조작을 2~3년 간격의 정기적인 감사를 수행하였다.However, the conventional audit system is limited to simply providing the information to the auditor after collecting and collecting information on the audited organization. In addition, each auditor performed regular audits at intervals of 2 to 3 years for audited operations that had not been imprisoned for a long time.

그러나 종래의 감사 방식은 모든 사안별로 감사자가 피감사대상을 직접적으로 검토 및 감사하여야 하므로, 시간적 지리적으로 한계에 다다르고 있는 실정이다. However, in the conventional auditing method, since the auditor has to directly review and audit the subject for each case, it is reaching its limits both temporally and geographically.

더욱이, 조직 구조 개편 또는 자산규모 증가로 인해 조직의 사업구조가 개편됨에 따라, 종래와 다른 새로운 유형의 사고가 발생하고 그 사고 금액이 거액화되고 있어 새로운 감사 시스템 구축에 대한 필요성이 제기되었다. Moreover, as the organization's business structure is reorganized due to organizational restructuring or increased asset size, a new type of accident occurs and the amount of the accident is increasing, raising the need for a new audit system.

본 발명의 배경기술은 대한민국 특허공개번호 10-2006-0086619호(2006.08.01))의 'ERP 시스템 기반의 감사정보 시스템 및 이를 이용한 감사정보 운영 방법, 그 프로그램이 기록된 기록매체'에 개시되어 있다.The background art of the present invention is disclosed in Korean Patent Publication No. 10-2006-0086619 (2006.08.01), 'ERP system-based audit information system and audit information operation method using the same, and a recording medium on which the program is recorded' there is.

기업, 회사, 기관, 단체 등(이하 기업으로 통칭)에 있어서 그 조직의 자산을 보호하고 업무의 능률을 높이기 위해 업무 손실(Risk)을 억제하는 것이 주요한 업무가 되고 있으며, 이러한 업무 손실의 현황 파악 및 관리를 위한 경영 기법으로서 감사 제도를 예로 들 수 있다.For corporations, companies, institutions, organizations, etc. (hereinafter collectively referred to as corporations), it is a major task to protect the assets of the organization and to increase work efficiency, to control business risks, and to understand the current status of these business losses. An example is the audit system as a management technique for management and management.

하지만, 종래의 감사 제도는 주로 과거 감사 경험이나 감사 실적 위주로 수행됨으로써 감사 자원의 낭비 또는 불합리한 감사가 수행되는 문제점이 상존해 왔다. 이에 따라 감사 활동의 질적 하락과 반복적인 업무 손실이 초래되고 이로 인해 불필요한 감사 자원이 다시 낭비되는 악순환이 반복되는 단점이 있다.However, since the conventional audit system is mainly performed based on past audit experiences or audit results, problems such as waste of audit resources or unreasonable audits have been present. As a result, there is a disadvantage in that the quality of audit activities deteriorates and repetitive work losses occur, resulting in a vicious cycle in which unnecessary audit resources are wasted again.

더욱이, 감사 활동의 관리에 있어서 감사 보고, 감사 결과 및 이에 따른 시정/개선 방안 등이 모두 분실 및 소멸의 우려가 높은 종이 형태의 문서로만 관리됨으로써 이전 감사 데이터에 대한 축적된 자료를 얻기 어렵다는 문제점도 있다.Furthermore, in the management of audit activities, audit reports, audit results, and corrective/improvement plans are all managed only as paper documents with a high risk of loss or extinction, making it difficult to obtain accumulated data on previous audit data. there is.

뿐만 아니라, 종이 형태의 감사 데이터는 분석, 검색, 가공이 어려워 감사 활동에 제대로 활용되지 못하고 있으며, 정보 제공 흐름이 문서의 유통 속도에 크게 영향 받음에 따라 업무 처리와 의사 결정이 지연되는 등 업무 생산성 향상을 저하시키는 요인으로 작용하고 있다.In addition, audit data in paper form is difficult to analyze, search, and process, so it is not properly utilized in audit activities, and work productivity such as delays in work processing and decision-making as the flow of information provision is greatly affected by the speed of circulation of documents It acts as a factor that slows down the improvement.

따라서, 감사 활동에 있어 업무 생산성과 신속성을 향상하고 감사 관련 자료를 체계적으로 저장, 검색 및 통계 처리할 수 있는 기능을 구현할 수 있는 새로운 개념의 감사 관리 시스템 감사 관리 방법의 출현이 요구되어 왔다.Therefore, it has been required to develop a new concept audit management system audit management method that can improve work productivity and speed in audit activities and implement functions that can systematically store, search, and statistically process audit-related data.

한편, 소정의 타겟에 대한 가계대출 사기의 경우에 신용 및 전세건에 대해서 사기대출비율이 0.018%로 신규 대출 신청건을 분석하여 정상과 사기대출을 예측하는 모델을 개발하기에는 데이터 수집 및 분석에 한계가 있다.On the other hand, in the case of household loan fraud for a predetermined target, the fraudulent loan ratio for credit and deposit cases is 0.018%, and data collection and analysis are limited to develop a model that predicts normal and fraudulent loans by analyzing new loan applications there is

또한, 소정의 타겟에 대한 가계대출 부실의 경우에 부실 예측의 변별력이 떨어지는 문제가 있었으며, 실제 부실하지 않은 경우에 부실로 예측하거나 부실한 경우 정상으로 예측하는 경우가 많이 있었다.In addition, there is a problem in that the discriminative power of bad prediction is low in the case of bad household loans for a predetermined target, and there are many cases in which bad predictions are made when they are not actually bad, or normal predictions are made when bad household loans are bad.

본 발명은 이러한 문제점을 해결하고자 안출된 것으로, 본 발명의 목적은 사기가계대출 사기/부실로 인한 손실규모가 커짐에 따라서 사기가계대출 사기/부실 관련 이상징후의 적기 탐지할 수 있으며, 사후적발 중심 및 인력 중심에서 벗어나 사기 및 부정가계대출 사기/부실 예방할 수 있고, 점검대상 여신의 위험도 평가 및 자동재학습 기능으로 감사 효율성 증대 및 통합점검 관리 체계 구축이 가능하며, 상시 모니터링의 고도화를 통한 리스크 관리 체계 구축이 가능한 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템을 제공하는 것이다.The present invention has been made to solve these problems, and an object of the present invention is to timely detect abnormal symptoms related to fraudulent household loan fraud / insolvency as the scale of loss due to fraudulent household loan fraud / insolvency increases, and focuses on post-detection. It is possible to prevent fraud and fraudulent household loan fraud / insolvency by moving away from human resources, and it is possible to increase audit efficiency and build an integrated inspection management system through the risk assessment and automatic relearning function of loans subject to inspection, and to manage risks through advanced monitoring at all times. It is to provide a regular audit support system for household loan fraud/insolvency using artificial intelligence that can build a system.

본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템은, 사용자가 소정의 서류를 제출하여 가계대출 사기/부실 신청을 한 경우 신용등급 및 가계대출 사기/부실가능금액 등을 조사하여 가계대출 사기/부실거래를 시행하는 가계대출 사기/부실시스템과, 상기 가계대출 사기/부실시스템이 수행하는 가계대출 사기/부실거래에 대해서 주기적인 감사 외에 유무선 인터넷을 매개로 사기 또는 부실 거래 위험률과 그 근거항목을 고려하여 상시감사를 실시하며, 고위험군에 대하여 효율적인 영업감사를 수행할 수 있도록 지원하는 감사정보시스템과, 상기 가계대출 사기/부실시스템의 제 1 데이터베이스로부터 유무선 인터넷을 거쳐 데이터를 수집, 학습을 위한 전처리를 수행하며, 데이터를 분석 및 학습, 모델링하여 감사단말의 도움을 받아 이상거래 예측 모델을 생성, 저장하고, 이상거래 예측모델을 이용하여 상기 가계대출 사기/부실시스템의 가계대출 사기/부실거래 데이터에 대해 이상거래인지 여부를 예측하여 상기 감사정보시스템에 제공하여 상기 감사단말이 상기 감사정보시스템의 사기/부실 가계대출 사기/부실탐지 모니터링을 이용하여 가계대출 사기/부실에 대하여 상시 감사를 효율적으로 수행할 수 있게 해주는 인공지능감사분석시스템을 포함하며,In the household loan fraud/insolvency regular audit support system using artificial intelligence according to an embodiment of the present invention, when a user submits a predetermined document to apply for household loan fraud/insolvency, the credit rating and the possible amount of household loan fraud/insolvency In addition to the household loan fraud/insolvency system that conducts fraudulent/insolvent transactions in household loans by investigating fraudulent/insolvent transactions, etc. An audit information system that conducts regular audits in consideration of the risk rate of insolvent transactions and its basis items, and supports efficient business audits for high-risk groups, and the first database of the above household loan fraud / insolvency system through wired and wireless Internet Collect data, perform preprocessing for learning, analyze, learn, and model data to create and store an abnormal transaction prediction model with the help of an audit terminal, and use the abnormal transaction prediction model to perform the household loan fraud/insolvency system Household loan fraud/non-performing transaction data is predicted to be an abnormal transaction and provided to the audit information system, so that the audit terminal detects household loan fraud/insolvency using the fraud/insolvent household loan fraud/insolvency detection monitoring of the audit information system. It includes an artificial intelligence audit analysis system that enables efficient regular auditing of insolvency,

상기 데이터는 사기대출의 징후를 나타내는 항목을 중심으로 사기대출 가능성을 고려하여 인구통계학적 정보, 재직 및 소득정보, 은행거래정보, 사기대출관련속성정보를 포함하며,The data includes demographic information, employment and income information, bank transaction information, and fraudulent loan-related attribute information in consideration of the possibility of fraudulent loans, focusing on items indicating signs of fraudulent loans.

상기 데이터는 부실예측모델분석을 위하여 개인대출신청, 개인신용정보요약상세, 개인여신심사승인실적명세, 및 파생변수를 포함하며,
상기 감사정보시스템은 상기 가계대출 사기/부실시스템을 통한 가계대출 사기/부실거래에 대하여 상기 인공지능 감사분석시스템의 사기/부실 예측 모델 결과값이 높게 나온 경우에 상시 감사를 수행하여 사기 및 부정가계대출 사기/부실을 예방하기 위한 상시감사모듈과 사기가계대출 사기/부실에 의한 업무 손실의 현황 파악 및 관리를 위한 조직에 대한 정기적인 영업 감사모듈을 포함하며,
상기 상시감사모듈은 상기 가계대출 사기/부실시스템을 통한 가계대출 사기/부실거래에 대하여 사기 확률를 표시하는 사기확률 표시부와, 상기 가계대출 사기/부실시스템을 통한 가계대출 사기/부실거래에 대하여 부실확률을 표시하는 부실확률 표시부와, 상기 사기확률 표시부 또는 상기 부실확률 표시부를 통해 표시하는 사기확률 또는 부실확률에 대하여 상기 가계대출 사기/부실거래의 확률에 대한 근거를 제시하는 근거제시부를 더 포함하는 것을 특징으로 한다.
The above data includes personal loan application, personal credit information summary details, personal credit review approval performance details, and derived variables for insolvency prediction model analysis.
The audit information system conducts regular audits when the result of the fraud/insolvency prediction model of the artificial intelligence audit analysis system is high for fraudulent/insolvent transactions of household loans through the fraud/insolvency system for household loans, and detects fraud and fraudulent households. It includes a regular audit module to prevent loan fraud/insolvency and a regular sales audit module for organizations to identify and manage business losses due to fraud/insolvency in fraudulent household loans.
The regular audit module includes a fraud probability display unit for displaying a fraud probability for household loan fraud/insolvency transactions through the household loan fraud/insolvency system, and a fraud probability for household loan fraud/insolvency transactions through the household loan fraud/insolvency system. Further comprising: an insolvency probability display unit displaying and a basis presentation unit for presenting a basis for the probability of the household loan fraud/insolvency transaction with respect to the fraud probability or insolvency probability displayed through the fraud probability display unit or the insolvency probability display unit. to be characterized

본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템에 의하면, 허위/사기가계대출 사기/부실 취급에 따른 금융기관의 손실 예방 및 사고금액 대형화에 대비할 수 있으며, 대내외 환경변화에 따른 신종 사기(기획 가계대출 사기/부실) 가계대출 사기/부실 대응으로 금융기관의 손실예방 및 평판 리스크 관리가 가능하며, 사기 고위험 분류 여신 계좌에 대한 선별 및 집중 점검으로 감사역 점검 업무의 효율성 증대로 점검 범위 확대할 수 있다.According to the household loan fraud / insolvency regular audit support system using artificial intelligence according to an embodiment of the present invention, it is possible to prevent losses of financial institutions due to fraud / insolvency handling of false / fraudulent household loans and to prepare for large-scale accidents, internally and externally A new type of fraud (planned household loan fraud/insolvency) in response to environmental changes enables loss prevention and reputation risk management of financial institutions by responding to household loan fraud/insolvency. The scope of inspection can be expanded by increasing the efficiency of

특히, 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템에 의하면, 사기/부실 데이터가 불충분 또는 불균일한 경우 뿐만 아니라 변별력이 떨어지는 경우에 대해서 사기 고위험 분류 여신 계좌에 대한 선별 및 집중 점검으로 감사역 점검 업무의 효율성 증대로 점검 범위 확대할 수 있다. In particular, according to the household loan fraud/insolvency regular audit support system using artificial intelligence according to an embodiment of the present invention, not only when fraud/insolvency data is insufficient or non-uniform, but also in cases where the discriminative power is low, it is classified as a high-risk fraud loan account. It is possible to expand the scope of inspection by increasing the efficiency of inspection work by the auditor through selective and intensive inspection.

도 1은 본 발명의 일시스템에 따른 인공지능을 이용한 상시감사지원시스템의 전체 구성도를 나타낸다.
도 2는 도 1의 감사정보시스템의 내부 구성을 설명하는 블록도이다.
도 3은 도 1의 감사정보시스템이 감사단말에 제공하는 화면예시도이다.
도 4는 도 1의 본 발명의 일 실시예에 따른 인공지능감사 분석시스템의 내부 구성을 설명하는 블록도이다.
도 5는 도 4의 인공지능감사분석시스템과 도 2의 감사정보시스템 사이의 인터페이스 구성도를 나타낸다.
도 6은 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원방법의 플로우챠트이다.
도 7은 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원방법에 사용된 사기/부실 가계대출 사기/부실에 대한 지도학습과 비지도학습의 연동관계를 설명하는 개념도이다.
도 8a 및 도 8b는 도 6의 단계 S30 및 S35의 분석 데이터 중 모델링에 사용될 후보 변수를 도출하는 방법과, 학습데이터를 가공하는 방법을 나타내는 플로우챠트이다.
도 9는 가계대출 사기/부실 상시감사 모델개발 및 모델평가에 대한 개념을 나타내는 개념도이다.
도 10a는 가계사기예측성능을 학습데이터와 데스트데이터의 비율을 달리한 2차 모델과 3차모델의 성능을 나타내는 도면이고, 도 10b는 도 3의 감사단말에 제공하는 화면예시도의 변형예를 나타내는 도면이며, 도 10c는 DNN모델을 사용한 경우의 성능지표를 나타내는 도면이다.
도 11은 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원방법을 이용할 경우 가계부실예측결과를 나타내는 그래프이다.
도 12a 및 도 12b는 각각 DNN 모델로 분석한 결과, 예측된 부실 확률(저부실/중부실/고부실)별 개인신용등급의 분포를 나타내는 것이며, 개발된 모델이 정상/사기 구분을 실제와 반대로 예측한 건에 대해 사후적인 검증을 수행한 결과를 나타내는 표이다.
1 shows the overall configuration of a regular audit support system using artificial intelligence according to one system of the present invention.
Figure 2 is a block diagram explaining the internal configuration of the audit information system of Figure 1.
Figure 3 is an exemplary screen provided by the audit information system of Figure 1 to the audit terminal.
Figure 4 is a block diagram explaining the internal configuration of the artificial intelligence audit analysis system according to an embodiment of the present invention of Figure 1.
Figure 5 shows the configuration of the interface between the artificial intelligence audit analysis system of Figure 4 and the audit information system of Figure 2.
6 is a flowchart of a regular audit support method for fraudulent/insolvent household loans using artificial intelligence according to an embodiment of the present invention.
7 is a conceptual diagram explaining the interlocking relationship between supervised learning and unsupervised learning for fraud/insolvent household loan fraud/insolvency used in the household loan fraud/insolvency constant audit support method using artificial intelligence according to an embodiment of the present invention. am.
8A and 8B are flowcharts illustrating a method of deriving candidate variables to be used for modeling among the analysis data of steps S30 and S35 of FIG. 6 and a method of processing learning data.
9 is a conceptual diagram illustrating the concept of developing a household loan fraud/insolvency regular audit model and model evaluation.
10A is a diagram showing the performance of a second model and a third model with different ratios of learning data and test data for household fraud prediction performance, and FIG. 10B is a modified example of a screen example provided to an audit terminal in FIG. 3 FIG. 10C is a diagram showing performance indicators in the case of using a DNN model.
11 is a graph showing household insolvency prediction results when using the household loan fraud/insolvency constant audit support method using artificial intelligence according to an embodiment of the present invention.
12a and 12b show the distribution of personal credit ratings by predicted insolvency probability (low insolvency/medium insolvency/high insolvency) as a result of analysis by the DNN model, respectively. This is a table showing the results of performing post-hoc verification on predicted cases.

이하에서는 본 발명의 일 실시예에 따른 상시형 감사 장치를 첨부된 도면을 참조하여 상세하게 설명한다. 이 과정에서, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, a continuous auditing device according to an embodiment of the present invention will be described in detail with reference to the accompanying drawings. In this process, terms to be described later are terms defined in consideration of functions in the present invention, which may vary according to the intention or practice of a user or operator. Therefore, definitions of these terms will have to be made based on the content throughout this specification.

도 1은 본 발명의 일시스템에 따른 인공지능을 이용한 상시감사지원시스템의 전체 구성도를 나타내며, 도 2는 도 1의 감사정보시스템의 내부 구성을 설명하는 블록도이고, 도 3은 도 1의 감사정보시스템이 감사단말에 제공하는 화면예시도이며, 도 4는 도 1의 본 발명의 일 실시예에 따른 인공지능감사 분석시스템의 내부 구성을 설명하는 블록도이다.Figure 1 shows the overall configuration of a regular audit support system using artificial intelligence according to one system of the present invention, Figure 2 is a block diagram explaining the internal configuration of the audit information system of Figure 1, Figure 3 is a It is an example of a screen provided by an audit information system to an audit terminal, and FIG. 4 is a block diagram illustrating the internal configuration of an artificial intelligence audit analysis system according to an embodiment of the present invention in FIG.

도 1 내지 도 4에 도시된 바와 같이, 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템(1)은, 사용자가 소정의 서류를 제출하여 가계대출 사기/부실 신청을 한 경우 신용등급 및 가계대출 사기/부실가능금액 등을 조사하여 가계대출 사기/부실거래를 시행하는 가계대출 사기/부실시스템(100)과, 상기 가계대출 사기/부실시스템(100)이 수행하는 가계대출 사기/부실거래에 대해서 주기적인 감사 외에 유무선 인터넷(200)을 매개로 사기 또는 부실 거래 위험률과 그 근거항목을 고려하여 상시감사를 실시하며, 고위험군에 대하여 효율적인 영업감사를 수행할 수 있도록 지원하는 감사정보시스템(300)과, 상기 가계대출 사기/부실시스템(100)의 제 1 데이터베이스(101)로부터 유무선 인터넷(200)을 거쳐 데이터를 수집, 학습을 위한 전처리를 수행하며, 데이터를 분석 및 학습, 모델링하여 감사단말(10)의 도움을 받아 이상거래 예측 모델을 생성, 저장하고, 이상거래 예측모델을 이용하여 상기 가계대출 사기/부실시스템(100)의 가계대출 사기/부실거래 데이터(101)에 대해 이상거래인지 여부를 예측하여 상기 감사정보시스템(300)에 제공하여 상기 감사단말(10)이 상기 감사정보시스템(300)의 사기/부실 가계대출 사기/부실탐지 모니터링을 이용하여 가계대출 사기/부실에 대하여 상시 감사를 효율적으로 수행할 수 있게 해주는 인공지능감사분석시스템(500)을 포함한다.As shown in FIGS. 1 to 4 , the household loan fraud/insolvency regular audit support system 1 using artificial intelligence according to an embodiment of the present invention allows a user to submit predetermined documents to detect fraud/insolvency in household loans. In case of application, the household loan fraud/insolvency system 100 conducts household loan fraud/insolvency transactions by examining the credit rating and possible amount of household loan fraud/insolvency, and the household loan fraud/insolvency system 100 performs In addition to periodic audits for household loan fraud/insolvent transactions, regular audits are conducted in consideration of the risk rate of fraud or insolvency transactions and the basis items through the wired/wireless Internet (200), so that efficient business audits can be performed for high-risk groups. Collects data from the supporting audit information system 300 and the first database 101 of the household loan fraud/insolvency system 100 through the wired and wireless Internet 200, performs pre-processing for learning, and analyzes the data and learning and modeling to generate and store an abnormal transaction prediction model with the help of the audit terminal 10, and use the abnormal transaction prediction model to obtain the household loan fraud/insolvency transaction data of the household loan fraud/insolvency system 100 ( 101), predicts whether or not it is an abnormal transaction and provides it to the audit information system 300 so that the audit terminal 10 uses the fraud/insolvency household loan fraud/insolvency detection monitoring of the audit information system 300 to It includes an artificial intelligence audit analysis system 500 that enables efficient regular auditing of loan fraud/insolvency.

상기 인공지능감사분석시스템(500)의 제 2 데이터베이스(501)는 하둡 파일 시스템(hadoop file system)으로 원천데이터와, 상기 제 1 데이터베이스(101)로부터 인공지능감사분석작업을 위해서 변경된(staging) 데이터를 저장하는 학습용 데이터저장부(501a)와, 상기 학습용 데이터를 이용하여 머닝러닝학습을 하기 위한 예측모델 저장부(501b)와, 예측모델을 이용하여 사기가계대출 사기/부실여부 등 예측결과를 저장하는 예측결과 저장부(501c)를 더 포함할 수 있다.The second database 501 of the artificial intelligence audit analysis system 500 includes original data as a Hadoop file system and data staging from the first database 101 for AI audit analysis work. A learning data storage unit 501a for storing , a predictive model storage unit 501b for machine learning learning using the learning data, and prediction results such as fraud/insolvency of fraudulent household loans using the prediction model are stored A prediction result storage unit 501c may be further included.

상기 감사정보시스템(300)은 상기 가계대출 사기/부실시스템(100)을 통한 가계대출 사기/부실거래에 대하여 상기 인공지능 감사분석시스템(500)의 사기/부실 예측 모델 결과값이 높게 나온 경우에 상시 감사를 수행하여 사기 및 부정가계대출 사기/부실을 예방하기 위한 상시감사모듈(310)과 사기가계대출 사기/부실에 의한 업무 손실의 현황 파악 및 관리를 위한 조직에 대한 정기적인 영업 감사모듈(330)을 포함한다. The audit information system 300, when the result value of the fraud/insolvency prediction model of the artificial intelligence audit analysis system 500 is high for fraudulent/insolvent transactions in household loans through the fraudulent/insolvent household loan system 100 A regular audit module (310) to perform regular audits to prevent fraud and fraudulent household loan fraud/insolvency, and a regular sales audit module for organizations to identify and manage business losses due to fraudulent household loan fraud/insolvency ( 330).

상기 상시감사모듈(310)은 상기 가계대출 사기/부실시스템(100)을 통한 가계대출 사기/부실거래에 대하여 사기 확률를 표시하는 사기확률 표시부(311)와, 상기 가계대출 사기/부실시스템(100)을 통한 가계대출 사기/부실거래에 대하여 부실확률을 표시하는 부실확률 표시부(313)와, 상기 사기확률 표시부(311) 또는 상기 부실확률 표시부(313)를 통해 표시하는 사기확률 또는 부실확률에 대하여 상기 가계대출 사기/부실거래의 확률에 대한 근거를 제시하는 근거제시부(315)를 더 포함할 수 있다.The regular audit module 310 includes a fraud probability display unit 311 displaying a fraud probability for household loan fraud/insolvency transactions through the household loan fraud/insolvency system 100, and the household loan fraud/insolvency system 100 The insolvency probability display unit 313 for displaying the insolvency probability for fraudulent/insolvent transactions of household loans through the fraud probability display unit 311 or the insolvency probability display unit 313, and the fraud probability or insolvency probability displayed through the above A basis presentation unit 315 for presenting a basis for the probability of household loan fraud/non-performing transaction may be further included.

상기 근거제시부(315)는 일반적으로 데이터기반의 머신러닝 모델의 경우에 높은 정밀도와 연속적인 위험도 추정으로 정교한 위험도를 제공하지만 결과에 대한 명확한 설명이 어려운 문제점을 해결하기 위하여, 상기 감사단말(10) 또는 상기 인공지능감사분석시스템(500)의 지원을 받아 우선적으로 검토할 비즈니스룰 또는 모델 및 근거를 제시함으로써 사기 고위험 분류 여신 계좌에 대한 선별 및 집중 점검으로 상기 감사단말(10)의 점검 업무의 효율성을 증대시킬 수 있으며, 상기 감시단말(10)이 고려할 수 있는 종래의 비지니스 룰 또는 모델 이외의 새로운 비지니스룰 또는 모델을 제시하여 점검 범위를 확대할 수 있다.In general, the evidence presentation unit 315 provides a sophisticated risk level with high precision and continuous risk estimation in the case of a data-based machine learning model, but in order to solve the problem that it is difficult to clearly explain the results, the audit terminal 10 Alternatively, with the support of the artificial intelligence audit analysis system 500, by presenting business rules or models and grounds to be reviewed first, the efficiency of the inspection task of the audit terminal 10 is selectively and intensively inspected for fraudulent high-risk classified loan accounts. can be increased, and the inspection range can be expanded by presenting a new business rule or model other than the conventional business rule or model that the monitoring terminal 10 can consider.

상기 상시감사모듈(310)과 상기 영업감사모듈(330)은 상호 연동되어 고위험군에 대해서 뿐만 아니라 전체 가계대출 사기/부실거래에 대하여 통계분석과 머신러닝을 진행하여 상시 모니터링의 고도화를 통한 리스크 관리 체계 구축이 가능하다.The regular audit module 310 and the sales audit module 330 interlock with each other to conduct statistical analysis and machine learning not only for high-risk groups but also for fraudulent/non-performing transactions in household loans, so as to achieve a risk management system by advancing regular monitoring. it is possible to build

상기 인공지능감사분석시스템(500)은 이상거래탐지서버(510)와, 모델/비지니스룰개발서버(530)와, 자동학습서버(550)와, AI 예측서버(560)와, 연동서버(570)를 포함한다.The artificial intelligence audit analysis system 500 includes an abnormal transaction detection server 510, a model/business rule development server 530, an automatic learning server 550, an AI prediction server 560, and an interworking server 570. ).

상기 이상거래탐지서버(510)는 가계대출 사기/부실거래에 대해 이상거래를 정의하고 태깅 등 관리 체계를 수립하는 이상거래 관리부(511)와, 상기 이상거래 관리부(511)에 의해 정의된 이상거래 데이터를 분류 수집하는 이상거래 데이터 수집부(513)와, 이상거래 데이터가 전체 가계대출 사기/부실거래 데이터 대비 1% 이내로 매우 적은 데이터여서 머신러닝모델로 이용하는 경우에 정확도가 떨어지는 문제가 발생하므로, 이상거래 데이터 중 노이즈를 제거하며, 학습데이터로 가공하기 전에 처리하는 데이터 전처리부(515)와, 이후 자세히 설명하는 모델/비지니스룰 개발서버(530) 또는 자동 학습 서버(550)에서 이용할 수 있는 학습데이터로 처리하기 위한 학습데이터 가공부(517)를 포함한다.The abnormal transaction detection server 510 includes an abnormal transaction management unit 511 that defines abnormal transactions for household loan fraud/insolvent transactions and establishes a management system such as tagging, and abnormal transactions defined by the abnormal transaction management unit 511. Since the abnormal transaction data collection unit 513 classifies and collects data, and the abnormal transaction data is very small, less than 1% of the total household loan fraud / non-performing transaction data, there is a problem of low accuracy when used as a machine learning model. Data pre-processing unit 515 that removes noise from abnormal transaction data and processes it before processing it into learning data, and learning that can be used in the model/business rule development server 530 or automatic learning server 550, which will be described in detail later. It includes a learning data processing unit 517 for processing into data.

상기 학습데이터 가공부(517)는 이상거래 데이터를 식별하고, 머신러닝 솔루션을 위한 타켓 데이터로 정의한다.The learning data processing unit 517 identifies abnormal transaction data and defines it as target data for a machine learning solution.

상기 모델/비지니스룰 개발서버(530)는 이상거래 예측 정교화를 위한 머신러닝 예측모형을 개발하고, 부실가계대출 사기/부실거래 또는 사기거래 가계대출 사기/부실을 방지할 수 있는 비즈니스룰을 최적화하거나 신규개발하는 것을 특징으로 한다.The model/business rule development server 530 develops a machine learning prediction model for elaborating abnormal transaction predictions, optimizes business rules that can prevent fraudulent household loan fraud/insolvency transactions or fraudulent transaction household loan fraud/insolvency, or It is characterized by new development.

상기 모델/비지니스룰 개발서버(530)는 머신러닝 기반의 이상거래 탐지모델을 개발하는 이상거래 탐지모델개발부(531)와, 제공되는 업무요건을 분석하여 부실가계대출 사기/부실거래 또는 사기거래 가계대출 사기/부실을 방지할 수 있는 비즈니스룰을 최적화하거나 신규개발하는 비지니스룰 개발부(533)와, 상기 감사정보시스템(300)의 상시감사모듈(310)에서 점검할 상시감사점검항목을 개발하는 상시감사점검항목 개발부(535)와, 기존 규칙에서 발견되지 않은 새로운 유형의 사기패턴을 탐지하고 새로운 이상거래 유형을 지속적으로 자기 개발하여 자동학습서버(550)를 통해서 예측모델을 생성하고, 사기 또는 부실 가계대출 사기/부실에 대한 예측정보를 제공하도록 하기 위한 New 사기패턴 탐지부(537)를 더 포함한다.The model/business rule development server 530 analyzes the business requirements provided by the abnormal transaction detection model development unit 531 that develops a machine learning-based abnormal transaction detection model, and detects fraudulent household loan fraud/insolvent transactions or fraudulent transaction households. A business rule development unit 533 that optimizes or newly develops business rules that can prevent loan fraud/insolvency and develops regular audit check items to be checked by the regular audit module 310 of the audit information system 300 The audit check item development unit 535 detects a new type of fraud pattern not found in the existing rules, continuously self-develops a new type of abnormal transaction, and generates a predictive model through the automatic learning server 550, fraud or insolvency A new fraud pattern detection unit 537 is further included to provide prediction information on household loan fraud/insolvency.

상기 상시감사점검항목 개발부(535)는 가계가계대출 사기/부실인 경우 허위/사기 확률이 높은 신청 건의 탐지를 위해 룰 적용 및 머신러닝학습(지도학습)하여 결과값 등을 상기 감사단말(10)에 제공하여 상시감사할 수 있도록 할 수 있다.The regular audit check item development unit 535 applies rules and machine learning learning (supervised learning) to detect applications with a high probability of false / fraud in case of fraud / insolvency of household loans, and sends the result value to the audit terminal 10 It can be provided for regular auditing.

상기 상시감사점검항목 개발부(535)는 기업여신인 경우, 신규 신용평가 대상 기업의 재무/비재무 정보를 머신러닝 학습(비지도학습) 통한 룰을 적용하여 사기/고위험 군에 대한 예측 정보를 상기 감사단말(10)에 제공하여 상시감사할 수 있도록 할 수 있다.In the case of corporate loans, the regular audit check items development unit 535 applies rules through machine learning learning (unsupervised learning) to financial/non-financial information of companies subject to new credit evaluation, and predicts fraud/high-risk group information through the audit It can be provided to the terminal 10 so that it can be audited at all times.

이와 같이 가계가계대출 사기/부실과 기업여신에 대하여 머신러닝 학습을 차별화하여 상기 감사단말(10)의 업무부하를 줄일 수 있다.In this way, the work load of the audit terminal 10 can be reduced by differentiating machine learning learning for household loan fraud/insolvency and corporate loan.

상기 자동 학습 서버(550)는 머신러닝 알고리즘을 이용하여 상기 학습데이터 가공부(517)에서 가공된 학습데이터를 이용하여 상기 이상거래 탐지모델개발부(531)에서 개발된 이상거래 모델을 이용하여 지도학습을 진행하여 사기가능성을 확률적으로 판단하는 지도학습부(551)와, 사기가계대출 사기/부실건수가 불충분하여 노이즈가 발생할 수 있으므로 이상거래데이터의 특성을 고려하여 상기 모델/비지니스룰 개발서버(530)에서 개발된 이상거래탐지모델 또는 비즈니스룰 또는 상시 점검항목이나 새로운 사기패턴을 적용하여 자동으로 비지도학습을 수행하는 비지도학습부(553)와, 상기 사기/부실 가계대출 사기/부실 모델에 대하여 비교분석하여 정확도가 높은 모델을 적용하는 모델비교분석부(555)와, 상기 가계대출 사기/부실거래에 대하여 적용할 예측모델을 상기 모델비교분석부(555)의 분석결과를 이용하여 최종선정하는 예측모델생성부(557)를 포함할 수 있다.The automatic learning server 550 performs supervised learning using the abnormal transaction model developed in the abnormal transaction detection model development unit 531 using the learning data processed in the learning data processing unit 517 using a machine learning algorithm. and the model/business rule development server ( An unsupervised learning unit 553 that automatically performs unsupervised learning by applying the abnormal transaction detection model or business rule developed in step 530, or a regular check item or a new fraud pattern, and the fraud/insolvent household loan fraud/insolvency model A model comparison and analysis unit 555 that compares and analyzes and applies a model with high accuracy, and a prediction model to be applied to the household loan fraud / insolvent transaction is finalized using the analysis result of the model comparison and analysis unit 555 It may include a predictive model generator 557 to select.

상기 AI 예측서버(560)는 상기 예측모델생성부(557)에서 생성한 예측모델을 이용하여 상기 지도학습부(551)와 상기 비지도학습부(553)를 이용하여 머신러닝 학습에 의하여 사기 또는 부실 가계대출 사기/부실거래의 확률을 예측하는 AI 예측부(561)와, 상기 AI 예측부(561)에서 예측된 정보를 예측정보 DB(567)에 저장하는 예측정보저장부(563)와, 상기 AI 예측서버(560)와 상기 감사정보시스템(300)을 연결하기 위한 인터페이스부(565)를 포함할 수 있다.The AI prediction server 560 uses the supervised learning unit 551 and the unsupervised learning unit 553 using the prediction model generated by the prediction model generation unit 557 to perform fraud or fraud by machine learning learning. An AI prediction unit 561 for predicting the probability of fraudulent/non-performing transactions in bad household loans, and a prediction information storage unit 563 for storing information predicted by the AI prediction unit 561 in a prediction information DB 567; An interface unit 565 for connecting the AI prediction server 560 and the audit information system 300 may be included.

상기 연동서버(570)는 상기 인터넷망(200)을 통해서 상기 가계대출 사기/부실시스템(100), 감사단말(10), 감사정보시스템(300)과 송수신할 수 있도록 연결하기 위한 송수신 인터페이스(571)와, 상기 감사정보시스템(300)의 상시감사모듈(310)과 영업감사모듈(330)에서 상기 감사단말(10)의 니즈에 따라 제공할 정보를 예를들어 사기 또는 부실 확률을 % 또는 막대그래프로 표시하거나 근거항목을 순위로 제공하거나 강조표시하는 등 감사 정보를 커스터마이징할 수 있는 커스터마이징부(573)를 포함할 수 있다.The interlocking server 570 is a transmission/reception interface 571 for connecting to the household loan fraud/insolvency system 100, audit terminal 10, and audit information system 300 through the Internet network 200 so as to transmit and receive ), and information to be provided according to the needs of the audit terminal 10 in the regular audit module 310 and the sales audit module 330 of the audit information system 300, for example, the percentage or bar of fraud or insolvency probability A customizing unit 573 capable of customizing audit information, such as displaying a graph, providing evidence items in rank, or highlighting, may be included.

이제 도 5를 참조하여 도 4의 인공지능감사분석시스템과 도 2의 감사정보시스템 사이의 인터페이스를 상세히 설명한다.Now, referring to FIG. 5, the interface between the artificial intelligence audit analysis system of FIG. 4 and the audit information system of FIG. 2 will be described in detail.

도 5는 도 4의 인공지능감사분석시스템과 도 2의 감사정보시스템 사이의 인터페이스 구성도를 나타낸다.Figure 5 shows the configuration of the interface between the artificial intelligence audit analysis system of Figure 4 and the audit information system of Figure 2.

도 5에 도시된 바와 같이, 상기 자동학습서버(550)는 상기 가계대출 사기/부실시스템(100)의 제 1 데이터베이스(101)로부터 과거 가계대출 사기/부실거래 데이터를 일정 주기로 추출, 변환 적재하여 상기 하둡 시스템인 제 2 데이터베이스(501)에 저장할 수 있으며, 상기 학습데이터 가공부(517)에 의해서 가공된 학습데이터를 상기 지도학습부(551) 또는 비지도학습부(553)에서 학습을 진행하고 상기 모델비교분석부(555)에서 산출된 모델을 비교분석하여 예측모델저장영역(501b)에 저장하고 상기 지도학습부(551) 또는 비지도학습부(553)에서 연속하여 재학습하며, 상기 모델비교분석부(555)는 정확도 등 배포기준을 만족하지 못하면 데이터나 파라미터를 변경하여 재학습하고, 상기 예측모델생성부(557)에서 정확도 등 모델의 성능 기준을 만족한 모델을 최종적으로 예측모델로 선정하면, 상기 AI 예측서버(560)에서 상기 가계대출 사기/부실시스템(100)의 제 1 데이터베이스(101)로부터 유입된 일배치로 적재되는 가계대출 사기/부실거래 데이터에 대하여 추출, 변환, 적재하고 상기 AI 예측부(561)에서 상기 예측모델을 이용하여 예측하고자 하는 일배치로 적재되는 가계대출 사기/부실거래 데이터에 대하여 사기확률 또는 부실확률값을 예측하며, 예측결과를 예측결과저장영역(501c)에 저장하고 상기 인터페이스부(565)를 통하여 상기 감사정보시스템(300)의 상시감사모듈(310)를 통해 제공하여 상시 감사 모니터링함으로써 허위/사기가계대출 사기/부실 취급에 따른 은행 손실 예방 및 사고금액 대형화에 대비할 수 있다.As shown in FIG. 5, the automatic learning server 550 extracts, converts, and loads past household loan fraud/insolvency transaction data from the first database 101 of the household loan fraud/insolvency system 100 at regular intervals. It can be stored in the second database 501, which is the Hadoop system, and the learning data processed by the learning data processing unit 517 is learned in the supervised learning unit 551 or the unsupervised learning unit 553, The models calculated in the model comparison and analysis unit 555 are compared and analyzed, stored in the prediction model storage area 501b, and continuously re-learned in the supervised learning unit 551 or the unsupervised learning unit 553, and the model If the comparison and analysis unit 555 does not satisfy the distribution criteria such as accuracy, data or parameters are changed and re-learned, and in the predictive model generator 557, a model that satisfies the model performance criteria such as accuracy is finally converted into a predictive model. If selected, the AI prediction server 560 extracts, converts, and loads the household loan fraud/insolvency transaction data loaded in a single batch from the first database 101 of the household loan fraud/insolvency system 100 and the AI prediction unit 561 predicts a fraud probability or a non-performing probability value for the household loan fraud/non-performing transaction data loaded in a batch to be predicted using the prediction model, and the prediction result is stored in the prediction result storage area 501c ), and provided through the regular audit module 310 of the audit information system 300 through the interface unit 565, and constantly audited and monitored to prevent bank losses and accidents due to fraudulent / insolvent handling of false / fraudulent household loans You can prepare for an increase in the amount.

따라서, 대내외 환경변화에 따른 신종 사기(기획 가계대출 사기/부실) 가계대출 사기/부실 대응으로 은행의 손실예방 및 평판 리스크 관리가 가능하며, 사기 고위험 분류 여신 계좌에 대한 선별 및 집중 점검으로 상기 감사단말(10)의 점검 업무의 효율성 증대로 점검 범위 확대할 수 있다.Therefore, it is possible to prevent losses and manage reputational risks by responding to new types of fraud (planned household loan fraud/insolvency) and household loan fraud/insolvency according to changes in the internal and external environment. The inspection range can be expanded by increasing the efficiency of the inspection task of the terminal 10 .

이제 도 6 및 도 7을 참조하여 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원방법에 대하여 상세히 설명한다.Now, with reference to FIGS. 6 and 7 , a method for supporting fraud/insolvency auditing of household loans using artificial intelligence according to an embodiment of the present invention will be described in detail.

도 6은 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원방법의 플로우챠트이며, 도 7은 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원방법에 사용된 사기/부실 가계대출 사기/부실에 대한 지도학습과 비지도학습의 연동관계를 설명하는 개념도이다. 6 is a flowchart of a household loan fraud/insolvency constant audit support method using artificial intelligence according to an embodiment of the present invention, and FIG. 7 is a flowchart of a household loan fraud/insolvency constant using artificial intelligence according to an embodiment of the present invention. It is a conceptual diagram explaining the interlocking relationship between supervised learning and unsupervised learning for fraud/insolvent household loan fraud/insolvency used in the audit support method.

먼저 도 6 및 도 7에 도시된 바와 같이, 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원방법에 있어서, 상기 인공지능감사분석시스템(500)은 이상거래탐지서버(510)의 이상거래 관리부(511)에서 가계대출 사기/부실거래의 비즈니스 요구사항을 정리하고, 인공지능감사분석할 이상거래를 선정하여 요건을 정의한다(S10)First, as shown in FIGS. 6 and 7, in the household loan fraud/insolvency regular audit support method using artificial intelligence according to an embodiment of the present invention, the artificial intelligence audit analysis system 500 is an abnormal transaction detection server In the abnormal transaction management unit (511) of (510), the business requirements for fraudulent/non-performing transactions in household loans are organized, and the abnormal transactions to be audited and analyzed by artificial intelligence are selected and the requirements are defined (S10).

상기 이상거래 관리부(511)는 이상거래 예측 타켓을 정의하고, 분석대상, 관찰기간, 모델 세그먼트 정의, 분석방법을 선정할 수 있다.The abnormal transaction management unit 511 may define an abnormal transaction prediction target, select an analysis target, an observation period, model segment definition, and an analysis method.

상기 이상거래 관리부(511)에 의해 정의된 이상거래 데이터를 상기 이상거래 데이터 수집부(513)에서 분류 수집하면, 상기 데이터 전처리부(515)에서 이상거래 데이터 중 노이즈 제거를 하고 속도나 정확도를 높이기 위한 데이터 전처리를 수행하고, 상기 학습테이터 가공부(517)에서 상기 모델/비지니스룰 개발서버(530) 또는 자동 학습 서버(550)에서 이용할 수 있는 학습데이터로 처리하여 준비한다(S20).When the abnormal transaction data defined by the abnormal transaction management unit 511 is classified and collected by the abnormal transaction data collection unit 513, the data pre-processing unit 515 removes noise from the abnormal transaction data and increases speed or accuracy. The data pre-processing is performed, and the learning data processing unit 517 processes and prepares learning data that can be used in the model/business rule development server 530 or the automatic learning server 550 (S20).

상기 학습데이터 가공부(517)는 단기내 부도 데이터, 과거 사기(사고)관련 여신 데이터, 허위가계대출 사기/부실 의심 등록 차주 데이터 등을 분석 데이터 범위로 하여 데이터를 탐색 분석하여(S30) 학습데이터로 가공할 수 있다.The learning data processing unit 517 explores and analyzes data (S30) using short-term bankruptcy data, past fraud (accident) related credit data, false household loan fraud / insolvency suspected registered borrower data, etc. as the range of analysis data. can be processed with

특히, 가계대출 사기/부실과 관련하여 사기예측모델분석 데이터는 사기대출의 징후를 나타내는 항목을 중심으로 사기대출 가능성을 고려하여 4개의 카테고리 하에서 후보변수를 정의하였다.In particular, in relation to household loan fraud/insolvency, the fraud prediction model analysis data defined candidate variables under four categories by considering the possibility of fraudulent loans, focusing on items that indicate signs of fraudulent loans.

카데고리의미Category Meaning 주요후보변수main candidate variable 인구통계학적 정보demographic information 연령, 성별 등 고객의 인구통계학적인 기본적인 속성정보Basic demographic information of customers such as age and gender 연령수, 성별구분, 개인신용등급Number of ages, gender, personal credit rating 재직및소득정보Employment and Income Information 고객의 재직회사 및 소득에 관한 정보Information about your company and income 현직장분류, 현직장근무월, 연소득금액, 나이스추정소득금액Current workplace classification, current workplace service month, annual income amount, Nice estimated income amount 은행거래정보banking information 고객의 은행 이용정도를 판단할 수 있는 관계성 정보
Relational information that can determine the degree of customer use of the bank
최식6개월내 요구불평잔
최신3개월평균급여이체금액 당행거래기간월수 담보여부
No complaints within 6 months of eating
Average wage transfer amount for the latest 3 months Number of months of the current transaction period Security
사기대출관련속성정보Fraudulent Loan Property Information 사기대출에서 흔히 나타나는 속성 정보(과거 영업감사부의 여신감사 경험을 통해 파악한 정보Attribute information commonly found in fraudulent loans (information identified through past credit audit experiences of the Sales Audit Department) 재직업체구분_고위험군여부
의심직작명 유사도
Employment Classification_High-Risk Group
Suspicious job title similarity

또한, 부실예측모델분석 데이터에 대해서도 개인대출신청, 개인신용정보요약상세, 개인여신심사승인실적명세, 및 파생변수 등을 고려하여 분석데이터를 구성할 수 있다.Also, for the insolvency prediction model analysis data, the analysis data can be configured by considering personal loan application, personal credit information summary details, personal credit review approval record, and derived variables.

상기 학습데이터 가공부(517)는 상기 모델/비지니스룰 개발서버(530)에 의해 개발 또는 최적화된 머신러닝 예측모형, 부실가계대출 사기/부실거래 또는 사기거래 가계대출 사기/부실을 방지할 수 있는 비즈니스룰을 이용하여 학습데이터를 탐색분석할 수 있으며, 기존 규칙에서 발견되지 않은 새로운 유형의 사기패턴을 탐지하고 새로운 이상거래 유형을 자동학습서버(550)를 통해서 생성된 예측모델과, New 사기패턴 탐지부(537)에서 제공하는 새로운 유형의 사기패턴을 이용할 수도 있으며, 모델비교분석부(555)에 의해서 비교분석하여 정확도가 높은 모델을 적용하여 학습데이터를 가공할 수 있다(S35).The learning data processing unit 517 is a machine learning prediction model developed or optimized by the model/business rule development server 530, which can prevent fraudulent household loan fraud/non-performing transactions or fraudulent transaction household loan fraud/insolvency. It is possible to search and analyze learning data using business rules, detect new types of fraud patterns not found in existing rules, and predict new types of abnormal transactions through the automatic learning server 550, and new fraud patterns. A new type of fraud pattern provided by the detection unit 537 may be used, and the learning data may be processed by applying a highly accurate model after comparative analysis by the model comparison and analysis unit 555 (S35).

상기 자동 학습 서버(550)는 상기 지도학습부(551)를 통해서 머신러닝 알고리즘을 이용하여 상기 학습데이터 가공부(517)에서 가공된 학습데이터와, 상기 이상거래 탐지모델개발부(531)에서 개발된 이상거래 모델을 이용하여 지도학습을 진행하여 사기가능성을 확률적으로 판단할 수 있으며, 상기 비지도학습부(553)를 이용하여 상기 모델/비지니스룰 개발서버(530)에서 개발된 이상거래탐지모델 또는 비즈니스룰 또는 상시 점검항목이나 새로운 사기패턴을 적용하여 자동으로 비지도학습을 수행할 수 있다(S50).The automatic learning server 550 uses the machine learning algorithm through the supervised learning unit 551, and the learning data processed by the learning data processing unit 517 and the abnormal transaction detection model developed by the development unit 531. It is possible to probabilistically determine the possibility of fraud by performing supervised learning using the abnormal transaction model, and the abnormal transaction detection model developed in the model/business rule development server 530 using the unsupervised learning unit 553. Alternatively, unsupervised learning may be performed automatically by applying business rules, regular check items, or new fraud patterns (S50).

상기 데이터 학습/모델링 단계(S40)는 상기 예측모델생성부(557)를 이용하여 상기 가계대출 사기/부실거래에 대하여 적용할 예측모델을 상기 모델비교분석부(555)의 분석결과를 이용하여 최종선정하는 모델/비지니스룰 개발/비교분석단계(S35)를 반복할 수 있다. In the data learning/modeling step (S40), a prediction model to be applied to the household loan fraud/insolvent transaction using the predictive model generator 557 is finalized using the analysis result of the model comparison and analysis unit 555. The selection model/business rule development/comparative analysis step (S35) may be repeated.

상기 AI 예측서버(560)는 상기 예측모델생성부(557)에서 생성한 예측모델을 이용하여 상기 지도학습부(551)와 상기 비지도학습부(553)를 이용하여 머신러닝 학습에 의하여 사기 또는 부실 가계대출 사기/부실거래의 확률을 예측할 수 있다(S50)The AI prediction server 560 uses the supervised learning unit 551 and the unsupervised learning unit 553 using the prediction model generated by the prediction model generation unit 557 to perform fraud or fraud by machine learning learning. Probability of insolvent household loan fraud/insolvent transaction can be predicted (S50)

상기 AI 예측서버(560)와 상기 감사정보시스템(300)을 인터페이스부(565)가 연결하여 상기 감사정보시스템(300)의 상시감사모듈(310)에서 사기 또는 부실 확률을 % 또는 막대그래프로 표시하며, 근거항목을 순위로 제공하여 이와 연동하는 상기 감사단말(10)이 감사 모니터링함으로써 허위/사기가계대출 사기/부실 취급에 따른 은행 손실 예방 및 사고금액 대형화에 대비할 수 있다.The AI prediction server 560 and the audit information system 300 are connected by the interface unit 565 and the regular audit module 310 of the audit information system 300 displays the probability of fraud or insolvency in % or a bar graph In addition, it is possible to prevent bank losses due to fraudulent/insolvent handling of false/fraudulent household loans and to prepare for an increase in accident amount by providing evidence items in order and auditing and monitoring by the auditing terminal 10 interlocking with them.

이제 도 8a 및 도 9를 참조하여 분석 데이터 중 모델링에 사용될 후보 변수를 도출하는 방법과, 학습데이터를 가공하는 방법에 대해서 설명한다.Now, with reference to FIGS. 8A and 9 , a method of deriving candidate variables to be used for modeling from analysis data and a method of processing learning data will be described.

도 8a 및 도 8b는 도 6의 단계 S30 및 S35의 분석 데이터 중 모델링에 사용될 후보 변수를 도출하는 방법과, 학습데이터를 가공하는 방법을 나타내는 플로우챠트이고, 도 9는 가계대출 사기/부실 상시감사 모델개발 및 모델평가에 대한 개념을 나타내는 개념도이다.8A and 8B are flowcharts illustrating a method of deriving candidate variables to be used for modeling among the analysis data of steps S30 and S35 of FIG. 6 and a method of processing learning data, and FIG. 9 is a regular audit of household loan fraud/insolvency It is a conceptual diagram showing the concept of model development and model evaluation.

도 8a에 도시된 바와 같이, 최적의 모델 탐색 분석단계(S30)는 분석 데이터 중 모델링에 사용될 후보 변수를 도출하하기 위하여 기초분석을 수행하며, 이를 통해 오류나 이상치를 찾고 모델 성능을 올리기 위한 데이터 가공을 수행한다.As shown in FIG. 8A, in the optimal model search and analysis step (S30), basic analysis is performed to derive candidate variables to be used for modeling among the analyzed data, and through this, errors or outliers are found and data processing is performed to improve model performance. Do it.

이를 위하여, 상기 최적의 모델 탐색 분석단계(S30)는 퍼센티지 분석을 수행하여 분석 데이터중 모델링에 사용될 후보변수가 동일값 비율이 90% 이상인 경우에 제외하는 분포분석단계(S301)를 수행하고, 후보변수와 타겟간의 평균 차이가 유의미한지 통계적 검증을 수행하는 연속형 변수 유의성 검증을 수행하고, 범주(Class)별 관측값과 기대값의 통계적 차이를 검증하는 범주형 변수 유의성 검증을 수행하는 단변량유의성분석단계(S302)를 수행하고, 가계대출 사기/부실을 위하여 점검해야 하는 점검항목 변수, 예를들어 필수점검대상인지, 과거담보대출보유수, 최근 3개월타행소액신용대출발생횟수, 과거타행여신계좌보유수, 과거 당행여신계좌보유수, 2년이내 요구불사고신고이력수, 퇴지견금보유 여부 등 가계점검 항목변수를 추가하면서 모델을 검증하는 단계(S303)를 수행하고, 유의성 검증후 남은 변수를 사용하되, 필요시 변수 타입을 변경하여 유의한 변수를 생성하여 후보변수를 도출하고, 후보변수가 많을 경우 모델링 전에 다변량 변수를 피처로 선택하여 최종후보변수를 결정하는 최종후보변수 도출(후보변수 도출, 피쳐선택) 단계(S304)를 수행하고, 모델링 변수 세트를 비지니스 모델 및 룰로서 선택하여 모델링 적용 변수를 생성하는 모델링 변수 설정단계(S305)를 포함할 수 있다.To this end, in the optimal model search and analysis step (S30), percentage analysis is performed to perform a distribution analysis step (S301) in which the candidate variable to be used for modeling among the analyzed data is excluded when the ratio of the same value is 90% or more, and the candidate variable is excluded. Continuous variable significance test, which performs statistical tests to see if the average difference between a variable and target is significant, and univariate significance test, which performs categorical variable significance test, which tests the statistical difference between observed values and expected values by category Analysis step (S302) is performed, and check item variables to be checked for fraud / insolvency of household loans, for example, whether it is a mandatory check subject, number of past mortgage loans, number of small credit loans to other banks in the last 3 months, past loans to other banks The step of verifying the model (S303) is performed while adding household check item variables such as the number of account holdings, the number of past loan account holdings, the number of non-requested non-reporting records within 2 years, whether or not the retirement allowance is held, and the remaining variables after significance verification , but if necessary, change the variable type to generate significant variables to derive candidate variables, and if there are many candidate variables, select multivariate variables as features before modeling to derive final candidate variables to determine the final candidate variables (candidate variables). Derivation, feature selection) step (S304) is performed, and a modeling variable setting step (S305) of generating modeling applied variables by selecting a modeling variable set as a business model and a rule may be included.

[표 2]에 도시된 바와 같이, 인구 통계학적 정보, 재직 및 소득 정보, 은행 거래 정보, 사기대출 관련 속성 정보를 데이터 탐색분석을 거쳐 최종 61개 변수를 설정할 수 있다.As shown in [Table 2], the final 61 variables can be set through data exploration and analysis of demographic information, employment and income information, bank transaction information, and attribute information related to fraudulent loans.

[표 2][Table 2]

Figure 112020128384619-pat00001
Figure 112020128384619-pat00001

도 8b 및 도 9에 도시된 바와 같이, 가계대출 사기/부실에 대한 상시감사 모델개발/비교분석단계(S35)는 후보변수와 타겟으로 이루어진 학습데이터를 활용하여 모델을 개발하고 이 모델을 통해 대출 신청건별 사기확률 계산 후 모델의 성능을 평가하여 최적의 모델을 선정하기 위하여, 선정모델을 개발하는 단계(S351)와 상기 선정모델을 이용하여 대출신청건별 사기대출확률을 인구통계, 재직/소득, 은행거래 등 후보변수 및 타겟 등 학습데이터를 활용하여 가계대출 사기/부실신청건별 사기확률을 계산하는 사기대출확률을 도출하는 단계(S352)와, 모델예측 스코어별 내림차순 청렬을 하여 예측확률과 실제로 해당 신청이 정상인지 사기인지여부를 판별하여 모델을 평가하는 단계(S353) 및 모델에 대한 성능지표계산 및 비교단계(S354)를 포함할 수 있다.As shown in FIGS. 8B and 9, in the regular audit model development/comparison analysis step (S35) for household loan fraud/insolvency, a model is developed using learning data consisting of candidate variables and targets, and loans are obtained through this model. In order to select the optimal model by evaluating the performance of the model after calculating the fraud probability for each application, developing a selection model (S351) and using the selection model to calculate the fraud probability for each loan application The step of deriving the probability of fraudulent loans (S352), which calculates the probability of fraud for each case of fraudulent/insolvent application for household loans, using learning data such as candidate variables and targets such as bank transactions; It may include determining whether the application is normal or fraudulent, evaluating the model (S353), and calculating and comparing performance indicators for the model (S354).

상기 모델에 대한 성능지표계산 및 비교단계(S354)는 각각의 신청건별로 위아래건을 정상과 사기로 구분하여 건별 정밀도와 재현율을 구해서 커브를 생성할 수 있다.In the performance index calculation and comparison step (S354) for the model, a curve may be generated by dividing upper and lower cases into normal and fraudulent cases for each application case and obtaining precision and recall rate for each case.

정밀도는 실제사기건수와 모델사기예측건수의 비를 나타내며, 재현율을 모델사기예측건수와 실제사기건수의 비를 나타내는 것으로, PRAUC(Area under curve precision recall) 분석, 예컨대 정밀도, 재현율 곡선 아래의 영역의 면적을 분석하여, 1에 가까울수록 모델이 우수하다고 판단하는데, 정상대비 사기비율이 0.012%와 같이 데이터 불균형이 발생하는 경우에 사용할 수 있다.Precision refers to the ratio of the actual number of fraud cases to the number of model fraud predictions, and recall refers to the ratio of the number of model fraud predictions to the actual number of fraud cases. After analyzing the area, the closer to 1 is, the better the model is.

한편, 사기예측모델개발 및 평가를 위하여 전체테이터 건수 대비 사기건수를 상담일시, 대출서류송부 일시 등 데이터를 달리하여 2차 3차 검증을 수행할 수 있으며, 학습 및 테스트의 경우에도 전체 데이터에 대해서 학습테이터와 테스트 데이터의 비율을 달리하면서 수행할 수 있다.On the other hand, in order to develop and evaluate a fraud prediction model, the second and third verifications can be performed by changing the data such as the date and time of consultation and the date and time of sending loan documents for the number of fraud cases compared to the total number of data. It can be performed while varying the ratio of training data and test data.

도 10a는 가계사기예측성능을 학습데이터와 데스트데이터의 비율을 달리한 2차 모델과 3차모델의 성능을 나타내는 화면예시도이다. 10A is an example screen showing the performance of a second model and a third model in which the ratio of learning data and test data is different for household fraud prediction performance.

도 10a에 도시된 바와 같이, 학습데이터와 데스트데이터의 비율을 달리한 2차 모델과 3차모델의 성능이 달리 평가되며, 3차 모델의 성능이 2차 모델에 비하여 PRAUC가 1에 가까운 값을 가지며 F1-Score도 높기 때문에 우수한 모델임을 알 수 있다.As shown in FIG. 10A, the performance of the 2nd model and the 3rd model with different ratios of training data and test data are evaluated differently, and the performance of the 3rd model shows a PRAUC value close to 1 compared to the 2nd model. It has a high F1-Score, so it can be seen that it is an excellent model.

도 10b는 도 3의 감사단말에 제공하는 화면예시도의 변형예를 나타내는 도면이다.FIG. 10B is a diagram showing a modified example of the exemplary screen provided to the auditing terminal of FIG. 3 .

도 10b에 도시된 바와 같이, 감사단말(10)에 사기예측결과의 설명력을 높이기 위하여 근거 항목을 산출 표시하는데 머신러닝 모델해석 라이브러리 SHAP(SHapely additive exPlanation)을 활용하여 예측건별 변수의 영향도를 방향과 크기로 표시할 수도 있으며, 근거항목으로 사기중요항목의 순위와 내용 및 값을 표시할 수도 있고, 정상중요항목의 순위와 내용 및 값을 표시할 수 있다.As shown in FIG. 10B, in order to increase the explanatory power of the fraud prediction result in the audit terminal 10, the machine learning model interpretation library SHAP (SHapely additive exPlanation) is used to calculate and display the basis items to direct the influence of each prediction case variable. It can be displayed in size and size, and the rank, content and value of important fraudulent items can be displayed as evidence items, and the rank, content and value of normal important items can be displayed.

이를 위하여 최적 모형으로 판단된 모델로 적합시킨 중요 변수를 도출할 수 있다.To this end, it is possible to derive important variables fitted with the model determined to be the optimal model.

한편, 가계의 사기대출 모델 뿐만 아니라 부실예측 모델에 대해서도 개발 평가할 수 있는데, 부실모델의 경우에는 부실비율이 0.73%로 사기비율에 비해 큰 비중을 차지하므로 이에 대해서는 모델 성능을 개선하기 위해 앙상블계열의 알고리즘 이외에 심층 신경망 모델을 이용할 수 있다.On the other hand, it is possible to develop and evaluate not only the household fraudulent loan model but also the insolvency prediction model. In the case of the insolvency model, the insolvency rate is 0.73%, which accounts for a large portion compared to the fraud rate. In addition to algorithms, deep neural network models can be used.

심층 신경망 모델(DNN;Deep Neural Network)은 인간의 신경계를 모사한 학습 방법으로 연속형, 범주형 변수에 관계없이 모두 분석을 가능하며 예측력이 다른 머신러닝 기법에 비해 사대적으로 우수하며 피쳐추출도 자동으로 수행하며 데이터 크기가 증가할 수록 성능이 증가하는 특장점을 가질 수 있다.Deep Neural Network (DNN) is a learning method that mimics the human nervous system and can be analyzed regardless of continuous or categorical variables. Its predictive power is significantly superior to other machine learning techniques, and feature extraction is also It is performed automatically and can have the feature that performance increases as the data size increases.

따라서, 정확도 향상 및 과대 적합 감소를 위해 사용하는 것으로, 도 10c는 도 10a의 학습데이터를 사용한 경우와 DNN모델을 사용한 경우의 성능지표를 비교하는 도면이다. Therefore, it is used to improve accuracy and reduce overfitting, and FIG. 10c is a diagram comparing performance indicators in the case of using the learning data of FIG. 10a and in the case of using the DNN model.

도 10c에 도시된 바와 같이, 사용자가 학습 데이터를 가공하여 사용한 경우보다 DNN 모델을 사용하여 부실예측 모델을 개발한 경우에 실제 정상을 부실로 오예측하는 케이스가 크게 감소한 것을 PRAUC값이 DNN 모델에서 1에 더 가깝고 F1-Score가 더 큰 것을 통해서 알 수 있었다.As shown in FIG. 10c, when the user developed a poor prediction model using a DNN model, compared to when the user processed and used the training data, the case of mispredicting the actual normal as poor was significantly reduced, and the PRAUC value in the DNN model It was closer to 1 and the F1-Score was larger.

도 11은 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원방법을 이용할 경우 가계부실예측결과를 나타내는 그래프이다.11 is a graph showing household insolvency prediction results when using the household loan fraud/insolvency constant audit support method using artificial intelligence according to an embodiment of the present invention.

도 11에 도시된 바와 같이, 본 발명의 일 실시예에 따른 인공지능을 이용한 가계대출 사기/부실 상시감사지원방법을 이용할 경우 가계부실예측에 대해서 감사단말에 대하여 예를들어 예측 확률 0.4를 기준으로 정상/부실로 분류한 결과와 표시할 때, 예측 확률 0.2 이하를 저부실, 0.2초과 0.8미만을 중부실, 0.8 이상을 고부실로 분류할 수 있다.As shown in FIG. 11, when the household loan fraud/insolvency constant audit support method using artificial intelligence according to an embodiment of the present invention is used, for example, based on the prediction probability of 0.4, for the audit terminal for household insolvency prediction When displaying the result of classification as normal/poor, prediction probabilities of 0.2 or less can be classified as low, 0.2 to less than 0.8 as medium, and 0.8 or more as high.

도 12a 및 도 12b는 각각 DNN 모델로 분석한 결과, 예측된 부실 확률(저부실/중부실/고부실)별 개인신용등급의 분포를 나타내는 것이며, 개발된 모델이 정상/사기 구분을 실제와 반대로 예측한 건에 대해 사후적인 검증을 수행한 결과를 나타내는 표이다.12a and 12b show the distribution of individual credit ratings by predicted insolvency probability (low/medium/high insolvency) as a result of analysis by the DNN model, respectively. This is a table showing the results of performing post-hoc verification on predicted cases.

도 12a에 도시된 바와 같이, DNN 모델로 분석한 결과, 예측된 부실 확률(저부실/중부실/고부실)별 개인신용등급의 분포를 통해서 변별력을 제공할 수 있었다.As shown in FIG. 12a, as a result of analysis with the DNN model, discrimination power could be provided through the distribution of individual credit ratings for each predicted insolvency probability (low insolvency/medium insolvency/high insolvency).

또한, 도 12b에 도시된 바와 같이, 개발된 모델이 정상/사기 구분을 실제와 반대로 예측한 건에 대해 사후적인 검증을 진행한 결과, 모델의 예측값의 타당성을 확인하였다.In addition, as shown in FIG. 12B, the validity of the predicted value of the model was confirmed as a result of conducting a post-hoc verification on the case where the developed model predicted the normal/fraud classification in the opposite way to the actual one.

Claims (8)

대출시스템과, 가계대출 사기/부실시스템이 수행하는 가계대출 사기/부실거래에 대해서 주기적인 감사 외에 유무선 인터넷을 매개로 사기 또는 부실 거래 위험률과 그 근거항목을 고려하여 상시감사를 실시하며, 고위험군에 대하여 효율적인 영업감사를 수행할 수 있도록 지원하는 감사정보시스템과, 상기 가계대출 사기/부실시스템의 제 1 데이터베이스로부터 유무선 인터넷을 거쳐 데이터를 수집, 학습을 위한 전처리를 수행하며, 데이터를 분석 및 학습, 모델링하여 감사단말의 도움을 받아 이상거래 예측모델을 생성, 저장하고, 상기 이상거래 예측모델을 이용하여 상기 가계대출 사기/부실시스템의 가계대출 사기/부실거래 데이터에 대해 이상거래인지 여부를 예측하여 상기 감사정보시스템에 제공하여 상기 감사단말이 상기 감사정보시스템의 사기/부실 가계대출 사기/부실탐지 모니터링을 이용하여 가계대출 사기/부실에 대하여 상시 감사를 효율적으로 수행할 수 있게 해주는 인공지능감사분석시스템을 포함하며,
상기 데이터는 사기대출의 징후를 나타내는 항목을 중심으로 사기대출 가능성을 고려하여 인구통계학적 정보, 재직 및 소득정보, 은행거래정보, 사기대출관련속성정보를 포함하며,
상기 데이터는 부실예측모델분석을 위하여 개인대출신청, 개인신용정보요약상세, 개인여신심사승인실적명세, 및 파생변수를 포함하며,
상기 감사정보시스템은 상기 가계대출 사기/부실시스템을 통한 가계대출 사기/부실거래에 대하여 상기 인공지능 감사분석시스템의 사기/부실 예측 모델 결과값이 높게 나온 경우에 상시 감사를 수행하여 사기 및 부정가계대출 사기/부실을 예방하기 위한 상시감사모듈과 사기가계대출 사기/부실에 의한 업무 손실의 현황 파악 및 관리를 위한 조직에 대한 정기적인 영업 감사모듈을 포함하며,
상기 상시감사모듈은 상기 가계대출 사기/부실시스템을 통한 가계대출 사기/부실거래에 대하여 사기 확률를 표시하는 사기확률 표시부와, 상기 가계대출 사기/부실시스템을 통한 가계대출 사기/부실거래에 대하여 부실확률을 표시하는 부실확률 표시부와, 상기 사기확률 표시부 또는 상기 부실확률 표시부를 통해 표시하는 사기확률 또는 부실확률에 대하여 상기 가계대출 사기/부실거래의 확률에 대한 근거를 제시하는 근거제시부를 더 포함하는 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템.
In addition to regular audits of the loan system and household loan fraud/insolvent transactions performed by the household loan fraud/insolvency system, regular audits are conducted in consideration of the risk rate of fraud or insolvency transactions through the wired/wireless Internet and the basis items. Collects data from the audit information system and the first database of the household loan fraud/insolvency system through the wired and wireless Internet, performs pre-processing for learning, analyzes and learns data, Modeling, creating and storing an abnormal transaction prediction model with the help of the audit terminal, and predicting whether or not it is an abnormal transaction for the household loan fraud / insolvency transaction data of the household loan fraud / insolvency system using the abnormal transaction prediction model Artificial intelligence audit analysis that is provided to the audit information system so that the audit terminal can efficiently perform regular audits on household loan fraud / insolvency by using the fraud / insolvency household loan fraud / insolvency detection monitoring of the audit information system including the system,
The data includes demographic information, employment and income information, bank transaction information, and fraudulent loan-related attribute information, taking into account the possibility of fraudulent loans, focusing on items that indicate signs of fraudulent loans.
The above data includes personal loan application, personal credit information summary details, personal credit review approval record details, and derived variables for insolvency prediction model analysis.
The audit information system performs a regular audit when the fraud/insolvency prediction model result value of the artificial intelligence audit analysis system is high for fraudulent/insolvent transactions of household loans through the fraud/insolvency system for household loans, and detects fraud and fraudulent households. It includes a regular audit module to prevent loan fraud/insolvency and a regular sales audit module for organizations to identify and manage business losses due to fraud/insolvency in fraudulent household loans.
The regular audit module includes a fraud probability indicator displaying a fraud probability for household loan fraud/insolvency transactions through the household loan fraud/insolvency system, and an insolvency probability for household loan fraud/insolvency transactions through the household loan fraud/insolvency system. Artificial intelligence further comprising a non-performing probability display unit for displaying and a grounds presentation unit for presenting a basis for the probability of the household loan fraud/non-performing transaction with respect to the fraud probability or non-performing probability displayed through the fraud probability display unit or the insolvency probability display unit. Household loan fraud/insolvency regular audit support system using intelligence.
제 1 항에 있어서,
상기 인공지능감사분석시스템은 하둡 파일 시스템(hadoop file system)으로 상기 제 1 데이터베이스로부터 인공지능감사분석작업을 위해서 변경된 데이터를 저장하는 학습용 데이터저장부와, 상기 학습용 데이터를 이용하여 머닝러닝학습을 하기 위한 예측모델 저장부와, 예측모델을 이용하여 사기가계대출 사기/부실여부 등 예측결과를 저장하는 예측결과 저장부를 더 포함하는 제 2 데이터베이스를 포함하는 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템.
According to claim 1,
The artificial intelligence audit analysis system is a Hadoop file system, and a learning data storage unit for storing changed data for artificial intelligence audit analysis work from the first database, and machine learning learning using the learning data Household loan fraud/insolvency regular audit support using artificial intelligence, including a second database further including a prediction model storage unit for storing household loans and a prediction result storage unit for storing prediction results such as fraudulent household loan fraud/insolvency using the prediction model system.
삭제delete 삭제delete 제 1 항에 있어서
상기 인공지능감사분석시스템은 이상거래를 정의하고, 이상거래 데이터 수집 및 전처리하며, 사고사례 데이터 식별 및 머신러닝 솔루션 타겟 데이터를 정의하고, 이상거래 데이터를 탐지 분석하는 이상거래탐지서버와, 머신러닝 기반의 이상거래 탐지모델을 개발하고 가계대출 사기/부실거래 요건을 분석하여 비즈니스룰을 개발하는 모델/비지니스룰개발서버와, 머신러닝학습을 통하여 이상거래 정의, 탐지, 분석, 새로운 룰 모델 개발 학습을 자동하는 하는 자동학습서버와, 상기 자동학습서버에서 개발된 머신러닝 모델과 학습데이터를 이용하여 이상거래를 인공지능으로 예측하는 AI 예측서버와, 상기 AI 예측서버와 상기 감사정보시스템을 연동시키는 연동서버를 포함하며,
상기 모델/비지니스룰개발서버는 가계대출 사기/부실을 위하여 점검해야 하는 점검항목 변수를 추가하면서 모델을 검증하는 단계와, 변수 타입을 변경하여 유의미한 변수를 생성하여 후보변수를 도출하고, 후보변수가 많을 경우 모델링 전에 다변량 변수를 피처로 선택하여 최종후보변수를 결정하는 단계와, 모델링 변수 세트를 비지니스 모델 및 룰로서 선택하여 모델링 적용 변수를 생성하는 모델링 변수 설정단계를 수행하며,
학습데이터를 활용하여 모델을 개발하고 개발된 모델을 통해 대출 신청건별 사기확률 계산 후 모델의 성능을 평가하여 모델을 선정하는 단계와, 상기 선정모델을 이용하여 대출신청건별 사기대출확률을 인구통계, 재직/소득, 은행거래 후보변수 및 타겟 등 학습데이터를 활용하여 가계대출 사기/부실신청건별 사기확률을 계산하는 사기대출확률을 도출하는 단계와, 모델예측 스코어별 내림차순 정렬을 하여 예측확률과 실제로 해당 신청이 정상인지 사기인지여부를 판별하여 모델을 평가하는 단계 및 모델에 대한 성능지표계산 및 비교단계를 수행하는 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템.
According to claim 1
The artificial intelligence audit analysis system defines abnormal transaction data, collects and preprocesses abnormal transaction data, identifies accident case data and defines target data for machine learning solutions, and detects and analyzes abnormal transaction data. An abnormal transaction detection server and machine learning A model/business rule development server that develops business rules by developing an abnormal transaction detection model based on household loan fraud/non-performing transactions and analyzing requirements for fraudulent/non-performing transactions in household loans, and learning to define, detect, analyze, and develop new rule models through machine learning learning An automatic learning server that automates, an AI prediction server that predicts abnormal transactions with artificial intelligence using the machine learning model developed in the automatic learning server and learning data, and an AI prediction server that links the audit information system. Including an interlocking server,
The model/business rule development server performs the steps of verifying the model while adding checklist variables to be checked for fraud/insolvency of household loans, generating meaningful variables by changing variable types, deriving candidate variables, and deriving candidate variables. In many cases, a step of determining a final candidate variable by selecting a multivariate variable as a feature before modeling, and a modeling variable setting step of selecting a modeling variable set as a business model and a rule to create a modeling application variable,
After developing a model using the learning data and calculating the probability of fraud for each loan application through the developed model, evaluating the performance of the model and selecting a model; The step of deriving the probability of fraud by calculating the probability of fraud by household loan fraud / insolvent application by using learning data such as employment / income, bank transaction candidate variables and targets, and sorting in descending order by model prediction score to match the predicted probability and actual Household loan fraud/insolvency regular audit support system using artificial intelligence that performs the model evaluation step by determining whether the application is normal or fraudulent, and the performance index calculation and comparison step for the model.
제 5 항에 있어서
상기 모델/비지니스룰 개발서버는 머신러닝 기반의 이상거래 탐지모델을 개발하는 이상거래 탐지모델개발부와, 제공되는 업무요건을 분석하여 부실가계대출 사기/부실거래 또는 사기거래 가계대출 사기/부실을 방지할 수 있는 비즈니스룰을 신규개발하는 비지니스룰 개발부와, 상기 감사정보시스템의 상시감사모듈에서 점검할 상시감사점검항목을 개발하는 상시감사점검항목 개발부와, 기존 규칙에서 발견되지 않은 새로운 유형의 사기패턴을 탐지하고 새로운 이상거래 유형을 지속적으로 자기 개발하여 상기 자동학습서버를 통해서 예측모델을 생성하고, 사기 또는 부실 가계대출 사기/부실에 대한 예측정보를 제공하도록 하기 위한 New 사기패턴 탐지부를 더 포함하는 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템.
According to claim 5
The model/business rule development server prevents fraudulent household loan fraud/insolvent transactions or fraudulent transaction household loan fraud/insolvency by analyzing the business requirements provided by the abnormal transaction detection model development department that develops a machine learning-based abnormal transaction detection model. A business rule development department that newly develops possible business rules, a regular audit check item development unit that develops regular audit check items to be inspected in the regular audit module of the audit information system, and a new type of fraud pattern not found in the existing rules. New fraud pattern detection unit for detecting and continuously self-developing new abnormal transaction types to generate a predictive model through the automatic learning server and to provide prediction information on fraud or insolvent household loan fraud / insolvency Further comprising Household loan fraud/insolvency regular audit support system using artificial intelligence.
제 6 항에 있어서
상기 자동 학습 서버는 머신러닝 알고리즘을 이용하여 학습데이터 가공부에서 가공된 학습데이터를 이용하여 상기 이상거래 탐지모델개발부에서 개발된 이상거래 모델을 이용하여 지도학습을 진행하여 사기가능성을 확률적으로 판단하는 지도학습부와, 상기 모델/비지니스룰 개발서버에서 개발된 이상거래탐지모델 또는 비즈니스룰 또는 상시 점검항목이나 새로운 사기패턴을 적용하여 자동으로 비지도학습을 수행하는 비지도학습부와, 상기 사기/부실 가계대출 사기/부실 모델에 대하여 비교분석하는 모델비교분석부와, 상기 가계대출 사기/부실거래에 대하여 적용할 예측모델을 상기 모델비교분석부의 분석결과를 이용하여 최종 선정하는 예측모델생성부를 포함하는 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템.
According to claim 6
The automatic learning server proceeds with supervised learning using the learning data processed in the learning data processing unit using the machine learning algorithm and the abnormal transaction model developed in the abnormal transaction detection model development unit to probabilistically determine the possibility of fraud an unsupervised learning unit that automatically performs unsupervised learning by applying an abnormal transaction detection model or business rule developed in the model/business rule development server, a regular inspection item, or a new fraud pattern; / A model comparison analysis unit that compares and analyzes fraudulent household loan fraud / insolvency models, and a prediction model generation unit that finally selects a prediction model to be applied to the household loan fraud / insolvency transaction using the analysis results of the model comparison analysis unit Household loan fraud/insolvency regular audit support system using artificial intelligence including
제 7 항에 있어서
상기 AI 예측서버는 상기 예측모델생성부에서 생성한 예측모델을 이용하여 상기 지도학습부 또는 상기 비지도학습부를 이용하여 머신러닝 학습에 의하여 사기 또는 부실 가계대출 사기/부실거래의 확률을 예측하는 AI 예측부를 포함하며,
상기 AI 예측서버는 심층 신경망 모델을 이용하며, 사기예측결과의 설명력을 높이기 위하여 근거 항목을 산출 표시하기 위하여 예측건별 변수의 영향도를 방향과 크기로 표시하는 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템.

According to claim 7
The AI prediction server predicts the probability of fraudulent or insolvent household loan fraud/insolvent transaction by machine learning learning using the supervised learning unit or the unsupervised learning unit using the prediction model generated by the prediction model generator AI. Including a prediction unit,
The AI prediction server uses a deep neural network model, and in order to increase the explanatory power of fraud prediction results, household loan fraud / insolvency using artificial intelligence that displays the degree of influence of each prediction case in direction and size in order to calculate and display evidence items audit support system.

KR1020200162697A 2020-11-27 2020-11-27 Loan regular auditing system using artificia intellicence KR102499182B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200162697A KR102499182B1 (en) 2020-11-27 2020-11-27 Loan regular auditing system using artificia intellicence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200162697A KR102499182B1 (en) 2020-11-27 2020-11-27 Loan regular auditing system using artificia intellicence

Publications (2)

Publication Number Publication Date
KR20220074327A KR20220074327A (en) 2022-06-03
KR102499182B1 true KR102499182B1 (en) 2023-02-10

Family

ID=81983734

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200162697A KR102499182B1 (en) 2020-11-27 2020-11-27 Loan regular auditing system using artificia intellicence

Country Status (1)

Country Link
KR (1) KR102499182B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102631430B1 (en) * 2023-02-14 2024-01-30 주식회사 와이에스메타 Method for predicting loan result for each of loan product for real estate and computer device for the same

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101153968B1 (en) * 2009-11-03 2012-06-08 김대환 System and method for preventing financial fraud
KR101999765B1 (en) * 2018-01-22 2019-07-12 주식회사 닥터퀀트 Method and system for analyzing pattern of banking phishing loan using data mining technology
KR102094377B1 (en) * 2019-04-12 2020-03-31 주식회사 이글루시큐리티 Model Selection System for Unsupervised Anomaly Detectors and Method Thereof
KR102103902B1 (en) * 2019-07-03 2020-04-23 (주)위세아이텍 Component-based machine learning automation device and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101153968B1 (en) * 2009-11-03 2012-06-08 김대환 System and method for preventing financial fraud
KR101999765B1 (en) * 2018-01-22 2019-07-12 주식회사 닥터퀀트 Method and system for analyzing pattern of banking phishing loan using data mining technology
KR102094377B1 (en) * 2019-04-12 2020-03-31 주식회사 이글루시큐리티 Model Selection System for Unsupervised Anomaly Detectors and Method Thereof
KR102103902B1 (en) * 2019-07-03 2020-04-23 (주)위세아이텍 Component-based machine learning automation device and method

Also Published As

Publication number Publication date
KR20220074327A (en) 2022-06-03

Similar Documents

Publication Publication Date Title
No et al. Multidimensional audit data selection (MADS): A framework for using data analytics in the audit data selection process
Amani et al. Data mining applications in accounting: A review of the literature and organizing framework
Smith et al. An analysis of customer retention and insurance claim patterns using data mining: A case study
Ogwueleka et al. Neural network and classification approach in identifying customer behavior in the banking sector: A case study of an international bank
US8103615B2 (en) Intelligently interactive profiling system and method
Ding et al. A machine learning-based peer selection method with financial ratios
Bravo et al. Granting and managing loans for micro-entrepreneurs: New developments and practical experiences
CN112700324A (en) User loan default prediction method based on combination of Catboost and restricted Boltzmann machine
Abdou et al. Would credit scoring work for Islamic finance? A neural network approach
Ala’raj et al. The applicability of credit scoring models in emerging economies: an evidence from Jordan
KR102499181B1 (en) Loan regular auditing system using artificia intellicence
Kumar et al. Credit score prediction system using deep learning and k-means algorithms
US20060248096A1 (en) Early detection and warning systems and methods
KR102499182B1 (en) Loan regular auditing system using artificia intellicence
CN116911994B (en) External trade risk early warning system
Hasheminejad et al. Data mining techniques for analyzing bank customers: A survey
CN117333012A (en) Financial risk tracking management system, device and storage medium based on data mining
CN117132383A (en) Credit data processing method, device, equipment and readable storage medium
Prorokowski Validation of the backtesting process under the targeted review of internal models: practical recommendations for probability of default models
Gleue et al. Decision support for the automotive industry: Forecasting residual values using artificial neural networks
KR102499183B1 (en) Loan regular auditing system using artificia intellicence
Marevac et al. Decision-making AI for customer worthiness and viability
CN114612239A (en) Stock public opinion monitoring and wind control system based on algorithm, big data and artificial intelligence
Nazari et al. Evaluating the effectiveness of data mining techniques in credit scoring of bank customers using mathematical models: a case study of individual borrowers of Refah Kargaran Bank in Zanjan Province, Iran
Ertuğrul Customer Transaction Predictive Modeling via Machine Learning Algorithms

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant