KR102677721B1 - 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법 - Google Patents

매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법 Download PDF

Info

Publication number
KR102677721B1
KR102677721B1 KR1020220164931A KR20220164931A KR102677721B1 KR 102677721 B1 KR102677721 B1 KR 102677721B1 KR 1020220164931 A KR1020220164931 A KR 1020220164931A KR 20220164931 A KR20220164931 A KR 20220164931A KR 102677721 B1 KR102677721 B1 KR 102677721B1
Authority
KR
South Korea
Prior art keywords
data
business
companies
information
analysis
Prior art date
Application number
KR1020220164931A
Other languages
English (en)
Other versions
KR20240081044A (ko
Inventor
오정환
심평섭
조경아
유상율
현홍진
김태진
안태욱
Original Assignee
주식회사 비즈데이터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 비즈데이터 filed Critical 주식회사 비즈데이터
Priority to KR1020220164931A priority Critical patent/KR102677721B1/ko
Publication of KR20240081044A publication Critical patent/KR20240081044A/ko
Application granted granted Critical
Publication of KR102677721B1 publication Critical patent/KR102677721B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/20Point-of-sale [POS] network systems
    • G06Q20/202Interconnection or interaction of plural electronic cash registers [ECR] or to host computer, e.g. network details, transfer of information from host to ECR or from ECR to ECR

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Accounting & Taxation (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법에 관한 것으로, 보다 구체적으로는, 사업자 또는 사업장에 대한 매출 추이 데이터를 머신러닝 모델을 활용하여 분석하고, 머신러닝 모델에서 산출한 결과치를 바탕으로 사업자 또는 사업장의 휴폐업 가능성에 대한 예측을 탐지할 수 있도록 하기 위한 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법에 관한 것이다.

Description

매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법{Based on sales trend data, business shutdown prediction model system, and method thereof}
본 발명은 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법에 관한 것으로, 보다 구체적으로는, 사업자 또는 사업장에 대한 매출 추이 데이터를 머신러닝 모델을 활용하여 분석하고, 머신러닝 모델에서 산출한 결과치를 바탕으로 사업자 또는 사업장의 휴폐업 가능성에 대한 예측을 탐지할 수 있도록 하기 위한 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법에 관한 것이다.
동일 업종 또는 유사 업종의 국내외 기업 시장에서는 경쟁력 확보를 희망하는 기업의 경영과제를 해결하는 것으로 많은 연구들이 이루어지고 있다.
이러한 기업들 중 최종 목표는 기업의 영속성으로 폐휴업을 하지 않도록 하는 특성을 단편적으로 파악하는 것에 만족하지 않고 폐휴업으로 진행하지 않도록 어떠한 전략을 수립할 것인지에 대한 해법을 요구하며, 이를 통해 새로운 수요창출을 기대하고 있다.
매출을 높이는 것 뿐만 아니라, 기업을 영속하는 것이 모든 기업의 주요 경영목표이고, 이러한 점을 고려할 때 매출추이 데이터에 근거한 사업자 휴폐업 예측은 새로운 사업을 진행하는 경우에도 큰 도움이 될 것으로 이에 대한 기술 개발이 요구되고 있다.
대한민국 특허출원 출원번호 제10-2006-0006331(2006.01.20)호 "관능평가를 통한 매출액 예측시스템 및 그 예측시스템의 매출액 예측방법(SYSTEM FOR PREDICTING THE AMOUNT OF SELLING USING SENSORY EVALUATION AND METHOD THEREFOR)"
본 발명은 상기의 문제점을 해결하기 위한 것으로, 사업자 또는 사업장에 대한 매출 추이 데이터를 머신러닝 모델을 활용하여 분석하고, 머신러닝 모델에서 산출한 결과치를 바탕으로 사업자 또는 사업장의 휴폐업 가능성에 대한 예측을 탐지할 수 있도록 하기 위한 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법에 관한 것이다.
그러나 본 발명의 목적들은 상기에 언급된 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기의 목적을 달성하기 위해 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템은, 복수의 사업장단말(100), 네트워크(200), 휴폐업 예측 서버(300), 서비스단말(400), 데이터서버(500)를 포함하며, 휴폐업 예측 서버(300)가 사업자 또는 사업장에 대에 구비된 사업장 단말(100) 및 데이터서버(500)로부터 매출 추이 데이터{카드매출, pos 데이터, Dart(Data Analysis, Retrieval and Transfer System) 분기실적데이터, 세금계산서 포함}를 분석하고, 산출한 결과치를 바탕으로 사업자 또는 사업장의 휴폐업 가능성에 대한 예측을 탐지한 뒤, 사업장단말(100) 및 서비스단말(400) 중 적어도 하나 이상에게 정보를 제공하도록 하는 것을 특징으로 한다.
이때, 휴폐업 예측 서버(300)는, 복수의 사업장단말(100)을 운영하는 사업자에 대한 대한 원천 데이터 확보를 수행하되, 수집데이터 수집을 위한 SQL / NoSql 수집기를 활용함으로써, "매출 추이 데이터"{Dart 분기실적데이터, 공공데이터(휴폐업), 사용자 제공 데이터(File, 원장 데이터), POS 데이터, 세금계산서 데이터, 카드사 데이터 포함}을 사업장단말(100)으로부터 네트워크(200)를 통해 직접 제공받거나 각 사업장단말(100)의 계정으로 등록된 데이터서버(500)에 대한 요청을 통해 네트워크(200)를 거쳐 간접 제공받을 수 있도록 송수신부(310)를 제어한 뒤, 데이터 처리 모듈(322)로 제공하는 데이터 수집 모듈(321); 을 포함하는 것을 특징으로 한다.
또한, 데이터 처리 모듈(322)은, "매출 추이 데이터"를 데이터 수집 모듈(321)로부터 제공받아 데이터베이스(330)에 저장하는 '데이터 적재 과정'을 수행하는 것을 특징으로 한다.
또한, 데이터 처리 모듈(322)은, 원천 데이터(MariaDB SQL / Clickhouse SQL 저장소)로 구분된 저장소에 저장하되, 원천데이터, Dart 수집 결과, 공공데이터, 파일데이터로로 구분 가능한 "매출 추이 데이터"를 적재하는 것을 특징으로 할 수 있다.
상기의 목적을 달성하기 위해 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 방법은, 휴폐업 예측 서버(300)가 사업자 또는 사업장에 대에 구비된 사업장 단말(100) 및 데이터서버(500)로부터 매출 추이 데이터{카드매출, pos 데이터, Dart(Data Analysis, Retrieval and Transfer System) 분기실적데이터, 세금계산서 포함}를 분석하고, 산출한 결과치를 바탕으로 사업자 또는 사업장의 휴폐업 가능성에 대한 예측을 탐지하는 제 1 단계; 및 휴폐업 예측 서버(300)가 휴폐업 가능성에 대한 예측을 사업장단말(100) 및 서비스단말(400) 중 적어도 하나 이상에게 정보를 제공하는 제 2 단계; 를 포함하는 하는 것을 특징으로 한다.
이때, 상기 제 1 단계는, 휴폐업 예측 서버(300)가 복수의 사업장단말(100)을 운영하는 사업자에 대한 대한 원천 데이터 확보를 수행하되, 수집데이터 수집을 위한 SQL / NoSql 수집기를 활용함으로써, "매출 추이 데이터"{Dart 분기실적데이터, 공공데이터(휴폐업), 사용자 제공 데이터(File, 원장 데이터), POS 데이터, 세금계산서 데이터, 카드사 데이터 포함}을 사업장단말(100)으로부터 네트워크(200)를 통해 직접 제공받거나 각 사업장단말(100)의 계정으로 등록된 데이터서버(500)에 대한 요청을 통해 네트워크(200)를 거쳐 간접 제공받을 수 있도록 송수신부(310)를 제어하는 것을 특징으로 한다.
또한, 상기 제 1 단계는, 휴폐업 예측 서버(300)가 "매출 추이 데이터"를 데이터 수집 모듈(321)로부터 제공받아 데이터베이스(330)에 저장하는 '데이터 적재 과정'을 수행하는 것을 특징으로 한다.
또한, 상기 제 1 단계는, 휴폐업 예측 서버(300)가 원천 데이터(MariaDB SQL / Clickhouse SQL 저장소)로 구분된 저장소에 저장하되, 원천데이터, Dart 수집 결과, 공공데이터, 파일데이터로로 구분 가능한 "매출 추이 데이터"를 적재하는 것을 특징으로 한다.
본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법은, 사업자 또는 사업장에 대한 매출 추이 데이터를 머신러닝 모델을 활용하여 분석하고, 머신러닝 모델에서 산출한 결과치를 바탕으로 사업자 또는 사업장의 휴폐업 가능성에 대한 예측을 탐지할 수 있도록 할 수 있는 효과를 제공할 수 있다.
도 1은 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템(1)을 나타내는 도면이다.
도 2는 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템(1) 중 휴폐업 예측 서버(300)의 구성요소를 나타내는 블록도이다.
도 3 및 도 4는 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템(1)의 개념을 설명하기 위한 도면이다.
도 5는 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 방법을 나타내는 흐름도이다.
이하, 본 발명의 바람직한 실시예의 상세한 설명은 첨부된 도면들을 참조하여 설명할 것이다. 하기에서 본 발명을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
본 명세서에 있어서는 어느 하나의 구성요소가 다른 구성요소로 데이터 또는 신호를 '전송'하는 경우에는 구성요소는 다른 구성요소로 직접 상기 데이터 또는 신호를 전송할 수 있고, 적어도 하나의 또 다른 구성요소를 통하여 데이터 또는 신호를 다른 구성요소로 전송할 수 있음을 의미한다.
도 1은 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템(1)을 나타내는 도면이다.
도 1을 참조하면, 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템(1)은 복수의 사업장단말(100), 네트워크(200), 휴폐업 예측 서버(300), 서비스단말(400), 데이터서버(500)를 포함함으로써, 휴폐업 예측 서버(300)가 사업자 또는 사업장에 대에 구비된 사업장 단말(100) 및 데이터서버(500)로부터 매출 추이 데이터(카드매출, pos 데이터, Dart 분기실적데이터, 세금계산서 등)를 머신러닝 모델을 활용하여 분석하고, 머신러닝 모델에서 산출한 결과치를 바탕으로 사업자 또는 사업장의 휴폐업 가능성 확률에 대한 예측을 탐지한 뒤, 사업장단말(100) 및 서비스단말(400) 중 적어도 하나 이상에게 정보를 제공할 수 있다.
본 특허 시스템에서의 데이터 수집파트는 개별 단말기에서 발생한 데이터를 수집하는 것이 아닌 개별 단말기로부터 발생한 데이터를 중앙에서 수집(및 정제)하는 업체로부터 얻은 데이터를 수집하는 것으로 시작하며, 사업장단말(100)은 수집업체(공공데이터포털 포함)일 수 있다.
도 2는 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템(1) 중 휴폐업 예측 서버(300)의 구성요소를 나타내는 블록도이다. 도 3 및 도 4는 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템(1)의 개념을 설명하기 위한 도면이다. 도 5는 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 방법을 나타내는 흐름도이다.
먼저, 도 2를 참조하면, 휴폐업 예측 서버(300)는 송수신부(310), 제어부(320) 및 데이터베이스(330)를 포함하며, 제어부(320)는 데이터 수집 모듈(321), 데이터 처리 모듈(322), 정보분석모듈(323), 결과 처리모듈(324)을 포함할 수 있다.
데이터 수집 모듈(321)은 복수의 사업장단말(100)을 운영하는 사업자에 대한 대한 원천 데이터 확보를 수행할 수 있으며, 도 3과 같은 분석기업 수 현황을 수집하여 활용할 수 있다.
보다 구체적으로, 데이터 수집 모듈(321)은 수집데이터 수집을 위한 SQL / NoSql 수집기를 활용함으로써, "매출 추이 데이터"{Dart 분기실적데이터, 공공데이터(휴폐업), 사용자 제공 데이터(File, 원장 데이터), POS 데이터, 세금계산서 데이터, 카드사 데이터 등}을 사업장단말(100)으로부터 네트워크(200)를 통해 직접 제공받거나 각 사업장단말(100)의 계정으로 등록된 데이터서버(500)에 대한 요청을 통해 네트워크(200)를 거쳐 간접 제공받을 수 있도록 송수신부(310)를 제어한 뒤, 데이터 처리 모듈(322)로 제공할 수 있다.
데이터 처리 모듈(322)은 "매출 추이 데이터"를 데이터 수집 모듈(321)로부터 제공받아 저장하는 '데이터 적재 과정'을 수행할 수 있으며, 불특정 다수의 DB를 타겟으로 하여 SQL 및 NOSQL 기반 프레임웍 활용이 가능할 수 있다.
본 발명의 다른 실시예로, 데이터 처리 모듈(322)은 원천 데이터(MariaDB SQL / Clickhouse SQL 저장소)로 구분된 저장소에 저장할 수 있다. 즉, 데이터 처리 모듈(322)은 원천데이터, Dart 수집 결과, 공공데이터, 파일데이터 등으로 구분 가능한 "매출 추이 데이터"를 적재할 수 있다.
다음으로, 데이터 처리 모듈(322)은 데이터 전처리/정제 프로세스 모듈을 구비함으로써, '데이터 전처리 / 정제 과정' 을 수행할 수 있으며, 데이터 전처리/정제 프로세스 모듈은 전처리 서버_파이썬 기반으로 작동할 수 있다. 데이터 정제/전처리 과정은 정합성, 이상치, 데이터 클렌징 등이 수행될 수 있다.
또한, 데이터 처리 모듈(322)은 상거래 거래 패턴 정보, 매출 정보(존재하는 경우 한정), 업종 정보와 휴폐업과의 상관 관계 분석을 위한 데이터 정제를 수행하는 것이다.
다음으로, 데이터 처리 모듈(322)은 '분석 데이터 데이터 적재 과정'을 수행할 수 있다. 전처리 적제 결과로 정제결과 데이터, 학습용 데이터 및 분석용 데이터를 데이터베이스(330)에 데이터 처리 모듈(322)이 제공할 수 있으며, 주기성을 가지는 거래 패턴을 분석용 데이터(지역, 업종별 각각 분석)로 적재할 수 있다.
정보분석모듈(323)은 분석용 데이터에 대해서 'ML(머신러닝) 과정'을 수행하기 위해 학습데이터 기반 입력데이터 분석모듈을 구비함으로써, 분석용 데이터에 해당하는 학습 결과 데이터 입력 또는 분석대상 데이터 입력에 따라, 지역/업종별 상거래 데이터와 휴 폐업 관계를 분석하되, 주기성을 가지는 상거래 데이터(소상공인 식자재 구매, 제조업 물품대 구매, ...) 변화 패턴과 휴폐업과의 관계 분석할 뿐만 아니라, 구매 후 매출과 관련 있는 거래가 주요 분석 대상(정수기, 보안업체, 방제 업체 거래를 포함하여 매월 고정 지출 비용 감소는 제외)으로 과정을 수행할 수 있다.
결과 처리모듈(324)은 분석결과 데이터를 생성하고, 기업휴폐업 예측 서비스 정보를 제공할 수 있으며, 이때, 사업장단말(100) 및 서비스단말(400) 중 적어도 하나 이상에게 정보를 제공할 수 있으며, 도 3과 같은 기업 위험 예측 그래프와 분석 결과 기업 수 현환 등도 제공할 수 있다.
분석결과 데이터를 생성시, 결과 처리모듈(324)은 ML 분석 결과 데이터를 생성하는 것이다.
기업휴폐업 예측 서비스 정보를 제공시, 결과 처리모듈(324)은 분석 결과 데이터와 메타(meta)정보를 결합하여 데이터베이스(330)에 저장할 수 있다. 여기서 메타정보는 서비스를 요청한 사업장단말(100) 또는 서비스단말(400)과 동일한 사업군, 동일한 지역, 동일 및 유사 업종 등과 같은 매핑 정보일 수 있다.
이러한 1) 데이터 수집 모듈(321), 2) 데이터 처리 모듈(322), 3) 정보분석모듈(323), 4) 결과 처리모듈(324)에 의한 과정은 도 5와 같이 1) 원천 데이터 확보(S11), 2) 데이터 적재(S12), 데이터 전처리 / 정제(S13), 분석 데이터 마트 데이터 적재(S14), 3) ML(머신러닝)(S15), 4) 분석결과 데이터(S16) 및 기업휴폐업 예측 서비스 정보(S17)에 대한 과정일 수 있다.
한편, 정보분석모듈(323)에 의한 탐지기준에 대해서 살펴보면, (1) 업종, (2) 장기간 거래하던 업체와 거래 중단, (3) 매출 발생요인 급감(카드, 거래처, 세금계산서 발행, 분기매출실적, POS 데이터 기준 매출 등), (4) 거래추이특징(거래한 기업 수, 평균 거래 일자 수, 평균 거래 개월 수 ...) 등을 기준으로 기업휴폐업 예측으로 탐지할 수 있다. 그리고, 본 발명의 일실시예로, 정보분석모듈(323)에 의한 "모델검증 샘플데이터"는 세금계산서, Dart 기업 분기실적데이터일 수 있다.
그리고 정보분석모듈(323)에서 사용하는 "이상 징후 지수"는 ML(Machine Learning) 모델을 통하여 얻은 확률을 지수로 사용할 수 있다.
정보분석모듈(323)은 이상 징후 지수를 획득한 뒤, 유사 기업 탐색을 수행함으로써, 세금계산서가 없거나 Dart 기업 분기실적데이터에 따른 매출추이 데이터에 이상 징후가 발생한 기업을 학습시키고자 해당 기업과 유사한 기업을 탐색할 있으며, 분석 방법으로 기업별 데이터들을 비교하여 유사한 기업을 찾아낼 수 있다.
정보분석모듈(323)에 의한 유사한 기업 탐색 분석 방법에 쓰인 기법은 코사인 유사도(Cosine Similarity) 및 기하학적 거리, 유크리드 거리(Euclidean Distance)이 사용될 수 있다.
첫번째로, 코사인 유사도(Cosine Similarity)는 하기의 두개의 기업 A, B에 대한 이상 징후 지수(Ai, Bi)를 활용해 수학식 1에 의해 연산될 수 있다.
두번째로, 기하학적 거리, 유크리드 거리(Euclidean Distance)는 두개의 기업 x, y에 대한 이상 징후 지수(xi, yi)를 활용해 수학식 2에 의해 연산될 수 있다.
이라한 정보분석모듈(323)에 의한 유사한 기업 탐색 분석 방법의 필수 조건으로는 1) 해당 기업과 같은 업종을 우선적으로 선별, 2) 같은 업종에 유사한 기업이 없으면 다른 업종의 기업을 선택, 3) Cosine Similarity가 0.3 초과하는 기업들 선택할 수 있으며, 최종 선택 조건으로 Cosine Similarity가 높은 기업 중 기업별 데이터 Euclidean Distance가 적은 최대 3개의 기업 선택할 수 있다.
또한, 본 발명의 다른 실시예로, 정보분석모듈(323)에 의한 부도 기업 탐색이 수행될 수 있으며, 세금계산서 내에 데이터를 통하여 부도 및 휴폐업 기업들 분류할 수 있다.
부도 기업 탐색의 분석 방법에 있어서, 각 기업들의 6년치 데이터를 이용하여 부도 기업의 특징을 찾아서 ML(Machine Learning) 기법으로 분류할 수 있다.
분석에 쓰인 세부 변수들은 하기의 표 1 및 도 4와 같을 수 있으며, BYR_PRDCT_BIZ_CD, RECENT_STOP, MAX_MONTH_DIF 변수가 영향력이 큰 변수일 수 있다.
정보분석모듈(323)에 의한 ML의 전처리 및 모델링 기법으로는 Standard Scaler, PCA, Over Sampling, ML(Random Forest, XGB, Ensemble ect)이 적어도 하나 이상 사용될 수 있다.
본 발명의 다른 실시예로, 정보분석모듈(323)은 분산 파일 프로그램에 의해 세부 변수 별로에 분산 저장된 수집 데이터를 머신러닝 알고리즘을 통해 분석하고 실제 부도난 기업의 표본들과 세부 변수별 비교를 통한 부도 기업 탐색을 수행할 수 있다. 여기서 보다 구체적으로, 정보분석모듈(323)에서 사용되는 머신러닝 알고리즘은 의사결정트리(DT) 분류 알고리즘, 랜덤 포레스트 분류 알고리즘, SVM 분류알고리즘, XGboost 분류 알고리즘, Light GBM 분류 알고리즘 중 하나일 수 있다.
정보분석모듈(323)은 분산 파일 프로그램에 의해 DCS DB에 분산 저장된 수집 데이터를 분석하여 그 분석한 결과로 다수의 특징 정보인 세부 변수의 각 변수별 임계범위 내의 공통된 파라미터를 추출하고 추출된 특징 정보에 해당하는 공통된 파라미터를 복수의 머신러닝 알고리즘 중 적어도 하나 이상을 이용하여 학습하여 학습한 결과로 부도 기업을 판단할 수 있다.
즉, 정보분석모듈(323)은 판단 결과의 정확도 향상을 위해 다수의 상호 보완적인 머신러닝 알고리즘들로 구성된 앙상블 구조를 적용할 수 있다.
결정 트리 분류 알고리즘은 트리 구조로 학습하여 결과를 도출하는 방식으로 결과 해석 및 이해가 용이하고, 데이터 처리 속도가 빠르며 탐색 트리 기반으로 룰 도출이 가능할 수 있다. DT의 낮은 분류 정확도를 개선하기 위한 방안으로 RF를 적용할 수 있다. 랜덤 포레스트 분류 알고리즘은 다수의 DT를 앙상블로 학습한 결과를 도축하는 방식으로, DT보다 결과 이해가 어려우나 DT보다 결과 정확도가 높을 수 있다. DT 또는 RF 학습을 통해 발생 가능한 과적합의 개선 방안으로 SVM을 적용할 수 있다. SVM 분류 알고리즘은 서로 다른 분류에 속한 데이터를 평면 기반으로 분류하는 방식으로, 일반적으로 높은 정확도를 갖고, 구조적으로 과적합(overfitting)에 낮은 민감도를 가질 수 있다.
정보분석모듈(323)은 머신러닝 이후 정제된 데이터를 활용해 딥러닝 수행하며, 딥러닝 방식은 부도 기업을 분석하여 형성된 패턴 데이터별 반복 작업시 하나의 전체 프로세스에 소요되는 시간인 사이클 타임(Cycle time)과, 각 판단시간의 최대 시간인 택트 타임(Tact time)의 감소를 최소화하는 방식으로 각 파라미터 데이터의 공정 파라미터에 대한 딥러닝 알고리즘 프로그램의 변환 및 적용에 따라 수행될 수 있다.

도 5와 같이, 본 발명의 실시예에 따른 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 방법은, 원천 데이터 확보(S11), 데이터 적제(S12), 데이터 전처리 / 정제(S13), 분석 데이터 마트 데이터 적제(S14), ML(머신러닝)(S15), 분석결과 데이터(S16), 기업휴폐업 예측 서비스 정보(S17) 과정을 통해 이루어질 수 있다.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.
컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술 분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이상과 같이, 본 명세서와 도면에는 본 발명의 바람직한 실시예에 대하여 개시하였으며, 비록 특정 용어들이 사용되었으나, 이는 단지 본 발명의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시예 외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다.
1 : 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템
100 : 사업장단말
200 : 네트워크
300 : 휴폐업 예측 서버
310 : 송수신부
320 : 제어부
321 : 데이터 수집 모듈
322 : 데이터 처리 모듈
323 : 정보분석모듈
324 : 결과 처리모듈
330 : 데이터베이스
400 : 서비스단말
500 : 데이터서버

Claims (8)

  1. 복수의 사업장단말(100), 네트워크(200), 휴폐업 예측 서버(300), 서비스단말(400), 데이터서버(500)를 포함하여, 휴폐업 예측 서버(300)가 사업자 또는 사업장에 대에 구비된 사업장 단말(100) 및 데이터서버(500)로부터 매출 추이 데이터(카드매출, pos 데이터, Dart 분기실적데이터, 세금계산서 포함)를 머신러닝 모델을 활용하여 분석하고, 머신러닝 모델에서 산출한 결과치를 통해 사업자 또는 사업장의 휴폐업 가능성 확률에 대한 예측을 탐지한 뒤, 사업장단말(100) 및 서비스단말(400) 중 적어도 하나 이상에게 정보를 제공하는 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템(1)에 있어서,
    휴폐업 예측 서버(300)는,
    송수신부(310), 제어부(320) 및 데이터베이스(330)를 포함하며, 제어부(320)는 데이터 수집 모듈(321), 데이터 처리 모듈(322), 정보분석모듈(323), 결과 처리모듈(324)을 포함하며,
    데이터 수집 모듈(321)은,
    복수의 사업장단말(100)을 운영하는 사업자에 대한 대한 원천 데이터 확보를 수행하며, 분석기업 수 현황을 수집하여 활용하되,
    수집데이터 수집을 위한 SQL / NoSql 수집기를 활용하여, "매출 추이 데이터"{Dart 분기실적데이터, 공공데이터(휴폐업), 사용자 제공 데이터(File, 원장 데이터), POS 데이터, 세금계산서 데이터, 카드사 데이터 포함}을 사업장단말(100)으로부터 네트워크(200)를 통해 직접 제공받거나 각 사업장단말(100)의 계정으로 등록된 데이터서버(500)에 대한 요청을 통해 네트워크(200)를 거쳐 간접 제공받을 수 있도록 송수신부(310)를 제어한 뒤, 데이터 처리 모듈(322)로 제공하며,
    데이터 처리 모듈(322)은,
    "매출 추이 데이터"를 데이터 수집 모듈(321)로부터 제공받아 저장하는 '데이터 적재 과정'을 수행하며, 복수의 DB를 타겟으로 하여 SQL 및 NOSQL 기반 프레임웍 활용을 수행하며,
    원천 데이터(MariaDB SQL / Clickhouse SQL 저장소)로 구분된 저장소에 저장하되, 원천데이터, Dart 수집 결과, 공공데이터, 파일데이터를 포함하여 구분 가능한 "매출 추이 데이터"를 적재하며,
    데이터 전처리/정제 프로세스 모듈을 구비하여, '데이터 전처리 / 정제 과정' 을 수행하며, 데이터 전처리/정제 프로세스 모듈은 전처리 서버_파이썬 기반으로 작동하며, 데이터 정제/전처리 과정은 정합성, 이상치, 데이터 클렌징을 포함하여 수행되며,
    데이터 처리 모듈(322)은,
    상거래 거래 패턴 정보, 매출 정보(존재하는 경우 한정), 업종 정보와 휴폐업과의 상관 관계 분석을 위한 데이터 정제를 수행할 뿐만 아니라, '분석 데이터 데이터 적재 과정'을 수행하며, 전처리 적제 결과로 정제결과 데이터, 학습용 데이터 및 분석용 데이터를 데이터베이스(330)로 제공하며, 주기성을 가지는 거래 패턴을 분석용 데이터(지역, 업종별 각각 분석 포함)로 적재하며,
    정보분석모듈(323)은,
    분석용 데이터에 대해서 'ML(머신러닝) 과정'을 수행하기 위해 학습데이터 기반 입력데이터 분석모듈을 구비함으로써, 분석용 데이터에 해당하는 학습 결과 데이터 입력 또는 분석대상 데이터 입력에 따라, 지역/업종별 상거래 데이터와 휴 폐업 관계를 분석하되, 주기성을 가지는 상거래 데이터(소상공인 식자재 구매, 제조업 물품대 구매 포함) 변화 패턴과 휴폐업과의 관계 분석할 뿐만 아니라, 구매 후 매출과 관련 있는 거래가 주요 분석 대상(정수기, 보안업체, 방제 업체 거래를 포함하여 매월 고정 지출 비용 감소는 제외)으로 과정을 수행하며,
    결과 처리모듈(324)은,
    분석결과 데이터를 생성하고, 기업휴폐업 예측 서비스 정보를 제공하며,
    사업장단말(100) 및 서비스단말(400) 중 적어도 하나 이상에게 정보를 제공하며, 기업 위험 예측 그래프와 분석 결과 기업 수 현황도 제공하며,
    분석결과 데이터를 생성시, ML 분석 결과 데이터를 생성하며,
    기업휴폐업 예측 서비스 정보를 제공시, 분석 결과 데이터와 메타(meta)정보를 결합하여 데이터베이스(330)에 저장하며, 메타정보로 서비스를 요청한 사업장단말(100) 또는 서비스단말(400)과 동일한 사업군, 동일한 지역, 동일 및 유사 업종을 포함하는 매핑 정보를 활용하며,
    정보분석모듈(323)에 의한 휴폐업 탐지기준으로, (1) 업종, (2) 장기간 거래하던 업체와 거래 중단, (3) 매출 발생요인 급감(카드, 거래처, 세금계산서 발행, 분기매출실적, POS 데이터 기준 매출 포함), (4) 거래추이특징(거래한 기업 수, 평균 거래 일자 수, 평균 거래 개월 수 포함)을 포함한 기준으로 기업휴폐업 예측으로 탐지하며,
    정보분석모듈(323)에 의한 "모델검증 샘플데이터"는 세금계산서, Dart 기업 분기실적데이터이며, 정보분석모듈(323)에서 사용하는 "이상 징후 지수"는 ML(Machine Learning) 모델을 통하여 얻은 확률을 지수로 사용하는 경우,
    정보분석모듈(323)은,
    이상 징후 지수를 획득한 뒤, 유사 기업 탐색을 수행하여, 세금계산서가 없거나 Dart 기업 분기실적데이터에 따른 매출추이 데이터에 이상 징후가 발생한 기업을 학습시키고자 해당 기업과 유사한 기업을 탐하며, 분석 방법으로 기업별 데이터들을 비교하여 유사한 기업을 찾아내며,
    정보분석모듈(323)에 의한 유사한 기업 탐색 분석 방법에 쓰인 기법은 코사인 유사도(Cosine Similarity) 및 기하학적 거리, 유크리드 거리(Euclidean Distance)이 사용되며,
    코사인 유사도(Cosine Similarity)에 있어서, 두개의 기업 A, B에 대한 이상 징후 지수(Ai, Bi)를 활용해 에 의해 연산하며,
    기하학적 거리, 유크리드 거리(Euclidean Distance)는 두개의 기업 x, y에 대한 이상 징후 지수(xi, yi)를 활용해 에 의해 연산되며,
    정보분석모듈(323)에 의한 유사한 기업 탐색 분석 방법의 필수 조건으로는 1) 해당 기업과 같은 업종을 우선적으로 선별, 2) 같은 업종에 유사한 기업이 없으면 다른 업종의 기업을 선택, 3) Cosine Similarity가 0.3 초과하는 기업들 선택하며, 최종 선택 조건으로 Cosine Similarity가 상대적으로 높은 기업 중 기업별 데이터 Euclidean Distance가 적은 최대 3개의 기업 선택하며,
    정보분석모듈(323)에 의한 부도 기업 탐색이 수행되며, 세금계산서 내에 데이터를 통하여 부도 및 휴폐업 기업들 분류하며,
    부도 기업 탐색의 분석 방법에 있어서, 각 기업들의 미리 설정된 기간 데이터를 이용하여 부도 기업의 특징을 찾아서 ML(Machine Learning) 기법으로 분류하며,
    분석에 쓰인 세부 변수들은 BYR_PRDCT_BIZ_CD(업종코드), CONUT_MONTHS(6년 동안 거래한 개월수), MAX_COUNT_MONTHS_BYR_SUP(6년 동안 한 공급기업과 거래한 최고 거래 개월 수), AVG_COUNT_MONTHS_BYR_SUP(6년 동안 한 공급기업과 거래한 평균 개월 수), AVG_COUNT_DAYS(월별 평균 거래 일자 수), AVG_SUM_TOT_AMT(월별 총 거래금액의 평균), COUNT_SUP(3년 동안 거래한 공급기업), RECENT_STOP(6개월 이내로 서비스 공급기업을 끊은 달 수), MAX_MONTH_DIF(거래 내역 상 가장 최근 날짜로부터 끊긴 달 수) 변수이며,
    정보분석모듈(323)에 의한 ML의 전처리 및 모델링 기법으로는 Standard Scaler, PCA, Over Sampling, ML(Random Forest, XGB, Ensemble ect)이 적어도 하나 이상 사용되며,
    정보분석모듈(323)은 분산 파일 프로그램에 의해 분석에 쓰인 세부 변수들에 해당하는 세부 변수 별로에 분산 저장된 수집 데이터를 머신러닝 알고리즘을 통해 분석하고 실제 부도난 기업의 표본들과 세부 변수별 비교를 통한 부도 기업 탐색을 수행하되, 정보분석모듈(323)에서 사용되는 머신러닝 알고리즘은 의사결정트리(DT) 분류 알고리즘, 랜덤 포레스트 분류 알고리즘, SVM 분류알고리즘, XGboost 분류 알고리즘, Light GBM 분류 알고리즘 중 하나일 수 이며,
    정보분석모듈(323)은 분산 파일 프로그램에 의해 DCS DB에 분산 저장된 수집 데이터를 분석하여 분석한 결과로 다수의 특징 정보에 해당하는 분석에 쓰인 세부 변수들 중 각 세부 변수의 각 변수별 임계범위 내의 공통된 파라미터를 추출하고 추출된 특징 정보에 해당하는 공통된 파라미터를 복수의 머신러닝 알고리즘 중 적어도 하나 이상을 이용하여 학습하여 학습한 결과로 부도 기업을 판단하되, 판단 결과의 정확도 향상을 위해 다수의 상호 보완적인 머신러닝 알고리즘들로 구성된 앙상블 구조를 적용하며,
    정보분석모듈(323)은 머신러닝 이후 정제된 데이터를 활용해 딥러닝 수행하며, 딥러닝 방식은 부도 기업을 분석하여 형성된 패턴 데이터별 반복 작업시 하나의 전체 프로세스에 소요되는 시간인 사이클 타임(Cycle time)과, 각 판단시간의 최대 시간인 택트 타임(Tact time)의 감소를 최소화하는 방식으로 각 파라미터 데이터의 공정 파라미터에 대한 딥러닝 알고리즘 프로그램의 변환 및 적용에 따라 수행하는 것을 특징으로 하는 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
KR1020220164931A 2022-11-30 2022-11-30 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법 KR102677721B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220164931A KR102677721B1 (ko) 2022-11-30 2022-11-30 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220164931A KR102677721B1 (ko) 2022-11-30 2022-11-30 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20240081044A KR20240081044A (ko) 2024-06-07
KR102677721B1 true KR102677721B1 (ko) 2024-06-25

Family

ID=91479915

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220164931A KR102677721B1 (ko) 2022-11-30 2022-11-30 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102677721B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100517883B1 (ko) * 2005-01-27 2005-09-28 엠씨지컨설팅(주) 기업신용평가 정보제공 시스템 및 방법
KR102084389B1 (ko) * 2019-06-18 2020-03-04 한국과학기술정보연구원 기업평가방법 및 시스템
KR102471985B1 (ko) * 2022-06-27 2022-11-29 주식회사 몬데인컨설팅 인공지능에 기반한 사업 경영 컨설팅 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100517883B1 (ko) * 2005-01-27 2005-09-28 엠씨지컨설팅(주) 기업신용평가 정보제공 시스템 및 방법
KR102084389B1 (ko) * 2019-06-18 2020-03-04 한국과학기술정보연구원 기업평가방법 및 시스템
KR102471985B1 (ko) * 2022-06-27 2022-11-29 주식회사 몬데인컨설팅 인공지능에 기반한 사업 경영 컨설팅 시스템

Also Published As

Publication number Publication date
KR20240081044A (ko) 2024-06-07

Similar Documents

Publication Publication Date Title
Bose et al. Business data mining—a machine learning perspective
Raju et al. Data mining: Techniques for enhancing customer relationship management in banking and retail industries
CN114048870A (zh) 一种基于日志特征智能挖掘的电力***异常监测方法
KR102168198B1 (ko) 기업 부도 예측 시스템 및 이의 동작 방법
CN102667775A (zh) 训练和使用具有关联规则模型的分类模型的方法
Li et al. RETRACTED ARTICLE: Data mining optimization model for financial management information system based on improved genetic algorithm
Chern et al. A decision tree classifier for credit assessment problems in big data environments
CN115358481A (zh) 一种企业外迁预警识别的方法、***及装置
Verma et al. Data mining: next generation challenges and futureDirections
Hasheminejad et al. Data mining techniques for analyzing bank customers: A survey
CN117764724A (zh) 一种智能化的信用评级报告构建方法及***
KR102677721B1 (ko) 매출추이 데이터에 근거한 사업자 휴폐업 예측모델 시스템 및 방법
CN117237038A (zh) 一种基于流量引擎的商品精准曝光处理***
Liu Design of XGBoost prediction model for financial operation fraud of listed companies
Wu et al. Customer churn prediction for commercial banks using customer-value-weighted machine learning models
KR102543211B1 (ko) 비정형 기업 데이터를 이용한 기업성장 예측 시스템
KR102499182B1 (ko) 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템
Piatetsky-Shapiro Data mining and knowledge discovery in business databases
Ul Ain et al. Analysis of variant data mining methods for depiction of fraud
Singh et al. Two-tiered clustering classification experiments for market segmentation of EFTPOS retailers
Gopala Krishnan et al. Predictive algorithm and criteria to perform big data analytics
Xuanyuan et al. Application of C4. 5 Algorithm in Insurance and Financial Services Using Data Mining Methods
Roselin et al. Customer Behaviour Analysis for Credit Card Proposers Based on Data Mining Techniques
Wang et al. Diminishing downsides of data mining
Gusmão et al. A Customer Journey Mapping Approach to Improve CPFL Energia Fraud Detection Predictive Models

Legal Events

Date Code Title Description
AMND Amendment
AMND Amendment
E601 Decision to refuse application
X701 Decision to grant (after re-examination)
GRNT Written decision to grant