KR20230142108A - 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법, 장치 및 컴퓨터-판독가능 기록매체 - Google Patents

딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법, 장치 및 컴퓨터-판독가능 기록매체 Download PDF

Info

Publication number
KR20230142108A
KR20230142108A KR1020220040894A KR20220040894A KR20230142108A KR 20230142108 A KR20230142108 A KR 20230142108A KR 1020220040894 A KR1020220040894 A KR 1020220040894A KR 20220040894 A KR20220040894 A KR 20220040894A KR 20230142108 A KR20230142108 A KR 20230142108A
Authority
KR
South Korea
Prior art keywords
data
information
user account
user
notification
Prior art date
Application number
KR1020220040894A
Other languages
English (en)
Inventor
이경일
베를로셰 이반
Original Assignee
주식회사 솔트룩스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 솔트룩스 filed Critical 주식회사 솔트룩스
Priority to KR1020220040894A priority Critical patent/KR20230142108A/ko
Priority to PCT/KR2023/002673 priority patent/WO2023191317A1/ko
Publication of KR20230142108A publication Critical patent/KR20230142108A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/323Visualisation of programs or trace data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

유저들이 관심 있어하는 토픽에 대한 데이터의 등록을 감지 시, 이로부터 유저들에게 영향을 주는 이벤트의 발생 여부를 판단하고, 이벤트 발생 시, 데이터로부터 분석될 수 있는 다양한 정보를 자동으로 추출하여 유저에게 제공하여, 유저별로 맞춤화된 유용한 정보를 조기에 감지 및 제공받을 수 있도록 하여 사업에 대한 의사 결정 등에 유용하게 활용할 수 있도록 한다. 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법은, 온라인 상의 게시 컨텐츠를 포함하는 데이터가 업로드되는 다수의 데이터 소스로부터 데이터의 등록 시 등록된 데이터를 크롤링(Crawling)하여 데이터의 등록을 관리하는 데이터 수집 및 관리 단계; 크롤링된 데이터에 대해서, 유저 계정으로부터 설정된 정보로서 유저 계정의 관심 정보를 포함하는 관심 토픽별로 인덱싱(Indexing)하여 저장하는 데이터 분류 및 저장 단계; 저장된 데이터에 포함된 텍스트 데이터의 분석을 통해 상기 저장된 데이터의 등록으로 발생된 이벤트가 유저 계정에 대한 알림 대상이 되는 통지 대상 이벤트인지 여부를 딥시그널 알고리즘을 이용하여 판단하는 데이터 분석 단계; 및 데이터 분석 단계에서 통지 대상 이벤트로 판단되는 데이터에 대해서 적어도 데이터의 메인 키워드를 포함하는 식별 정보, 등록된 데이터가 관심 토픽에 영향을 미치는 속성 정보인 이벤트 타입 정보 및 등록된 데이터에 포함된 컨텐츠의 내용 정보를 포함하는 통지 정보를 생성하여 유저 계정에 전송하는 알림 단계;를 포함하는 것을 특징으로 한다.

Description

딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법, 장치 및 컴퓨터-판독가능 기록매체{PROVIDING METHOD, APPARATUS AND COMPUTER-READABLE MEDIUM OF MONITORING RISK OR OPPORTUNITY EVENTS ON USER-CUSTOMIZED TOPICS THROUGH DEEP SIGNAL}
본 발명은 온라인 상의 유저가 관심을 두는 주식 종목 등을 포함하는 객체의 키워드를 의미하는 토픽에 대한 이벤트가 발생됨을 감지 시 이를 조기에 감지 및 통지하기 위한 기술에 관한 것으로, 구체적으로는, 유저가 세팅한 바에 따라서 유저별로 맞춤화된 관심 토픽에 대해서, 게시글, 뉴스 등의 등록 시 그 중요성을 판단하고, 특정 이벤트가 발생된 것으로 판단된 경우 즉시 이를 유저에게 알려, 유저가 주식, 사업 등의 의사 결정에 있어서 최신의 트렌드를 정확하게 반영할 수 있도록 하는 기술에 관한 것이다.
개인이나 기업 들은, 최근 매우 급변하고 있는 온/오프라인 상의 정보에 대해서 사업, 투자, 또는 기타 의사결정에 있어서 영향을 미치는 정보에 대해서, 사업, 투자 또는 의사결정 상의 손실을 방지하거나, 좋은 기회를 놓치지 않기 위하여, 적시에 정보에 대한 주의를 기울여야 한다.
특히, 상술한 개인 또는 기업에 영향을 미치는 정보들은 특정 이벤트로 발생되는데, 예를 들어 주가의 변동, 주요 영향을 미치는 뉴스, 투자 대상에 대한 주요 감성이 들어나는 게시글이나 정보 등의 온라인 상의 공개가 이에 속한다. 이러한 이벤트는 온라인 상의 다양한 공간에서 동시 다발적으로 다양한 토픽에 대해서 발생됨에 따라서 유저들은 이에 대한 세심한 관심을 기울여야 한다.
이러한 이벤트들을 감지하기 위해서는, SNS, 웹페이지, 클라우드 서버 등 매우 다양한 소스로서, 상술한 이벤트를 포함하는 데이터가 등록되는 데이터 소스를 매우 다양하게 동시에 모니터링해야 한다. 또한, 이들 데이터 소스로부터, 유저들은 자신이 관심있는 토픽을 분류 및 필터링(Filtering)하고, 이에 대한 정보를 추출할 수 있어야 한다.
또한, 해당 데이터에 포함된 메시지가 관심 토픽에 어떤 영향이 있는지 또는 어떤 세부 토픽에 해당하는 컨텐츠인지 여부를 파악하기 위해서 유저들이 직접 해당 데이터를 상세히 모니터링하거나, 이로부터 많은 메타데이터를 추출해야 한다.
그러나, 매우 다양하고 대량의 정보가 등록되는 최근에는, 상술한 프로세스를 유저들이 직접 수행하는 것이 매우 힘들고, 이에 따라서 이벤트의 발생을 적시에 감지하지 못함에 따라서 리스크 관리 또는 기회 포착을 적시에 하지 못하는 문제가 있다.
이러한 문제에 대해서 예를 들어 미국등록특허 8230445호 등에서는, 특정 이벤트의 발생을 검출하는 에이전트가, 특정 데이터소스로부터 이벤트의 발생을 감지 시, 유저가 설정한 키워드에 대응하는 데이터를 데이터 소스로부터 검출한 뒤 이를 유저들에게 메일 등의 다양한 방식으로 알리는 기술을 게시하고 있다.
그러나, 이는 단순한 키워드 기반 검색으로서, 해당 정보로부터 유저들에게 실질적으로 유용한 정보를 적시에 제공하는 것은 매우 힘들고, 유저들은 결국 포털 사이트 등에서 키워드 검색 후 컨텐츠에 대한 직접 분석을 해야 하는 것과 같이, 데이터 소스로부터 검색된 이벤트에 대응되는 데이터를 직접 분석해야 해서, 대량의 데이터로부터 유용한 정보를 추출하지 못하는 문제점이 있다.
이에 본 발명은, 다양한 데이터 소스로부터 유저들이 관심 있어하는 토픽에 대한 데이터의 등록을 감지 시, 이로부터 유저들에게 영향을 주는 이벤트의 발생 여부를 판단하고, 이벤트 발생 시, 데이터로부터 분석될 수 있는 다양한 정보를 자동으로 추출하여 유저에게 제공함으로써, 유저들에게 자신이 관심있어 하는 토픽에 대한 유용한 정보들을 조기에 감지 및 제공받을 수 있도록 하여, 개인이나 기업 등의 다양한 업무에 있어서 즉시적으로 유용한 정보를 제공하는 기술을 제공하는 데 그 목적이 있다.
상기 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법은, 온라인 상의 게시 컨텐츠를 포함하는 데이터가 업로드되는 다수의 데이터 소스로부터 데이터의 등록 시 등록된 데이터를 크롤링(Crawling)하여 데이터의 등록을 관리하는 데이터 수집 및 관리 단계; 크롤링된 데이터에 대해서, 유저 계정으로부터 설정된 정보로서 유저 계정의 관심 정보를 포함하는 관심 토픽별로 인덱싱(Indexing)하여 저장하는 데이터 분류 및 저장 단계; 상기 저장된 데이터에 포함된 텍스트 데이터의 분석을 통해 상기 저장된 데이터의 등록으로 발생된 이벤트가 유저 계정에 대한 알림 대상이 되는 통지 대상 이벤트인지 여부를 딥시그널 알고리즘을 이용하여 판단하는 데이터 분석 단계; 및 상기 데이터 분석 단계에서 통지 대상 이벤트로 판단되는 데이터에 대해서 적어도 데이터의 메인 키워드를 포함하는 식별 정보, 등록된 데이터가 관심 토픽에 영향을 미치는 속성 정보인 이벤트 타입 정보 및 등록된 데이터에 포함된 컨텐츠의 내용 정보를 포함하는 통지 정보를 생성하여 유저 계정에 전송하는 알림 단계;를 포함하는 것을 특징으로 한다.
상기 데이터 수집 및 관리 단계는, 로그인 없이 데이터 수집이 가능한 데이터 소스로부터 데이터를 크롤링하는 제1 크롤러 및 유저 계정의 로그인 시 데이터 수집이 가능한 데이터 소스에 접근하여 유저 계정을 이용하여 로그인하고 데이터를 크롤링하는 제2 크롤러 중 어느 하나를 데이터 소스에 대한 유저 계정의 로그인 필요성을 기준으로 데이터 소스 별로 이용하여 데이터를 크롤링하는 것이 가능하다.
상기 데이터 수집 및 관리 단계는, 유저가 이벤트 알림을 받고자 하는 대상에 대한 키워드 정보를 포함하는 관심 정보를 컨텐츠 내에 포함하는 데이터를 크롤링하는 것이 가능하다.
상기 데이터 수집 및 관리 단계는, 크롤링되는 데이터에 대한 통계 수치, 정상적인 크롤링 여부를 나타내는 크롤링 오류 비율 및 데이터 소스에 대한 접근 실패 정보를 포함하는 크롤링 모니터링 정보를 생성하여 유저 계정에 전송하는 것이 가능하다.
다양한 데이터 스키마(Schema) 및 이기종 데이터 소스에 대응하기 위하여, 크롤링된 데이터가 저장되는 데이터베이스는 확장 가능한 NoSQL 저장소인 것이 가능하다.
상기 데이터 분석 단계는, 데이터에 포함된 텍스트를 번역하여 유저 계정에서 설정된 언어로 텍스트를 분석하되, 데이터에 포함된 텍스트 분석 결과에 대한 인코딩 오류, 이진 문서로의 번역에 따른 번역 오류 및 텍스트 분석 결과 유저 계정에서 설정된 스팸 분류 기준에 속함에 따른 데이터의 스팸 분류 결과를 포함하는 비정상 분석 결과를 감지하고, 유저 계정에 비정상 분석 결과에 대한 리포트를 제공하는 것이 가능하다.
상기 데이터 분석 단계는, 상기 딥시그널 알고리즘으로서, 인공지능 기반 알고리즘들로서, 기설정된 텍스트 감성 분석 알고리즘, 데이터에 포함된 이미지에 대한 기설정된 이미지 분석 알고리즘, 텍스트 저작자, 텍스트에 포함된 토픽 및 텍스트를 기반으로 인지 가능한 이벤트를 추출 가능한 기설정된 문장 구조 분석 및 키워드 추출 알고리즘, 및 데이터에 포함된 텍스트를 기설정된 개수의 문장으로 요약하는 기설정된 문장 요약 알고리즘을 이용하여 데이터에 포함된 텍스트 데이터 및 비텍스트 데이터를 분석하고, 분석된 토픽이 유저 계정에 기설정된 관심 토픽에 해당하는 경우, 상기 데이터를 통지 대상 이벤트에 속하는 것으로 판단하는 알고리즘을 이용하는 것이 가능하다.
상기 알림 단계는, 상기 데이터 분석 단계를 통해 도출된 정보를 이용하여, 토픽의 시계열 집계 통계 정보와, 토픽에 대응되는 데이터에 대한 온라인 상의 등록 및 열람 수치를 기반으로 판단되는 인기 주제, 인기 문서 및 인기 대상을 포함하는 인기 객체 정보를 데이터의 접근이 가능한 접속 링크 정보와 함께 유저 계정에 등록된 알림 주소로 전송하는 것이 가능하다.
본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 장치는, 온라인 상의 게시 컨텐츠를 포함하는 데이터가 업로드되는 다수의 데이터 소스로부터 데이터의 등록 시 등록된 데이터를 크롤링(Crawling)하여 데이터의 등록을 관리하는 데이터 수집 및 관리부; 크롤링된 데이터에 대해서, 유저 계정으로부터 설정된 정보로서 유저 계정의 관심 정보를 포함하는 관심 토픽별로 인덱싱(Indexing)하여 저장하는 데이터 분류 및 저장부; 상기 저장된 데이터에 포함된 텍스트 데이터의 분석을 통해 상기 저장된 데이터의 등록으로 발생된 이벤트가 유저 계정에 대한 알림 대상이 되는 통지 대상 이벤트인지 여부를 딥시그널 알고리즘을 이용하여 판단하는 데이터 분석부; 및 상기 데이터 분석 단계에서 통지 대상 이벤트로 판단되는 데이터에 대해서 적어도 데이터의 메인 키워드를 포함하는 식별 정보, 등록된 데이터가 관심 토픽에 영향을 미치는 속성 정보인 이벤트 타입 정보 및 등록된 데이터에 포함된 컨텐츠의 내용 정보를 포함하는 통지 정보를 생성하여 유저 계정에 전송하는 알림부;를 포함하는 것을 특징으로 한다.
본 발명에 의하면, 다양한 데이터 소스에 대해서 데이터의 등록을 감지 시, 이를 감지한 뒤 다양한 데이터들 중 유저가 관심있어하는 토픽에 대해서 분류를 수행한 뒤 이를 유저별 확장 가능한 데이터 저장공간에 저장하고, 이로부터 이벤트의 발생 여부를 판단한 뒤, 이벤트 발생 시 데이터로부터 추출되는 다양한 메타데이터, 감성분석 결과, 요약문 등의 정보를 이벤트 알림 정보와 함께 유저 계정에 전송하게 된다.
이러한 본 발명의 기능 구현에 따르면, 유저들에게 영향을 주는 이벤트의 발생 여부를 판단하고, 이벤트 발생 시, 데이터로부터 분석될 수 있는 다양한 정보를 자동으로 추출하여 유저에게 제공함으로써, 유저들에게 자신이 관심있어 하는 토픽에 대한 유용한 정보들을 조기에 감지 및 제공받을 수 있도록 하여, 개인이나 기업 등의 다양한 업무에 있어서 즉시적으로 유용한 정보를 제공할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법의 플로우차트.
도 2는 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 장치의 구성 블록도.
도 3은 본 발명의 일 실시예에 따른 데이터 수집 및 관리부의 세부 구성 블록도.
도 4는 본 발명의 일 실시예에 따른 데이터 분류 및 저장부의 세부 구성 블록도.
도 5는 본 발명의 일 실시예에 따른 데이터 분석부의 세부 구성 블록도.
도 6은 본 발명의 일 실시예에 따른 알림부의 세부 구성 블록도.
도 7은 본 발명의 일 실시예의 구현에 따라서 유저 계정에 제공되는 알람 정보의 예.
도 8은 본 발명의 일 실시 예에 따른 컴퓨팅 장치의 내부 구성의 일 예.
이하에서는, 다양한 실시 예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다.
본 명세서에서 사용되는 "실시 예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하지만, 하나이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다.
또한, 제 1, 제 2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
또한, 본 발명의 실시 예들에서, 별도로 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명의 실시 예에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
도 1은 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법의 플로우차트, 도 2는 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 장치의 구성 블록도, 도 3은 본 발명의 일 실시예에 따른 데이터 수집 및 관리부의 세부 구성 블록도, 도 4는 본 발명의 일 실시예에 따른 데이터 분류 및 저장부의 세부 구성 블록도, 도 5는 본 발명의 일 실시예에 따른 데이터 분석부의 세부 구성 블록도, 도 6은 본 발명의 일 실시예에 따른 알림부의 세부 구성 블록도, 도 7은 본 발명의 일 실시예의 구현에 따라서 유저 계정에 제공되는 알람 정보의 예이다. 이하의 설명에 있어서 본 발명의 다양한 구성요소 및 실시예에 대한 설명을 위하여 다수의 도면이 함께 참조되어 설명될 것이다.
상술한 도면을 참조하면, 먼저 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법(이하 본 발명의 방법이라 함)은, 후술하는 도 8에 도시된 컴퓨팅 장치 또는 도 2에 도시된 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 장치의 각 구성에 의하여 수행되는 것을 이해될 것이다. 즉, 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 장치 그 자체 또는 각 구성 요소는 상술한 컴퓨팅 장치 또는 복수의 컴퓨팅 장치로 구성될 수 있다.
도 1을 참조하면, 컴퓨팅 장치는 먼저, 온라인 상의 게시 컨텐츠를 포함하는 데이터가 업로드되는 다수의 데이터 소스로부터 데이터의 등록 시 등록된 데이터를 크롤링(Crawling)하여 데이터의 등록을 관리하는 데이터 수집 및 관리 단계(S10)를 수행한다.
본 발명에서 온라인 상이란, 유저가 단말을 통해 유무선 네트워크를 이용하여 접근 가능한 모든 온라인 상의 주소 또는 이에 대응하는 서버 등 가상의 공간을 통칭하는 개념으로 이해될 수 있다. 특히, 본 발명에 있어서는, 문서 등의 데이터에 대한 열람이나 다운로드가 가능한 가상 공간이 온라인 상의 공간에 대응되는 것으로 이해될 것이다.
본 발명에서 게시 컨텐츠는, 텍스트 및 비텍스트를 포함하는 컨텐츠로서, 후술하는 바와 같이 SNS 상의 유저들이 업로드한 동영상, 이미지, 텍스트 데이터 등의 컨텐츠, 학술자료, 뉴스, 블로그(Blog) 게시글 등 온라인 상에서 유저들이 확인 가능한 모든 컨텐츠를 포함한다.
데이터 소스는, 온라인 상의 가상 공간의 단위로서, 데이터의 접근이 가능한 서버 단위 또는 클라우드 단위의 저장소를 의미한다. 예를 들어 일 SNS(Social Network Service)나, 학술 자료 열람용 웹 페이지, 일반 포털 사이트 등 다양한 단위의 데이터에 대한 접근이 가능한 가상 공간 또는 이에 대응되는 저장소가 데이터를 공급하는 소스로서 데이터 소스로 지칭될 수 있다. 컴퓨팅 장치는, 데이터 소스로부터 데이터의 등록을 감지하기 위하여, 데이터 소스의 로그에 대한 접근 권한을 가질 수 있다.
데이터가 등록되는 순간 S10 단계를 통해 등록된 데이터가 크롤링, 즉 캡쳐링되어서, 후술하는 별도의 저장소에 데이터를 저장할 수 있도록 준비된다. 데이터를 저장할 수 있도록 준비함은, 최종적으로 저장소에 데이터를 저장하기 전 S20 단계의 수행을 위하여 임시로 특정 저장 공간에 데이터가 임시 저장됨을 의미하는 것으로 이해될 수 있다.
데이터 소스는 상술한 바와 같이 데이터에 대한 접근이 가능한 모든 장소를 의미한다. 이때 데이터 소스는 그 성격에 따라서 다양한 타입으로 분류될 수 있다. 예를 들어, 유저가 특정 아이디 등으로 로그인(Log-in)하는 과정 없이 데이터에 대한 접근이 가능한 데이터 소스가 있다. 예를 들어, 구글, 네이버, 트위터, 페이스북 등 플랫폼에 접속 시 데이터에 대한 접근이 가능한 형태이다.
한편, 유저가 특정 아이디 등으로 로그인하는 과정이 필요한 데이터 소스가 있다. 학교 게시판, 유저별 SNS, 네이버 카페 등이 이에 대한 예에 포함된다. 또한 개인 저장소로서, 유저가 로그인 하되, 완전히 폐쇄된 데이터 소스가 있다. 클라우드 저장소 등이 이에 대한 예로 들 수 있다.
이러한 경우에 컴퓨팅 장치는 서로 다른 크롤링 수단을 이용하여 데이터를 크롤링할 수 있다. 즉 데이터 소스의 접근 가능성 및 폐쇄성 여부에 따라서 서로 다른 크롤러를 사용할 수 있는 것이다. 이를 위해서 S10 단계의 수행에 있어서, 컴퓨팅 장치는 로그인 없이 데이터 수집이 가능한 데이터 소스로부터 데이터를 크롤링하는 제1 크롤러 및 유저 계정의 로그인 시 데이터 수집이 가능한 데이터 소스에 접근하여 유저 계정을 이용하여 로그인하고 데이터를 크롤링하는 제2 크롤러 중 어느 하나를 데이터 소스에 대한 유저 계정의 로그인 필요성을 기준으로 데이터 소스 별로 이용하여 데이터를 크롤링할 수 있다.
제2 크롤러의 경우, 컴퓨팅 장치는 제2 크롤러의 사용을 위해서, 유저가 본 발명의 방법에 따른 서비스를 제공하는 장치에 유저가 데이터의 접근을 위해서 등록한 데이터 소스에 대한 유저 계정의 아이디 및 패스워드 등을 유저 계정에 매칭하여 저장할 수 있으며, 데이터 소스에 따라서 같거나 다른 유저의 아이디 및 패스워드 등의 인증 정보를 이용하여, 데이터의 크롤링 시 제2 크롤러로 하여금 데이터 접근을 위해서 데이터 소스에 대한 인증을 수행하도록 할 수 있다.
한편, 본 발명에서는 유저에 맞춤화된 기회나 위험에 대응되는 데이터에 따른 이벤트를 알리는 데 그 목적이 있다. 이에 따라서 S10 단계에 있어서 컴퓨팅 장치는 데이터의 크롤링에 있어서 모든 데이터의 크롤링을 수행하지 않고, 유저가 설정한 조건에 만족하는 데이터에 대한 크롤링만을 수행하도록 설정할 수 있다.
예를 들어 상술한 서비스의 이용을 위하여 유저 계정을 등록하거나 관리 시, 유저들은 자신이 원하는 토픽이나 키워드 등을 관심 토픽 또는 관심 키워드로 지정 설정할 수 있다. 즉, 유저들은 상술한 관심 정보로서, 유저 계정에서 설정할 수 있는 관심 정보란에 이벤트 알림을 받고자 하는 대상에 대한 키워드 정보를 관심 정보로서 설정할 수 있다. 이때 S10 단계에 있어서 컴퓨팅 장치는 상술한 바와 같이 데이터의 등록을 감지 시, 데이터의 문서 구조 분석을 통해서, 관심 토픽 및 관심 키워드에 대응되거나, 단어 유사도 분석 알고리즘을 통해서 유저가 설정한 관심 정보에 해당하는 키워드와 유사한 토픽 또는 키워드를 포함하는 데이터만을 크롤링할 수 잇다. 본 발명에서 토픽은 데이터의 주제, 작성자, 작성 시간, 작성 장소 등에 대응되는 키워드나 문장을 의미하며, 키워드는 데이터에 포함된 단어 또는 단어군을 의미하는 것으로 이해될 수 있다.
데이터에서 토픽이나 키워드를 추출하는 데에는, 데이터가 텍스트인 경우 텍스트를 분석하여 이에 대응되는 토픽이나 키워드를 추출하는 프로세스를 의미한다. 한편, 데이터가 텍스트 이외의 이미지, 동영상 또는 음원 컨텐츠인 경우, 이에 매칭 저장된 해당 컨텐츠에 대한 토픽이나 키워드가 설정되어 저장되는 메타 데이터나, 예를 들어 이미지 분석을 통해서 도출되는 객체의 식별 정보, 색상 정보 등을 추출하는 프로세스를 의미할 수 있다.
한편, S10 단계에 있어서, 데이터의 크롤링이 정상적으로 이루어지는지 여부나, 데이터의 크롤링이 어떤 상태로 이루어지고 있는지 여부를 파악하는 것은, 유저에게 있어서 제공되는 정보에 대한 신뢰도 파악 및 트렌드 파악에 중요할 수 있다.
이를 위해서 본 발명의 다른 실시예에 있어서 S10 단계에서는, 크롤링되는 데이터에 대한 통계 수치, 정상적인 크롤링 여부를 나타내는 크롤링 오류 비율 및 데이터 소스에 대한 접근 실패 정보를 포함하는 크롤링 모니터링 정보를 생성하여 유저 계정에 전송하여, 현재 데이터에 대한 크롤링 상태를 모니터링할 수 있고, 이에 따라서 상술한 관심 토픽이나 관심 키워드의 편집 또는 데이터 소스에 대한 선택 등을 통해서 자신에게 맞춤화된 데이터 소스에서 데이터를 크롤링할 수 있도록 가이드할 수 있다.
이러한 다양한 기능을 수행하기 위하여, 도 2에 도시된 바와 같이 S10 단계의 기능을 수행하는 데이터 수집 및 관리부(11)가 본 발명의 일 실시예에 따른 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 장치(10, 이하 본 발명의 장치라 함)의 구성으로서 포함될 수 있다.
즉 데이터 수집 및 관리부(11)는 S10 단계에 대한 설명에서 언급한 바와 같이 온라인 상의 다수의 데이터 소스(100)로부터 데이터의 등록 시 등록된 데이터를 크롤링(Crawling)하여 데이터의 등록을 관리하는 기능을 수행한다.
이때 상술한 구체적인 기능을 수행하기 위해서, 도 3에 도시된 바와 같은 구체적인 구성 요소들을 포함할 수 있다. 이때, 상술한 제1 크롤러 및 제2 크롤러의 구분 기준과 달리, 데이터 소스의 종류에 따라서 서버 측 크롤러(110) 및 단말 측 크롤러(111)가 존재할 수 있다.
서버 측 크롤러(110)는 데이터 소스가 단말에서 접근 가능한 온라인 상의 원격의 서버에 대응되는 데이터 소스인 경우로서, 일반 API 기반 크롤러(1100), 일반 웹 사이트 크롤러(1101), 주식 크롤러(1102), 데이터 추출기(1103) 및 HTML 페이지 추출기(1104) 등이 포함될 수 있다.
이때 일반 API 기반 크롤러(1100), 일반 웹 사이트 크롤러(1101), 주식 크롤러(1102), 데이터 추출기(1103) 및 HTML 페이지 추출기(1104) 등은 앱이나 웹 상의 데이터 크롤러로서, 제1 크롤러에 속할 가능성이 높은 크롤러들을 의미할 수 있다.
한편, 단말 측 크롤러(111)는 유저별 개인 중요 정보가 저장되는 단말 측의 데이터를 크롤링하는 크롤러로서, 도 3에 도시된 바와 같이 클라우드 저장공간(1110), 파일 업로드(111), SNS 저장 공간(1112) 및 메타 검색기(1113) 등 개인의 접근시 인증이 필요한 데이터 소스에 대한 데이터 크롤러들이 포함될 수 있어, 주로 제2 크롤러가 이에 속하는 것으로 이해될 수 있다.
한편, 크롤링 분석기(112)는, 상술한 데이터의 크롤링이 정상적으로 이루어지는지 여부나, 데이터의 크롤링이 어떤 상태로 이루어지고 있는지 여부를 파악하는 기능을 수행하는 구성으로 이해될 수 있다.
S10 단계가 수행되면, 컴퓨팅 장치는, 크롤링된 데이터에 대해서, 유저 계정으로부터 설정된 정보로서 상술한 유저 계정의 관심 정보를 포함하는 관심 토픽별로 인덱싱(Indexing)하여 도 2에 도시된 크롤링된 데이터에 대한 데이터베이스(15)에 저장하는 데이터 분류 및 저장 단계(S20)를 수행한다.
크롤링된 데이터는, 다양한 비정형 세부 데이터로서, 텍스트, 이미지, 동영상, 음원 등을 포함하고 있다. S20 단계에서는 이에 대해서 상술한 바와 같이 유저 계정에 설정된 관심 토픽이나 키워드 등, 바람직하게는 관심 토픽별로, 데이터를 분류하고 이에 대한 인덱싱을 수행하여 데이터가 어떤 토픽에 대응되는지 여부를 데이터베이스(15)를 통해서 정확하게 파악할 수 있도록 할 수 있다.
이러한 기능을 수행하기 위하여, 도 2에 도시된 본 발명의 장치(10)에는, 데이터 분류 및 저장부(12)가 상술한 S20 단계에 대응되는 기능을 수행하는 구성으로 포함될 수 있다. 이때 상술한 구체적인 기능을 수행할 수 있도록 하기 위하여, 데이터 분류 및 저장부(12)는 도 4에 도시된 바와 같은 세부 구성 예를 갖도록 구성되어, S20 단계에 대한 구체적인 기능을 수행할 수 있다.
크롤링된 데이터(101)가 상술한 바와 같이 임시 저장 공간으로부터 로딩되면, S20 단계의 수행에 있어서 데이터 분류 및 저장부(12)는 세부 정보를 추출하는 정보 추출부(121)로서 예를 들어 데이터의 실제 위치 등을 파악할 수 있는 GPS 모듈(1211)이나, 상술한 토픽 추출 모듈(1212)을 포함하여 구성될 수 있다.
한편, 크롤링 컴포넌트에서 인덱싱/저장 컴포넌트로 전송하기 위해 큐 시스템은 컴포넌트 간 메시징 버스(122)를 담당하도록 구성될 수 있다. 또한, 본 발명에서 관리되는 데이터는 그 스키마(Schema)가 매우 다양하고, 이기종 데이터 소스가 다양하게 존재하기 때문에, 이에 대응하기 위하여, 상술한 크롤링된 데이터가 인덱싱 뒤 저장되는 데이터베이스(15)는 확장 가능상 저장소인 NoSQL 저장소인 것이 바람직하다.
NoSQL 저장소는 일반적인 데이터베이스 모델인 SQL 데이터베이스(관계형 데이터베이스)와 대비되는 개념으로서, 낮은 지연 시간의 애플리케이션을 포함한 수많은 데이터 액세스 패턴에 맞도록 설계되었다. NoSQL 검색 데이터베이스는 반정형 데이터에서 분석을 위해 설계되었다.
NoSQL 데이터베이스는 키값, 문서, 그래프 등 성능과 규모 확장에 최적화된 다양한 데이터 모델을 제공한다. NoSQL 데이터베이스는 흔히 수평으로 확장할 수 있는 보다 유연한 데이터 모델을 위해 관계형 데이터베이스의 일부 ACID 속성을 완화함으로써 조정한다. 이로써 NoSQL 데이터베이스는 단일 인스턴스의 한계를 넘어 수평으로 확장해야 하는 사용 사례에서 높은 처리량, 낮은 지연 시간을 위한 탁월한 선택이 될 수 잇다. NoSQL 데이터베이스는 일반적으로 거의 무제한적인 범위에서 일관된 성능을 제공하는 처리량 제고를 위해 분산형 아키텍처를 사용해 액세스 패턴이 확장 가능하기 때문에 분할성이 있다. 객체 기반 API를 통해 앱 개발자가 데이터 구조를 쉽게 저장 및 검색할 수 있다. 파티션 키를 사용하면 앱에서 키값 페어, 열 세트 또는 일련의 앱 객체 및 속성을 포함하는 반정형 문서를 검색할 수 있다.
NoSQL 데이터베이스에서는 데이터의 액세스 및 관리를 위해 다양한 데이터 모델을 사용한다. 이러한 데이터베이스 유형은 큰 테이터 볼륨, 짧은 지연 시간과 유연한 데이터 모델이 필요한 애플리케이션에 최적화되었으며, 이는 다른 데이터베이스의 데이터 일관성 제약 일부를 완화함으로써 이루어진다.
간단한 서적 데이터베이스를 위한 스키마 모델 구축 사례를 고려해보면, 관계형 데이터베이스에서, 서적 레코드는 흔히 숨겨져(또는 "정규화되어") 별도의 테이블에 보관되고, 관계는 기본 및 외래 키 제약 조건으로 정의된다. 이 예시에서 서적 테이블에는 ISBN, 책 제목, 및 에디션 번호 열이 있으며, 저자 테이블에는 저자 ID 및 저자명 열이 있고, 마지막으로 저자-ISBN 테이블에는 저자 ID 및 ISBN 열이 있다. 관계형 모델은 중복성을 줄이도록 정규화되고 일반적으로 저장에 최적화된 데이터베이스에서 데이터베이스가 테이블 사이에서 참조 무결성을 실현할 수 있도록 고안된다.
반면, NoSQL 데이터베이스에서, 서적 레코드는 보통 JSON 문서로 저장된다. 각각의 서적에 대해, 항목, ISBN, 책제목, 에디션 번호, 저자명, 및 저자 ID가 단일 문서 내에 속성으로 저장된다. 이 모델에서, 데이터는 직관적 개발과 수평 확장성에 최적화될 수 있다.
이러한 특성에 의하여, 본 발명의 데이터 소스에서 크롤링된 데이터의 저장에는 상술한 바와 같이 NoSQL 저장소의 특성을 갖는 데이터베이스(15)가 사용됨이 바람직하다.
한편, 상술한 토픽 추출 모듈(1212)에서는 상술한 바와 같이 데이터를 분석하여 토픽을 추출하게 되는데, 다양한 데이터의 타입에 따라서 토픽 추출 역시 다양한 알고리즘을 이용하여 이루어질 수 있으며, 예를 들어 문장 내의 키워드 빈도수 분석, 이미지 내의 객체 분석 등을 통해 토픽을 추출할 수 있다.
한편 S20 단계를 통하여 데이터에 대한 인덱싱이 이루어지면, 컴퓨팅 장치는 저장된 데이터에 포함된 텍스트 데이터의 분석을 통해 상기 저장된 데이터의 등록으로 발생된 이벤트가 유저 계정에 대한 알림 대상이 되는 통지 대상 이벤트인지 여부를 딥시그널 알고리즘을 이용하여 판단하는 데이터 분석 단계(S30)를 수행한다.
각 토픽별로 분류된 데이터는 다양한 세부 정보를 포함하고 있으며, 컴퓨팅 장치는 데이터베이스(15)에 새롭게 등록된 데이터에 대한 세부 정보를 정밀 분석하여 유저 계정에서 쓸모 있는 데이터, 즉 본 발명에서 유저 계정에 대한 통지 대상이 되는 이벤트인지 여부를 S30 단계를 통해 판단하게 되는 것이다.
상술한 기능을 수행하기 위하여 도 2에 도시된 바와 같이 본 발명의 장치(10)에는 상술한 S30 단계의 기능 수행을 위하여 데이터 분석부(13)가 포함될 수 있다.
이때 상술한 S30 단계에 대한 구체적인 기능들을 수행할 수 있도록 하기 위하여, 데이터 분석부(13)는 도 5에 도시된 바와 같은 다양한 세부 구성요소들을 포함할 수 있다.
S30 단계의 구체적인 수행의 일 예로서, 도 5에 세부 고성으로 포함된 비정상 분석 감지 모듈(131)에서는, 예를 들어 데이터의 분석에 대한 오류를 감지하여 이에 대한 리포트를 유저 계정에 제공할 수 있다. 비정상 분석 감지 모듈(131)은 예를 들어 상술한 도 3의 크롤링 분석기(112)가 수행하는 S10 단계의 구체적인 기능과 유사하게, 데이터의 분석에 있어서도 그 모니터링을 수행하는 것이다.
예를 들어 데이터에 포함된 텍스트를 번역하여 유저 계정에서 설정된 언어로 텍스트를 분석할 수 있다. 텍스트에 대한 언어 번역은, 기계어에서 유저가 이해할 수 있는 언어로의 번역 또는 유저가 사용하는 내국어로의 외국어 텍스트의 번역 모두를 포함하는 개념으로 이해될 수 있다. 이때 번역 오류로는, 데이터에 포함된 텍스트 분석 결과에 대한 인코딩 오류, 이진 문서로의 번역에 따른 번역 오류 등이 포함될 수 있다.
한편, 분석 오류에는, 분석 대상이 되는 데이터가 아닌 사용성이 없는 데이터에 대한 크롤링이 이루어진 경우를 다른 예로서 포함한다. 예를 들어 텍스트 분석 결과 유저 계정에서 설정된 스팸 분류 기준에 속함에 따른 데이터의 스팸 분류 결과가 발생 시 분석 오류로 판단할 수 있다.
컴퓨팅 장치, 즉 본 발명의 장치(10)는 S30 단계의 수행 시, 비정상 분석 감지 모듈(131)에 의하여 상술한 예들에 포함하는 비정상 분석 결과를 감지하고, 유저 계정에 비정상 분석 결과에 대한 리포트를 제공할 수 있는 것이다.
한편, 감성 분석 모듈(132), 이미지 분석 모듈(133), 문장 구조 분석/키워드 추출 모듈(134), 요약 모듈(135), 번역 모듈(146) 등이 다양한 데이터의 분석을 위해서 포함될 수 있다.
딥시그널(Deep Signal) 알고리즘은, 상술한 각 모듈(132, 133, 134, 135, 146) 모듈에 해당하는 알고리즘이 결합되어 데이터를 분석하고, 후술하는 바와 같이 유저의 관심 정보에 해당하는 이벤트의 발생 여부를 판단하는 동시에, 이에 대해서 유저 계정에 맞춤화된 이벤트의 발생 시 이를 알릴 수 있도록 하는 알고리즘을 지칭한다.
예를 들어, 인공지능 기반 알고리즘들로서, 감성 분석 모듈(132)은 기설정된 텍스트 감성 분석 알고리즘, 이미지 분석 모듈(133)은 데이터에 포함된 이미지에 대한 기설정된 이미지 분석 알고리즘, 문장 구조 분석/키워드 추출 모듈(134)은 텍스트 저작자, 텍스트에 포함된 토픽 및 텍스트를 기반으로 인지 가능한 이벤트를 추출 가능한 기설정된 문장 구조 분석 및 키워드 추출 알고리즘, 요약 모듈(135)은 데이터에 포함된 텍스트를 기설정된 개수의 문장으로 요약하는 기설정된 문장 요약 알고리즘을 각각 포함한다. 이러한 알고리즘과 함께 번역 모듈(136)에서는 상술한 바와 같이 유저가 사용하는 것으로 유저 계정에 설정된 언어로 텍스트나 기계어 등을 번역하게 된다. 또한, 이외에, 토픽이나 키워드에 링크된 다양한 텍스트에 포함된 엔티티 등에 대한 인지 알고리즘 역시 적용될 수 있다.
본 발명에 있어서 S30 단계는 상술한 세부 구성들에 포함된 복합적인 알고리즘들을 이용하여 데이터에 포함된 텍스트 데이터 및 비텍스트 데이터를 분석하게 된다. 이를 바탕으로 데이터에 포함된 텍스트 데이터 및 비텍스트 데이터의 분석 결과 이벤트의 발생 여부를 판단하게 된다.
유저에게 맞춤화된 이벤트의 발생 여부를 판단함은, 데이터 분석부(13)에 포함된 이벤트 감지 모듈(137)이 분석된 토픽이 유저 계정에 기설정된 관심 토픽에 해당하는 경우, 그 데이터를 통지 대상 이벤트에 속하는 것으로 판단함을 의미한다. 이렇게 통지 대상 이벤트에 속하는 데이터에 대한 정보가 유저 계정에 이벤트가 발생되었음을 알리는 통지 정보로서 생성되어 S40 단계를 통해 전송되는 것이다.
즉 상술한 바와 같이, 딥시그널 알고리즘을 통하여, 다양한 게시 컨텐츠의 등록 시 데이터에 포함된 컨텐츠가 유저 계정에 설정된 관심 정보에 해당하는 키워드 등에 대해서 유저의 정책 결정 및 의사 결정 등에 영향을 미치는 이벤트인지 여부를 판단할 수 있게 된다.
S30 단계가 수행되면, 컴퓨팅 장치는, S30 단계에서 통지 대상 이벤트로 판단되는 데이터에 대해서 적어도 데이터의 메인 키워드를 포함하는 식별 정보, 등록된 데이터가 관심 토픽에 영향을 미치는 속성 정보인 이벤트 타입 정보 및 등록된 데이터에 포함된 컨텐츠의 내용 정보를 포함하는 통지 정보를 생성하여 유저 계정에 전송하는 알림 단계(S40)를 수행한다.
도 2에는 상술한 S40 단계의 기능 수행을 위한 구성으로서 알림부(14)가 포함되어 있다. 또한 도 6에는 상술한 알림부(14)의 세부 구성이 도시되어 있다. 상술한 바와 같이 알림부(14)는 주로 유저 단말(20)에 연결되어 상술한 통지 정보를 유저 단말(20)을 통해 로그인한 유저 계정에 전송한다.
이벤트 판단 모듈(141)은 예를 들어 데이터 분석부(13)로부터 S30 단계의 기능 수행에 따라서 분석된 토픽이 유저 계정의 관심 토픽에 해당하는 경우, 데이터를 통지 대상 이벤트에 속하는 것으로 판단됨을 알리는 신호를 수신하여, 해당 데이터가 이벤트에 해당함을 판단하는 기능을 수행한다. 또한 이와 더불어, 데이터의 식별 정보, 이벤트 타입 등에 대한 정보 및 데이터의 내용 정보를 수신할 수 있다.
데이터의 식별 정보는, 저작자, 저작 일자, 저작 장소, 데이터 소스 및 메타 데이터 등 데이터를 식별할 수 있는 정보를 의미한다. 이벤트 타입에 대한 정보는 예를 들어 상술한 감성 분석 알고리즘을 통하여 분석된 결과로서, 관심 토픽에 긍정적인 영향을 미치는 데이터인지 또는 부정적인 영향을 미치는 데이터인지 여부를 식별할 수 있는 정보를 의미한다. 데이터의 내용 정보는 데이터에 포함된 엔티티, 키워드, 전체 컨텐츠 등을 의미할 수 있다.
한편, 통계 모듈(142)은 상술한 바와 같이 수집되는 데이터의 수집량, 수집 빈도 등 데이터의 트렌드를 파악할 수 있는 정보를 포함한다. 예를 들어, S30 단계를 통해 도출된 정보를 이용하여 도출된 토픽의 시계열 집계 통계 정보 등이 통계 모듈(142)로부터 S40 단계의 기능 수행을 통해서 수집되어 제공될 수 있다.
한편 인기 정보 분석 모듈(143)은 유저 계정에서 설정된 관심 토픽에 대해서, 해당 토픽에서 인기 있는 것으로 판단되는 주체, 문서 및 대상 등을 포함하는 정보를 분석하는 기능을 S40 단계에서 구체적으로 수행한다.
예를 들어, 토픽에 대응되는 데이터에 대한 온라인 상의 등록 및 열람 수치를 기반으로 판단되는 인기 주제, 인기 문서 및 인기 대상을 포함하는 인기 객체 정보가 인기 정보 분석 모듈(143)에서 파악되는 정보로서 포함될 수 있다.
S40 단계 및 알림부(14)에서 수행되는 기능에 의하면 상술한 다양한 정보가 제공되는데, 이때 데이터의 직접 확인이 가능하도록 S40 단계에서 제공되는 통지 정보에는 상술한 정보들 이외에, 데이터의 접근이 가능한 접속 링크 정보가 함께 제공될 수 있다. 이때 유저 계정 전송되는 통지 정보는, 이메일, 문자, 푸쉬(Push) 등 유저 계정에 등록된 알림 주소로 다양한 형태로 전송될 수 있다.
예를 들어 통지 정보는 도 7에 도시된 바와 같은 푸쉬 메시지(200)로서, 이벤트가 감지되었음을 알리는 신호와 함께 해당 토픽(201), 통계 정보(202) 및 이벤트 타입 정보(203) 등이 아이콘이나 키워드화되어 제공되고, 뷰어 메뉴(204)가 함께 제공되어, 유저들은 이를 통해서 해당 데이터 소스에 직접 접근하여 데이터를 확인할 수 있다.
이와 같은 본 발명의 실시예에 따르면, 예를 들어 유저가 주식을 투자하는 투자자인 경우, 주식에 해당하는 종목 등을 관심 정보로 등록 시, 관심 정보에 대응하는 종목의 주가에 영향을 미칠 수 있는 다양한 이벤트에 대해서 알림을 받음으로써, 투자에 대한 의사 결정에 도움을 줄 수 있다.
또 다른 예로는, 유저가 회사를 경영하는 경영자 또는 임직원인 경우, 자신의 업무에 영향을 미치는 키워드 등을 관심 정보로 등록 시, 이에 대한 다양한 소스를 수집할 수 있으며, 이를 통해서 업무에 대한 의사 또는 정책 결정에 영향을 미칠 수 있는 이벤트를 제공받을 수 있다.
이 외에도, 학생, 부모, 주부, 구직자 등 매우 다양한 분야의 유저들이, 자신의 생활 또는 활동에 영향을 미칠 수 있는 토픽에 대해서 이에 영향을 미칠 수 있는 이벤트가 발생되는 경우, 일일이 해당 정보를 조회할 필요 없이, 자신에게 도움이 되는 컨텐츠를 제공받고, 컨텐츠의 트렌드 등에 대한 정보 분석 결과를 제공받아, 생활 또는 활동에 대한 가이드를 제공받음으로써, 딥시그널 인공지능 모델이 각 유저의 비서와 같은 역할을 하도록 하는 효과가 있다.
도 8은 본 발명의 일 실시 예에 따른 컴퓨팅 장치의 내부 구성의 일 예를 도시하였으며, 이하의 설명에 있어서, 상술한 도 1 내지 7에 대한 설명과 중복되는 불필요한 실시 예에 대한 설명은 생략하기로 한다.
도 8에 도시한 바와 같이, 컴퓨팅 장치(10000)은 적어도 하나의 프로세서(processor)(11100), 메모리(memory)(11200), 주변장치 인터페이스(peripheral interface)(11300), 입/출력 서브시스템(I/O subsystem)(11400), 전력 회로(11500) 및 통신 회로(11600)를 적어도 포함할 수 있다. 이때, 컴퓨팅 장치(10000)은 촉각 인터페이스 장치에 연결된 유저 단말이기(A) 혹은 전술한 컴퓨팅 장치(B)에 해당될 수 있다.
메모리(11200)는, 일례로 고속 랜덤 액세스 메모리(high-speed random access memory), 자기 디스크, 에스램(SRAM), 디램(DRAM), 롬(ROM), 플래시 메모리 또는 비휘발성 메모리를 포함할 수 있다. 메모리(11200)는 컴퓨팅 장치(10000)의 동작에 필요한 소프트웨어 모듈, 명령어 집합 또는 그밖에 다양한 데이터를 포함할 수 있다.
이때, 프로세서(11100)나 주변장치 인터페이스(11300) 등의 다른 컴포넌트에서 메모리(11200)에 액세스하는 것은 프로세서(11100)에 의해 제어될 수 있다.
주변장치 인터페이스(11300)는 컴퓨팅 장치(10000)의 입력 및/또는 출력 주변장치를 프로세서(11100) 및 메모리 (11200)에 결합시킬 수 있다. 프로세서(11100)는 메모리(11200)에 저장된 소프트웨어 모듈 또는 명령어 집합을 실행하여 컴퓨팅 장치(10000)을 위한 다양한 기능을 수행하고 데이터를 처리할 수 있다.
입/출력 서브시스템(11400)은 다양한 입/출력 주변장치들을 주변장치 인터페이스(11300)에 결합시킬 수 있다. 예를 들어, 입/출력 서브시스템(11400)은 모니터나 키보드, 마우스, 프린터 또는 필요에 따라 터치스크린이나 센서 등의 주변장치를 주변장치 인터페이스(11300)에 결합시키기 위한 컨트롤러를 포함할 수 있다. 다른 측면에 따르면, 입/출력 주변장치들은 입/출력 서브시스템(11400)을 거치지 않고 주변장치 인터페이스(11300)에 결합될 수도 있다.
전력 회로(11500)는 단말기의 컴포넌트의 전부 또는 일부로 전력을 공급할 수 있다. 예를 들어 전력 회로(11500)는 전력 관리 시스템, 배터리나 교류(AC) 등과 같은 하나 이상의 전원, 충전 시스템, 전력 실패 감지 회로(power failure detection circuit), 전력 변환기나 인버터, 전력 상태 표시자 또는 전력 생성, 관리, 분배를 위한 임의의 다른 컴포넌트들을 포함할 수 있다.
통신 회로(11600)는 적어도 하나의 외부 포트를 이용하여 다른 컴퓨팅 장치와 통신을 가능하게 할 수 있다.
또는 상술한 바와 같이 필요에 따라 통신 회로(11600)는 RF 회로를 포함하여 전자기 신호(electromagnetic signal)라고도 알려진 RF 신호를 송수신함으로써, 다른 컴퓨팅 장치와 통신을 가능하게 할 수도 있다.
이러한 도 8의 실시 예는, 컴퓨팅 장치(10000)의 일례일 뿐이고, 컴퓨팅 장치(11000)은 도 8에 도시된 일부 컴포넌트가 생략되거나, 도 8에 도시되지 않은 추가의 컴포넌트를 더 구비하거나, 2개 이상의 컴포넌트를 결합시키는 구성 또는 배치를 가질 수 있다. 예를 들어, 모바일 환경의 통신 단말을 위한 컴퓨팅 장치는 도 8에도시된 컴포넌트들 외에도, 터치스크린이나 센서 등을 더 포함할 수도 있으며, 통신 회로(1160)에 다양한 통신방식(WiFi, 3G, LTE, Bluetooth, NFC, Zigbee 등)의 RF 통신을 위한 회로가 포함될 수도 있다. 컴퓨팅 장치(10000)에 포함 가능한 컴포넌트들은 하나 이상의 신호 처리 또는 어플리케이션에 특화된 집적 회로를 포함하는 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어 양자의 조합으로 구현될 수 있다.
본 발명의 실시 예에 따른 방법들은 다양한 컴퓨팅 장치를 통하여 수행될 수 있는 프로그램 명령(instruction) 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 특히, 본 실시 예에 따른 프로그램은 PC 기반의 프로그램 또는 모바일 단말 전용의 어플리케이션으로 구성될 수 있다. 본 발명이 적용되는 애플리케이션은 파일 배포 시스템이 제공하는 파일을 통해 이용자 단말에 설치될 수 있다. 일 예로, 파일 배포 시스템은 이용자 단말이기의 요청에 따라 상기 파일을 전송하는 파일 전송부(미도시)를 포함할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시 예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술 분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로 (collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨팅 장치상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시 예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시 예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광 기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시 예들이 비록 한정된 실시 예와 도면에 의해 설명되었으나, 해당 기술 분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시 예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (10)

  1. 하나 이상의 프로세서 및 상기 프로세서에서 수행 가능한 명령들을 저장하는 하나 이상의 메모리를 포함하는 컴퓨팅 장치로 구현되는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법으로서,
    온라인 상의 게시 컨텐츠를 포함하는 데이터가 업로드되는 다수의 데이터 소스로부터 데이터의 등록 시 등록된 데이터를 크롤링(Crawling)하여 데이터의 등록을 모니터링하는 데이터 수집 및 관리 단계;
    크롤링된 데이터에 대해서, 유저 계정으로부터 설정된 정보로서 유저 계정의 관심 정보를 포함하는 관심 토픽별로 인덱싱(Indexing)하여 저장하는 데이터 분류 및 저장 단계;
    상기 저장된 데이터에 포함된 텍스트 데이터의 분석을 통해 상기 저장된 데이터의 등록으로 발생된 이벤트가 유저 계정에 대한 알림 대상이 되는 통지 대상 이벤트인지 여부를 딥시그널 알고리즘을 이용하여 판단하는 데이터 분석 단계; 및
    상기 데이터 분석 단계에서 통지 대상 이벤트로 판단되는 데이터에 대해서 적어도 데이터의 메인 키워드를 포함하는 식별 정보, 등록된 데이터가 관심 토픽에 영향을 미치는 속성 정보인 이벤트 타입 정보 및 등록된 데이터에 포함된 컨텐츠의 내용 정보를 포함하는 통지 정보를 생성하여 유저 계정에 전송하는 알림 단계;를 포함하는 것을 특징으로 하는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법.
  2. 제1항에 있어서,
    상기 데이터 수집 및 관리 단계는,
    로그인 없이 데이터 수집이 가능한 데이터 소스로부터 데이터를 크롤링하는 제1 크롤러 및 유저 계정의 로그인 시 데이터 수집이 가능한 데이터 소스에 접근하여 유저 계정을 이용하여 로그인하고 데이터를 크롤링하는 제2 크롤러 중 어느 하나를 데이터 소스에 대한 유저 계정의 로그인 필요성을 기준으로 데이터 소스 별로 이용하여 데이터를 크롤링하는 것을 특징으로 하는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법.
  3. 제1항에 있어서,
    상기 데이터 수집 및 관리 단계는,
    유저 계정에 저장된 정보로서, 유저가 이벤트 알림을 받고자 하는 대상에 대한 키워드 정보를 포함하는 관심 정보를 컨텐츠 내에 포함하는 데이터를 크롤링하는 것을 특징으로 하는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법.
  4. 제1항에 있어서,
    상기 데이터 수집 및 관리 단계는,
    크롤링되는 데이터에 대한 통계 수치, 정상적인 크롤링 여부를 나타내는 크롤링 오류 비율 및 데이터 소스에 대한 접근 실패 정보를 포함하는 크롤링 모니터링 정보를 생성하여 유저 계정에 전송하는 것을 특징으로 하는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법.
  5. 제1항에 있어서,
    다양한 데이터 스키마(Schema) 및 이기종 데이터 소스에 대응하기 위하여, 크롤링된 데이터가 저장되는 데이터베이스는 확장 가능한 NoSQL 저장소인 것을 특징으로 하는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법.
  6. 제1항에 있어서,
    상기 데이터 분석 단계는,
    데이터에 포함된 텍스트를 번역하여 유저 계정에서 설정된 언어로 텍스트를 분석하되, 데이터에 포함된 텍스트 분석 결과에 대한 인코딩 오류, 이진 문서로의 번역에 따른 번역 오류 및 텍스트 분석 결과 유저 계정에서 설정된 스팸 분류 기준에 속함에 따른 데이터의 스팸 분류 결과를 포함하는 비정상 분석 결과를 감지하고, 유저 계정에 비정상 분석 결과에 대한 리포트를 제공하는 것을 특징으로 하는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법.
  7. 제1항에 있어서,
    상기 데이터 분석 단계는,
    상기 딥시그널 알고리즘으로서,
    인공지능 기반 알고리즘들로서, 기설정된 텍스트 감성 분석 알고리즘, 데이터에 포함된 이미지에 대한 기설정된 이미지 분석 알고리즘, 텍스트 저작자, 텍스트에 포함된 토픽 및 텍스트를 기반으로 인지 가능한 이벤트를 추출 가능한 기설정된 문장 구조 분석 및 키워드 추출 알고리즘, 및 데이터에 포함된 텍스트를 기설정된 개수의 문장으로 요약하는 기설정된 문장 요약 알고리즘을 이용하여 데이터에 포함된 텍스트 데이터 및 비텍스트 데이터를 분석하고, 분석된 토픽이 유저 계정에 기설정된 관심 토픽에 해당하는 경우, 상기 데이터를 통지 대상 이벤트에 속하는 것으로 판단하는 알고리즘을 이용하는 것을 특징으로 하는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법.
  8. 제7항에 있어서,
    상기 알림 단계는,
    상기 데이터 분석 단계를 통해 도출된 정보를 이용하여, 토픽의 시계열 집계 통계 정보와, 토픽에 대응되는 데이터에 대한 온라인 상의 등록 및 열람 수치를 기반으로 판단되는 인기 주제, 인기 문서 및 인기 대상을 포함하는 인기 객체 정보를 데이터의 접근이 가능한 접속 링크 정보와 함께 유저 계정에 등록된 알림 주소로 전송하는 것을 특징으로 하는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법.
  9. 하나 이상의 프로세서 및 상기 프로세서에서 수행 가능한 명령들을 저장하는 하나 이상의 메모리를 포함하는 컴퓨팅 장치로 구현되는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 장치로서,
    온라인 상의 게시 컨텐츠를 포함하는 데이터가 업로드되는 다수의 데이터 소스로부터 데이터의 등록 시 등록된 데이터를 크롤링(Crawling)하여 데이터의 등록을 관리하는 데이터 수집 및 관리부;
    크롤링된 데이터에 대해서, 유저 계정으로부터 설정된 정보로서 유저 계정의 관심 정보를 포함하는 관심 토픽별로 인덱싱(Indexing)하여 저장하는 데이터 분류 및 저장부;
    상기 저장된 데이터에 포함된 텍스트 데이터의 분석을 통해 상기 저장된 데이터의 등록으로 발생된 이벤트가 유저 계정에 대한 알림 대상이 되는 통지 대상 이벤트인지 여부를 딥시그널 알고리즘을 이용하여 판단하는 데이터 분석부; 및
    상기 데이터 분석 단계에서 통지 대상 이벤트로 판단되는 데이터에 대해서 적어도 데이터의 메인 키워드를 포함하는 식별 정보, 등록된 데이터가 관심 토픽에 영향을 미치는 속성 정보인 이벤트 타입 정보 및 등록된 데이터에 포함된 컨텐츠의 내용 정보를 포함하는 통지 정보를 생성하여 유저 계정에 전송하는 알림부;를 포함하는 것을 특징으로 하는 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 장치.
  10. 컴퓨터-판독가능 기록매체로서,
    상기 컴퓨터-판독가능 기록매체는, 컴퓨팅 장치로 하여금 이하의 단계들을 수행하도록 하는 명령들을 저장하며, 상기 단계들은:
    온라인 상의 게시 컨텐츠를 포함하는 데이터가 업로드되는 다수의 데이터 소스로부터 데이터의 등록 시 등록된 데이터를 크롤링(Crawling)하여 데이터의 등록을 관리하는 데이터 수집 및 관리 단계;
    크롤링된 데이터에 대해서, 유저 계정으로부터 설정된 정보로서 유저 계정의 관심 정보를 포함하는 관심 토픽별로 인덱싱(Indexing)하여 저장하는 데이터 분류 및 저장 단계;
    상기 저장된 데이터에 포함된 텍스트 데이터의 분석을 통해 상기 저장된 데이터의 등록으로 발생된 이벤트가 유저 계정에 대한 알림 대상이 되는 통지 대상 이벤트인지 여부를 딥시그널 알고리즘을 이용하여 판단하는 데이터 분석 단계; 및
    상기 데이터 분석 단계에서 통지 대상 이벤트로 판단되는 데이터에 대해서 적어도 데이터의 메인 키워드를 포함하는 식별 정보, 등록된 데이터가 관심 토픽에 영향을 미치는 속성 정보인 이벤트 타입 정보 및 등록된 데이터에 포함된 컨텐츠의 내용 정보를 포함하는 통지 정보를 생성하여 유저 계정에 전송하는 알림 단계;를 포함하는 것을 특징으로 하는 컴퓨터-판독가능 기록매체.
KR1020220040894A 2022-04-01 2022-04-01 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법, 장치 및 컴퓨터-판독가능 기록매체 KR20230142108A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220040894A KR20230142108A (ko) 2022-04-01 2022-04-01 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법, 장치 및 컴퓨터-판독가능 기록매체
PCT/KR2023/002673 WO2023191317A1 (ko) 2022-04-01 2023-02-24 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법, 장치 및 컴퓨터-판독가능 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220040894A KR20230142108A (ko) 2022-04-01 2022-04-01 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법, 장치 및 컴퓨터-판독가능 기록매체

Publications (1)

Publication Number Publication Date
KR20230142108A true KR20230142108A (ko) 2023-10-11

Family

ID=88203109

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220040894A KR20230142108A (ko) 2022-04-01 2022-04-01 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법, 장치 및 컴퓨터-판독가능 기록매체

Country Status (2)

Country Link
KR (1) KR20230142108A (ko)
WO (1) WO2023191317A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080076585A (ko) * 2007-02-16 2008-08-20 강민수 문서보안용 검색기능을 제공하는 네트워크 검색서버,네트워크 검색서버의 검색방법, 문서보안용 검색기능을제공하는 화상형성장치, 문서보안용 네트워크 검색기능을제공하는 네트워크 보안 시스템 및 기록매체
US11030264B2 (en) * 2018-12-30 2021-06-08 Superfy Technologies Ltd. Systems and methods for matching a query
CN111177532A (zh) * 2019-12-02 2020-05-19 平安资产管理有限责任公司 一种垂直搜索方法、装置、计算机***及可读存储介质
CN111259223B (zh) * 2020-02-17 2020-11-10 北京国新汇金股份有限公司 基于情感分析模型的新闻推荐和文本分类方法
WO2022025750A1 (en) * 2020-07-30 2022-02-03 Mimos Berhad Person profile finder using semantic similarity measurement of object based on internet source and related keywords

Also Published As

Publication number Publication date
WO2023191317A1 (ko) 2023-10-05

Similar Documents

Publication Publication Date Title
US11704321B2 (en) Techniques for relationship discovery between datasets
US11200248B2 (en) Techniques for facilitating the joining of datasets
US11163527B2 (en) Techniques for dataset similarity discovery
US10192051B2 (en) Data acceleration
US11726840B2 (en) Flexible and scalable artificial intelligence and analytics platform with advanced content analytics and data ingestion
US20180341839A1 (en) Techniques for sentiment analysis of data using a convolutional neural network and a co-occurrence network
US9323826B2 (en) Methods, apparatus and software for analyzing the content of micro-blog messages
US9501578B2 (en) Dynamic semantic models having multiple indices
Goonetilleke et al. Twitter analytics: a big data management perspective
Carvalho et al. MISNIS: An intelligent platform for twitter topic mining
Mansmann et al. Discovering OLAP dimensions in semi-structured data
US11803600B2 (en) Systems and methods for intelligent content filtering and persistence
Schintler et al. Encyclopedia of big data
Andrews et al. Creating corroborated crisis reports from social media data through formal concept analysis
Chen et al. Aggregating semantic annotators
Lomotey et al. RSenter: terms mining tool from unstructured data sources
Spahiu et al. Topic profiling benchmarks in the linked open data cloud: Issues and lessons learned
Wu et al. Sub-event discovery and retrieval during natural hazards on social media data
KR20230142108A (ko) 딥시그널을 통한 유저 맞춤화된 토픽에 대한 리스크 또는 기회 이벤트 모니터링 방법, 장치 및 컴퓨터-판독가능 기록매체
Mittal Knowledge for Cyber Threat Intelligence
Kiio Apache Spark based big data analytics for social network cybercrime forensics
Couto A model for automatized data integration in hadoop-based data lakes
Otsuka et al. Text Filtering for Harmful Document Classification Using Three‐Word Co‐Occurrence and Large‐Scale Data Processing
Hanadi Relevance Feedback Optimization for Digital Forensic Investigations
Al Suwaidi Relevance Feedback Optimization for Digital Forensic Investigations