KR102228737B1 - Method And Apparatus for Detecting Fake News by Using Artificial Intelligence - Google Patents

Method And Apparatus for Detecting Fake News by Using Artificial Intelligence Download PDF

Info

Publication number
KR102228737B1
KR102228737B1 KR1020200073560A KR20200073560A KR102228737B1 KR 102228737 B1 KR102228737 B1 KR 102228737B1 KR 1020200073560 A KR1020200073560 A KR 1020200073560A KR 20200073560 A KR20200073560 A KR 20200073560A KR 102228737 B1 KR102228737 B1 KR 102228737B1
Authority
KR
South Korea
Prior art keywords
information
news
fake
fact
determination
Prior art date
Application number
KR1020200073560A
Other languages
Korean (ko)
Other versions
KR102228737B9 (en
Inventor
김성수
이주훈
Original Assignee
주식회사 푸시뉴스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 푸시뉴스 filed Critical 주식회사 푸시뉴스
Priority to KR1020200073560A priority Critical patent/KR102228737B1/en
Application granted granted Critical
Publication of KR102228737B1 publication Critical patent/KR102228737B1/en
Priority to PCT/KR2021/007642 priority patent/WO2021256884A1/en
Publication of KR102228737B9 publication Critical patent/KR102228737B9/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Disclosed are a method and a device for reading fake news using AI. The embodiment, when a service which curates and shows various news in securities information market to individual investors who are fragmented on various websites and looking for securities information, collects news, provides reliable information tailored to consumer preferences, uses artificial intelligence to read fake news, and distinguishes between fake news and reliable news among the securities information.

Description

AI를 이용한 가짜뉴스 판독 방법 및 장치{Method And Apparatus for Detecting Fake News by Using Artificial Intelligence}Method And Apparatus for Detecting Fake News by Using Artificial Intelligence}

본 발명의 일 실시예는 AI를 이용한 가짜뉴스 판독 방법 및 장치에 관한 것이다.An embodiment of the present invention relates to a method and apparatus for reading fake news using AI.

이하에 기술되는 내용은 단순히 본 실시예와 관련되는 배경 정보만을 제공할 뿐 종래기술을 구성하는 것이 아니다.The contents described below merely provide background information related to the present embodiment, and do not constitute the prior art.

증권 부분 뉴스 큐레이션 시장은 2019년을 기준으로 대략 1조5천억원으로 추정된다. 주된 소비자는 560만명 내지 800만명이 개인투자자로 추정된다. 최근 통과된 데이터3법으로 인해 비실명정보로도 마케팅 및 사업을 전개할 수 있을 것으로 전망된다. The securities sector news curation market is estimated to be approximately 1.5 trillion won as of 2019. The main consumers are estimated to be 5.6 to 8 million individual investors. Due to the recently passed data 3 method, it is expected that marketing and business can be conducted even with non-real name information.

국내 증권정보를 보며, 주식을 거래하는 개인투자자는 대략 560만명 내지 800만명 정도이나, 무분별하게 가짜뉴스에 노출되고 있는 실정이다. 일반적으로 개인투자자들은 인터넷을 이용하여 관련 정보를 찾아보지만 복수의 사이트에서 시간과 비용을 낭비하고 있으며, 원하는 정보와 정확한 정보를 찾지 못하고 있다.There are approximately 5.6 million to 8 million individual investors who trade stocks while looking at domestic stock information, but they are indiscriminately exposed to fake news. In general, individual investors use the Internet to search for related information, but they are wasting time and money on multiple sites, and are unable to find the desired and accurate information.

최근 들어, 1인 미디어 증가에 따른 소비환경이 변화되고 있다. 1인 미디어 뉴스는 시간과 장소의 구애없이 실시간으로 소비 가능하므로, 흥미 위주의 창작물이나 조합물 같은 무분별한 가짜뉴스를 생산하고 유통시키는 부작용이 증가하고 있다.In recent years, the consumption environment is changing due to the increase in single-person media. Since single-person media news can be consumed in real time, regardless of time and place, the side effects of producing and distributing indiscriminate fake news such as interesting creations or combinations are increasing.

가짜뉴스의 경제적, 사회적 폐해가 증가하고 있다. 즉, ‘낚시성 기사’나 트래픽 유발 목적의 ‘어뷰징(Abusing)기사’, 홍보 등의 특정한 목적으로 대가를 받고 쓴‘광고성 기사'들은 뉴스를 소비하는 소비자의 혼란을 가중시키고 있다. 사회적 비용 또한 덩달아 크게 증가하고 있는 실정이며, 가짜뉴스로 인한 경제적 피해는 30조원에 달하는 것으로 조사되었다.The economic and social harm of fake news is on the rise. In other words, “fishing articles”, “abusing articles” for the purpose of inducing traffic, and “advertising articles” written for specific purposes, such as publicity, are aggravating confusion among consumers who consume news. The social cost is also increasing significantly, and the economic damage caused by fake news is estimated to reach 30 trillion won.

가짜뉴스로 인한 국가 신뢰도가 하락하고 있으며, 로이터 언론 연구소 조사에 따르면 한국은 뉴스 신뢰도 23%로 세계에서 최악의 가짜뉴스 나라로 평가되고 있다.The country's credibility is declining due to fake news, and according to a survey by the Reuters Institute of Media, Korea is rated as the world's worst fake news country with 23% of news reliability.

정보의 비대칭 문제로 정보의 신뢰도에서 가짜뉴스로 인한 피해가 급증하고 있다. 따라서, 신뢰성과 공정성에 대한 문제가 대두되고 있으며, 뉴스 컨텐츠 등에 대해서 명확하게 판별하여 사회적ㆍ경제적ㆍ정치적 갈등해소에 기여하는 기술을 필요로 한다.Due to the asymmetry of information, the damage caused by fake news is increasing rapidly in the reliability of information. Therefore, the problem of reliability and fairness is emerging, and technology that contributes to resolving social, economic, and political conflicts by clearly discriminating news contents, etc. is required.

본 실시예는 다양한 웹사이트에서 파편화되어 증권 정보를 찾는 개인 투자자들에게 증권 정보 시장의 다양한 뉴스들을 큐레이션해서 보여주는 서비스를 제공할 때, 뉴스를 수집하고, 신뢰도 있는 정보를 소비자 선호에 맞춰 제공하며, 인공지능을 이용하여 가짜뉴스를 판독하여 증권 정보들 중에서 가짜뉴스와 신뢰할 수 있는 뉴스를 가려낼 수 있도록 하는 AI를 이용한 가짜뉴스 판독 방법 및 장치를 제공하는 데 목적이 있다.In this embodiment, when providing a service that curates and shows various news of the stock information market to individual investors who are fragmented on various websites and looking for stock information, the news is collected and reliable information is provided according to consumer preferences. , The purpose of this study is to provide a method and apparatus for reading fake news using AI that allows you to identify fake news and reliable news from stock information by reading fake news using artificial intelligence.

본 실시예의 일 측면에 의하면, 뉴스 공급자로부터 증권 뉴스 정보를 수집하는 뉴스 정보 수집부; 상기 증권 뉴스 정보 중 구독자 단말기에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링하는 뉴스 선별부; 인공지능을 이용하여 기 학습된 학습 데이터를 기반으로 상기 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성하는 가짜뉴스 판별부; 및 상기 관심항목 뉴스정보에 상기 진위판별결과를 매칭하여 상기 구독자 단말기로 큐레이션(Curation)하는 뉴스 큐레이션부를 포함하는 것을 특징으로 하는 가짜뉴스 판독 장치를 제공한다.According to an aspect of the present embodiment, there is provided a news information collection unit for collecting stock news information from a news provider; A news screening unit for filtering only interest item news information corresponding to a keyword or interest item set by a subscriber terminal among the stock news information; A fake news determination unit that generates a result of authenticity determination by determining whether the interest item news information is fake news or real news based on pre-learned learning data using artificial intelligence; And a news curation unit matching the interest item news information with the authenticity determination result to curate the subscriber terminal.

본 실시예의 다른 측면에 의하면, 뉴스 정보 수집부에서 뉴스 공급자로부터 증권 뉴스 정보를 수집하는 과정; 뉴스 선별부에서 상기 증권 뉴스 정보 중 구독자 단말기에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링하는 과정; 가짜뉴스 판별부에서 인공지능을 이용하여 기 학습된 학습 데이터를 기반으로 상기 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성하는 과정; 및 뉴스 큐레이션부에서 상기 관심항목 뉴스정보와 상기 진위판별결과를 상기 구독자 단말기로 큐레이션(Curation)하는 과정을 포함하는 것을 특징으로 하는 가짜뉴스 판독 방법을 제공한다.According to another aspect of the present embodiment, a process of collecting stock news information from a news provider in a news information collection unit; Filtering only interest item news information corresponding to a keyword or interest item set by a subscriber terminal among the stock news information by a news selection unit; Generating an authenticity determination result by determining whether the interest item news information is fake news or real news based on the learning data previously learned using artificial intelligence in the fake news determination unit; And curating the interest item news information and the authenticity determination result by the news curation unit to the subscriber terminal.

이상에서 설명한 바와 같이 본 실시예에 의하면, 다양한 웹사이트에서 파편화되어 증권 정보를 찾는 개인 투자자들에게 증권 정보 시장의 다양한 뉴스들을 큐레이션해서 보여주는 서비스를 제공할 때, 뉴스를 수집하고, 신뢰도 있는 정보를 소비자 선호에 맞춰 제공하며, 인공지능을 이용하여 가짜뉴스를 판독하여 증권 정보들 중에서 가짜뉴스와 신뢰할 수 있는 뉴스를 가려낼 수 있도록 하는 효과가 있다.As described above, according to the present embodiment, when providing a service that curates and shows various news of the stock information market to individual investors who are fragmented from various websites and search for stock information, the news is collected and reliable information Is provided according to consumer preferences, and has the effect of identifying fake news and reliable news among stock information by reading fake news using artificial intelligence.

본 실시예에 의하면, 가짜뉴스 판별 근거를 전문가의 신뢰도 또는 분야별 전문가의 팩트체크에 따라 진위여부 판정 프로세스를 수행하여 자동으로 진위여부를 갱신하여 진위여부 정보를 판정할 수 있는 효과가 있다.According to the present embodiment, it is possible to determine the authenticity information by automatically updating the authenticity or not by performing the authenticity determination process according to the reliability of an expert or a fact check of an expert in each field on the basis for determining the fake news.

도 1은 본 실시예에 따른 AI를 이용한 가짜뉴스 판독 시스템을 개략적으로 나타낸 도면이다.
도 2a,2b는 본 실시예에 따른 가짜뉴스 판독기를 개략적으로 나타낸 도면이다.
도 3은 본 실시예에 따른 가짜뉴스 판독 서비스 제공 과정을 나타낸 도면이다.
도 4는 본 실시예에 따른 가짜뉴스 식별 정보 제공 방법을 나타낸 도면이다.
도 5는 본 실시예에 따른 가짜뉴스 판독을 위해 문맥 판단 방법을 나타낸 도면이다.
도 6은 본 실시예에 따른 가짜뉴스 판독을 위해 합성 여부를 판단 방법을 나타낸 도면이다.
도 7은 본 실시예에 따른 가짜뉴스 판독기의 학습 수행 개념을 나타낸 도면이다.
도 8은 본 실시예에 따른 인공지능을 이용한 뉴스 진위 판별 서비스를 나타낸 도면이다.
도 9는 본 실시예에 따른 서비스 제공 개념을 나타낸 도면이다.
1 is a diagram schematically showing a fake news reading system using AI according to the present embodiment.
2A and 2B are schematic diagrams of a fake news reader according to the present embodiment.
3 is a diagram showing a process of providing a fake news reading service according to the present embodiment.
4 is a diagram showing a method of providing fake news identification information according to the present embodiment.
5 is a diagram showing a method of determining a context for reading fake news according to the present embodiment.
6 is a diagram showing a method of determining whether to synthesize or not to read fake news according to the present embodiment.
7 is a diagram showing a learning performance concept of a fake news reader according to the present embodiment.
8 is a diagram showing a news authenticity determination service using artificial intelligence according to the present embodiment.
9 is a diagram illustrating a concept of providing a service according to the present embodiment.

이하, 본 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, the present embodiment will be described in detail with reference to the accompanying drawings.

도 1은 본 실시예에 따른 AI를 이용한 가짜뉴스 판독 시스템을 개략적으로 나타낸 도면이다.1 is a diagram schematically showing a fake news reading system using AI according to the present embodiment.

본 실시예에 따른 AI를 이용한 가짜뉴스 판독 시스템은 구독자 단말기(110), 가짜뉴스 판독기(120), 관리자 단말기(130), 뉴스 공급자(140), 전문가 판정단 단말기(150)를 포함한다. AI를 이용한 가짜뉴스 판독 시스템에 포함된 구성요소는 반드시 이에 한정되는 것은 아니다.The fake news reading system using AI according to this embodiment includes a subscriber terminal 110, a fake news reader 120, a manager terminal 130, a news provider 140, and an expert judgment terminal 150. Components included in the fake news reading system using AI are not necessarily limited thereto.

구독자 단말기(110)는 가짜뉴스 판독기(120)로부터 뉴스컨텐츠, 뉴스진위정보를 제공받는다. 구독자 단말기(110)는 가짜뉴스 판독기(120)로부터 구독에 따른 포인트 및 리워드를 제공한다.The subscriber terminal 110 receives news content and news authenticity information from the fake news reader 120. The subscriber terminal 110 provides points and rewards according to the subscription from the fake news reader 120.

구독자 단말기(110)는 가짜뉴스 판독기(120)로 접속하여 뉴스 컨텐츠를 검색하고, 뉴스 구독 정보를 수신한다. 구독자 단말기(110)는 가짜뉴스 판독기(120)로 뉴스 진위를 요청하고, 유료 서비스를 이용한다.The subscriber terminal 110 accesses the fake news reader 120 to search for news content and receives news subscription information. The subscriber terminal 110 requests the authenticity of the news from the fake news reader 120 and uses a paid service.

구독자 단말기(110)는 회원가입 및 탈퇴를 관리한다. 구독자 단말기(110)는 회원 정보를 관리하고, 포인트를 충전하고 포인트 사용을 관리한다. 구독자 단말기(110)는 진위 판정 서비스를 신청하고, 뉴스 컨텐츠 정보를 확인한다. 구독자 단말기(110)는 뉴스 컨텐츠의 진위여부에 대한 이의를 신청한다.The subscriber terminal 110 manages membership registration and withdrawal. The subscriber terminal 110 manages member information, recharges points, and manages the use of points. The subscriber terminal 110 applies for the authenticity determination service and checks news content information. The subscriber terminal 110 requests an objection to the authenticity of the news content.

가짜뉴스 판독기(120)는 증권 정보를 큐레이션하여 모바일 애플리케이션으로 제공한다. 가짜뉴스 판독기(120)는 증권 정보에 대한 빅데이터, 인공지능을 이용하여 가짜뉴스를 걸러내는 뉴스 큐레이션을 제공한다. The fake news reader 120 curates stock information and provides it to a mobile application. The fake news reader 120 provides news curation that filters out fake news using big data and artificial intelligence for stock information.

가짜뉴스 판독기(120)는 증권 뉴스의 송출매체와 계약하여 증권 뉴스의 최초 송출진원지인 뉴스 공급자(140)로부터 RSS, 크롤링 기술을 이용하여 증권 관련 데이터를 수집한다.The fake news reader 120 contracts with a transmission medium of stock news and collects stock-related data using RSS and crawling technology from the news provider 140, which is the first transmission source of stock news.

가짜뉴스 판독기(120)는 수집한 증권 관련 데이터에 대한 확정 기사와 추정 기사를 분류하고, 빅데이터를 합치는 과정을 거쳐 해당 뉴스의 진위여부를 파악한다. 가짜뉴스 판독기(120)는 증권분야에서 주가 변화, 뉴스, SNS 등 매체 송출 이후 일어나고 있는지를 알고리즘을 이용하여 분석한다.The fake news reader 120 classifies confirmed and estimated articles for the collected securities-related data, and identifies the authenticity of the news through a process of combining big data. The fake news reader 120 analyzes, using an algorithm, whether the stock price change in the securities field, news, or SNS is occurring after the transmission of the media.

가짜뉴스 판독기(120)는 인공지능을 이용하여 사용자가 지정한 뉴스 소스원의 컨텐츠가 가짜일 확률을 알려준다. 가짜뉴스 판독기(120)는 정확한 팩트체크를 위하여 분야별 전문가 및 검증된 판정단이 전문가 판정단 단말기(150)로부터 수신된 팩트체크 결과를 기반으로 인공지능을 이용하여 뉴스 진위여부를 판별하는 서비스를 구독자 단말기(110)로 제공한다.The fake news reader 120 informs the probability that the contents of the news source designated by the user are fake by using artificial intelligence. The fake news reader 120 provides a service for determining whether the news is authentic or not by using artificial intelligence based on the fact check result received from the expert judgment terminal 150 by field experts and verified judges for accurate fact check. 110).

가짜뉴스 판독기(120)는 인공지능 기술을 이용하여 사용자가 원하는 증권 정보들 중에서 가짜뉴스와 신뢰할 수 있는 정보를 가려낼 수 있도록 한다. 가짜뉴스 판독기(120)는 가짜뉴스와 신뢰할 수 있는 정보를 가려낼 수 있는 근거를 제시한다. 가짜뉴스 판독기(120)는 근거에 대해 전문가의 신뢰도나 진위여부에 참가한 전문가 판정단 단말기(150)로부터 수신된 판정정보에 따라 자동으로 진위여부를 갱신하여 진위여부 정보를 판정한다.The fake news reader 120 uses artificial intelligence technology to screen out fake news and reliable information from among stock information desired by the user. The fake news reader 120 provides a basis for screening out fake news and reliable information. The fake news reader 120 automatically updates the authenticity or not according to the determination information received from the expert judgment terminal 150 participating in the expert's reliability or authenticity of the evidence to determine the authenticity information.

가짜뉴스 판독기(120)는 증권정보가 필요한 기업, 단체, 개인투자자들에게 중요한 증권정보와 기업들의 동향정보 등에 대한 주요 정보를 구독자 단말기(110)로 제공한다. 가짜뉴스 판독기(120)는 인공지능을 기반으로 뉴스 컨텐츠의 진위여부를 판정을 위한 결과에 대해 학습한다.The fake news reader 120 provides the subscriber terminal 110 with important information about stock information and trends of companies, which are important to companies, organizations, and individual investors who need stock information. The fake news reader 120 learns about the result for determining whether the news content is authentic or not based on artificial intelligence.

관리자 단말기(130)는 가짜뉴스 판독기(120)에 접속하여 가짜뉴스 판독기(120)의 전반적인 기능을 제어한다. 관리자 단말기(130)는 컨텐츠에 대한 진위여부를 관리한다.The manager terminal 130 accesses the fake news reader 120 and controls the overall functions of the fake news reader 120. The manager terminal 130 manages whether the content is authentic or not.

관리자 단말기(130)는 회원 및 전문가 정보를 관리한다. 관리자 단말기(130)는 전문가에 대한 승인 및 정지를 관리한다. 관리자 단말기(130)는 진짜 또는 가짜 판정정보에 대응하는 포인트 입금을 관리한다. 관리자 단말기(130)는 컨텐츠 진위여부 정보를 관리한다. 관리자 단말기(130)는 전문가 수익정책을 관리한다.The manager terminal 130 manages member and expert information. The manager terminal 130 manages approval and suspension of experts. The manager terminal 130 manages the deposit of points corresponding to the real or fake determination information. The manager terminal 130 manages content authenticity information. The manager terminal 130 manages the expert profit policy.

뉴스 공급자(140)는 가짜뉴스 판독기(120)로부터 뉴스 검색(키워드, 구독)을 요청받고, 가짜뉴스 판독기(120)로 뉴스 검색에 대응하는 뉴스정보를 전송한다.The news provider 140 receives a request for a news search (keyword, subscription) from the fake news reader 120 and transmits news information corresponding to the news search to the fake news reader 120.

전문가 판정단 단말기(150)는 가짜뉴스 판독기(120)로 뉴스 정보에 대응하는 진짜 또는 가짜 판정정보를 전송한다. 전문가 판정단 단말기(150)는 가짜뉴스 판독기(120)로부터 진짜 또는 가짜 판정정보에 대응하는 포인트 또는 리워드를 제공받는다.The expert decision terminal 150 transmits real or fake decision information corresponding to the news information to the fake news reader 120. The expert judgment terminal 150 receives points or rewards corresponding to real or fake judgment information from the fake news reader 120.

전문가 판정단 단말기(150)는 회원가입된 전문가 또는 판정단 단말기로서, 전문분야를 설정한다. 전문가 판정단 단말기(150)는 기 설정된 전문분야에 대응하는 증권 뉴스 정보에 대한 진위여부를 확인하고 관리한다.The expert judgment group terminal 150 is a member-registered expert or judgment group terminal, and sets a specialized field. The expert judgment group terminal 150 checks and manages the authenticity of stock news information corresponding to a preset specialized field.

전문가 판정단 단말기(150)는 진짜 또는 가짜 판정정보에 대응하는 포인트를 수신하여 적립한 적립 현황과 사용내역을 관리한다. 전문가 판정단 단말기(150)는 기 설정된 전문분야에 대한 이의를 신청하고 관리한다. 전문가 판정단 단말기(150)는 진짜판정정보 또는 가짜판정정보에 대응하는 포인트를 입금 받는다.The expert judgment terminal 150 manages the accumulated status and usage details by receiving points corresponding to the real or fake judgment information. The expert judgment group terminal 150 requests and manages an objection to a preset specialized field. The expert judgment terminal 150 receives points corresponding to real judgment information or fake judgment information.

도 2a,2b는 본 실시예에 따른 가짜뉴스 판독기를 개략적으로 나타낸 도면이다.2A and 2B are schematic diagrams of a fake news reader according to the present embodiment.

가짜뉴스 판독기(120)는 인공지능기술을 이용한 가짜뉴스 학습엔진, 인공지능기술을 이용한 가짜뉴스 판단엔진을 포함한다. 가짜뉴스 판독기(120)는 학습데이터를 관리하고, 구독정보 설정을 관리하고, 가짜뉴스 확률을 계산하고 정보를 제공한다.The fake news reader 120 includes a fake news learning engine using artificial intelligence technology and a fake news judgment engine using artificial intelligence technology. The fake news reader 120 manages learning data, manages subscription information settings, calculates a fake news probability, and provides information.

본 실시예에 따른 가짜뉴스 판독기(120)는 뉴스 정보 수집부(210), 뉴스 선별부(220), 가짜뉴스 판별부(230), 학습부(232), 진위 판별부(234), 뉴스 큐레이션부(240)를 포함한다. 가짜뉴스 판독기(120)에 포함된 구성요소는 반드시 이에 한정되는 것은 아니다.The fake news reader 120 according to the present embodiment includes a news information collection unit 210, a news selection unit 220, a fake news determination unit 230, a learning unit 232, an authenticity determination unit 234, and a news queue. It includes a ration unit 240. Components included in the fake news reader 120 are not necessarily limited thereto.

다시 말해, 가짜뉴스 판독기(120)는 회원관리모듈, 전문가관리모듈, 포인트관리모듈, 구독정보관리모듈, 결제관리모듈, 서비스구매관리모듈, 진위확률관리모듈, 뉴스컨텐츠정보관리모듈, 전문가평가모듈, 컨텐츠별 진위평가 의견관리모듈, 전문가별 전문분야 설정관리모듈, 가짜뉴스판별정책 관리모듈, 전문가랭킹 관리모듈, 진위판정모듈, 알림통지모듈, 이의신청모듈을 포함하는 형태로 구현 가능하다.In other words, the fake news reader 120 is a member management module, expert management module, point management module, subscription information management module, payment management module, service purchase management module, authenticity probability management module, news content information management module, expert evaluation module. It can be implemented in a form including content-specific authenticity evaluation opinion management module, expert-specific field setting management module, fake news discrimination policy management module, expert ranking management module, authenticity determination module, notification notification module, and objection application module.

가짜뉴스 판독기(120)에 포함된 각 구성요소는 장치 내부의 소프트웨어적인 모듈 또는 하드웨어적인 모듈을 연결하는 통신 경로에 연결되어 상호 간에 유기적으로 동작할 수 있다. 이러한 구성요소는 하나 이상의 통신 버스 또는 신호선을 이용하여 통신한다.Each component included in the fake news reader 120 is connected to a communication path connecting a software module or a hardware module inside the device, so that they can operate organically with each other. These components communicate using one or more communication buses or signal lines.

도 2에 도시된 가짜뉴스 판독기(120)의 각 구성요소는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 소프트웨어적인 모듈, 하드웨어적인 모듈 또는 소프트웨어와 하드웨어의 결합으로 구현될 수 있다.Each component of the fake news reader 120 shown in FIG. 2 refers to a unit that processes at least one function or operation, and may be implemented as a software module, a hardware module, or a combination of software and hardware.

뉴스 정보 수집부(210)는 뉴스 공급자(140)로부터 증권 뉴스 정보를 수집한다. 뉴스 선별부(220)는 증권 뉴스 정보 중 구독자 단말기(110)에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링한다. The news information collection unit 210 collects stock news information from the news provider 140. The news selection unit 220 filters only news information of interest items corresponding to keywords or interest items set by the subscriber terminal 110 among stock news information.

가짜뉴스 판별부(230)는 인공지능을 이용하여 기 학습된 학습 데이터를 기반으로 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성한다. 가짜뉴스 판별부(230)는 전문가 판정정보(전문가 진짜판정정보 또는 전문가 가짜판정정보), 학습 데이터를 기반으로 관심항목 뉴스정보가 가짜뉴스인지의 진위여부를 판별한다.The fake news determination unit 230 generates an authenticity determination result by determining whether the interest item news information is fake news or real news based on the previously learned learning data using artificial intelligence. The fake news determination unit 230 determines whether the interest item news information is fake news based on expert determination information (expert real determination information or expert fake determination information) and learning data.

가짜뉴스 판별부(230)는 관심항목 뉴스정보에 포함된 문자와 이미지를 분리한 후 문자에 대해서 전처리를 수행한다. 가짜뉴스 판별부(230)는 문자들을 기반으로 단어를 인지한다. 가짜뉴스 판별부(230)는 단어를 조합한 순서를 기반으로 문맥을 이해하고, 문맥을 기반으로 자체 팩트체크 결과정보를 생성한다.The fake news determination unit 230 separates the text and the image included in the interest item news information, and then performs pre-processing on the text. The fake news determination unit 230 recognizes a word based on characters. The fake news determination unit 230 understands the context based on the order in which words are combined, and generates its own fact check result information based on the context.

가짜뉴스 판별부(230)는 문맥을 기반으로 특정 기업의 계약 또는 수주 기사로 판단하면 계약 금액, 계약 년도, 계약 조건을 팩트 정보로 저장한다. 가짜뉴스 판별부(230)는 문맥을 기반으로 기업 또는 정부의 투자 기사로 판단하면 투자처, 투자분야, 투자비용, 투자년도를 팩트 정보로 저장한다. 가짜뉴스 판별부(230)는 문맥을 기반으로 세계 증시 기사로 판단하면 국가별 증시 증감율, 일시를 팩트 정보로 저장한다. 가짜뉴스 판별부(230)는 문맥을 기반으로 기업별 신기술 개발 기사로 판단하면 기업별 신기술 정보를 팩트 정보로 저장한다. 가짜뉴스 판별부(230)는 문맥을 기반으로 국가별 경제 성장률 기사로 판단하면 국가별 경제 성장률 정보를 팩트 정보로 저장한다.The fake news determination unit 230 stores a contract amount, a contract year, and a contract condition as fact information when it is determined as a contract or order article of a specific company based on the context. The fake news determination unit 230 stores the investment destination, investment field, investment cost, and investment year as fact information when it is determined as an investment article of a company or government based on the context. The fake news determination unit 230 stores the rate of increase and decrease of the stock market by country and the date and time as fact information when it is determined as a global stock market article based on the context. The fake news determination unit 230 stores the new technology information for each company as fact information when it is determined as a new technology development article for each company based on the context. The fake news determination unit 230 stores information on the economic growth rate for each country as fact information when it is determined as an article of the economic growth rate for each country based on context.

가짜뉴스 판별부(230)는 문맥을 기반으로 새로운 증권 정보가 인지되면, 새로운 증권 정보와 기 저장된 팩트 정보가 일치하는지의 여부를 확인하여 자체 팩트체크 결과정보를 생성한다. 확인 결과, 새로운 증권 정보가 기 저장된 팩트 정보와 일치하는 경우, 가짜뉴스 판별부(230)는 진짜뉴스로 판단한 자체 팩트체크 결과정보를 생성한다. 확인 결과, 새로운 증권 정보가 기 저장된 팩트 정보와 미일치하는 경우, 가짜뉴스 판별부(230)는 가짜뉴스로 판단한 자체 팩트체크 결과정보를 생성한다.When the new stock information is recognized based on the context, the fake news determination unit 230 checks whether the new stock information and the pre-stored fact information match to generate self-fact check result information. As a result of the confirmation, if the new stock information matches the pre-stored fact information, the fake news determination unit 230 generates its own fact check result information determined to be real news. As a result of the confirmation, if the new stock information does not match the pre-stored fact information, the fake news determination unit 230 generates its own fact check result information determined as fake news.

가짜뉴스 판별부(230)는 관심항목 뉴스정보에 포함된 문자와 이미지를 분리한 후 이미지에 대한 합성 여부를 확인한 이미지 판정결과정보를 생성한다. 확인 결과, 이미지가 합성한 것으로 판단되면, 가짜뉴스 판별부(230)는 이미지 가짜판정정보를 생성한다. 확인 결과, 이미지가 합성하지 않은 것으로 판단되면, 가짜뉴스 판별부(230)는 이미지 진짜판정정보를 생성한다.The fake news determination unit 230 separates characters and images included in the news information of interest items, and then generates image determination result information confirming whether or not the images are synthesized. As a result of the confirmation, if it is determined that the image is synthesized, the fake news determination unit 230 generates image false determination information. As a result of the confirmation, if it is determined that the image is not synthesized, the fake news determination unit 230 generates image real determination information.

가짜뉴스 판별부(230)는 관심항목 뉴스정보가 가짜뉴스로 판별되는 경우, 가짜뉴스 확률정보를 계산한다. 가짜뉴스 판별부(230)는 전문가 판정정보(전문가 진짜판정정보 또는 전문가 가짜판정정보), 자체 팩트체크 결과정보(진짜뉴스, 가짜뉴스), 이미지 판정결과정보(이미지 진짜판정정보 또는 이미지 가짜판정정보)를 기반으로 가짜뉴스 확률정보를 계산한다.The fake news determination unit 230 calculates the fake news probability information when the interest item news information is determined to be fake news. The fake news determination unit 230 includes expert judgment information (expert real judgment information or expert fake judgment information), self fact check result information (real news, fake news) , image judgment result information (image real judgment information or image fake judgment information ), the probability information of fake news is calculated.

학습부(232)는 가짜뉴스 사례와 가짜뉴스 패턴을 분석한다. 학습부(232)는 가짜뉴스 사례와 가짜뉴스 패턴을 학습하여 학습 데이터에 반영한다. 학습부(232)는 가짜뉴스 사례와 가짜뉴스 패턴을 기반으로 증권 뉴스 정보를 분석한 결과를 학습하여 학습 데이터에 반영한다.The learning unit 232 analyzes fake news cases and fake news patterns. The learning unit 232 learns fake news cases and fake news patterns and reflects them in the learning data. The learning unit 232 learns the result of analyzing stock news information based on the fake news case and the fake news pattern and reflects it in the learning data.

진위 판별부(234)는 뉴스 공급자(140)로부터 새로운 증권 뉴스 정보를 수신하는 경우, 구독자 단말기(110)로 전달하기 전에 새로운 증권 뉴스 정보의 분야를 분류한다.When receiving new stock news information from the news provider 140, the authenticity determination unit 234 classifies the field of new stock news information before passing it to the subscriber terminal 110.

진위 판별부(234)는 해당 분야에 대응하는 전문분야를 갖는 전문가 판정단 단말기(150)로 증권 뉴스 정보를 전송한다. 진위 판별부(234)는 전문가 판정단 단말기(150)로부터 전문분야에 따라 새로운 증권 뉴스 정보에 대한 전문가 판정정보(전문가 진짜판정정보 또는 전문가 가짜판정정보)를 수신한다. The authenticity determination unit 234 transmits stock news information to the expert determination terminal 150 having a specialized field corresponding to the field. The authenticity determination unit 234 receives expert determination information (expert genuine determination information or expert fake determination information) for new stock news information according to a specialized field from the expert determination unit 150.

뉴스 큐레이션부(240)는 관심항목 뉴스정보에 진위판별결과를 매칭하여 구독자 단말기(110)로 큐레이션(Curation)한다. 뉴스 큐레이션부(240)는 관심항목 뉴스정보와 함께 가짜뉴스 확률을 전송한다.The news curation unit 240 matches the result of authenticity determination with the news information of interest items, and curates the subscriber terminal 110. The news curation unit 240 transmits the probability of fake news along with the news information of the interest item.

도 3은 본 실시예에 따른 가짜뉴스 판독 서비스 제공 과정을 나타낸 도면이다.3 is a diagram showing a process of providing a fake news reading service according to the present embodiment.

도 3의 (a)에 도시된 바와 같이, 구독자 단말기(110)는 본인이 관심 있는 뉴스풀을 설정한다. 도 3의 (b)에 도시된 바와 같이, 구독자 단말기(110)는 키워드를 설정하여 관심있는 뉴스정보를 검색결과로서 출력한다.As shown in (a) of FIG. 3, the subscriber terminal 110 sets up a news pool that the user is interested in. As shown in (b) of FIG. 3, the subscriber terminal 110 sets a keyword and outputs news information of interest as a search result.

도 3의 (c)에 도시된 바와 같이, 구독자 단말기(110)는 가짜뉴스 판독기(120)로부터 사용자가 설정한 뉴스공급자로부터 검색어에 대응하는 정보를 가져와서 뉴스 목록 창에 출력한다.As shown in (c) of FIG. 3, the subscriber terminal 110 fetches information corresponding to the search word from the news provider set by the user from the fake news reader 120 and outputs it to the news list window.

도 3의 (d)에 도시된 바와 같이, 구독자 단말기(110)는 사용자가 관심있는 뉴스정보를 클릭하면 상세정보창에 가짜뉴스 판독기(120)로부터 분석된 진위여부 정보와 전문가가 제시한 진위여부 판정정보를 확인할 수 있는 정보를 상단에 배치하여 출력하는 동시에 광고와 함께 해당 컨텐츠 정보를 제공한다.As shown in (d) of FIG. 3, when the user clicks on the news information of interest, the subscriber terminal 110 determines the authenticity information analyzed by the fake news reader 120 in the detailed information window and the authenticity presented by the expert. Information that can be checked is placed on the top and displayed, while providing relevant content information along with advertisements.

도 4는 본 실시예에 따른 가짜뉴스 식별 정보 제공 방법을 나타낸 도면이다.4 is a diagram showing a method of providing fake news identification information according to the present embodiment.

1차적으로 가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 수신된 전문가 판정정보(전문가 진짜판정정보 또는 전문가 가짜판정정보)를 이용하여 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한다. 즉, 가짜뉴스 판독기(120)는 뉴스 컨텐츠의 진위여부 판정을 위해서는 전문판정단계를 수행한다.First, the fake news reader 120 determines whether the news information is fake news or real news by using the expert judgment information (expert real judgment information or expert fake judgment information) received from the expert judgment terminal 150. That is, the fake news reader 120 performs a professional determination step to determine whether the news content is authentic or not.

2차적으로 가짜뉴스 판독기(120)는 뉴스에 삽입된 텍스트를 인지하여 문맥을 분석한 후 기 저장된 팩트 정보와 비교하여 뉴스에 대해 자체 팩트체크로 진위 판별한다. 즉, 가짜뉴스 판독기(120)는 뉴스 컨텐츠의 문맥을 파악하여 가짜뉴스일 확률을 판단한다.Secondly, the fake news reader 120 recognizes the text inserted in the news, analyzes the context, and compares it with pre-stored fact information to determine the authenticity of the news with its own fact check. That is, the fake news reader 120 determines the probability of fake news by grasping the context of the news content.

3차적으로 가짜뉴스 판독기(120)는 뉴스에 삽입된 이미지가 합성 사진 판별하여 뉴스에 대한 진위를 판별한다. 즉, 가짜뉴스 판독기(120)는 뉴스에 포함된 사진정보의 합성여부를 판단하여 가짜뉴스일 확률을 판단한다.Thirdly, the fake news reader 120 determines the authenticity of the news by determining the composite photo of the image inserted in the news. That is, the fake news reader 120 determines whether the photo information included in the news is synthesized, and determines the probability of the fake news.

가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 진짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 진짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 진짜판정정보로 판단하면 해당 뉴스를 진짜뉴스로 판단한다.The fake news reader 120 receives the expert real judgment information from the expert judgment terminal 150, determines the text included in the stock news information as real news with its own fact check, and the image inserted in the stock news information is an image. If it is judged by the real judgment information, the news is judged as the real news.

가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 가짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 진짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 진짜판정정보로 판단하면, 해당 뉴스에 대해 전문가가 판단한 결과 가짜뉴스일 수 있음을 나타내고 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.The fake news reader 120 receives the expert fake judgment information from the expert judgment terminal 150, determines the text included in the stock news information as real news with its own fact check, and the image inserted in the stock news information is an image. If it is judged as real judgment information, it indicates that the news may be fake news as a result of the expert's judgment, and calculates probability information of fake news so that it is output together with the news.

가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 진짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 가짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 진짜판정정보로 판단하면, 해당 뉴스에 대해 자체팩드체크 결과 가짜뉴스일 수 있음을 나타내고 자체팩드체크 결과 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.The fake news reader 120 receives the expert's genuine judgment information from the expert judgment terminal 150, determines the text included in the stock news information as fake news with its own fact check, and the image inserted in the stock news information is an image. If it is judged as the real judgment information, it indicates that the news may be fake news as a result of the self-pack check, and the probability information of the fake news as a result of the self-pack check is calculated and output together with the news.

가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 진짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 진짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 가짜판정정보로 판단하면, 해당 뉴스에 대해 이미지 팩드체크 결과 가짜뉴스일 수 있음을 나타내고 가짜 이미지(합성 이미지)를 포함하고 있는 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.The fake news reader 120 receives the expert real judgment information from the expert judgment terminal 150, determines the text included in the stock news information as real news with its own fact check, and the image inserted in the stock news information is an image. If it is judged as fake judgment information, it indicates that the news may be fake news as a result of the image pack check, and calculates probability information of fake news that includes a fake image (composite image) and outputs it along with the corresponding news.

여기서, 가짜뉴스 판독기(120)는 세가지 판단 기준 중 한가지 판단기준이 가짜로 판단(전문가 판정정보, 자체 팩트체크 결과정보, 이미지 판정결과정보)되므로 가짜뉴스일 확률정보를 예컨대, 대략 30%로 산출할 수 있다.Here, the fake news reader 120 calculates probability information of fake news as, for example, approximately 30%, since one of the three criteria is determined to be fake (expert decision information, self fact check result information, image decision result information). can do.

가짜뉴스 판독기(120)는 전문가 판정정보가 가짜뉴스인 것으로 판단되는 경우, 전문가가 판정한 전문분야에 따라 가짜뉴스 확률정보를 계산할 수 있다. 가짜뉴스 판독기(120)는 전문분야가 수치화 가능분야(예컨대, IT 분야)인 경우 평균 임계치보다 높은 가중치를 반영하고, 전문분야가 수치화 불가능분야(예컨대, 정치, 시사, 예측)인 경우 평균 임계치보다 낮은 가중치를 반영하여 가짜 뉴스 확률정보를 계산할 수 있다.When it is determined that the expert determination information is fake news, the fake news reader 120 may calculate the fake news probability information according to the specialized field determined by the expert. The fake news reader 120 reflects a weight higher than the average threshold when the field of expertise is digitizable (eg, IT field), and when the field of expertise is non-digitizable (eg, politics, current affairs, prediction), the weight is higher than the average threshold. The fake news probability information can be calculated by reflecting the low weight.

가짜뉴스 판독기(120)는 자체 팩트체크 결과정보가 가짜뉴스인 것으로 판단되는 경우, 기 저장된 팩트 정보에 포함된 항목과 미일치 개수를 카운트하여 가짜뉴스 확률정보를 계산할 수 있다. 가짜뉴스 판독기(120)는 기 저장된 팩트 정보 내의 각 항목에 중요도에 따른 가중치를 반영하여 가짜 뉴스 확률정보를 계산할 수 있다.If the fake news reader 120 determines that the fact check result information is fake news, the fake news probability information may be calculated by counting the number of items and mismatches included in the pre-stored fact information. The fake news reader 120 may calculate the fake news probability information by reflecting the weight according to the importance to each item in the pre-stored fact information.

가짜뉴스 판독기(120)는 이미지 판정결과정보로 판단한 결과 뉴스에 삽입된 이미자 합성 또는 위변조 이미지로 확인되는 경우, 해당 뉴스에 포함된 문맥과 연계하여 가짜뉴스 확률정보를 계산하거나 합성 또는 위변조 확률을 수치화하여 가짜뉴스 확률정보를 계산할 수 있다.The fake news reader 120 calculates fake news probability information in connection with the context included in the news, or quantifies the probability of synthesis or forgery, when it is determined by the image judgment result information and confirms that the image inserted in the news is synthesized or forged. Thus, the probability information of fake news can be calculated.

가짜뉴스 판독기(120)는 뉴스에 대한 판정 결과, 전문가 판정정보, 자체 팩트체크 결과정보, 이미지 판정결과정보 중 가짜뉴스로 판단한 결과를 기반으로 가짜뉴스 확률정보를 계산한다.The fake news reader 120 calculates fake news probability information based on a result of determining fake news among the decision results for news, expert decision information, self fact check result information, and image decision result information.

예컨대, 가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 가짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 가짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 진짜판정정보로 판단하면, 해당 뉴스에 대해 전문가가 판단한 결과와 자체팩드체크 결과가 가짜뉴스일 수 있음을 나타내고, 전문가 판단결과와 자체팩드체크 결과로 인해 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.For example, the fake news reader 120 receives expert fake judgment information from the expert judgment terminal 150, determines the text included in the stock news information as fake news with its own fact check, and the image inserted in the stock news information If the image is judged as the real judgment information, it indicates that the result of the expert judgment and the self-pack check result for the relevant news may be fake news, and the probability information of the fake news due to the expert judgment result and the self-pack check result is calculated. It should be printed with the news.

다시 말해, 가짜뉴스 판독기(120)는 세가지 판단 기준 중 두가지 판단기준이 가짜로 판단(예컨대, 전문가 판정정보(전문가 가짜판정정보), 팩트체크 결과정보(가짜뉴스), 이미지 판정결과정보(이미지 진짜판정정보))되므로 가짜뉴스일 확률정보를 높게 산출(예컨대, 대략 60 %)할 수 있다.In other words, the fake news reader 120 judges that two of the three judgment criteria are fake (e.g., expert judgment information (expert fake judgment information), fact check result information (fake news), image judgment result information (image real Judgment information)), so the probability information of fake news can be calculated high (for example, about 60%).

예컨대, 가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 가짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 가짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 가짜판정정보로 판단하면, 해당 뉴스에 대해 전문가가 판단한 결과, 자체팩드체크 결과, 이미지 판정결과 모두가 가짜뉴스일 수 있음을 나타내고, 전문가 판단결과, 자체 팩드체크 결과, 이미지 판정결과 모두 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.For example, the fake news reader 120 receives expert fake judgment information from the expert judgment terminal 150, determines the text included in the stock news information as fake news with its own fact check, and the image inserted in the stock news information If the image is judged as fake judgment information, it indicates that the result of the expert's judgment on the news, the self-packed check result, and the image judgment result may all be fake news, and the expert judgment result, self-packed check result, and image judgment result are all fake. The probability information of news is calculated and output with the news.

여기서, 가짜뉴스 판독기(120)는 세가지 판단 기준 모두가 가짜로 판단(전문가 판정정보(전문가 가짜판정정보), 팩트체크 결과정보(가짜뉴스), 이미지 판정결과정보(이미지 가짜판정정보))되므로 가짜뉴스일 확률정보를 높게 산출(예컨대, 대략 90 %)할 수 있다.Here, the fake news reader 120 judges that all three criteria are fake (expert determination information (expert fake determination information), fact check result information (fake news), image determination result information (image fake determination information)). It is possible to calculate high probability information (eg, about 90%) of news.

본 발명의 실시예에 따르면, 가짜 뉴스 판별을 위한 텍스트에 대한 판단은 아래와 같은 방법을 기반으로 수행될 수 있다.According to an embodiment of the present invention, the determination of the text for discriminating fake news may be performed based on the following method.

텍스트에 포함된 단어 간의 연관성에 대한 학습 결과를 기반으로 가짜 뉴스에 대한 판단이 수행될 수 있다. 뉴스 판별을 위해 기존의 진짜 뉴스에 대한 학습이 수행될 수 있다. 진짜 뉴스에 대한 학습을 통해 단어간 연관도에 대한 학습의 수행 이후, 가짜 뉴스에 대한 판단은 가짜 뉴스에 포함된 단어 연관도에 대한 판단을 추가적으로 고려하여 가짜 뉴스의 진위 여부에 대한 판단이 수행될 수 있다. 진짜 뉴스에 포함된 단어 연관도에 대한 학습은 단어간 1차 연관도와 2차 연관도를 추출하여 수행될 수 있다. 1차 연관도와 2차 연관도는 텍스트 내의 단어간 거리를 고려하여 추출될 수 있다. 1차 연관도와 2차 연관도를 결정하기 위한 단어 간 거리는 입력되는 학습을 위해 입력되는 뉴스의 길이에 따라 적응적으로 조정될 수 있다. 1차 연관도와 2차 연관도를 기반으로 단어간 연관도가 추출되되 1차 연관도에 상대적으로 높은 가중치를 두어 뉴스의 진위 여부에 대한 판단이 수행될 수 있다.A judgment on fake news may be performed based on a result of learning about the association between words included in the text. To discriminate news, learning about the existing real news can be performed. After learning about the relationship between words through learning about real news, the judgment on fake news is performed by additionally considering the judgment on the level of word correlation included in the fake news, and a judgment on whether the fake news is authentic or not. I can. Learning about the degree of relevance of words included in real news can be performed by extracting the primary and secondary relevance between words. The first degree of association and the second degree of association may be extracted in consideration of the distance between words in the text. The distance between words for determining the first degree of association and the second degree of association may be adaptively adjusted according to the length of the input news for input learning. The degree of association between words is extracted based on the first degree of association and the second degree of association, but a relatively high weight is given to the first degree of association to determine whether the news is authentic or not.

또한, 추가적으로 본 발명의 실시예에 따르면, 뉴스의 진위 여부에 대한 판단을 수행하기 위해 뉴스의 발행처에 대한 정보, 뉴스의 발행 속도 정보와 발행량 정보에 대한 학습이 추가적으로 수행될 수 있다. 동일한 주제에 대해 기존의 진짜 뉴스와 가짜 뉴스가 뉴스로서 발생되는 발행처, 발행되는 발행량, 발행 속도에 대한 정보가 수집될 수 있고, 발행량과 발행 속도를 기반으로 발행 뉴스가 가짜 뉴스일 확률이 시간의 흐름에 따라 조정될 수 있다. In addition, according to an embodiment of the present invention, in order to determine whether or not the news is authentic, learning about the news publisher information, news publication speed information, and publication amount information may be additionally performed. On the same topic, information on the publisher, the amount of publication, and the speed of publication, where the existing real and fake news are generated as news, can be collected. Based on the publication volume and publication speed, the probability that the published news is fake news is over time. It can be adjusted according to the flow.

예를 들어, 진짜 뉴스의 경우, 하나의 뉴스 발행 시점을 기준으로 출처가 다른 곳에서 유사한 뉴스들이 증가하는 추세를 보이다가 점진적으로 감소하는 추세를 가질 수 있다. 하지만, 가짜 뉴스의 경우, 출처가 동일한 곳에서 급속도로 발행되고, 다른 출처의 뉴스에 대한 증가가 이루어지지 않고, 급속하게 소멸될 수 있다. 이러한 뉴스 출처, 뉴스 발행량, 뉴스 발행 속도에 대한 학습을 통해 가짜 뉴스와 진짜 뉴스가 퍼지는 발행 패턴에 대한 학습이 수행될 수 있고, 이를 기반으로 뉴스가 진짜 뉴스인지 가짜 뉴스인지에 대한 판단이 실시간으로 변화되면서 수행될 수 있다.For example, in the case of real news, similar news from different sources may show an increasing trend based on the time of publication of one news and then gradually decrease. However, in the case of fake news, the source is rapidly published from the same source, and news from other sources does not increase, and may rapidly disappear. By learning about the news source, the amount of news issuance, and the speed of news issuance, it is possible to learn about fake news and the spreading pattern of real news, and based on this, it is possible to judge whether the news is real or fake news It can be done while changing.

도 5는 본 실시예에 따른 가짜뉴스 판독을 위해 문맥 판단 방법을 나타낸 도면이다.5 is a diagram showing a method of determining a context for reading fake news according to the present embodiment.

가짜뉴스 판독기(120)는 RNN(Recurrent Neural Networks)을 이용하여 문자열, 동영상 등 시계열 정보가 담긴 데이터에서 문맥을 판단하고, 문맥을 기반으로 가짜뉴스를 식별한다.The fake news reader 120 uses Recurrent Neural Networks (RNN) to determine the context from data containing time series information such as character strings and videos, and identifies fake news based on the context.

가짜뉴스 판독기(120)는 복수의 레이어로 구성된 인공신경망 구조를 가지며, 가짜뉴스 판독기(120)는 증권 뉴스 정보 내의 문장을 전처리하고 특징을 추출한다. 가짜뉴스 판독기(120)는 증권 뉴스 정보 내에 포함된 단어를 인지하고, 단어의 순서를 기반으로 문맥을 이해하고 문맥 내에 등장한 단어가 문맥을 이해하는데 중요한 단어이라고 판단되면 기억한다.The fake news reader 120 has an artificial neural network structure composed of a plurality of layers, and the fake news reader 120 preprocesses sentences in stock news information and extracts features. The fake news reader 120 recognizes a word included in the stock news information, understands the context based on the order of the words, and remembers the word appearing in the context when it is determined that it is an important word for understanding the context.

가짜뉴스 판독기(120)는 문맥을 판단하여 해당 증권 정보가 팩트체크된 정보라고 판단하는 경우, 저장한다. 예컨대, 가짜뉴스 판독기(120)는 특정 기업의 계약 또는 수주 정보 기사가 팩트로 판단되면, 계약 금액, 계약 년도, 계약 조건을 저장한다. 이후 가짜뉴스 판독기(120)는 동일한 분야에서 새로운 기사가 검색되는 경우, 팩트체크된 정보를 기반으로 새로운 기사가 가짜뉴스인지 여부를 검색할 수 있다. 가짜뉴스 판독기(120)는 기 저장된 정보와 해당 정보가 필요한 곳과의 차이(GAP)가 적을 경우 높은 학습효과를 갖는다.If the fake news reader 120 determines the context and determines that the corresponding stock information is fact-checked information, it stores it. For example, if the fake news reader 120 determines that the contract or order information article of a specific company is a fact, it stores the contract amount, the contract year, and the contract condition. Thereafter, when a new article is searched in the same field, the fake news reader 120 may search whether the new article is fake news based on the fact-checked information. The fake news reader 120 has a high learning effect when the difference (GAP) between the previously stored information and the place where the corresponding information is required is small.

도 6은 본 실시예에 따른 가짜뉴스 판독을 위해 합성 여부를 판단 방법을 나타낸 도면이다.6 is a diagram showing a method of determining whether to synthesize or not to read fake news according to the present embodiment.

가짜뉴스 판독기(120)는 증권 뉴스 정보에 포함된 사진의 합성 여부 판단하여 가짜뉴스를 식별한다. 가짜뉴스 판독기(120)는 CNN(Convolutional Neural Network)을 이용하여 컨볼루션(Convolution)과 풀링(Pooling)을 이용하여 특징(Feature)을 추출하여 학습한다.The fake news reader 120 identifies fake news by determining whether a photo included in the stock news information is synthesized. The fake news reader 120 extracts and learns features by using convolution and pooling using a convolutional neural network (CNN).

가짜뉴스 판독기(120)는 컨볼루션(Convolution)의 출력데이터를 다시 입력데이터로 사용한다. 가짜뉴스 판독기(120)는 데이터를 줄이거나 강조하는 용도로 사용한다. 가짜뉴스 판독기(120)는 풀링을 수행할 때, 최대 풀링(Max Pooling), 최소 풀링(Min Pooling), 평균 풀링(Average Pooling)을 이용할 수 있으나, CNN에서 주로 최대 풀링을 이용한다.The fake news reader 120 uses the output data of the convolution again as input data. The fake news reader 120 is used to reduce or emphasize data. When performing pooling, the fake news reader 120 can use Max Pooling, Min Pooling, and Average Pooling, but CNN mainly uses maximum pooling.

도 7은 본 실시예에 따른 가짜뉴스 판독기의 학습 수행 개념을 나타낸 도면이다.7 is a diagram showing a learning performance concept of a fake news reader according to the present embodiment.

가짜뉴스 판독기(120)는 가짜뉴스를 판독을 위한 학습을 수행한다. 가짜뉴스 판독기(120)는 가짜뉴스 사례와 패턴을 분석하고, 가짜뉴스 사례와 패턴을 기반으로 증권 뉴스 정보를 분석한 결과를 학습한다. The fake news reader 120 learns to read fake news. The fake news reader 120 analyzes fake news cases and patterns, and learns the results of analyzing stock news information based on fake news cases and patterns.

가짜뉴스 판독기(120)는 이미지없이 문자로만 구성된 증권 뉴스 정보에 대해서는 문자열, 동영상 등 시계열 정보가 담긴 데이터를 다루는데 적합한 RNN(Recurrent Neural Networks) 알고리즘을 이용하여 학습을 수행한다. 가짜뉴스 판독기(120)는 이미지 합성과 관련된 부분은 텐서플로우의 CNN(Convolutional Neural Network)을 이용하여 학습을 수행할 수 있다.The fake news reader 120 learns about stock news information composed of only text without an image using a Recurrent Neural Networks (RNN) algorithm suitable for handling data containing time series information such as character strings and videos. The fake news reader 120 may learn a part related to image synthesis using a TensorFlow Convolutional Neural Network (CNN).

도 8은 본 실시예에 따른 인공지능을 이용한 뉴스 진위 판별 서비스를 나타낸 도면이다.8 is a diagram showing a news authenticity determination service using artificial intelligence according to the present embodiment.

가짜뉴스 판독기(120)는 인공지능 기술을 이용하여 뉴스 진위여부를 판별하기 위해 학습 데이터를 이용한 지도학습에서부터 시작하여 학습된 데이터를 중심으로 뉴스정보 분석하여 자동으로 가짜뉴스일 확률을 판단해내고 이를 뉴스 진위서비스를 통하여 이용자에게 제공한다.The fake news reader 120 automatically determines the probability of fake news by analyzing news information based on the learned data starting from supervised learning using learning data to determine whether the news is authentic or not using artificial intelligence technology. Provided to users through news authenticity service.

도 8에 도시된 바와 같이, 학습 데이터 가공을 위해 뉴스컨텐츠 및 작성자정보 입력모듈은 입력받은 증권 뉴스 정보를 가짜뉴스 컨텐츠 정보 가동모듈과 가짜뉴스 컨텐츠 작성자 정보 가공모듈로 전송한다.As shown in FIG. 8, for processing the learning data, the news content and author information input module transmits the received stock news information to the fake news content information operation module and the fake news content creator information processing module.

가짜뉴스 컨텐츠 정보 가동모듈은 입력받은 증권 뉴스 정보로부터 뉴스 컨텐츠를 추출한다. 가짜뉴스 컨텐츠 작성자 정보 가공모듈은 입력받은 증권 뉴스 정보로부터 작성자 정보를 추출한다.The fake news content information operation module extracts news content from the received stock news information. The fake news content creator information processing module extracts author information from the input stock news information.

진위 정보 검증 모듈은 뉴스 컨텐츠에 대한 뉴스정보 진위정보에 대해서 검증을 수행한다. 뉴스 진위 판단 모듈은 뉴스 컨텐츠에 대한 뉴스 학습 정보를 이용하여 팩트체크를 수행하여 가짜뉴스인지를 확인한다. 작성자 성향 판단모듈은 작성자 정보를 기반으로 작성자 성향 학습 정보를 이용하여 작성자 성향을 분류한다.The authenticity information verification module verifies the authenticity information of news information about the news content. The news authenticity determination module checks whether it is fake news by performing a fact check using news learning information about news content. The author propensity determination module classifies author propensity using the author propensity learning information based on the author information.

뉴스 분류모듈은 뉴스 컨텐츠에 가짜뉴스 정보와 작성자 성향을 기반으로 뉴스를 분류한다. 뉴스 진위 정보 출력 모듈은 뉴스 진위 정보를 출력한다. 뉴스 정보 입력 모듈은 뉴스 진위 정보를 웹서버 및 통신 서버로 전송한다.The news classification module classifies news based on fake news information and author propensity in news content. The news authenticity information output module outputs news authenticity information. The news information input module transmits the news authenticity information to the web server and the communication server.

도 9는 본 실시예에 따른 서비스 제공 개념을 나타낸 도면이다.9 is a diagram illustrating a concept of providing a service according to the present embodiment.

가짜뉴스 판독기(120)는 뉴스매체 등 뉴스컨텐츠의 소스 원으로부터 정보를 수신한다. 다시 말해, 가짜뉴스 판독기(120)는 언론사 뉴스 공급자(140)로부터 증권 뉴스 정보를 수집한다. 가짜뉴스 판독기(120)는 수집한 증권 뉴스 정보 중 구독자 단말기(110)에서 설정한 키워드 또는 분야에 해당하는 특정분야 뉴스정보만을 추출한다.The fake news reader 120 receives information from a source of news content such as a news medium. In other words, the fake news reader 120 collects stock news information from the media news provider 140. The fake news reader 120 extracts only news information from a specific field corresponding to a keyword or field set by the subscriber terminal 110 from among the collected stock news information.

가짜뉴스 판독기(120)는 인공지능을 이용하여 특정분야 뉴스정보가 가짜뉴스일 확률을 분석한다. 가짜뉴스 판독기(120)는 분석된 가짜뉴스일 확률정보를 특정분야 뉴스정보와 함께 사용자에게 제공한다. 구독자 단말기(110)는 뉴스매체에 대하여 구독설정을 진행하고, 관심 항목에 대해서는 키워드를 통하여 필터링하여 관련 정보를 별도로 확인할 수 있다.The fake news reader 120 analyzes the probability that news information in a specific field is fake news using artificial intelligence. The fake news reader 120 provides the analyzed fake news probability information to the user along with the specific field news information. The subscriber terminal 110 may set up a subscription for a news medium, and filter related items of interest through keywords to separately check related information.

이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the present embodiment, and those of ordinary skill in the technical field to which the present embodiment pertains will be able to make various modifications and variations without departing from the essential characteristics of the present embodiment. Accordingly, the present embodiments are not intended to limit the technical idea of the present embodiment, but to explain the technical idea, and the scope of the technical idea of the present embodiment is not limited by these embodiments. The scope of protection of this embodiment should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be construed as being included in the scope of the present embodiment.

110: 구독자 단말기
120: 가짜뉴스 판독기
130: 관리자 단말기
140: 뉴스 공급자
150: 전문가 판정단 단말기
210: 뉴스 정보 수집부
220: 뉴스 선별부
230: 가짜뉴스 판별부
232: 학습부
234: 진위 판별부
240: 뉴스 큐레이션부
110: subscriber terminal
120: fake news reader
130: administrator terminal
140: news provider
150: expert judgment team terminal
210: news information collection unit
220: news screening unit
230: fake news discrimination unit
232: Learning Department
234: authenticity determination unit
240: News Curation Department

Claims (5)

뉴스 공급자로부터 증권 뉴스 정보를 수집하는 뉴스 정보 수집부;
상기 증권 뉴스 정보 중 구독자 단말기에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링하는 뉴스 선별부;
인공지능을 이용하여 기 학습된 학습 데이터를 기반으로 상기 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성하는 가짜뉴스 판별부; 및
상기 관심항목 뉴스정보에 상기 진위판별결과를 매칭하여 상기 구독자 단말기로 큐레이션(Curation)하는 뉴스 큐레이션부
를 포함하되, 상기 가짜뉴스 판별부는 상기 관심항목 뉴스정보에 포함된 문자와 이미지를 분리한 후 상기 문자에 대해서 전처리를 수행한 후 상기 문자들을 기반으로 단어를 인지하고, 상기 단어를 조합한 순서를 기반으로 문맥을 인지하고,
상기 관심항목 뉴스정보의 상기 문맥을 기반으로 특정 기업의 계약 또는 수주 기사로 판단하면 계약 금액, 계약 년도, 계약 조건을 팩트 정보로 저장하며, 상기 문맥을 기반으로 기업 또는 정부의 투자 기사로 판단하면 투자처, 투자분야, 투자비용, 투자년도를 팩트 정보로 저장하며, 상기 문맥을 기반으로 세계 증시 기사로 판단하면 국가별 증시 증감율, 일시를 팩트 정보로 저장하며, 상기 문맥을 기반으로 기업별 신기술 개발 기사로 판단하면 기업별 신기술 정보를 팩트 정보로 저장하며, 상기 문맥을 기반으로 국가별 경제 성장률 기사로 판단하면 국가별 경제 성장률 정보를 팩트 정보로 저장하며,
상기 문맥을 기반으로 새로운 증권 정보가 인지되면, 상기 새로운 증권 정보가 기 저장된 팩트 정보와 일치하는 경우 진짜뉴스로 판단한 팩트체크 결과정보를 생성하고, 상기 새로운 증권 정보가 기 저장된 팩트 정보와 미일치하는 경우 가짜뉴스로 판단한 팩트체크 결과정보를 생성하며,
상기 팩트 정보 내의 문장 길이에 따라 적응적으로 상기 팩트 정보 내의 상기 문장에 포함된 단어간 거리를 기반으로 1차 연관도와 2차 연관도를 추출하고, 상기 1차 연관도와 상기 2차 연관도를 기반으로 단어간 연관도를 추출한 후 상기 1차 연관도에 상기 2차 연관도보다 높은 가중치를 반영하여 상기 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별하며,
상기 관심항목 뉴스정보에 대한 발행처 정보, 발행 속도 정보, 발행량 정보를 수집한 후 상기 발행처 정보를 기반으로 하나의 발행처를 기준으로 다른 발행처에서 유사한 뉴스들이 발행되는 것으로 확인되고, 상기 발행 속도 정보 및 상기 발행량 정보를 기반으로 뉴스가 증가하는 추세로 발행되다가 점진적으로 감소하는 추세를 가지는 경우 상기 진짜뉴스로 판단한 팩트체크 결과정보를 생성하고, 상기 발행처 정보를 기반으로 동일한 발행처에서만 유사한 뉴스들이 발행되는 것으로 확인되고, 상기 발행 속도 정보 및 상기 발행량 정보를 기반으로 뉴스가 급속도로 발행되다가 급속하게 소멸되는 추세를 갖는 경우 상기 가짜뉴스로 판단한 팩트체크 결과정보를 생성하며,
상기 이미지에 대한 합성 여부를 확인하여, 상기 이미지가 합성한 것으로 판단되면 이미지 가짜판정정보를 생성하고, 상기 이미지가 합성되지 않은 것으로 판단되면 이미지 진짜판정정보를 생성하며, 전문가 판정단 단말기로부터 전문분야에 따라 상기 새로운 증권 정보에 대해 전문가 진짜판정정보 및 전문가 가짜판정정보를 수신하고,
상기 이미지 진짜판정정보, 상기 이미지 가짜판정정보, 상기 전문가 진짜판정정보, 상기 전문가 가짜판정정보, 상기 진짜뉴스로 판단한 팩트체크 결과정보, 상기 가짜뉴스로 판단한 팩트체크 결과정보 중 가짜판정정보가 포함된 비율을 기반으로 가짜뉴스 확률정보를 계산하며,
상기 가짜뉴스 확률정보를 계산할 때,
상기 전문가 진짜판정정보, 상기 전문가 가짜판정정보에 대해 전문분야가 수치화 가능분야인 경우 평균 임계치보다 높은 가중치를 반영하고, 전문분야가 수치화 불가능분야인 경우 평균 임계치보다 낮은 가중치를 반영하고, 상기 가짜뉴스로 판단한 팩트체크 결과정보에 기 저장된 팩트 정보에 포함된 항목과 미일치 개수를 카운트하고, 기 저장된 팩트 정보 내의 각 항목의 중요도에 따른 가중치를 반영하고, 상기 이미지 가짜판정정보에 합성 또는 위변조 확률을 수치화하여 상기 가짜뉴스 확률정보에 반영하는 것을 특징으로 하는 가짜뉴스 판독 장치.
A news information collection unit that collects stock news information from a news provider;
A news screening unit for filtering only interest item news information corresponding to a keyword or interest item set by a subscriber terminal among the stock news information;
A fake news determination unit that generates a result of authenticity determination by determining whether the interest item news information is fake news or real news based on pre-learned learning data using artificial intelligence; And
A news curation unit that matches the result of authenticity determination with the interest item news information and curates the subscriber terminal
Including, wherein the fake news determination unit performs pre-processing on the character after separating the character and the image included in the news information of the interest item, recognizes a word based on the characters, and determines the order of combining the words. Based on the context,
If it is determined as a contract or order article of a specific company based on the above context of the interest item news information, the contract amount, contract year, and contract terms are stored as fact information, and if it is determined as an investment article of a company or government based on the above context, The investment destination, investment field, investment cost, and investment year are stored as fact information, and if it is judged as a global stock market article based on the above context, the increase/decrease rate and date of the stock market by country are stored as fact information, and new technology development for each company based on the above context. If it is judged as an article, information on new technology for each company is stored as fact information, and if it is judged as an article on the economic growth rate by country based on the above context, information on the economic growth rate by country is stored as fact information.
When new stock information is recognized based on the context, when the new stock information matches the pre-stored fact information, the fact check result information determined to be real news is generated, and the new stock information does not match the pre-stored fact information. In this case, the fact check result information judged as fake news is generated,
Adaptively according to the sentence length in the fact information, extracting a first degree of association and a second degree of association based on the distance between words included in the sentence in the fact information, and based on the first degree of association and the second degree of association After extracting the degree of correlation between words, a weight higher than the second degree of relevance is reflected in the first degree of relevance to determine whether the interest item news information is fake news or real news,
After collecting the issuer information, issuance rate information, and issue amount information for the interest item news information, it is confirmed that similar news are issued from one issuer based on the issuer information, and the issue rate information and the If the news is published in an increasing trend based on the issuance information and then gradually decreases, the fact check result information determined as the real news is generated, and it is confirmed that similar news are issued only from the same publisher based on the publisher information. And, based on the issuance speed information and the issuance amount information, when the news is rapidly published and then rapidly disappears, fact check result information determined as the fake news is generated,
It checks whether the image is synthesized, and if it is determined that the image is synthesized, image false determination information is generated, and if it is determined that the image is not synthesized, image real determination information is generated. Accordingly, for the new securities information, the expert's genuine judgment information and the expert's fake judgment information are received,
Including false determination information among the image real determination information, the image fake determination information, the expert real determination information, the expert fake determination information, the fact check result information determined as the real news, and the fact check result information determined as the fake news. Calculates the probability information of fake news based on the ratio,
When calculating the fake news probability information,
For the real expert judgment information and the expert fake judgment information, a weight higher than the average threshold is reflected when the field of expertise is a field that can be quantified, and a weight lower than the average threshold is applied when the field of expertise is a field that cannot be quantified, and the fake news Counts the number of items and mismatches included in the pre-stored fact information in the fact check result information determined as, reflects the weight according to the importance of each item in the pre-stored fact information, and calculates the probability of synthesis or forgery in the image false determination information Fake news reading device, characterized in that the numerical value is reflected in the fake news probability information.
제1항에 있어서,
가짜뉴스 사례와 가짜뉴스 패턴을 분석하고, 상기 가짜뉴스 사례와 상기 가짜뉴스 패턴을 학습하여 상기 학습 데이터에 반영하며, 상기 가짜뉴스 사례와 상기 가짜뉴스 패턴을 기반으로 상기 증권 뉴스 정보를 분석한 결과를 학습하여 상기 학습 데이터에 반영하는 학습부
를 추가로 포함하는 것을 특징으로 하는 가짜뉴스 판독 장치.
The method of claim 1,
The result of analyzing the fake news case and the fake news pattern, learning the fake news case and the fake news pattern and reflecting it in the learning data, and analyzing the stock news information based on the fake news case and the fake news pattern Learning unit that learns and reflects it in the learning data
Fake news reading device, characterized in that it further comprises.
제2항에 있어서,
상기 뉴스 공급자로부터 상기 새로운 증권 정보를 수신하는 경우, 상기 구독자 단말기로 전달하기 전에 상기 새로운 증권 정보의 분야를 분류하며, 해당 분야에 대응하는 전문분야를 갖는 상기 전문가 판정단 단말기로 상기 증권 뉴스 정보를 전송하며, 상기 전문가 판정단 단말기로부터 상기 전문분야에 따라 상기 새로운 증권 정보에 대한 전문가 판정정보를 수신하는 진위 판별부
를 추가로 포함하는 것을 특징으로 하는 가짜뉴스 판독 장치.
The method of claim 2,
When receiving the new stock information from the news provider, the field of the new stock information is classified before being transmitted to the subscriber terminal, and the stock news information is transmitted to the expert judgment terminal terminal having a specialized field corresponding to the field. And, the authenticity determination unit for receiving expert determination information for the new securities information according to the specialized field from the expert determination terminal terminal
Fake news reading device, characterized in that it further comprises.
제3항에 있어서,
상기 가짜뉴스 판별부는,
상기 전문가 판정정보, 상기 학습 데이터를 기반으로 상기 관심항목 뉴스정보가 가짜뉴스인지의 진위여부를 판별하는 것을 특징으로 하는 가짜뉴스 판독 장치.
The method of claim 3,
The fake news determination unit,
Fake news reading device, characterized in that to determine whether or not the interest item news information is fake news based on the expert determination information and the learning data.
뉴스 정보 수집부에서 뉴스 공급자로부터 증권 뉴스 정보를 수집하는 과정;
뉴스 선별부에서 상기 증권 뉴스 정보 중 구독자 단말기에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링하는 과정;
가짜뉴스 판별부에서 상기 관심항목 뉴스정보에 포함된 문자와 이미지를 분리한 후 상기 문자에 대해서 전처리를 수행한 후 상기 문자들을 기반으로 단어를 인지하고, 상기 단어를 조합한 순서를 기반으로 문맥을 인지하는 과정;
상기 가짜뉴스 판별부에서 상기 관심항목 뉴스정보의 상기 문맥을 기반으로 특정 기업의 계약 또는 수주 기사로 판단하면 계약 금액, 계약 년도, 계약 조건을 팩트 정보로 저장하며, 상기 문맥을 기반으로 기업 또는 정부의 투자 기사로 판단하면 투자처, 투자분야, 투자비용, 투자년도를 팩트 정보로 저장하며, 상기 문맥을 기반으로 세계 증시 기사로 판단하면 국가별 증시 증감율, 일시를 팩트 정보로 저장하며, 상기 문맥을 기반으로 기업별 신기술 개발 기사로 판단하면 기업별 신기술 정보를 팩트 정보로 저장하며, 상기 문맥을 기반으로 국가별 경제 성장률 기사로 판단하면 국가별 경제 성장률 정보를 팩트 정보로 저장하는 과정;
상기 가짜뉴스 판별부에서 상기 문맥을 기반으로 새로운 증권 정보가 인지되면, 상기 새로운 증권 정보가 기 저장된 팩트 정보와 일치하는 경우 진짜뉴스로 판단한 팩트체크 결과정보를 생성하고, 상기 새로운 증권 정보가 기 저장된 팩트 정보와 미일치하는 경우 가짜뉴스로 판단한 팩트체크 결과정보를 생성하는 과정;
상기 가짜뉴스 판별부에서 상기 팩트 정보 내의 문장 길이에 따라 적응적으로 상기 팩트 정보 내의 상기 문장에 포함된 단어간 거리를 기반으로 1차 연관도와 2차 연관도를 추출하고, 상기 1차 연관도와 상기 2차 연관도를 기반으로 단어간 연관도를 추출한 후 상기 1차 연관도에 상기 2차 연관도보다 높은 가중치를 반영하여 상기 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성하는 과정;
상기 가짜뉴스 판별부에서 상기 관심항목 뉴스정보에 대한 발행처 정보, 발행 속도 정보, 발행량 정보를 수집하는 과정;
상기 가짜뉴스 판별부에서 상기 발행처 정보를 기반으로 하나의 발행처를 기준으로 다른 발행처에서 유사한 뉴스들이 발행되는 것으로 확인되고, 상기 발행 속도 정보 및 상기 발행량 정보를 기반으로 뉴스가 증가하는 추세로 발행되다가 점진적으로 감소하는 추세를 가지는 경우 상기 진짜뉴스로 판단한 팩트체크 결과정보를 생성하는 과정;
상기 가짜뉴스 판별부에서 상기 발행처 정보를 기반으로 동일한 발행처에서만 유사한 뉴스들이 발행되는 것으로 확인되고, 상기 발행 속도 정보 및 상기 발행량 정보를 기반으로 뉴스가 급속도로 발행되다가 급속하게 소멸되는 추세를 갖는 경우 상기 가짜뉴스로 판단한 팩트체크 결과정보를 생성하는 과정;
상기 가짜뉴스 판별부에서 상기 이미지에 대한 합성 여부를 확인하여, 상기 이미지가 합성한 것으로 판단되면 이미지 가짜판정정보를 생성하고, 상기 이미지가 합성되지 않은 것으로 판단되면 이미지 진짜판정정보를 생성하는 과정;
상기 가짜뉴스 판별부에서 전문가 판정단 단말기로부터 전문분야에 따라 상기 새로운 증권 정보에 대해 전문가 진짜판정정보 및 전문가 가짜판정정보를 수신하는 과정;
상기 가짜뉴스 판별부에서 상기 이미지 진짜판정정보, 상기 이미지 가짜판정정보, 상기 전문가 진짜판정정보, 상기 전문가 가짜판정정보, 상기 진짜뉴스로 판단한 팩트체크 결과정보, 상기 가짜뉴스로 판단한 팩트체크 결과정보 중 가짜판정정보가 포함된 비율을 기반으로 가짜뉴스 확률정보를 계산하는 과정;
상기 가짜뉴스 판별부에서 상기 전문가 진짜판정정보, 상기 전문가 가짜판정정보에 대해 전문분야가 수치화 가능분야인 경우 평균 임계치보다 높은 가중치를 반영하고, 전문분야가 수치화 불가능분야인 경우 평균 임계치보다 낮은 가중치를 적용하여 상기 가짜뉴스 확률정보에 반영하는 과정;
상기 가짜뉴스 판별부에서 상기 가짜뉴스로 판단한 팩트체크 결과정보에 기 저장된 팩트 정보에 포함된 항목과 미일치 개수를 카운트하고, 기 저장된 팩트 정보 내의 각 항목의 중요도에 따른 가중치를 적용하여 상기 가짜뉴스 확률정보에 반영하는 과정;
상기 가짜뉴스 판별부에서 상기 이미지 가짜판정정보에 합성 또는 위변조 확률을 수치화하여 상기 가짜뉴스 확률정보에 반영하는 과정; 및
뉴스 큐레이션부에서 상기 관심항목 뉴스정보, 상기 진위판별결과, 상기 가짜뉴스 확률정보를 상기 구독자 단말기로 큐레이션(Curation)하는 과정
을 포함하는 것을 특징으로 하는 가짜뉴스 판독 방법.
A process of collecting stock news information from a news provider in the news information collection unit;
Filtering only interest item news information corresponding to a keyword or interest item set by a subscriber terminal among the stock news information by a news selection unit;
The fake news determination unit separates the characters and images included in the interest item news information, performs pre-processing on the characters, recognizes words based on the characters, and determines the context based on the order in which the words are combined. Cognitive process;
If the fake news determination unit determines that the contract or ordered article of a specific company is based on the context of the news information of the interest item, the contract amount, contract year, and contract conditions are stored as fact information, and based on the context, the company or government If it is judged as an investment article, the investment destination, investment field, investment cost, and investment year are stored as fact information, and if it is judged as a global stock market article based on the above context, the rate of increase and decrease of the stock market by country and date and time are stored as fact information. A process of storing new technology information for each company as fact information if it is determined as a new technology development article for each company, and storing information on the economic growth rate for each country as fact information if it is determined as an economic growth rate article for each country based on the context;
When the fake news determination unit recognizes new stock information based on the context, if the new stock information matches the pre-stored fact information, the fact check result information determined to be real news is generated, and the new stock information is pre-stored. Generating fact check result information determined to be fake news when it does not match the fact information;
The fake news determination unit adaptively extracts a first degree of association and a second degree of association based on the distance between words included in the sentence in the fact information according to the sentence length in the fact information, and the first degree of association and the After extracting the relevance between words based on the secondary relevance, a weight higher than the secondary relevance is reflected in the primary relevance to determine whether the interest item news information is fake news or real news. Generating process;
Collecting, by the fake news determination unit, information about a publisher of the interest item, information about an issuance rate, and information about an amount of publication;
The fake news determination unit confirms that similar news is issued from another issuing source based on the issuing source information, and the news is published in an increasing trend based on the issuance speed information and the issuance amount information, and then gradually. Generating the fact check result information determined to be the real news when it has a decreasing trend;
When the fake news determination unit confirms that similar news are issued only from the same publisher based on the publisher information, and the news is rapidly published based on the issuance speed information and the issuance information, and then rapidly disappears. Generating the fact check result information determined as fake news;
Checking whether the image is synthesized by the fake news determination unit, generating false image determination information when it is determined that the image is synthesized, and generating image real determination information when it is determined that the image is not synthesized;
Receiving, by the fake news determination unit, expert real determination information and expert fake determination information for the new stock information according to a specialized field from an expert determination unit terminal;
Among the real image determination information, the image fake determination information, the expert real determination information, the expert fake determination information, the fact check result information determined as the real news, and the fact check result information determined as the fake news in the fake news determination unit. Calculating the probability information of fake news based on the ratio in which the fake judgment information is included;
The fake news determination unit reflects a weight higher than the average threshold for the real expert judgment information and the expert fake judgment information when the field of expertise is a field that can be quantified, and a weight lower than the average threshold when the field of expertise is a field that cannot be quantified. Applying and reflecting the fake news probability information;
The fake news determination unit counts the number of items and mismatches included in the pre-stored fact information in the fact check result information determined as the fake news, and applies a weight according to the importance of each item in the pre-stored fact information to the fake news. The process of reflecting in probability information;
A process of quantifying a synthesis or forgery probability of the image false determination information in the fake news determination unit and reflecting it in the fake news probability information; And
A process of curating the interest item news information, the authenticity determination result, and the fake news probability information to the subscriber terminal in the news curation unit
Fake news reading method comprising a.
KR1020200073560A 2020-06-17 2020-06-17 Method And Apparatus for Detecting Fake News by Using Artificial Intelligence KR102228737B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020200073560A KR102228737B1 (en) 2020-06-17 2020-06-17 Method And Apparatus for Detecting Fake News by Using Artificial Intelligence
PCT/KR2021/007642 WO2021256884A1 (en) 2020-06-17 2021-06-17 Method and device for identifying fake news using ai

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200073560A KR102228737B1 (en) 2020-06-17 2020-06-17 Method And Apparatus for Detecting Fake News by Using Artificial Intelligence

Publications (2)

Publication Number Publication Date
KR102228737B1 true KR102228737B1 (en) 2021-03-17
KR102228737B9 KR102228737B9 (en) 2023-02-23

Family

ID=75243384

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200073560A KR102228737B1 (en) 2020-06-17 2020-06-17 Method And Apparatus for Detecting Fake News by Using Artificial Intelligence

Country Status (2)

Country Link
KR (1) KR102228737B1 (en)
WO (1) WO2021256884A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021256884A1 (en) * 2020-06-17 2021-12-23 주식회사 푸시뉴스 Method and device for identifying fake news using ai
KR20230128616A (en) 2022-02-28 2023-09-05 세종대학교산학협력단 Method of generating data set for detecting fake news

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117540038B (en) * 2024-01-10 2024-03-22 中国信息通信研究院 Intelligent detection false data synthesis method and system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165598A (en) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology Apparatus and method for extracting rumor information
KR20170114321A (en) * 2016-04-04 2017-10-16 (주)어반트시스템 Personalized news contents filtering system and method using the Keyword analysis
KR20190019589A (en) * 2017-08-18 2019-02-27 주식회사 포스코아이씨티 System and Method for Checking Fact

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102228737B1 (en) * 2020-06-17 2021-03-17 주식회사 푸시뉴스 Method And Apparatus for Detecting Fake News by Using Artificial Intelligence

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165598A (en) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology Apparatus and method for extracting rumor information
KR20170114321A (en) * 2016-04-04 2017-10-16 (주)어반트시스템 Personalized news contents filtering system and method using the Keyword analysis
KR20190019589A (en) * 2017-08-18 2019-02-27 주식회사 포스코아이씨티 System and Method for Checking Fact

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
K. Shu et al., Fake News Detection on Social media: A Data Mining Perspective, http://arXiv:1708.01967v3 (2017.12.19.)* *
R. Ian, Satirical fake News and/as American Political Discourse, Journal of American Culture, 35(3), pp.258-275 (2012) *
S. Chopra et al., Towards Automatic Identification of Fake News: Headline-Article Stance Detection with LSTM Attention Models, Stanford CS224d Deep Learning for NLP final project (2017) *
운영석 외, 페이크 뉴스 탐지 기술 동향과 시사점, 정보통신기술진흥센터 주간기술동향 (2017.10.04) *
이동호 외, 딥러닝 기법을 이용한 가짜뉴스 탐지, 2018년 춘계학술발표대회 논문집 제25권제1호 pp.384-387 (2018.05.) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021256884A1 (en) * 2020-06-17 2021-12-23 주식회사 푸시뉴스 Method and device for identifying fake news using ai
KR20230128616A (en) 2022-02-28 2023-09-05 세종대학교산학협력단 Method of generating data set for detecting fake news

Also Published As

Publication number Publication date
KR102228737B9 (en) 2023-02-23
WO2021256884A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
KR102228737B1 (en) Method And Apparatus for Detecting Fake News by Using Artificial Intelligence
Kotsiantis et al. Forecasting fraudulent financial statements using data mining
US11330009B2 (en) Systems and methods for machine learning-based digital content clustering, digital content threat detection, and digital content threat remediation in machine learning task-oriented digital threat mitigation platform
CN107807941B (en) Information processing method and device
Rastogi et al. Effective opinion spam detection: A study on review metadata versus content
JP2022548501A (en) Data acquisition method and device for analyzing cryptocurrency transactions
CN112419029A (en) Similar financial institution risk monitoring method, risk simulation system and storage medium
CN108737138B (en) Service providing method and service platform
CA3169417A1 (en) Method of and system for appraising risk
Naudé et al. A machine learning approach to detecting fraudulent job types
Jamshidi et al. Characterizing the dynamics and evolution of incentivized online reviews on Amazon
Nguyen et al. Rug-pull malicious token detection on blockchain using supervised learning with feature engineering
Choo et al. Detecting opinion spammer groups and spam targets through community discovery and sentiment analysis
Kovács The Turing test of online reviews: Can we tell the difference between human-written and GPT-4-written online reviews?
KR102187832B1 (en) Apparatus For Extracting Similar Enterprise And Method For Extracting Similar Enterprise Using The Same
Tornés et al. Detecting forged receipts with domain-specific ontology-based entities & relations
KR102417698B1 (en) Platform system for collecting information of financial instruments, method for collecting information of financial instruments and computer program for the same
Shehnepoor et al. ScoreGAN: A fraud review detector based on multi task learning of regulated GAN with data augmentation
Cai et al. Co-attention based feature fusion network for spam review detection on douban
Kaur et al. A review on detecting fake news through text classification
Hao et al. [Retracted] Research on Data News Propagation Path Based on the Big Data Algorithm
CN113785321A (en) Company scale estimation system
Jeevitha et al. Using machine learning to identify instances of cyberbullying on social media
Namvar et al. Moderating Effects of Time-Related Factors in Predicting the Helpfulness of Online Reviews: a Deep Learning Approach.
Mrudula et al. A survey on challenges and opportunistic spotting fake reviewer groups in consumer reviews

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]