KR102077923B1 - 건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버 - Google Patents

건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버 Download PDF

Info

Publication number
KR102077923B1
KR102077923B1 KR1020180075068A KR20180075068A KR102077923B1 KR 102077923 B1 KR102077923 B1 KR 102077923B1 KR 1020180075068 A KR1020180075068 A KR 1020180075068A KR 20180075068 A KR20180075068 A KR 20180075068A KR 102077923 B1 KR102077923 B1 KR 102077923B1
Authority
KR
South Korea
Prior art keywords
classification
information
safety
image
text
Prior art date
Application number
KR1020180075068A
Other languages
English (en)
Other versions
KR20200001936A (ko
Inventor
박찬식
이도엽
Original Assignee
중앙대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 중앙대학교 산학협력단 filed Critical 중앙대학교 산학협력단
Priority to KR1020180075068A priority Critical patent/KR102077923B1/ko
Publication of KR20200001936A publication Critical patent/KR20200001936A/ko
Application granted granted Critical
Publication of KR102077923B1 publication Critical patent/KR102077923B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버가 개시된다. 개시된 서버는 건설 현장의 안전 문서를 분류하는 동작을 수행하는 서버에 있어서,
관리자의 단말 장치로부터 상기 안전 문서를 수신하는 수신부 - 상기 안전 문서는 상기 건설 현장의 이미지 및 상기 이미지와 관련된 텍스트를 포함함 -; 및 상기 이미지를 분석하여 상기 이미지 내에 존재하는 객체를 검출하고, 상기 검출된 객체를 분석하여 상기 검출된 객체의 명칭 정보를 산출하고, 상기 텍스트를 자연어 처리하여 상기 텍스트로부터 키워드를 검출하며, 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 기 설정된 분류 항목으로 상기 안전 문서를 분류하는 분류부;를 포함한다.

Description

건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버{Method for classifying safety document on construction site and Server for performing the same}
본 발명의 실시예들은 건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버에 관한 것이다.
건설 산업은 가장 위험한 산업 중 하나이다. 한국 산업 안전 보건 공단(KOSHA)에 따르면, 2016년 건설 업계 사망자는 544명으로 전체 산업의 31.2%를 차지했다. 안전 사고를 예방하기 위해, 정부의 안전 규제가 시행되고 있으며 학계는 안전 관련 연구에 많은 노력을 기울이고 있다. 또한, KOSHA는 개별 건설 프로젝트의 전반적인 안전 관리 업무를 지원하기 위해 다양한 안전 관련 콘텐츠(예: 규칙 및 규정, 안전 지침, 멀티미디어 교육 콘텐츠 및 사고 사례 등)를 웹 사이트에서 제공한다.
특히, 사고 사례는 규제를 제정하고 다양한 안전 내용을 개발하는데 중요한 기초가 된다. 또한, 치명적인 사고가 발생하면 사고 조사 및 근본 원인 분석이 국가에 보고되고, 이러한 사고 사례는 KOSHA 웹 사이트에서 제공된다. 또한, KOSHA는 업무 유형, 사고 유형, 회사 규모, 피해자의 나이 등 다양한 기준에 따라 산업 재해에 대한 연간 통계 보고서를 제공한다. 이러한 통계는 사고 발생 동향과 빈번하게 발생하는 사고 기준에 대한 정보를 전달함으로써, 관리할 최우선 순위 영역을 식별하고 전반적인 안전 관리 전략을 수립하는데 매우 유용하다.
한편, 실제 현장의 각 업무 유형별 안전 관리 계획을 수립하기 위해서는 현재의 근로 조건과 비교하여 비슷한 사고 사례를 재검토할 필요가 있다. 그러나, 이러한 통계는 일반적으로 루트 레벨과 같은 상위 수준에서 분석된다. 따라서, 통계로는 상세한 사고 발생 상황을 제공할 수 없기 때문에 개별 작업에 대한 구체적인 안전 계획을 수립하기가 어렵다. 즉, 개별 사고 사례의 사고 서술에는 특정 작업 단계, 특정 작업 영역, 원래의 원인 물질 및 장비 등과 같은 사고로 이어지는 상황적 작업 조건이 포함된다. 통계 및 개별 사례는 매우 유용하며, 서로 체계적으로 연결되어야 한다. 그러나, 통계 정보는 개별 사고 사례를 통해 분석되지만 통계는 통계 보고서에서만 볼 수 있으며, 사고 사례는 웹 사이트를 통한 키워드 검색으로만 액세스할 수 있다. 또한, 사고 사례를 분석한 대부분의 종래 연구에서는 사람인 전문가가 수행한 수동 분류 방법을 통해 사고 사례를 수집하고 분류하였다.
즉, 프로젝트 수행 시 생성되는 안전 문서들(일례로, 재해 사례 문서, 현장 안전점검 문서 등)은 추후 유사 업무 수행 시 핵심 관리 요인 파악을 위한 재해 빈도 분석, 작업자 교육 및 관리를 위한 유사 재해 사례 검색 등의 목적으로 활용될 수 있다. 이를 위해서는 안전 관련 문서들이 검색이나 통계 분석의 목적에 적합한 수준으로 분류되어야 한다. 하지만, 이러한 분류 작업은 전문가의 경험적 판단에 의해 주관적이며, 수동적인 방법으로 수행되고 있다. 또한, 현장에서 매일 생성되는 수많은 안전 점검 문서가 분류될 필요가 있지만, 이를 해당 업무를 수행하는 담당자가 직접 분류하도록 하는 것은 업무의 효율성을 저감시키는 결과를 야기한다.
상기한 바와 같은 종래기술의 문제점을 해결하기 위해, 본 발명에서는 건설 현장에서 안전 점검 시 사용되는 안전 문서를 분석하여 안전 문서를 자동으로 분류하는 방법 및 이를 수행하는 서버를 제안하고자 한다.
본 발명의 다른 목적들은 하기의 실시예를 통해 당업자에 의해 도출될 수 있을 것이다.
상기한 목적을 달성하기 위해 본 발명의 바람직한 일 실시예에 따르면, 건설 현장의 안전 문서를 분류하는 동작을 수행하는 서버에 있어서, 관리자의 단말 장치로부터 상기 안전 문서를 수신하는 수신부 - 상기 안전 문서는 상기 건설 현장의 이미지 및 상기 이미지와 관련된 텍스트를 포함함 -; 및 상기 이미지를 분석하여 상기 이미지 내에 존재하는 객체를 검출하고, 상기 검출된 객체를 분석하여 상기 검출된 객체의 명칭 정보를 산출하고, 상기 텍스트를 자연어 처리하여 상기 텍스트로부터 키워드를 검출하며, 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 기 설정된 분류 항목으로 상기 안전 문서를 분류하는 분류부;를 포함하는 것을 특징으로 하는 서버가 제공된다.
상기 분류 항목은, 복수의 메인 분류 항목 및 상기 복수의 메인 분류 항목 각각에 속하는 복수의 서브 분류 항목을 포함하고, 상기 복수의 메인 분류 항목은 공사의 종류와 관련된 공종 분류 항목, 공사가 진행되는 공간과 관련된 공간 분류 항목, 공사에 사용되는 자재와 관련된 자재 분류 항목 및 공사에 사용되는 도구와 관련된 도구 분류 항목을 포함하며, 상기 분류부는, 상기 복수의 메인 분류 항목 각각에 대해, 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 상기 안전 문서를 상기 복수의 서브 분류 항목 중 어느 한 서브 분류 항목으로 분류할 수 있다.
상기 안전 문서는 상기 관리자의 음성 녹취 정보를 더 포함하고, 상기 분류부는 상기 음성 녹취 정보를 텍스터로 변환하여 키워드를 검출하고, 상기 음성 녹취 정보로부터 검출된 키워드를 더 이용하여 상기 안전 문서를 분류할 수 있다.
상기 서버는 상기 건설 현장 내의 복수의 작업 공간에서 수행되는 공종 정보를 저장하는 저장부를 더 포함하고, 상기 수신부는 상기 단말 장치의 위치 정보를 더 수신하며, 상기 분류부는 상기 단말 장치의 위치 정보를 이용하여 상기 단말 장치가 위치하는 공간에서 수행되는 공종 정보를 확인하고, 상기 확인된 공종 정보에 기반하여 상기 이미지 내에 존재하는 객체를 검출할 수 있다.
상기 저장부는 건설 현장 용어에 대한 유의어 사전을 더 저장하고, 상기 유의어 사전에는 비속어 및 상기 비속어와 관련된 표준어의 매칭 관계가 저장되어 있고, 상기 분류부는 상기 자연어 처리 시 상기 유의어 사전을 이용하여 상기 텍스트로부터 키워드를 검출할 수 있다.
또한, 본 발명의 다른 실시예에 따르면, 프로세서가 포함된 장치에서 수행되며, 건설 현장의 안전 문서를 분류하는 방법에 있어서, 관리자의 단말 장치로부터 상기 안전 문서를 수신하는 단계 - 상기 안전 문서는 상기 건설 현장의 이미지 및 상기 이미지와 관련된 텍스트를 포함함 -; 상기 이미지를 분석하여 상기 이미지 내에 존재하는 객체를 검출하는 단계; 상기 검출된 객체를 분석하여 상기 검출된 객체의 명칭 정보를 산출하는 단계; 상기 텍스트를 자연어 처리하여 상기 텍스트로부터 키워드를 검출하는 단계; 및 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 기 설정된 분류 항목으로 상기 안전 문서를 분류하는 단계;를 포함하는 것을 특징으로 하는 안전 문서 분류 방법이 제공된다.
본 발명에 따르면, 안전 문서를 자동으로 분류하여 통계 및 검색의 목적으로 활용할 수 있는 장점이 있다.
또한, 본 발명에 따르면, 안전 문서에 포함된 텍스트를 자동 분석하여 문서 분류를 위한 관리자의 노력을 줄여줄 수 있고, 차후 분석된 정보를 통계 및 검색을 통해 재활용할 수 있는 장점이 있다.
또한, 본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 본 발명의 일 실시예에 따른 서버의 개략적인 구성을 도시한 도면이다.
도 2는 안전 문서의 일례를 도시한 도면이다.
도 3는 본 발명에 따른 분류부에서 수행되는 동작의 개념을 도시한 도면이다.
도 4는 본 발명에 따른 분류 항목의 일례를 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 건설 현장의 안전 문서의 분류 방법의 흐름도를 도시한 도면이다.
본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
이하, 본 발명의 다양한 실시예들을 첨부된 도면을 참조하여 상술한다.
도 1은 본 발명의 일 실시예에 따른 서버의 개략적인 구성을 도시한 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 서버(100)는 건설 현장의 안전 문서를 분류하는 동작을 수행하며, 수신부(110), 저장부(120) 및 분류부(130)를 포함한다. 이하, 각 구성 요소 별로 그 기능을 상세하게 설명하기로 한다.
수신부(110)는 관리자의 단말 장치로부터 안전 문서를 수신한다.
이 때, 단말 장치는 관리자가 소지하는 스마트 기기(스마트폰 또는 태블릿 PC)일 수 있다.
그리고, 안전 문서는 건설 현장과 관련되는 문서를 의미하는 것으로서, 일례로 건설 현장에서 발생된 사고와 관련된 재해 사례 문서 또는 건설 현장의 안전을 점검하기 위해 작성하는 현장 안전 점검 문서 등일 수 있다. 도 2에서는 재해 사례 문서의 일례를 도시하고 있다.
이 때, 안전 문서는 종이로 작성된 오프라인 문서일 수도 있고, 스마트 기기를 통해 작성된 온라인 문서일 수도 있다. 만약, 안전 문서가 오프라인 문서인 경우 스마트 기기에 포함된 카메라를 통해 안전 문서를 온라인 문서로 변환할 수 있고, 스마트 기기는 변환된 온라인 문서를 서버로 전송할 수 있다.
또한, 안전 문서는 도 2에 도시된 바와 같이 건설 현장의 이미지(일례로, 사진) 및 이미지와 관련된 텍스트를 포함할 수 있다.
저장부(120)는 건설 현장의 안전 문서를 분류하는데 사용되는 여러 가지 정보를 저장하고 있으며, 기 설정된 분류 항목으로 분류된 안전 문서가 저장될 수 있다. 여기서, 저장부(120)에 저장된 정보는 건설 현장 내의 복수의 작업 공간에서 수행되는 공종 정보, 건설 현장 용어에 대한 유의어 사전 등일 수 있다.
분류부(130)는 안전 문서를 자동으로 분류하는 기능을 수행하는 것으로서, 서버(100)에 포함된 메모리 및 프로세서에 의해 동작이 구현될 수 있다. 이 때, 메모리는 휘발성 및/또는 비휘발성 메모리일 수 있고, 서버(100)의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 저장한다. 그리고, 프로세서는 중앙처리장치, 애플리케이션 프로세서, 또는 커뮤니케이션 프로세서 중 하나 또는 그 이상을 포함할 수 있다.
도 3에서는 분류부(130)에서 수행되는 동작의 개념을 도시하고 있다. 분류부(130)의 동작을 보다 상세하게 설명하면 다음과 같다.
먼저, 분류부(130)는 안전 문서 내에 포함된 이미지를 분석하여 이미지 내에 존재하는 객체를 검출한다. 이 때, 객체는 건설 현장에 위치한 자재 또는 도구(장비)일 수 있다. 일례로서, 분류부(130)는 이미지에서 배경을 삭제하고 전경을 객체로서 추출할 수 있으며, 기타 다양한 방법으로 이미지에서 객체를 추출할 수 있다.
한편, 분류부(130)는 단말 장치의 위치 정보 및 저장부(120)에 저장된 정보에 기반하여 이미지에서 객체를 추출함으로써 객체 추출의 정확성을 높일 수 있다.
세부적으로, 저장부(120)에는 건설 현장 내의 복수의 작업 공간에서 수행되는 공종 정보가 저장되어 있고, 수신부(110)는 단말 장치의 위치 정보를 단말 장치로부터 수신한다. 그리고, 분류부(130)는 단말 장치의 위치 정보를 이용하여 단말 장치가 위치하는 공간에서 수행되는 공종 정보를 확인하고, 확인된 공종 정보에 기반하여 이미지 내에 존재하는 객체를 검출할 수 있다. 즉, 공종이 확인되면, 어떠한 자재 또는 도구가 사용되는지에 대한 확인이 가능하므로, 분류부(130)는 공종 정보를 확인하고, 이에 기반하여 이미지 내에 존재하는 객체를 검출한다. 일례로, 확인된 공종이 "방수 공사"인 경우, 일반적으로 방수 공사에는 다수의 도구가 사용되며, 분류부(130)는 상기한 다수의 도구에 기반하여 이미지 내에 존재하는 객체를 검출할 수 있다.
한편, 안전 문서의 텍스트 내에 공종에 관한 정보가 포함될 수 있으며, 이 경우 단말 장치는 위치 정보를 보내지 않을 수 있다.
다음으로, 분류부(130)는 검출된 객체를 분석하여 검출된 객체의 명칭 정보를 산출한다. 상기 검출된 객체의 분석은 공지된 다양한 방식을 이용하여 수행될 수 있다.
계속하여, 분류부(130)는 안전 문서에 포함된 텍스트를 자연어 처리(NLP: National Language Processing)하여 텍스트로부터 키워드를 검출한다. 이 때, 건설 사고 사례를 기반으로 한 건설 사고 온톨로지(construction accident ontology)가 사용되어 안전 문서를 구조화된 형식으로 분류한다.
여기서, 자연어 처리는 인간이 발화하는 언어 현상을 기계적으로 분석하여 컴퓨터가 이해할 수 있는 형태로 만드는 자연 언어 이해 또는 그러한 형태를 다시 인간이 이해할 수 있는 언어로 표현하는 제반 기술을 의미한다. 즉, 자연어 처리의 주된 목적은 컴퓨터를 사용하여 자연 언어에 대한 분석을 수행하고, 분류 및 정보 검색 프로세스를 개선하기 위해 의미론적으로 문서를 표현하는 것이다.
자연어 처리는 일반적으로 전처리(pre-processing) 단계, 특징 선택(feature selection) 단계 및 분류 (classification) 단계로 구성된다. 전처리 단계의 경우, 토큰화(문장을 개별 토큰으로 분할), 형태소 분석(단어를 줄기로 변환), 품사 태깅(명사, 동사 및 형용사를 각 토큰에 할당) 및 불용어 제거(일반적인 단어 삭제) 등과 같은 방법이 사용된다. 그리고, 특징 선택 단계의 경우, 잡음 특징을 제거함으로써 분류 정확도를 향상시키기 위해, 트렌팅 세트에서 발생하는 용어의 서브 세트를 선택한다. TF-IDF는 개별 단어가 얼마나 독창적인지에 따라 개별 단어의 무게를 측정하는 데 주로 사용된다. 마지막으로, 분류 단계의 경우, NB(Naive Bayes), k-NN(k-nearest neighbor) 및 SVM(Support Vector Machines)의 알고리즘이 사용된다.
또한, 사고 온톨로지를 구축하기 위해
Figure 112018063890032-pat00001
온톨로지 저작 도구가 사용된다. R 프로그램의 자연어 처리를 통해 추출된 설명을 포함하는 텍스트 파일은 토큰화, 형태소 분석 및 불용어 제어를 통해 처리되고, 이전에 정의된 용어 집합과의 매칭을 통해 자동으로 개별 범주에 할당된다. 매칭 프로세스 후 개별 사고 케이스는 스프레드 시트 형식으로 표현된 카테고리로 분류된다.
다음으로, 분류부(130)는 안전 문서 내의 이미지에서 검출된 객체의 명칭 정보 및 안전 문서 내의 텍스트에서 검출된 키워드의 정보를 이용하여 기 설정된 분류 항목으로 안전 문서를 분류한다. 이 때, 분류 항목에는 미리 설정된 키워드 세트가 존재하며, 분류부(130)는 미리 설정된 키워드 세트에 포함된 키워드들과, 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 비교하여 안전 문서를 분류할 수 있다.
본 발명의 일 실시예에 따르면, 분류 항목은 복수의 메인 분류 항목을 포함하고, 메인 분류 항목 각각에는 복수의 하위 분류 항목이 포함된다. 그리고, 메인 분류 항목은 공사의 종류와 관련된 공종(work type) 분류 항목, 공사가 진행되는 공간과 관련된 공간(space) 분류 항목, 공사에 사용되는 자재와 관련된 자재(resource) 분류 항목 및 공사에 사용되는 도구와 관련된 도구(tool) 분류 항목을 포함할 수 있다. 도 4에서는 분류 항목의 일례를 도시하고 있다.
이 때, 분류부(130)는 복수의 메인 분류 항목 각각에 대해, 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 안전 문서를 해당 하위 분류 항목으로 분류할 수 있다. 즉, 분류부(130)는 공종 분류 항목, 공간 분류 항목, 자재 분류 항목 및 도구 분류 항목 각각에 대해, 하위 분류 항목 중 하나를 선택하여 안전 문서를 분류할 수 있다.
일례로서, 도 4를 참조하면, 안전 문서의 텍스트에서 "철골계단", "달기체인" 이라는 키워드가 검출되는 경우, 분류부(130)는 해당 안전 문서를 공종 분류 항목의 "2742. 철골 계단설치"에, 공간 분류 항목의 "344. 계단실, 엘리베이터, 샤프트"에, 부위 분류 항목의 "273. 금속계단", 자재 분류 항목의 "4010. 체인 및 와이어로프"에 각각 분류할 수 있다.   
한편, 본 발명의 일 실시예에 따르면, 온라인으로 작성된 현장 안전 점검 문서 등의 안전 문서는 관리자의 음성 녹취 정보를 포함할 수 있다. 이 때, 음성 녹취 정보는 이미지와 관련된 텍스트와 함께 현장 안전 사항을 보고하는데 이용되며, 관리자의 단말 장치를 통해 획득된다. 이 경우, 분류부(130)는 음성 녹취 정보를 텍스터로 변환하여 키워드를 검출하고, 이미지에서 검출된 객체의 명칭 정보, 텍스트에서 검출된 키워드의 정보 및 음성 녹취 정보로부터 검출된 키워드를 이용하여 안전 문서를 분류할 수 있다.
또한, 건설 현장의 용어의 경우 가다기리(외쪽깎기), 기리(송곳), 아시바(비계) 등과 같은 일본식 용어 내지 비속어가 많이 사용되는데, 상기 비속어로 안전 문서의 텍스트가 쓰여지는 경우 키워드를 정확하게 검출할 수 없는 문제점이 있다. 따라서, 본 발명의 일 실시예에 따르면, 저장부(120)는 비속어 및 상기 비속어와 관련된 표준어의 매칭 관계가 저장되어 있는 건설 현장 용어에 대한 유의어 사전을 저장하며, 분류부(130)는 자연어 처리 시 유의어 사전을 이용하여 안전 문서의 텍스트로부터 키워드를 검출할 수 있다. 이 때, 유의어 사전은 건설 회사 별로 개별적으로 존재할 수 있다.
요컨대, 본 발명에 따른 서버(100)는 건설 현상의 재해 사례 문서 또는 현장 안전 점검 문서 등과 같은 안전 문서를 자동으로 분류해주는 역할을 수행하는 것으로서, 문서 분류를 위한 관리자의 노력을 줄여줄 뿐만 아니라 차후 분석된 정보를 통계 및 검색의 목적으로 활용할 수 있는 장점이 있다.
도 5는 본 발명의 일 실시예에 따른 건설 현장의 안전 문서의 분류 방법의 흐름도를 도시한 도면이다. 이 때, 상기 방법은 프로세서가 포함된 장치, 일례로 서버(100)에서 수행될 수 있다. 이하, 각 단계 별로 수행되는 과정을 설명한다.
먼저, 단계(510)에서는 관리자의 단말 장치로부터 안전 문서를 수신한다.
이 때, 상기에서 언급한 바와 같이, 안전 문서는 건설 현장의 이미지 및 이미지와 관련된 텍스트를 포함할 수 있다.
다음으로, 단계(520)에서는 안전 문서 내의 이미지를 분석하여 이미지 내에 존재하는 객체를 검출하고, 단계(530)에서는 검출된 객체를 분석하여 검출된 객체의 명칭 정보를 산출한다.
계속하여, 단계(540)에서는 안전 문서 내의 텍스트를 자연어 처리하여 텍스트로부터 키워드를 검출한다.
그 후, 단계(550)에서는 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 기 설정된 분류 항목으로 안전 문서를 분류한다.
지금까지 본 발명에 따른 건설 현장의 안전 문서의 분류 방법의 실시예들에 대하여 설명하였으며, 이에는 앞서 도 1 내지 도 4에서 설명한 서버(100)에 관한 구성이 그대로 적용될 수 있다. 따라서, 건설 현장의 안전 문서의 분류 방법에 대한 보다 상세한 설명은 생략하기로 한다.
또한, 본 발명의 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 일 실시예들의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.

Claims (6)

  1. 건설 현장의 안전 문서를 분류하는 동작을 수행하는 서버에 있어서,
    관리자의 단말 장치로부터 상기 안전 문서를 수신하는 수신부 - 상기 안전 문서는 상기 건설 현장의 이미지 및 상기 이미지와 관련된 텍스트를 포함함 -;
    상기 이미지를 분석하여 상기 이미지 내에 존재하는 객체를 검출하고, 상기 검출된 객체를 분석하여 상기 검출된 객체의 명칭 정보를 산출하고, 상기 텍스트를 자연어 처리하여 상기 텍스트로부터 키워드를 검출하며, 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 기 설정된 분류 항목으로 상기 안전 문서를 분류하는 분류부;를 포함하되,
    상기 분류 항목은, 복수의 메인 분류 항목 및 상기 복수의 메인 분류 항목 각각에 속하는 복수의 서브 분류 항목을 포함하고,
    상기 복수의 메인 분류 항목은 공사의 종류와 관련된 공종 분류 항목, 공사가 진행되는 공간과 관련된 공간 분류 항목, 공사에 사용되는 자재와 관련된 자재 분류 항목 및 공사에 사용되는 도구와 관련된 도구 분류 항목을 포함하며,
    상기 분류부는, 상기 복수의 메인 분류 항목 각각에 대해, 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 상기 안전 문서를 상기 복수의 서브 분류 항목 중 어느 한 서브 분류 항목으로 분류하는 것을 특징으로 하는 서버.
  2. 삭제
  3. 제1항에 있어서,
    상기 안전 문서는 상기 관리자의 음성 녹취 정보를 더 포함하고,
    상기 분류부는 상기 음성 녹취 정보를 텍스터로 변환하여 키워드를 검출하고, 상기 음성 녹취 정보로부터 검출된 키워드를 더 이용하여 상기 안전 문서를 분류하는 것을 특징으로 하는 서버.
  4. 제1항에 있어서,
    상기 서버는 상기 건설 현장 내의 복수의 작업 공간에서 수행되는 공종 정보를 저장하는 저장부를 더 포함하고,
    상기 수신부는 상기 단말 장치의 위치 정보를 더 수신하며,
    상기 분류부는 상기 단말 장치의 위치 정보를 이용하여 상기 단말 장치가 위치하는 공간에서 수행되는 공종 정보를 확인하고, 상기 확인된 공종 정보에 기반하여 상기 이미지 내에 존재하는 객체를 검출하는 것을 특징으로 하는 서버.
  5. 제4항에 있어서,
    상기 저장부는 건설 현장 용어에 대한 유의어 사전을 더 저장하고,
    상기 유의어 사전에는 비속어 및 상기 비속어와 관련된 표준어의 매칭 관계가 저장되어 있고,
    상기 분류부는 상기 자연어 처리 시 상기 유의어 사전을 이용하여 상기 텍스트로부터 키워드를 검출하는 것을 특징으로 하는 서버.
  6. 프로세서가 포함된 장치에서 수행되며, 건설 현장의 안전 문서를 분류하는 방법에 있어서,
    관리자의 단말 장치로부터 상기 안전 문서를 수신하는 단계 - 상기 안전 문서는 상기 건설 현장의 이미지 및 상기 이미지와 관련된 텍스트를 포함함 -; 및
    상기 이미지를 분석하여 상기 이미지 내에 존재하는 객체를 검출하는 단계;
    상기 검출된 객체를 분석하여 상기 검출된 객체의 명칭 정보를 산출하는 단계;
    상기 텍스트를 자연어 처리하여 상기 텍스트로부터 키워드를 검출하는 단계; 및
    상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 기 설정된 분류 항목으로 상기 안전 문서를 분류하는 단계;를 포함하되,
    상기 분류 항목은, 복수의 메인 분류 항목 및 상기 복수의 메인 분류 항목 각각에 속하는 복수의 서브 분류 항목을 포함하고,
    상기 복수의 메인 분류 항목은 공사의 종류와 관련된 공종 분류 항목, 공사가 진행되는 공간과 관련된 공간 분류 항목, 공사에 사용되는 자재와 관련된 자재 분류 항목 및 공사에 사용되는 도구와 관련된 도구 분류 항목을 포함하며,
    상기 안전 문서를 분류하는 단계는, 상기 복수의 메인 분류 항목 각각에 대해, 상기 산출된 객체의 명칭 정보 및 상기 검출된 키워드의 정보를 이용하여 상기 안전 문서를 상기 복수의 서브 분류 항목 중 어느 한 서브 분류 항목으로 분류하는 것을 특징으로 하는 안전 문서 분류 방법.
KR1020180075068A 2018-06-28 2018-06-28 건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버 KR102077923B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180075068A KR102077923B1 (ko) 2018-06-28 2018-06-28 건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180075068A KR102077923B1 (ko) 2018-06-28 2018-06-28 건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버

Publications (2)

Publication Number Publication Date
KR20200001936A KR20200001936A (ko) 2020-01-07
KR102077923B1 true KR102077923B1 (ko) 2020-02-14

Family

ID=69153714

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180075068A KR102077923B1 (ko) 2018-06-28 2018-06-28 건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버

Country Status (1)

Country Link
KR (1) KR102077923B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102576985B1 (ko) * 2020-03-27 2023-09-11 구주원 용어사전을 이용한 작업내역 기록 방법 및 시스템
KR102591138B1 (ko) * 2021-02-08 2023-10-19 인제대학교 산학협력단 플랜트 절차서의 작성지침 준수여부 검증방법 및 그의 시스템
KR102506778B1 (ko) * 2020-11-26 2023-03-07 주식회사 리걸인사이트 계약서 리스크 분석 방법 및 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101356462B1 (ko) 2013-07-30 2014-02-04 덕산메카시스 주식회사 Ifc 기반 3차원 빌딩 제어 방법 및 이를 이용한 3차원 빌딩 제어 시스템
KR101715001B1 (ko) 2015-12-30 2017-03-23 연세대학교 산학협력단 웨어러블 기기를 이용한 건설현장의 안전평가 표시 시스템 및 그 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080044102A1 (en) * 2005-01-07 2008-02-21 Koninklijke Philips Electronics, N.V. Method and Electronic Device for Detecting a Graphical Object
KR101801257B1 (ko) * 2016-03-23 2017-11-24 서울대학교산학협력단 효율적 건설문서 관리를 위한 텍스트마이닝 적용 기술

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101356462B1 (ko) 2013-07-30 2014-02-04 덕산메카시스 주식회사 Ifc 기반 3차원 빌딩 제어 방법 및 이를 이용한 3차원 빌딩 제어 시스템
KR101715001B1 (ko) 2015-12-30 2017-03-23 연세대학교 산학협력단 웨어러블 기기를 이용한 건설현장의 안전평가 표시 시스템 및 그 방법

Also Published As

Publication number Publication date
KR20200001936A (ko) 2020-01-07

Similar Documents

Publication Publication Date Title
US10642889B2 (en) Unsupervised automated topic detection, segmentation and labeling of conversations
KR101741509B1 (ko) 뉴스의 데이터마이닝을 통한 기업 평판 분석 장치 및 방법, 그 방법을 수행하기 위한 기록 매체
CN112487140B (zh) 问答对话评测方法、装置、设备及存储介质
KR102077923B1 (ko) 건설 현장의 안전 문서를 분류하는 방법 및 이를 수행하는 서버
US20210026835A1 (en) System and semi-supervised methodology for performing machine driven analysis and determination of integrity due diligence risk associated with third party entities and associated individuals and stakeholders
US20150356091A1 (en) Method and system for identifying microblog user identity
CN107102993B (zh) 一种用户诉求分析方法和装置
US20170091318A1 (en) Apparatus and method for extracting keywords from a single document
KR20190062391A (ko) 전자 기록의 문맥 리트리벌을 위한 시스템 및 방법
CN106202561A (zh) 基于文本大数据的数字化应急管理案例库构建方法及装置
CN107402913A (zh) 先行词的确定方法和装置
US20170270098A1 (en) External resource identification
WO2017091985A1 (zh) 停用词识别方法与装置
CN107545505B (zh) 保险理财产品信息的识别方法及***
CN107729337B (zh) 事件的监测方法和装置
CN115794798B (zh) 一种市场监管信息化标准管理与动态维护***及方法
CN108509561B (zh) 基于机器学习的岗位招聘数据筛选方法、***及存储介质
CN116720515A (zh) 基于大语言模型的敏感词审核方法、存储介质及电子设备
WO2016016973A1 (ja) 実績評価装置、実績評価装置の制御方法、および実績評価装置の制御プログラム
CN110796565A (zh) 监理日志的分析方法及分析***
CN110888977A (zh) 文本分类方法、装置、计算机设备和存储介质
CN116384380A (zh) 一种基于语义分析的案件关键词汇提取与标注方法
CN112579781B (zh) 文本归类方法、装置、电子设备及介质
CN109597879B (zh) 一种基于“引文关系”数据的业务行为关系抽取方法及装置
CN113077362A (zh) 规章制度文件的处理方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant