KR102117895B1 - Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 및 방법 - Google Patents

Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 및 방법 Download PDF

Info

Publication number
KR102117895B1
KR102117895B1 KR1020180149793A KR20180149793A KR102117895B1 KR 102117895 B1 KR102117895 B1 KR 102117895B1 KR 1020180149793 A KR1020180149793 A KR 1020180149793A KR 20180149793 A KR20180149793 A KR 20180149793A KR 102117895 B1 KR102117895 B1 KR 102117895B1
Authority
KR
South Korea
Prior art keywords
information
annotation
text
correction
calibration
Prior art date
Application number
KR1020180149793A
Other languages
English (en)
Inventor
곽용진
Original Assignee
주식회사 이르테크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 이르테크 filed Critical 주식회사 이르테크
Priority to KR1020180149793A priority Critical patent/KR102117895B1/ko
Application granted granted Critical
Publication of KR102117895B1 publication Critical patent/KR102117895B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • G09B7/04Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student characterised by modifying the teaching programme in response to a wrong answer, e.g. repeating the question, supplying a further explanation
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 한국어를 배우는 외국인 학습자에게 작문 오류와 그 교정 결과를 효과적으로 전달하여 한국어 학습 능력을 향상시키기 위해 외국인 학습자가 입력한 텍스트에 대해 전처리, 문법단위 식별, 언어분석, 교정처리, 교정유형 계산을 수행하고 교정 결과를 해당 학습자가 사용하는 디바이스의 출력 환경에 맞게 재구성하여 효과적이고 일관되게 표현 전달함으로써, 웹이나 모바일과 같이 다양한 디스플레이와 응용 프로그램 및 사용자 조작에 대해 일관된 사용과 표현이 가능하도록 하는 발명이다.

Description

Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 및 방법{A composition error proofreading apparatus and method for language learning by using Stand-off annotation}
본 발명은 컴퓨터를 이용하여 언어 특히 모국어가 아닌 언어를 학습하는 CALL(Computer Assistant Language Learning)에 대한 것으로, 인공지능 기술의 한 분야인 자연언어처리(NLP : Natural Language Processing)을 활용하여, 외국인이 작성한 한국어 문장에서 오류를 식별하고 교정하는 방법 및 그 장치에 관한 것이다.
언어 교육에 있어서 자동 평가 시스템의 중요성은 날로 커지고 있다. 작문 학습은 언어 학습에서 중요한 학습과정 중 하나이다. 이러한 작문을 평가할 때, 작문 내용의 일관성 평가는 평가의 기초가 된다고 할 수 있다.
또한 단순 텍스트와 점수로 평가한 결과를 제공한 평가 결과로는 학습자가 본인의 작문 수준을 점검하고 이해하기 어렵다. 작문 내용의 일관성 평가 결과는 학습자가 이해하기 쉽게 제공되어야 하며, 그 결과를 토대로 학습자가 본인의 학습 계획 수립에 도움을 줄 수 있는 정보를 담고 있어야 한다.
하지만, 기존의 자동 평가 시스템은 텍스트와 점수로 평가한 결과만을 제공하여 학습자에게 충분하고 직관적인 정보를 제공하지 못하므로, 이를 해결하기 위한 지속적인 연구개발이 요구되는 실정이다.
종래의 한국어 문장 교정 및 식별은 한글과컴퓨터사의 아래한글이나, Microsoft사의 Word와 같은 Stand-alone 방식의 문서 편집기 클라이언트에서 주로 수행되었다.
다음은 작문 글을 평가하는 시스템에 관한 대표적인 종래기술이다.
대한민국 등록특허공보 제10-0848260호는 작문 학습지도 방법 및 시스템에 관한 것으로서, 학습자에게 제공되는 학습정보인 인덱스정보가 저장된 인덱스 데이터베이스를 포함하는 작문 학습지도 데이터베이스를 구축하는 단계, 상기 작문 학습지도 데이터베이스를 참조하여 상기 학습자에게 학습주제를 제공하는 단계, 상기 학습자로부터 상기 학습주제에 관한 작문내용을 수신하는 단계, 상기 작문내용을 상기 교수자에게 제공한 후 상기 교수자로부터 상기 작문내용에 대한 첨삭정보를 수신하는 단계, 상기 작문 학습지도 데이터베이스에 포함된 상기 인덱스 데이터베이스로부터 상기 인덱스정보를 추출하는 단계 및 상기 학습자에게 상기 첨삭정보 및 상기 인덱스정보를 포함하는 교수정보를 제공하는 단계를 포하는 구성을 하였다.
또한 상기 종래기술은 글쓰기와 하나로 통합된 문법활용능력을 기초로, 효과적인 의사전달 능력을 향상시킴으로 실질적 작문작성 능력을 향상시킬 수 있는 효과를 얻을 수 있었으나, 교수자가 작문 글을 직접 읽어보고 작문내용에 대한 첨삭을 수행하여야 하는 불편함이 있어서, 이를 해결하기 위한 지속적인 연구개발이 요구되는 실정이다.
본 발명은 이러한 문제점을 해결하기 위해 자연언어처리(Natural Language Processing)에서 사용되는 데이터 표현법 표준(ISO-24612)의 일부인 Stand-off 주석을 이용하여 한국어를 배우는 외국인 학습자의 오류와 그 교정값을 효과적으로 표현하여, 웹이나 모바일과 같이 다양한 디스플레이에서 일관된 사용과 표현이 가능하도록 하는 발명에 관한 것이다.
대한민국 등록특허공보 제10-0848260호(2008.07.18.) 대한민국 공개특허공보 제10-2010-0111456호(2010.10.15.) 대한민국 공개특허공보 제10-2014-0051606호(2014.05.02.)
상술한 바와 같이 종래에는 작문 오류에 대한 첨삭은 원고지와 같은 아날로그 방식이 주류를 이루고 있었으나, 디지털 환경에서는 디스플레이와 사용자 화면의 구성에 따라 출력된 위치 정보가 변함에 따라 작문 오류에 대한 첨삭 및 그 결과 표현은 종래의 방식으로는 한계가 있다.
또한, 종래에는 일부 소프트웨어서 출력 문자의 화면상 위치정보를 이용하여 표현하는 경우가 있으나, 다변화 다양화 되고 있는 웹과 모바일 환경에서 사용하는 디스플레이와 개발도구(프로그래밍 언어 및 유틸리티)에 일관되고 손쉽게 적용할 수 있는 방법과 장치가 제공되지 못하고 있다.
본 발명의 목적은 종래의 문제점을 개선하기 위한 것으로 Stand-off 주석을 이용하여 입력 텍스트 오류와 그 교정값을 효과적으로 표현하는 것을 목적으로 한다.
구체적으로, 프로그래밍의 입출력이 되는 문자열에 대한 오류표시와 교정값을 효과적으로 표현하기 위한 일관된 일정의 절차와 자료구조를 제공함으로써, 다양한 디스플레이와 개발도구(프로그래밍 언어 및 유틸리티)에 일관되고 손쉽게 적용할 수 있는 방법과 장치를 제공하여 입력 텍스트의 오류와 교정값을 효과적으로 표현하도록 하고자 하는 것이 본 발명의 목적이라 할 것이다.
상기와 같은 목적을 실현하고자 하는 본 발명인 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치는,
사용자장치로부터 텍스트를 입력받는 입력부(100)와;
입력부(100)를 통해 입력받은 입력 텍스트에 포함된 한글 이외의 문자 및 기호들에 대한 전처리를 수행하고, 입력된 텍스트의 문법단위에 대한 식별처리를 수행하고, 입력된 텍스트의 교정을 수행하고, 수행 결과들에 대한 주석 정보들을 저장 처리하는 주석 처리부(200)와;
저장된 주석정보들을 이용해 교정정보가 매칭 표시된 텍스트 정보를 생성하는 표현부(300)와;
주석 처리부(200)와 표현부(300)에서 생성되는 각종 주석정보, 말뭉치 정보, 사전 정보, 학습수준 정보, 오류 패턴 정보, 어문 규정 정보 등이 저장되는 정보저장부(400)를 포함하는 것을 특징으로 한다.
본 발명은 한국어를 배우는 외국인 학습자에게 작문 오류와 그 교정 결과를 효과적으로 전달하여 한국어 학습 능력을 향상시키는 효과를 제공한다.
또한, 한국어를 배우는 외국인 학습자가 입력한 텍스트에 대해 전처리, 문법단위 식별, 언어분석, 교정처리, 교정유형 계산을 수행하고 교정 결과를 해당 학습자가 사용하는 디바이스의 출력 환경에 맞게 재구성하여 효과적이고 일관되게 표현 전달함으로써, 웹이나 모바일과 같이 다양한 디스플레이와 응용 프로그램 및 사용자 조작에 대해 일관된 사용과 표현이 가능한 효과를 제공한다.
도 1은 종래의 아날로그 방식에 의한 작문 오류에 대한 교정 예시도.
도 2는 종래의 출력 문자의 화면상 위치정보를 이용한 작문 오류에 대한 교정 예시도.
도 3은 본 발명에 의한 작문 오류에 대한 교정 예시도.
도 4는 본 발명의 교정장치 구성 블록도.
도 5는 본 발명의 교정장치 세부 구성 블록도.
도 6은 본 발명의 주석처리부의 기능 개념도.
도 7은 본 발명의 오류 문자열에 대한 교정유형, 교정처리, 교정부호 예시도.
도 8은 본 발명의 교정방법 구성 블록도.
도 9,10은 본 발명에 의한 다양한 화면 표출 방법의 예시도.
본 발명에 대한 상세한 설명은 단지 본 발명의 원리를 예시한다. 그러므로 당업자는 비록 본 명세서에 명확히 설명되거나 도시되지 않았지만, 본 발명의 원리를 구현하고 본 발명의 개념과 범위에 포함된 다양한 장치를 발명할 수 있는 것이다.
또한, 본 명세서에 열거된 모든 조건부 용어 및 실시 예들은 원칙적으로, 본 발명의 개념이 이해되도록 하기 위한 목적으로만 명백히 의도되고, 이와 같이 특별히 열거된 실시 예들 및 상태들에 제한적이지 않는 것으로 이해되어야 한다.
이하에서는 도 1 내지 도 8을 참조하여 본 발명인 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 및 방법에 대해 상세히 설명한다.
도 1에 도시된 바와 같이 종래에는 작문 오류에 대한 첨삭은 원고지와 같은 아날로그 방식이 주류를 이루고 있었으나, 디지털 환경에서는 디스플레이와 사용자 화면의 구성에 따라 출력된 위치 정보가 변함에 따라 작문 오류에 대한 아날로그 방식의 첨삭 및 그 결과 표현은 한계가 있다.
또한, 도 2에 도시된 바와 같이 종래에는 일부 소프트웨어서 출력 문자의 화면상 위치정보를 이용하여 표현하는 경우가 있으나, 다변화 다양화 되고 있는 웹과 모바일 환경에서 사용하는 디스플레이와 개발도구(프로그래밍 언어 및 유틸리티)에 일관되고 손쉽게 적용할 수 없다는 한계가 있다.
상술한 종래의 작문 오류에 대한 교정결과 표시 기술에 대한 문제점을 Stand-off 주석 방식을 적용하여 해결하고자 하는 본 발명인 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치는 도 4에 도시된 바와 같이,
사용자장치로부터 텍스트를 입력받는 입력부(100)와;
입력부(100)를 통해 입력받은 텍스트에 포함된 한글 이외의 문자 및 기호들에 대한 전처리를 수행하고, 입력된 텍스트의 문법적 단위들에 대한 식별처리를 수행하고, 입력된 텍스트의 언어분석을 수행하고, 입력된 텍스트의 교정을 수행하고, 수행 결과들에 대한 주석 정보들을 저장 처리하는 주석 처리부(200)와;
저장된 주석정보들을 이용해 교정결과가 매칭 표시된 텍스트 정보를 생성하는 표현부(300)와;
주석 처리부(200)와 표현부(300)에서 생성되는 각종 주석정보, 말뭉치 정보, 사전 정보, 학습수준 정보, 오류 패턴 정보, 어문 규정 정보 등이 저장되는 정보저장부(400)를 포함하는 것을 특징으로 한다
상기 입력부(100)는 사용자장치(예: PC, 스마트폰 등)로부터 텍스트를 입력받는 구성수단이다. 사용자장치를 이용하는 사람은 한국어를 학습하는 외국인이거나 한국어 학습을 하는 한국인일 수 있다.
사용자장치와 본 발명인 작문오류 교정 장치는 웹 방식의 통신네트워크로 연결되며 통신 네트워크를 통해 사용자장치는 한국어 텍스트(교정 받고자 하는 텍스트)를 본 발명인 작문오류 교정 장치로 전송하게 된다.
상기 주석 처리부(200)는 입력부(100)를 통해 입력받은 입력 텍스트에 포함된 한글 이외의 문자 및 기호에 대해 전처리를 수행하고, 입력된 텍스트의 문법단위에 대해 식별처리를 수행하고, 입력된 텍스트의 언어분석을 수행하고, 입력된 텍스트의 교정처리를 수행하고, 수행 결과들인 주석정보를 생성하여 저장 처리하는 구성으로서, 도 5에 도시된 바와 같이 전처리부(210), 문법단위 식별부(220), 언어 분석부(230), 교정부(240)를 포함하도록 구성된다.
이하에서는 주석 처리부를 구성하는 전처리부, 문법단위 식별부, 언어 분석부, 교정부에 대해 상세히 설명한다.
상기 전처리부(210)는 입력 텍스트의 일관된 문자열 위치정보 보존을 위해 입력된 텍스트에 포함된 한글 이외의 문자 및 기호에 대해 전처리를 수행하고, 전처리 결과에 대한 정보인 전처리 주석정보를 생성하여 정보저장부(400)에 저장 처리한다.
구체적으로, 상기 전처리란 입력된 텍스트에 포함된 한글 이외의 문자 및 기호들을 파악하고, 파악된 한글 이외의 문자 및 기호들 각각마다에 주석과 대체문자를 매칭 시키는 것을 의미하고, 상기 전처리 주석정보는 한글 이외의 문자 및 기호들 각각마다에 매칭 된 주석과 대체문자에 대한 정보를 포함하는 것을 특징으로 한다..
상기 전처리 주석정보에 포함되는 주석이란 본 발명인 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 장치에서 오류 교정 처리 시 한글 이외의 문자 및 기호들에 대한 처리 규칙에 대한 것이고, 대체문자란 본 발명의 작문오류 교정장치에서 오류 교정 처리 시 한글 이외의 문자 및 기호들의 처리의 용이성을 위해 오류 교정 처리 시 사용하고자 하는 문자를 의미한다.
또한, 상기 전처리란 입력 텍스트의 총 길이, 공백의 수, 줄바꿈 문자의 수를 입력된 텍스트로부터 파악하여 저장하는 것도 포함한다.
특히, 본 발명에서 한글 이외의 문자 및 기호란 한글을 제외한 모든 유니코드상의 기호범주에 속한 문자 및 기호들을 의미한다.
입출력 컴퓨터의 단말 및 응용 프로그램의 처리 방법에 따라 출력 결과가 상이한 경우가 자주 발생한다. 이로 인해, 입력 문자열의 위치값을 기반으로 하는 Stand-off 처리 방식에서 잘못된 위치를 식별하거나 출력 시 의도하지 않는 결과값이 출력된다.
특히, 쉼표(,), 역슬래시(\), 틸트(~, ‘), (겹)따옴표, 반각 문자 등은 컴퓨터 장치 또는 프로그래밍 언어에서 사전에 약속한 특별한 처리 역할을 담당하는 경우가 많아 목표 프로그램에 오류를 일으키기도 한다.
특히 한국어의 경우 초성, 중성, 종성의 결합에 대한 계산값을 유니코드 표와 매핑해 사용하기 때문에 전처리 대상 기호들이 혼용된 경우 올바른 한글처리가 어렵다.
즉, 사용자 입력장치로부터 입력되는 한글 텍스트에 전처리 대상 기호들이 혼용될 경우 본 발명의 오류 교정 장치를 통한 오류 교정처리가 어렵게 된다.
이를 방지하기 위해 본 발명은 전처리부(210)를 구성하는 것이고, 이를 통해 작문 오류 핵심 대상인 한글 처리에만 집중하여 한글 이외의 문자로 인한 목표 프로그램의 오류 및 오동작을 방지하게 되는 것이다.
아래 표1은 입력 텍스트에 포함된 한글 이외의 문자 및 기호들에 대한 전처리에 관한 전처리 주석정보의 예시를 보여주고 있다.
유니코드 값/범위 전처리 식별명 전처리 결과 출력/계산시 처리
0x0062 ~ 0x0074 English <unicode domain = “ASCII”>abc</unicode> 현재 문자열 유지
문자수 = 한글과 동일하게 계산
0x0027 Single Quatation <unicode domain = “ASCII” val = “0x0027” output = “‘”/> ¿로 대체
문자수 = 1로 고정
출력시 전처리 결과 참조하여 복원
0x2032(‘) Reversed prime <unicode domain = “General Punctuation” val = “2032” output = “‘”/> ¿로 대체
문자수 = 1로 고정
출력시 전처리 결과 참조하여 복원 | SQ(Single Quatation)과 동일 처리
0x0022 Double Quation <unicode domain = “ASCII” val = “0x0027” output = ““”/> ¿로 대체
문자수 = 1로 고정
출력시 전처리 결과 참조하여 복원
다음 DQ까지의 문자열은 문장식별 제외
상기표의 한 예인 Single Quatation “ ‘ ”를 설명하면, 한글 이외의 문자 및 기호인 Single Quatation “ ‘ ”의 대체문자는 “ ¿ ”으로 하고, 주석은 “ 교정 처리시에는 ¿로 처리하고 교정정보 출력시에는 ’로 복원 시킨다” 이다.
상기 문법단위 식별부(220)는 언어학적 처리 시 데이터의 입출력 단위를 일관되게 처리하기 위해 입력된 텍스트에서 어절(공백에 의해 구분, 토큰이라고도 함), 문장(문장종결어미 및 문장종결부호(마침표, 느낌표, 물음표 등)로 구분), 단락(줄바꿈)등과 같은 문법 단위를 식별하고, 식별된 문법 단위마다 주석처리하고 주석처리 결과정보를 문법단위 주석정보로 하여 저장처리 한다.
컴퓨터 등의 전산처리 장치(프로그램)에서는 텍스트 데이터에 대해 특정한 값과 형식에 의해 데이터를 구분한다. 예를 들어 어절라고 부르는 문법단위는 공백문자(스페이스키에 의해 입력된 공백 의미)에 의해 식별된다. 이렇게 약속된 문자로 텍스트를 분할한 결과를 일반적으로 토큰(token)이라고 부른다. 그러나 이러한 단위는 어절과 반드시 등가의 데이터값을 갖지 않는다.
공백문자가 여러 개인 경우 빈값을 갖기도 하고, 특히 문장의 경우 문장종결부호로 널리 사용되는 마침표, 물음표, 느낌표 등이 문장경계 이외의 위치에서도 자주 사용되기 때문이다.
본 발명에서 문법 단위는 언어학적 처리를 요구하는 모듈인 언어분석부(230)와 교정부(240)뿐만 아니라 표현부(300)와 최종 출력된 교정 결과를 사용자가 인식하도록 하는 출력부(500)에도 공통적으로 적용되므로 문법 단위에 대한 일관된 처리를 위해 본 발명에서는 문법단위 식별부(220)를 구성하는 것이다.
예를 들어, 어절은 한국어 어문 규정에서 띄어쓰기의 단위이므로, 입력된 텍스트에 ‘말하지.’가 포함되어 있는 경우, ‘말하지’와 ‘.’는 상술한 전처리부(210)에서 구분하고, 문법단위 식별부(220)는 ‘말하지.’를 하나의 문법 단위인 어절로 구분하는 것이다. 후술하겠지만 단어 단위인 ‘말하-, -지’는 언어분석부(230)에서 구분 분석하게 되는 것이다.
또한, 작은 따옴표에 둘러쌓인 “먹었다.”와 “먹는다.”는 문장종결어미를 가지고 있고, 문장종결부호도 가지고 있으나 실질적인 문장은 아니다. 문법단위 식별기(220)는 대규모의 언어데이터(말뭉치(corpus))와 언어학 전문가들의 연구결과를 기반으로 작성한 규칙과 기계학습 모델을 이용해 자동으로 “먹었다.”와 “먹는다.”가 문법 단위인 문장이 아닌 것으로 식별하게 되는 것이다.
아래 표 2~4는 <우리나라에서는 ‘먹었다.’라고 말하지, ‘먹는다’고 안 해요.>란 입력 텍스트를 문법 단위인 어절과 문장으로 구분하고 주석 처리한 문법단위 주석정보의 예시를 보여주고 있다.
offset 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
입력문 . ,
.
offset 21 22 23 24 25 26 27 28 29 30 31 32
seqID off_start off_end Length aType s_val t_val aCode
1 0 6 7 문법단위 우리나라에서는 어절 1
2 8 15 8 문법단위 ‘먹었다.’라고 어절 1
3 17 20 4 문법단위 말하지, 어절 1
4 21 26 6 문법단위 ‘먹는다’고 어절 1
5 28 28 1 문법단위 어절 1
6 30 32 3 문법단위 해요. 어절 1
7 0 32 33 문법단위 우리~해요. 문장 2
항목명 설명 값유형
seqID 주석 일련번호 숫자
off_start 주석 대상 어절의 시작위치 숫자
off_end 주석 대상 어절의 종료위치 숫자
Length 주석 대상 어절의 길이 숫자
aType 주석의 유형(여기서는 교정주석. 21) 숫자
s_val 문법단위 대상 문자열값 문자열(입력문의 부분 문자열)
t_val 주석코드의 문자표기 임의의 문자열
aCode 주석코드값 숫자
상기 <우리나라에서는 ‘먹었다.’라고 말하지, ‘먹는다’고 안 해요.>란 입력 텍스트는 7개의 문법 단위를 갖고 있는데 6개의 어절과 1개의 문장이다.
상기 표들은 7개의 문법 단위들인 6개의 어절과 1개의 문장마다의 주석의 예시를 보여주고 있다.
예를 들어, 문법 단위인 “ ‘먹었다.’라고 ”에 대한 주석은 “ 주석일련번호는 1이고, 대상어절의 시작위치는 8이고, 대상어절의 종료위치는 15이고, 대상어절의 길이는 8이고, 문법 단위는 어절이고, 어절에 대한 코드는 1이다”인 것이다.
따라서 본 발명의 문법단위 식별부(220)는 입력된 텍스트의 문법 단위를 식별하고, 식별한 문법 단위마다 주석을 달아 저장하는 것이다. 이로 인해 일관된 문법 단위 정보를 제공함으로써 본원 발명에서 언어학적 처리를 요구하는 모듈인 언어 분석부(230)와 교정부(240)뿐만 아니라 표현부(300)와 최종 출력된 교정 결과를 사용자가 인식하도록 하는 출력부(500)에서 데이터를 안정되고 일관되게 처리할 수 있게 되는 것이다.
상기 언어 분석부(230)는 입력 텍스트에 대한 형태소를 분석하고, 분석한 분석결과를 형태소 주석정보로 하여 저장처리 한다.
입력 텍스트에 대한 형태소 분석을 위해 언어분석부(230)는 형태소 분석기(tagger라고도 함), 구문 분석기(Syntatic Parser 또는 Parser라고도 함), 의미분석기, 의미역 분석기(Semantic Role Labler라고도 함), 개체명 식별기(Named Entity Recognition라고도 함) 등을 포함할 수 있다.
아래 표 5,6은 <우리나라에서는 ‘먹었다.’라고 말하지, ‘먹는다’라고 안 해요.>란 입력 텍스트 중 “ 우리나라에서는 ”, “ ‘먹는다’라고 ” 의 문자열에 대한 형태소 분석 결과에 대한 형태소 주석정보의 예시를 보여주고 있다.
seqID off_start off_end Length aType s_val t_val aCode
1 0 6 7 형태주석 우리나라 NNG(명사) 1
2 0 6 7 형태주석 에서는 JKB(부사격조사) 15
3 8 15 8 형태주석 SS(기호) 42
4 8 15 8 형태주석 VV(동사) 21
5 8 15 8 형태주석 는다 EF(종결어미) 31
6 8 15 8 형태주석 . SF(종결기호) 43
7 8 15 8 형태주석 SS(기호) 42
8 8 15 8 형태주석 라고 JKQ(인용격조사) 18
항목명 설명 값유형
seqID 주석 일련번호 숫자
off_start 주석 대상 어절의 시작위치 숫자
off_end 주석 대상 어절의 종료위치 숫자
Length 주석 대상 어절의 길이 숫자
aType 주석의 유형(여기서는 형태주석) 숫자
s_val 문법단위 대상 문자열값 문자열(입력문의 부분 문자열)
t_val 주석코드의 문자표기 임의의 문자열
aCode 주석코드값 숫자
상기 교정부(240)는 Stand-off 주석 방식에 의해 교정부호나 교정값이 입력 텐스트의 교정대상 문자열의 좌표나 그 좌표로부터 일정거리에 정확하게 매칭 표시되도록 하는 정보를 생성하는 구성으로서, 어문규정에 따른 교정 지침에 따라 입력 텍스트로부터 오류 문자열을 식별하고, 식별한 오류 문자열을 교정 처리하고, 교정 처리에 관한 교정 주석정보를 생성하고, 생성한 교정 주석정보를 저장처리 한다.
상기 교정 주석정보는 오류 문자열 정보, 오류 문자열에 대한 교정정보, 오류 문자열에 대한 교정부호와 교정값의 위치정보를 포함한다.
상기 오류 문자열에 대한 교정정보는 오류 문자열에 대한 교정값 정보, 교정부호 정보, 교정유형 정보를 적어도 포함하는 것을 특징으로 한다.
상기 교정부(240)가 교정 주석정보를 생성하고, 생성한 교정 주석정보를 저장처리 하는 이유는 교정부호(오류 문자열에 대한 교정 부호 이미지 데이터)나 교정값(오류 문자열에 대한 교정된 문자열 데이터)이 표시되는 위치를 입력 텍스트의 교정대상 문자열의 좌표나 그 좌표로부터 일정거리에 정확하게 일치시켜, 교정부호나 교정값이 입력 텍스트에 정확하게 표현되어 사용자장치에 표시되도록 하기 위함이다. 이를 위해 교정부(240)는 교정 주석정보를 생성하고 저장처리 하는 것이다.
즉, 텍스트를 구성하는 문자열들의 표시 위치는 출력장치의 상황(화면 크기, 응용 프로그램 GIU 창의 변경, 응용 프로그램의 유형 및 데이터 처리 방식 등)에 따라 변동되므로, 오류 문자열의 표시 위치(데이터 순서적 거리(offset)라고 함)에 교정정보(교정값과 교정부호)를 정확히 연결 매칭 시켜야 다양한 사용자 출력장치의 상황에 상관없이 교정정보(교정부호, 교정값 등)가 해당 오류 문자열의 위치나 근처에 정확히 표시된다. 이러한 방법으로 데이터를 표현하는 것을 Stand-off 주석 방식이라고 하며 본 발명에서 사용하는 방식이다.
상술한 Stand-off 주석 방식에 의해 상기 교정부(240)는 교정부호나 교정값이 입력 텐스트의 교정대상 문자열의 좌표나 그 좌표로부터 일정거리에 정확하게 매칭 표시되도록 하는 교정 주석정보를 생성하고, 생성한 교정 주석정보를 저장처리 하는 것이다.
이하에서는 교정부(240)의 기능 특징에 대해 상세히 설명한다.
먼저, 교정부(240)는 어문규정에 따른 교정 지침에 따라 입력 텍스트로부터 오류 문자열을 식별하고, 식별한 오류 문자열을 교정 처리한다.
즉, 어문 규정에 따라 입력된 텍스트에 오류 문자열이 있는지를 파악하고, 오류 문자열이 있는 것으로 파악되면 해당 오류 문자열을 어문규정에 따른 교정 지침에 따라 교정 처리 한다.
교정부(240)에 의한 교정 처리라 함은 해당 오류 문자열에 대한 교정값(오류 문자열을 교정지침에 따라 교정한 교정된 문자열)을 산출하고, 산출한 교정값과 해당 오류 문자열을 비교하여 교정 유형을 파악하고, 파악된 교정 유형에 해당하는 교정부호(띄어쓰기, 삭제 등의 부호)를 결정하는 것을 포함한다.
상기 교정값 산출이란, 예를 들어 입력 텍스트에 “대한민궁”이란 오류 문자열이 있다면 “대한민궁”이란 오류 문자열을 교정 지침에 따라 교정한 “대한민국”이란 교정된 문자열 생성을 의미한다.
상기의 교정유형 파악이란 산출한 교정값과 해당 오류 문자열을 비교하여 해당 오류 문자열이 띄어쓰기 오류인지, 삽입 오류(필요한 문자열이 누락된 경우)인지, 삭제 오류(불필요한 문자열이 있는 경우)인지, 교체 오류(오타 등의 문자열 수정이 필요한 경우)인지 등을 분석 파악하는 것이다.
상기 예의 경우(“대한민궁”이란 오류 문자열에 대해 “대한민국”이란 교정된 문자열 생성)에는 교체 오류(오타 등의 문자열 수정이 필요한 경우)로 분석하게 된다.
교정유형 파악은 오류 문자열의 오류 원인과 교정값의 처리 방법 및 교정부호의 선택을 결정하기 위한 의미를 담고 있다.
예를 들어 ‘한국’을 ‘항국’으로 표기한 경우, 일반적으로 ‘맞춤법 오류’라고 부르고 ‘항국’을 ‘한국’으로 교정한다. 그런데, ‘나는 아침을 꼭 먹는다.’를 ‘나는 아침에는 꼭 먹는다.’로 작성한 경우에는 문법적 오류로 명확한 이름이 존재하지 않는다. 그러므로 오류의 유형을 현상의 의미적 해석에 따라 결정하면 일관된 교정값의 처리와 교정부호 할당이 어려워진다.
따라서, 본 발명의 교정부(240)는 산출한 교정값과 오류 문자열(교정대상)을 비교하여, 둘 사이의 차이 유형을 패턴화하여 오류 문자열(교정대상)에 대한 처리방법 및 교정부호에 대한 정보를 교정 주석정보에 포함시킨다.
예를 들어, 오류 문자열 “경제활동”이 교정값 “경제 활동”으로 산출된 경우는 “띄어쓰기”로 처리하고 교정부호 ‘√’를 매핑한다는 교정 주석정보를 생성하고. 오류 문자열 “항국”이 교정값 “한국”으로 산출된 경우는 “교체”로 처리하고 교정부호 “-”를 매핑한다는 교정 주석 정보를 생성한다.
따라서 상기 교정 주석정보에 의하면 최종적으로는
Figure 112018119001971-pat00001
로된 텍스트가 사용자장치에서 출력되는 것이다.
도 7은 오류 문자열에 대한 교정유형, 교정처리, 교정부호를 나타내고 있으나 비교 패턴과 처리/부호 매핑 관계를 조정하고자 하는 경우 변경될 수 있다.
아래 표 7~9는 <2008부터 2009 한국에 일었어요.>란 입력 텍스트에 대한 교정 주석정보의 예시를 보여주고 있다.
offset 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
텍스트 2 0 0 8 2 0 0 9 .
교정문
seqID off_start off_end Length aType0 s_val t_val aCode
1 0 5 6 21(교정) 2008부터 2008년부터 삽입
2 7 9 4 21(교정) 2009 2009년까지 삽입
3 12 14 3 21(교정) 한국에 한국에서 삽입
4 16 20 5 21(교정) 일었어요 일했어요. 교체
항목명 0명 값유형
seqID 주석 일련번호 숫자
off_start 교정 대상 어절의 시작위치 숫자
off_end 교정 대상 어절의 종료위치 숫자
Length 주석 대상 어절의 길이 숫자
aType 주석의 유형(여기서는 교정주석. 21) 숫자
s_val 교정 대상 어절의 문자열값 문자열(입력문의 부분 문자열)
t_val 교정값(문자열) 임의의 문자열
aCode 교정 유형의 코드값(교정부호 및 교정값 출력 방법) 숫자
즉, 입력된 상기 텍스트인 <2008부터 2009 한국에 일었어요.>은 상기 교정부(240)에 의해 오류 문자열이 식별되고, 식별된 오류 문자열들은 교정되고, 교정처리에 관한 정보인 상기 표와 같은 교정 주석정보가 생성된 후 저장 처리되는 것이다.
저장 처리되는 교정 주석정보는 오류 문자열 정보(2008부터, 2009, 한국에, 일었어요)의 오류 문자열의 위치정보(2008부터, 2009, 한국에, 일었어요에 대한 offset값), 오류 문자열에 대한 교정정보를 적어도 포함하고 있고, 특히 상기표의 경우 오류 문자열에 대한 교정정보는 오류 문자열에 대한 교정값 정보(2008년부터, 2009년까지, 한국에서, 일했어요), 오류 문자열에 대한 교정유형 정보(삽입, 교체), 오류 문자열에 대한 교정부호와 교정값의 위치정보를 적어도 포함하고 있다.
상술한 주석 처리부(200)의 각 모듈은 도 6에 도시된 바와 같이 입력된 텍스트에 존재하는 오류 문자열을 파악하고, 오류 문자열마다 자동으로 주석정보(전처리 주석정보, 문법단위 주석정보, 형태소 주석정보, 교정 주석정보)를 생성하고, 생성된 주석정보는 사용자가 편집할 수 있게 하며, 편집된 주석정보는 수시로 저장하는 기능을 제공한다.
특히 저장 기능에서 변경(update)은 원문의 변경을 수반하는 경우도 있으며, 이 경우 전처리부로부터 변경된 문자열에 의한 보정값을 전달받아 모든 주석의 위치 정보값을 갱신할 수 있다.
상기 표현부(300)는 저장된 주석정보들을 이용해 교정정보가 매칭 표시된 텍스트 정보를 생성하기 위한 구성으로서, 도 5에 도시된 바와 같이 원문/주석 검증부(310), 주석 정렬부(330), 출력형식정보 생성부(330), 화면출력 제어부(340)를 포함하도록 구성된다.
표현부(300)를 구성하는 원문/주석 검증부, 주석 정렬부, 출력형식정보 생성부, 화면출력 제어부는 각각 다음의 역할을 수행한다.
상기 원문/주석 검증부(310)는 교정 대상인 입력된 텍스트와 저장된 주석 정보를 비교, 검사하는 구성으로서, 입력된 텍스트가 입력되어 주석된 시점의 상태와 동일한지를 검사한다.
입력된 텍스트는 원칙적으로 변경되지 않아야 하지만, 주석 처리부(200)를 거치지 않고 직접 변경을 수행하는 등의 행위로 인해 변경이 발생하는 경우가 있다. 이 경우 입력 텍스트의 문자 위치를 기반으로 작성된 모든 주석 정보는 잘못된 정보를 포함하게 된다. 그러므로 주석 정보가 적용된 출력 텍스트(교정정보가 표시된 입력 텍스트) 정보를 생성하기 전에 입력된 원문 텍스트와 주석 정보의 정합성을 검증할 필요가 있다.
이를 위해 원문/주석 검증부(310)는 입력된 텍스트의 원문 정보를 입력된 텍스트에 대한 전처리부가 생성한 전처리 주석정보, 문법단위 식별부가 생성한 문법단위 주석정보와 비교하여 변경 여부를 판정(서로 다른 값이 있으면 변경으로 판정)한다.
상기 원문/주석 검증부(310)에 의해 잘못된 위치에 교정정보가 표시 출력되는 것을 방지한다.
상기 주석 정렬부(320)는 출력 텍스트(입력 텍스트에 주석 내용(교정정보)을 결합시킨 텍스트) 생성시, 주석 내용(전처리 주석, 문법 단위 주석, 형태소(언어분석), 교정값과 교정부호에 대한 교정 주석 등)을 입력 텍스트에 결합하는 과정에서 먼저 생성된 출력 텍스트에 의해 나중에 생성되는 출력 텍스트가 영향을 받지 않게 하기 위한 구성이다.
출력 텍스트는 선형적(순차적)으로 생성되기 때문에 주석의 순서가 엇갈려 있으면 올바른 출력 텍스트가 생성되지 못한다.
주석은 대체로 순차적으로 생성되지만, 예외적인 경우가 종종 발생한다. 특히 교정의 경우에는 여러 차례 반복 교정을 수행(1차 교정, 2차 교정, ... n차 교정)할 수 있는데, 이때 추가되는 교정은 입력 텍스트 상의 위치가 앞 부분이더라도 데이터 정렬상 뒤에 존재할 수 있다. 예를 들어, ‘2009’를 ‘2009년까지’로 하는 교정이 다른 항목(다른 오류 문자열)보다 나중에서 수행한 경우 주석번호(seqID)는 더 높은 값으로 설정되어 뒤쪽에 저장될 수 있다.
아래표 10은 <2008부터 2009 한국에 일었어요.>란 원문 텍스트에 대해 2008부터 → 2009→ 한국에 → 일었어요의 교정순서로 교정된 예를 나타내고 있다. 이 경우 각 오류 문자열(2008, 2009, 한국에, 일었어요)에 대한 교정순서를 나타내는 주석번호(seqID) 중 오류 문자열 2009에 대한 교정 순서는 2번이다.
seqID off_start off_end Length aType0 s_val t_val aCode
1 0 5 6 21(교정) 2008부터 2008년부터 삽입
2 7 9 4 21(교정) 2009 2009년까지 삽입
3 12 14 3 21(교정) 한국에 한국에서 삽입
4 16 20 5 21(교정) 일었어요 일했어요. 교체
반면, 아래표 11은 원문 텍스트에 대해 2008부터 → 한국에 → 일었어요 → 2009의 교정순서로 교정된 예를 나타내고 있다. 이 경우 각 오류 문자열(2008, 2009, 한국에, 일었어요)에 대한 교정순서를 나타내는 주석번호(seqID) 중 오류 문자열 2009에 대한 교정 순서는 4번이다.
seqID off_start off_end Length aType0 s_val t_val aCode
1 0 5 6 21(교정) 2008부터 2008년부터 삽입
2 12 14 3 21(교정) 한국에 한국에서 삽입
3 16 20 5 21(교정) 일었어요 일했어요. 교체
4 7 9 4 21(교정) 2009 2009년까지 삽입
이 경우 주석영역 정렬을 거치지 않으면, “2008(년)부터 2009 한국에(서) 일었(했)어요.”라는 출력문이 먼저 생성되고, ‘2009’를 ‘2009년까지’로 수정하기 위해 텍스트의 위치 정보를 탐색할 때, ‘2009’의 위치를 오인하여, “2008(년)부터 2까지 한국에(서) 일었(했)어요.”로 수정하게 되어 출력 텍스트를 훼손하게 된다.
따라서 주석번호(seqID) 넘버링 시 교정 대상인 오류 문자열들의 교정 순서에 따라 주석번호(seqID)를 넘버링하는 것이 아니라 원문 텍스트상의 오류 문자열 순서에 따라 주석번호(seqID)를 넘버링하는 것이다. 이것이 상기 주석 정렬부(320)에서의 주석영역 정렬인 것이다.
즉, 상기표에서 오류 문자열 ‘2009’의 교정순서가 4번이었지만 오류문자열 순서상 2번에 해당하는 것이어서 오류 문자열 ‘2009’의 주석번호는 4번이 아닌 2번으로 정렬하게 되는 것이다.
상기 출력형식정보 생성부(330)는 저장된 주석정보를 이용하여 교정값 출력형식에 대한 정보를 생성하는 제1출력형식모듈(331)과 교정부호 출력형식에 대한 정보를 생성하는 제2출력형식모듈(332)을 포함하도록 구성된다.
상기 제1출력형식모듈(331)은 교정값이 입력 텍스트의 특정 위치에 표시되도록 하는 정보를 생성한다.
구체적으로, 제1출력형식모듈은 저장된 주석정보를 이용해 입력된 원문 텍스트에 존재하는 오류 문자열(교정 대상 문자열)의 위치정보인 제1위치값을 찾고, 제1위치값에 대한 상대적 출력 위치정보인 제2위치값을 결정한다. 이때 제2위치값은 교정값(교정된 문자열)이 표시되는 위치정보이다.
즉, 제1출력형식모듈(331)이 생성하는 교정값 출력형식에 대한 정보는 오류 문자열(교정 대상 문자열)에 대한 교정값이 입력 텍스트상 표시되는 위치에 대한 정보인 것이다.
예를 들어, 오류 문자열(교정 대상 문자열) “항국”을 교정값(교정된 문자열) “한국”으로 표시하는 경우를 설명한다.
먼저, 교정값(교정된 문자열)을 오류 문자열(교정 대상 문자열)에 연속된 문자열로 표시하는 경우는 제1위치값(“항”의 위치정보) 바로 다음에 교정값 ‘한’ 이 오도록 제2위치값을 결정한다.
이와 같이하면 그 결과는
Figure 112018119001971-pat00002
이 된다.
또 다른 표현 방법으로 교정값(교정된 문자열)을 오류 문자열(교정 대상 문자열)과는 다른 출력 라인에 표시하는 경우는 제1위치값(“항”의 위치정보)이 존재하는 라인의 이전 라인에 교정값 ‘한’ 이 오도록 제2위치값을 결정한다. 이와 같이하면 그 결과는
Figure 112018119001971-pat00003
이 된다.
상기 제2출력형식모듈(332)은 교정부호가 입력 텍스트의 특정 위치에 표시되도록 하는 정보를 생성한다.
구체적으로, 제2출력형식모듈은 저장된 주석정보를 이용해 입력된 원문 텍스트에 존재하는 오류 문자열(교정 대상 문자열)의 위치정보인 제1위치값을 찾고, 제1위치값에 대한 상대적 출력 위치정보인 제3위치값을 결정한다. 이때 제3위치값은 교정부호(띄어쓰기부호, 삭제부호 등)이 표시되는 위치정보이다.
즉, 제2출력형식모듈(332)이 생성하는 교정부호 출력형식에 대한 정보는 오류 문자열(교정 대상 문자열)에 대한 교정부호가 표시되는 위치정보에 대한 것이다.
예를 들어, 오류 문자열(교정 대상 문자열)에 교체를 위한 교정부호 “-” 를 표시하는 경우를 설명한다.
먼저, 오류 문자열(교정 대상 문자열)인 "항"의 위치정보인 제1위치값("항"의 위치정보)을 찾고, 교체를 위한 교정부호 “-”가 위치할 위치정보인 제3위치값을 결정한다. 이 경우(오류 문자열(교정 대상 문자열)에 교체를 위한 교정부호 “-”를 표시하는 경우)에는 제3위치값은 제1위치값과 동일한 것이어서 그 결과는 “
Figure 112018119001971-pat00004
”이 된다.
상기 화면출력 제어부(340)는 출력형식정보 생성부(330)가 생성한 정보에 따라 교정정보(교정값, 교정부호 등)가 표시된 입력 텍스트가 사용자장치가 요청하는 형식에 맞춰 사용자장치에 출력되도록 제어한다.
예를 들어 웹환경에서 출력하는 경우, 교정정보(교정값, 교정부호 등)가 표시된 입력 텍스트는 html 형식에 맞춰 표시되도록 제어한다.
따라서 교정정보가 교정대상 문자열의 좌표나 그 좌표로부터 일정거리에 정확하게 표시된 상태로 사용자장치에 출력 표시되는 것이다.
상기 정보저장부(400)는 주석 처리부(200)에서 생성되는 각종 주석정보와 교정처리에 필요한 말뭉치 정보, 사전 정보, 학습수준 정보, 오류 패턴 정보, 어문 규정 정보 등이 저장되는 저장수단이다.
도 3은 본 발명의 특징인 Stand-off 주석 방식이 적용되어 입력 텍스트에 대한 교정정보(교정부호와 교정문자열)가 표시된 입력 텍스트의 예시가 도시되어 있다. 즉, 오류 문자열 위치에 교정부호가 표시되고 오류 문자열 근처에 교정된 문자열이 표시되고 있음을 확인할 수 있다.
이하에서는 본 발명의 또 다른 실시예인 Stand-off 주석을 이용한 언어학습용 작문오류 교정방법에 대해 설명한다.
본 발명의 Stand-off 주석을 이용한 언어학습용 작문오류 교정방법은 도 8에 도시된 바와 같이,
사용자로부터 원문 텍스트를 입력받는 텍스트 입력단계(S100)와;
원문 텍스트에 대한 전처리 주석정보, 문법단위 주석정보, 교정 주석정보를 생성하여 저장하는 주석정보 생성단계(S200)와;
교정 대상인 원문 텍스트와 저장된 주석 정보를 비교하여, 원문 텍스트가 주석된 시점의 텍스트 상태와 동일한지를 검사하는 원문/주석 검증단계(S300)와;
원문 텍스트에 주석 내용을 결합하는 과정에서 먼저 생성된 출력 텍스트에 의해 나중에 생성되는 출력 텍스트가 영향을 받지 않게 하기 위해 주석영역을 정렬하는 주석영역 정렬단계(S400)와;
교정정보가 매칭 된 출력 텍스트를 생성하는 출력 텍스트 생성단계(S500)와;
생성된 출력 텍스트를 사용자에게 제공하는 출력 텍스트 제공단계(S600)를 포함한다.
상기 교정정보는 교정값과 교정부호를 포함하는 것을 특징으로 한다.
상기 텍스트 입력단계(S100)는 사용자장치(예: PC, 스마트폰 등)로부터 교정할 대상인 원문 텍스트를 입력받는 구성이다. 사용자장치와 본 발명인 작문오류 교정 장치는 웹 방식의 통신네트워크로 연결되며 통신 네트워크를 통해 사용자장치는 한국어 텍스트(교정 받고자 하는 원문 텍스트)를 본 발명인 작문오류 교정 장치로 전송하게 되고, 본 발명인 작문오류 교정 장치는 입력부(100)을 통해 원문 텍스트를 입력받게 된다.
상기 주석정보 생성단계(S200)는 본 발명의 주석 처리부(200)를 통해 원문 텍스트에 대한 전처리 주석정보, 문법단위 주석정보, 교정 주석정보를 생성하여 저장하는 단계이다.
구체적으로 주석정보 생성단계(S200)는
입력받은 원문 텍스트의 일관된 문자열 위치정보 보존을 위해 입력된 텍스트에 포함된 한글 이외의 문자 및 기호에 대해 전처리 하고, 전처리 결과에 대한 정보인 전처리 주석정보를 생성하여 저장하는 전처리 주석정보 생성단계(S210)와,
언어학적 처리 시 데이터의 입출력 단위를 일관되게 처리하기 위해 입력 텍스트에서 어절, 문장, 단락등과 같은 문법 단위를 식별하고, 식별된 문법 단위마다 주석 처리하고, 주석 처리 결과에 대한 정보인 문법단위 주석정보를 생성하여 저장하는 문법단위 주석정보 생성단계(S220)와,
어문규정에 따른 교정 지침에 따라 입력 텍스트로부터 오류 문자열을 식별하고, 식별한 오류 문자열을 교정처리하고, 교정처리에 결과에 대한 정보인 교정 주석정보를 생성하여 저장하는 교정 주석정보 생성단계(S230)를 포함한다.
전처리 주석정보와 문법단위 주석정보와 교정 주석정보를 포함하는 주석정보 생성에 대한 설명은 이미 본 발명의 교정 장치 부분에서 설명하였기에 생략하기로 한다.
상기 원문/주석 검증단계(S300)는 교정 대상인 원문 텍스트와 저장된 주석 정보를 비교하여, 원문 텍스트가 주석된 시점의 텍스트 상태와 동일한지를 검사하는 단계이다.
입력된 원문 텍스트는 원칙적으로 변경되지 않아야 하지만, 주석 정보에 의하지 않고 직접 변경을 수행하는 등의 행위로 인해 변경이 발생하는 경우가 있다. 이 경우 원문 텍스트의 문자 위치를 기반으로 작성된 모든 주석 정보는 잘못된 정보를 포함하게 된다. 그러므로 주석 정보가 적용된 출력 텍스트(교정정보가 표시된 원문 텍스트) 정보를 생성하기 전에 입력된 원문 텍스트와 주석 정보의 정합성을 검증할 필요가 있다.
이를 위해 원문/주석 검증단계(S300)는 입력된 원문 텍스트의 원문 정보를 입력된 텍스트에 대한 전처리부가 생성한 전처리 주석정보, 문법단위 식별부가 생성한 문법단위 주석정보와 비교하여 변경 여부를 판정(서로 다른 값이 있으면 변경으로 판정)한다. 즉, 원문/주석 검증단계(S300)에 의해 잘못된 위치에 교정정보가 표시 출력되는 것을 방지한다.
상기 주석영역 정렬단계(S400)는 원문 텍스트에 주석 내용(전처리 주석, 문법 단위 주석, 형태소(언어분석), 교정값과 교정부호에 대한 교정 주석 등)을 결합하는 과정에서 먼저 생성된 출력 텍스트에 의해 나중에 생성되는 출력 텍스트가 영향을 받지 않게 하기 위한 단계이다.
출력 텍스트는 선형적(순차적)으로 생성되기 때문에 주석의 순서가 엇갈려 있으면 올바른 출력 텍스트가 생성되지 못한다.
주석은 대체로 순차적으로 생성되지만, 예외적인 경우가 종종 발생한다. 특히 교정의 경우에는 여러 차례 반복 교정을 수행(1차 교정, 2차 교정, ... n차 교정)할 수 있는데, 이때 추가되는 교정은 입력 텍스트 상의 위치가 앞 부분이더라도 데이터 정렬상 뒤에 존재할 수 있다. 예를 들어, ‘2009’를 ‘2009년까지’로 하는 교정이 다른 항목(다른 오류 문자열)보다 나중에서 수행한 경우 주석번호(seqID)는 더 높은 값으로 설정되어 뒤쪽에 저장될 수 있다.
아래표 12는 <2008부터 2009 한국에 일었어요.>란 원문 텍스트에 대해 2008부터 → 2009→ 한국에 → 일었어요의 교정순서로 교정된 예를 나타내고 있다. 이 경우 각 오류 문자열(2008, 2009, 한국에, 일었어요)에 대한 교정순서를 나타내는 주석번호(seqID) 중 오류 문자열 2009에 대한 교정 순서는 2번이다.
seqID off_start off_end Length aType0 s_val t_val aCode
1 0 5 6 21(교정) 2008부터 2008년부터 삽입
2 7 9 4 21(교정) 2009 2009년까지 삽입
3 12 14 3 21(교정) 한국에 한국에서 삽입
4 16 20 5 21(교정) 일었어요 일했어요. 교체
반면, 아래표 13은 원문 텍스트에 대해 2008부터 → 한국에 → 일었어요 → 2009의 교정순서로 교정된 예를 나타내고 있다. 이 경우 각 오류 문자열(2008, 2009, 한국에, 일었어요)에 대한 교정순서를 나타내는 주석번호(seqID) 중 오류 문자열 2009에 대한 교정 순서는 4번이다.
seqID off_start off_end Length aType0 s_val t_val aCode
1 0 5 6 21(교정) 2008부터 2008년부터 삽입
2 12 14 3 21(교정) 한국에 한국에서 삽입
3 16 20 5 21(교정) 일었어요 일했어요. 교체
4 7 9 4 21(교정) 2009 2009년까지 삽입
이 경우 주석영역 정렬을 거치지 않으면, “2008(년)부터 2009 한국에(서) 일었(했)어요.”라는 출력문이 먼저 생성되고, ‘2009’를 ‘2009년까지’로 수정하기 위해 텍스트의 위치 정보를 탐색할 때, ‘2009’의 위치를 오인하여, “2008(년)부터 2까지 한국에(서) 일었(했)어요.”로 수정하게 되어 출력 텍스트를 훼손하게 된다.
따라서 주석번호(seqID) 넘버링 시 교정 대상인 오류 문자열들의 교정 순서에 따라 주석번호(seqID)를 넘버링하는 것이 아니라 원문 텍스트상의 오류 문자열 순서에 따라 주석번호(seqID)를 넘버링하는 것이다. 이것이 상기 주석영역 정렬단계(S300)에서의 주석영역 정렬인 것이다.
즉, 상기표에서 오류 문자열 ‘2009’의 교정순서가 4번이었지만 오류문자열 순서상 2번에 해당하는 것이어서 오류 문자열 ‘2009’의 주석번호는 4번이 아닌 2번으로 정렬하게 되는 것이다.
상기 출력 텍스트 생성단계(S500)는,
교정정보 중 교정값이 원문 텍스트상에 위치할 위치정보를 생성하는 교정값 위치 계산단계(S510)와,
교정정보 중 교정부호가 원문 텍스트상에 위치할 위치정보를 생성하는 교정부호 위치 계산단계(S520)와,
생성된 위치정보에 따라 교정값과 교정부호를 원문 텍스트의 해당 위치에 결합시켜 출력 텍스트를 생성하는 교정정보 결합단계(S530)를 포함한다.
상기 교정값 위치 계산단계(S510)는 입력된 원문 텍스트에 존재하는 오류 문자열의 원문 텍스트상의 위치정보인 제1위치값과 제1위치값에 대한 상대적 출력 위치정보인 제2위치값을 계산한다.
계산된 상기 제2위치값을 교정값이 표시되는 원문 텍스트상의 위치정보로 생성한다.
상기 교정부호 위치 계산단계(S520)는 입력된 원문 텍스트에 존재하는 오류 문자열의 출력 텍스트상의 위치정보인 제1위치값과 제1위치값에 대한 상대적 출력 위치정보인 제3위치값을 계산한다.
계산된 상기 제3위치값을 교정부호가 표시되는 원문 텍스트상의 위치정보로 생성한다.
교정값과 교정부호의 원문 텍스트상에서의 위치 정보를 생성하고, 위치정보에 따라 원문 텍스트의 해당 위치에 교정값과 교정부호가 표시되록 원문 텍스트와 교정값과 교정부호를 결합시키는 구체적인 특징은 이미 본 발명의 교정 장치 부분에서 설명하였기에 생략하기로 한다.
상기 출력 텍스트 제공단계(S600)는 생성된 출력 텍스트(교정값과 교정부호가 결합된 원문 텍스트)가 사용자장치의 환경에 맞게 또는 사용자장치가 요청하는 형식에 맞게 사용자장치에 표시되도록 제공하는 단계이다.
도 9,10은 본 발명에 의한 표현된 주석(교정값과 교정부호)가 서로 다른 출력환경(웹과 앱)과 디스플레이 양식에도 불구하고, 일관되게 처리됨을 보여주는 결과의 예시를 보여주고 있다.
이상에서 본 발명에 대한 기술사상을 첨부도면과 함께 서술하였지만, 이는 본 발명의 바람직한 실시예를 예시적으로 설명한 것이지 본 발명을 한정하는 것은 아니다. 또한, 이 기술 분야의 통상의 지식을 가진 자라면 누구나 본 발명의 기술사상의 범주를 이탈하지 않는 범위 내에서 다양한 변형 및 모방이 가능함은 명백한 사실이다.
100 : 입력부
200 : 주석처리부
300 : 표현부
400 : 정보저장부

Claims (13)

  1. Stand-off 주석을 이용한 언어학습용 작문오류 교정장치에 있어서,
    사용자장치로부터 텍스트를 입력받는 입력부(100)와;
    입력부(100)를 통해 입력받은 입력 텍스트에 포함된 한글 이외의 문자 및 기호들에 대한 전처리를 수행하고, 입력된 텍스트의 문법단위에 대한 식별처리를 수행하고, 입력된 텍스트의 교정을 수행하고, 수행 결과들에 대한 주석 정보들을 저장 처리하는 주석 처리부(200)와;
    저장된 주석정보들을 이용해 교정정보가 매칭 표시된 출력 텍스트 정보를 생성하는 표현부(300)와;
    주석 처리부(200)에서 생성되는 각종 주석정보와 교정처리에 필요한 말뭉치 정보, 사전 정보, 학습수준 정보, 오류 패턴 정보, 어문 규정 정보 등이 저장되는 정보저장부(400)를 포함하고,

    상기 주석 처리부(200)는,
    입력 텍스트의 일관된 문자열 위치정보 보존을 위해 입력된 텍스트에 포함된 한글 이외의 문자 및 기호에 대한 전처리를 수행하고, 전처리에 대한 결과정보인 전처리 주석정보를 생성하여 정보저장부(400)에 저장 처리하는 전처리부(210)와,
    언어학적 처리 시 데이터의 입출력 단위를 일관되게 처리하기 위해 입력 텍스트에서 어절, 문장, 단락등과 같은 문법 단위를 식별하고, 식별된 문법 단위마다 주석처리하고, 주석처리에 대한 결과정보인 문법단위 주석정보를 생성하여 정보저장부(400)에 저장 처리하는 문법단위 식별부(220)와,
    어문규정에 따른 교정 지침에 따라 입력 텍스트로부터 오류 문자열을 식별하고, 식별한 오류 문자열을 교정 처리하고, 교정 처리에 대한 결과정보인 교정 주석정보를 생성하여 정보저장부(400)에 저장 처리하는 교정부(240)를 포함하는 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치.
  2. 삭제
  3. 제1항에 있어서,
    상기 전처리부(210)에 의한 전처리란 입력된 텍스트에 포함된 한글 이외의 문자 및 기호들을 파악하고, 파악된 한글 이외의 문자 및 기호들 각각마다에 주석과 대체문자를 매칭 시키는 것을 의미하고,
    상기 전처리부(210)가 저장 처리하는 전처리 주석정보는 한글 이외의 문자 및 기호들 각각마다에 매칭 된 주석과 대체문자에 대한 정보를 포함하는 것을 특징으로 하고,
    상기 전처리 주석정보에 포함되는 주석이란 오류 교정 처리 시 한글 이외의 문자 및 기호들에 대한 처리 규칙에 대한 것이고, 대체문자란 한글 이외의 문자 및 기호들의 처리의 용이성을 위해 오류 교정 처리 시 사용하고자 하는 문자를 의미하고,
    한글 이외의 문자 및 기호란 한글을 제외한 모든 유니코드상의 기호범주에 속한 문자 및 기호들을 의미하는 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치.
  4. 제1항에 있어서,
    상기 교정 주석정보는 Stand-off 주석 방식에 의해 교정부호나 교정값이 입력 텍스트의 교정대상 문자열의 좌표나 그 좌표로부터 일정거리에 정확하게 매칭 표시되도록 하는 정보로서, 적어도 오류 문자열 정보, 오류 문자열의 위치 정보, 오류 문자열에 대한 교정정보를 포함하고,
    상기 오류 문자열에 대한 교정정보는 오류 문자열에 대한 교정부호 정보, 교정값 정보, 교정유형 정보, 교정부호와 교정값의 위치정보를 적어도 포함하는 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치.
  5. 제1항에 있어서,
    상기 교정부(240)에 의한 교정 처리는 해당 오류 문자열에 대한 교정값을 산출하고, 산출한 교정값과 해당 오류 문자열을 비교하여 교정 유형을 파악하고, 파악된 교정 유형에 해당하는 교정부호를 결정하는 것을 포함하며,
    상기 교정값이란 오류 문자열을 교정 지침에 따라 교정한 정된 문자열을 의미하고,
    상기 교정유형 파악이란 산출한 교정값과 해당 오류 문자열을 비교하여 해당 오류 문자열이 띄어쓰기 오류인지, 삽입 오류(필요한 문자열이 누락된 경우)인지, 삭제 오류(불필요한 문자열이 있는 경우)인지, 교체 오류(오타 등의 문자열 수정이 필요한 경우)인지 등을 분석 파악하는 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치.
  6. 제1항에 있어서,
    상기 표현부(300)는,
    잘못된 위치에 교정정보가 표시 출력되는 것을 방지하기 위해 교정 대상인 입력된 텍스트와 저장된 주석 정보를 비교, 검사하여 입력된 텍스트가 주석된 시점의 상태와 동일한지를 검사하는 원문/주석 검증부(310)와,
    입력 텍스트에 주석 내용을 결합하여 출력 텍스트를 생성하는 과정에서 먼저 생성된 출력 텍스트에 의해 나중에 생성되는 출력 텍스트가 영향을 받지 않게 하기 위해 주석영역을 정렬하는 주석 정렬부(320)와;
    주석정보를 이용해 교정값 출력형식에 대한 정보를 생성하는 제1출력형식모듈(331)과 주석정보를 이용해 교정부호 출력형식에 대한 정보를 생성하는 제2출력형식모듈(332)을 포함하도록 구성되는 출력형식정보 생성부(330)와,
    출력형식정보 생성부(330)가 생성한 정보에 따라 교정정보(교정값, 교정부호 등)가 표시된 출력 텍스트가 사용자장치가 요청하는 형식에 맞춰 사용자장치에 출력되도록 제어하는 화면출력 제어부(340)를 포함하는 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치.
  7. 제6항에 있어서,
    상기 제1출력형식모듈(331)이 생성하는 교정값 출력형식에 대한 정보는,
    입력된 원문 텍스트에 존재하는 오류 문자열의 원문 텍스트상의 위치정보인 제1위치값과 제1위치값에 대한 상대적 출력 위치정보인 제2위치값을 포함하고, 상기 제2위치값은 교정값이 표시되는 입력 텍스트상의 위치정보인 것을 특징으로 하며,
    상기 제2출력형식모듈(332)이 생성하는 교정부호 출력형식에 대한 정보는,
    입력된 원문 텍스트에 존재하는 오류 문자열의 원문 텍스트상의 위치정보인 제1위치값과 제1위치값에 대한 상대적 출력 위치정보인 제3위치값을 포함하고, 상기 제3위치값은 교정부호가 표시되는 입력 텍스트상의 위치정보인 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치.
  8. 제1항에 있어서,
    상기 주석 처리부(200)는 입력 텍스트에 대한 형태소를 분석하고, 분석한 분석결과를 형태소 주석정보로 하여 저장 처리하는 언어 분석부(230)를 더 포함하는 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치.
  9. Stand-off 주석을 이용한 언어학습용 작문오류 교정방법에 있어서,
    사용자로부터 원문 텍스트를 입력받는 텍스트 입력단계(S100)와;
    원문 텍스트에 대한 전처리 주석정보, 문법단위 주석정보, 교정 주석정보를 생성하여 저장하는 주석정보 생성단계(S200)와;
    교정 대상인 원문 텍스트와 저장된 주석 정보를 비교하여, 원문 텍스트가 주석된 시점의 텍스트 상태와 동일한지를 검사하는 원문/주석 검증단계(S300)와;
    원문 텍스트에 주석 내용을 결합하는 과정에서 먼저 생성된 출력 텍스트에 의해 나중에 생성되는 출력 텍스트가 영향을 받지 않게 하기 위해 주석영역을 정렬하는 주석영역 정렬단계(S400)와;
    교정정보가 매칭 된 출력 텍스트를 생성하는 출력 텍스트 생성단계(S500)와;
    생성된 출력 텍스트를 사용자에게 제공하는 출력 텍스트 제공단계(S600)를 포함하며,

    상기 주석정보 생성단계(S200)는,
    입력받은 원문 텍스트의 일관된 문자열 위치정보 보존을 위해 입력된 텍스트에 포함된 한글 이외의 문자 및 기호에 대해 전처리 하고, 전처리 결과에 대한 정보인 전처리 주석정보를 생성하여 저장하는 전처리 주석정보 생성단계(S210)와,
    언어학적 처리 시 데이터의 입출력 단위를 일관되게 처리하기 위해 입력 텍스트에서 어절, 문장, 단락등과 같은 문법 단위를 식별하고, 식별된 문법 단위마다 주석 처리하고, 주석 처리 결과에 대한 정보인 문법단위 주석정보를 생성하여 저장하는 문법단위 주석정보 생성단계(S220)와,
    어문규정에 따른 교정 지침에 따라 입력 텍스트로부터 오류 문자열을 식별하고, 식별한 오류 문자열을 교정처리하고, 교정처리에 결과에 대한 정보인 교정 주석정보를 생성하여 저장하는 교정 주석정보 생성단계(S230)를 포함하고,

    상기 교정정보는 교정값과 교정부호를 포함하는 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정방법.
  10. 삭제
  11. 제9항에 있어서,
    상기 교정 주석정보 생성단계(S230)는
    원문 텍스트에서 교정 대상 문자열을 찾는 오류 문자열을 식별하고, 식별된 오류 문자열에 대한 교정값 정보를 생성하는 교정값 생성단계(S231)와,
    원문 텍스트에서 교정 대상 문자열을 찾는 오류 문자열을 식별하고, 식별된 오류 문자열에 대한 교정부호 정보를 생성하는 교정부호 생성단계(S232)를 포함하는 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정방법.
  12. 제9항에 있어서,
    상기 출력 텍스트 생성단계(S500)는,
    교정값이 원문 텍스트상에 위치할 위치정보를 생성하는 교정값 위치 계산단계(S510)와,
    교정부호가 원문 텍스트상에 위치할 위치정보를 생성하는 교정부호 위치 계산단계(S520)와,
    생성된 위치정보에 따라 교정값과 교정부호를 원문 텍스트의 해당 위치에 결합시켜 출력 텍스트를 생성하는 교정정보 결합단계(S530)를 포함하는 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정방법.
  13. 제12항에 있어서,
    상기 교정값 위치 계산단계(S510)는,
    입력된 원문 텍스트에 존재하는 오류 문자열의 원문 텍스트상의 위치정보인 제1위치값과 제1위치값에 대한 상대적 출력 위치정보인 제2위치값 계산을 포함하고, 상기 제2위치값은 교정값이 표시되는 원문 텍스트상의 위치정보인 것을 특징으로 하며,
    상기 교정부호 위치 계산단계(S520)는,
    입력된 원문 텍스트에 존재하는 오류 문자열의 출력 텍스트상의 위치정보인 제1위치값과 제1위치값에 대한 상대적 출력 위치정보인 제3위치값 계산을 포함하고, 상기 제3위치값은 교정부호가 표시되는 원문 텍스트상의 위치정보인 것을 특징으로 하는 Stand-off 주석을 이용한 언어학습용 작문오류 교정방법.
KR1020180149793A 2018-11-28 2018-11-28 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 및 방법 KR102117895B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180149793A KR102117895B1 (ko) 2018-11-28 2018-11-28 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180149793A KR102117895B1 (ko) 2018-11-28 2018-11-28 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 및 방법

Publications (1)

Publication Number Publication Date
KR102117895B1 true KR102117895B1 (ko) 2020-06-02

Family

ID=71090871

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180149793A KR102117895B1 (ko) 2018-11-28 2018-11-28 Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 및 방법

Country Status (1)

Country Link
KR (1) KR102117895B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102365345B1 (ko) 2021-03-04 2022-02-23 주식회사 팀플백 인공지능과 빅데이터를 이용한 글쓰기 교정 시스템 및 그 방법
KR20220084915A (ko) * 2020-12-14 2022-06-21 박지우 클라우드 기반 문법 교정 서비스 제공 시스템
CN118210879A (zh) * 2024-05-20 2024-06-18 北京译图智讯科技有限公司 一种基于大语言模型的关键信息抽取方法及***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100848260B1 (ko) 2007-01-31 2008-07-25 주식회사 씨디아이홀딩스 작문 학습지도 방법 및 시스템
KR20090106936A (ko) * 2008-04-07 2009-10-12 삼성전자주식회사 문장 띄어쓰기 시스템 및 방법
KR20100111456A (ko) 2009-04-07 2010-10-15 (주)김앤데이비스 작문 지도 방법 및 시스템
KR20140021838A (ko) * 2012-08-10 2014-02-21 에스케이텔레콤 주식회사 문법 오류 검출 방법 및 이를 위한 오류검출장치
KR20140051606A (ko) 2012-10-23 2014-05-02 에스케이텔레콤 주식회사 Rdf 기반의 문장 온톨로지를 이용한 일관성 평가 방법 및 장치
KR20160015933A (ko) * 2014-08-01 2016-02-15 고려대학교 산학협력단 소셜 텍스트를 위한 철자 오류 교정 방법 및 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100848260B1 (ko) 2007-01-31 2008-07-25 주식회사 씨디아이홀딩스 작문 학습지도 방법 및 시스템
KR20090106936A (ko) * 2008-04-07 2009-10-12 삼성전자주식회사 문장 띄어쓰기 시스템 및 방법
KR20100111456A (ko) 2009-04-07 2010-10-15 (주)김앤데이비스 작문 지도 방법 및 시스템
KR20140021838A (ko) * 2012-08-10 2014-02-21 에스케이텔레콤 주식회사 문법 오류 검출 방법 및 이를 위한 오류검출장치
KR20140051606A (ko) 2012-10-23 2014-05-02 에스케이텔레콤 주식회사 Rdf 기반의 문장 온톨로지를 이용한 일관성 평가 방법 및 장치
KR20160015933A (ko) * 2014-08-01 2016-02-15 고려대학교 산학협력단 소셜 텍스트를 위한 철자 오류 교정 방법 및 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220084915A (ko) * 2020-12-14 2022-06-21 박지우 클라우드 기반 문법 교정 서비스 제공 시스템
KR102552811B1 (ko) * 2020-12-14 2023-07-06 박지우 클라우드 기반 문법 교정 서비스 제공 시스템
KR102365345B1 (ko) 2021-03-04 2022-02-23 주식회사 팀플백 인공지능과 빅데이터를 이용한 글쓰기 교정 시스템 및 그 방법
CN118210879A (zh) * 2024-05-20 2024-06-18 北京译图智讯科技有限公司 一种基于大语言模型的关键信息抽取方法及***

Similar Documents

Publication Publication Date Title
Black et al. Statistically-driven computer grammars of English: The IBM/Lancaster approach
Gerdes Collaborative dependency annotation
KR102117895B1 (ko) Stand-off 주석을 이용한 언어학습용 작문오류 교정장치 및 방법
JPH07325824A (ja) 文法チェックシステム
CN111310447A (zh) 语法纠错方法、装置、电子设备和存储介质
Cahill et al. Factors in designing effective orthographies for unwritten languages
CN104239289A (zh) 音节划分方法和音节划分设备
JP2019113803A (ja) 漢字学習装置
Rosen et al. Compiling and annotating a learner corpus for a morphologically rich language: CzeSL, a corpus of non-native Czech
CN106775914B (zh) 一种自动生成键值的代码国际化方法及装置
Darģis et al. The use of text alignment in semi-automatic error analysis: use case in the development of the corpus of the Latvian language learners
JP7222218B2 (ja) 文書校正支援システム、文書校正支援装置、文書校正支援方法、及びプログラム
Robert et al. A cognitive linguistic approach to analysis and correction of orthographic errors
KR20120078453A (ko) 직독직해를 위한 영어교육 방법과 시스템
US11087097B2 (en) Automatic item generation for passage-based assessment
US10635862B2 (en) Method of facilitating natural language interactions, a method of simplifying an expression and a system thereof
CN112528651A (zh) 一种智能批改方法、***、电子设备及存储介质
US20150104761A1 (en) Adaptive Grammar Instruction For Run-On Sentences
Van Nam et al. Building a spelling checker for documents in Khmer language
Pondalos et al. Effective Proofread Strategies
JP6766972B1 (ja) 文書校正装置、文書校正方法、及びプログラム
JP2002196663A (ja) 作文方式による外国語学習の漸進的出題システム及びその方法
Mogilevski Le Correcteur 101 (A Comparative Evaluation of Version 2.2 and Version 3.5 Pro)
Renner et al. Maximizing ANLP evaluation: Harmonizing flawed input
Garabík et al. A cross linguistic database of children's printed words in three Slavic languages

Legal Events

Date Code Title Description
GRNT Written decision to grant