KR20140018859A - 한자 정보 처리 방법 및 한자 정보 처리 장치 - Google Patents

한자 정보 처리 방법 및 한자 정보 처리 장치 Download PDF

Info

Publication number
KR20140018859A
KR20140018859A KR1020137018463A KR20137018463A KR20140018859A KR 20140018859 A KR20140018859 A KR 20140018859A KR 1020137018463 A KR1020137018463 A KR 1020137018463A KR 20137018463 A KR20137018463 A KR 20137018463A KR 20140018859 A KR20140018859 A KR 20140018859A
Authority
KR
South Korea
Prior art keywords
kanji
user
chinese character
information
input
Prior art date
Application number
KR1020137018463A
Other languages
English (en)
Inventor
주후이 유에
Original Assignee
차이나 모바일 커뮤니케이션즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 차이나 모바일 커뮤니케이션즈 코포레이션 filed Critical 차이나 모바일 커뮤니케이션즈 코포레이션
Publication of KR20140018859A publication Critical patent/KR20140018859A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

한자 정보 처리 방법 및 한자 정보 처리 장치가 개시된다. 이 방법은, 애플리케이션이, 사용자가 입력한 한자의 머신 코드를 결정하는 단계와, 사전 저장되어 있는 머신 코드 및 사전 저장되어 있는 한자 정보 사이의 대응 관계에 따라서, 사용자가 입력한 한자의 한자 정보를 결정하는 단계 - 이 한자 정보는 사용자가 입력한 한자의 발음을 포함함 - 와, 사용자가 입력한 한자의 한자 정보에 따라서, 그 한자의 발음의 수가 복수라고 결정되면, 복수의 발음 중에서, 사용자가 입력한 한자의 현재 발음을 결정하는 단계와, 한자의 머신 코드 및 이 결정된 현재 발음인 발음을 포함하는 한자 정보를 저장하는 단계를 포함한다. 이 기술적인 해법을 통해서, 한자 정보가 애플리케이션에 저장될 때, 다성자를 구별할 수 있다.

Description

한자 정보 처리 방법 및 한자 정보 처리 장치{CHINESE CHARACTER INFORMATION PROCESSING METHOD AND CHINESE CHARACTER INFORMATION PROCESSING DEVICE}
본 출원은, 2011년 1월 4일 출원된, 중국 특허 출원 제 201110000513.9 호, '한자 정보 처리 방법 및 한자 정보 처리 장치"의 우선권을 주장하며, 그 전체 내용은 여기에 참조로서 포함된다.
본 발명은 정보 처리 분야에 관한 것이고, 상세하게는 한자 정보 처리 방법 및 한자 정보 처리 장치에 관한 것이다.
한자는 현재 매우 널리 사용되고 있는 비철자(non-spelling) 문자이다. 국가 표준(GB) 코드에 따라서, 각각의 한자는 한자의 머신 코드라고도 하는, 정해진 2진 코드를 갖고 있다. 한자와 일대일 대응하는 한자의 머신 코드는, 저장, 표시 및 전송과 같은, 한자 정보의 처리를 행하기 위한 한자의 식별자로서 사용되고 있다. 현재, 일반적으로 사용되는 한자의 머신 코드는 GB 코드의 각각의 바이트의 첫번째 비트에 1을 추가한 것이다. 컴퓨터에 의해 처리될 때, 코드의 첫번째 비트가 '1'이라면, 그 코드는 한자의 머신 코드인 것으로 결정된다.
한자는 다양한 분야에서 널리 사용되고 있다. 일반적으로, 예컨대, 한자로 표현되어 Word, Excel 및 txt와 같은 애플리케이션에 저장되는 정보, 휴대 전화에 한자로 기록되어 저장되는 연락처 정보 등과 같이, 사람들은 한자를 이용해서 상황을 표현 혹은 기록한다. 현재, 한자 정보를 개개의 애플리케이션에 저장하는 일반적인 처리는 주로, 도 1에 도시된 바와 같이 다음과 같은 단계를 포함한다.
단계 101, 사용자가 애플리케이션을 통해서 입력하는 한자를 수신한다.
사용자는 음성 입력 방법, 내추럴 코드(natural code) 입력 방법, 그림 코드 입력 방법, 파이브 펜 셰이프 입력 방법 등과 같은 다양한 방법으로 한자를 입력할 수 있다. 일반적으로, 수신한 사용자 입력 한자는, 한자의 외부 코드(external code)로 표현된다(입력 코드라고도 함). 구체적으로, 한자의 외부 코드는 한자를 컴퓨터에 입력하기 위한 키보드 심볼의 세트이다.
단계 102, 운영 체제에서 한자의 대응하는 머신 코드를 결정한다.
이 단계에서, 운영 체제에서 한자의 대응하는 머신 코드는 한자의 입력 코드를 머신 코드로 변환함으로써 결정된다.
단계 103, 결정된 머신 코드를 저장한다.
상기 처리에서, 애플리케이션을 통한 한자의 저장이 구현될 수 있다. 공지된 바와 같이, 종래의 기술에서, 애플리케이션에서 한자로 표현된 다양한 정보를 저장하는 것은 실질적으로 한자의 머신 코드를 저장하는 것으로 구현된다. 그러나, 실제 애플리케이션에는, 다수의 다성(polyphonic) 한자가 존재한다. 예컨대 다성 한자 "
Figure pct00001
"는 복수의 발음을 갖고 있으며, 그 대응하는 발음은 'le(4성)' 및 'yue(4성)'이다. 그 결과, 종래 기술의 출원에서의, 한자 저장 방법에 의해서는, 다성자(polyphonic character)는 구별할 수 없으며, 예컨대 현재 저장되는 다성자에 대응하는 특별한 발음은 구별할 수 없다.
상기 견지에서, 본 발명의 실시예는, 한자 정보 처리 방법 및 한자 정보 처리 장치를 제공하는 것이다. 이 기술적인 해법을 이용해서 애플리케이션에서 한자 정보를 저장함으로써, 한자 중에서 다성자를 구별해내고, 이로써 애플리케이션이 한자를 처리하는 과정에서 한자 발음 식별의 정확도를 향상시킬 수 있다.
본 발명의 실시예는 이하의 기술적인 해법에 의해 달성된다.
본 발명의 일 측면에 따라서, 한자 정보 처리 방법이 제공된다.
본 발명의 실시예에 따른 한자 정보 처리 방법은,
애플리케이션이, 사용자가 입력한 한자의 머신 코드를 결정하는 단계와,
저장되어 있는, 머신 코드와 이 머신 코드에 대응하는 한자의 한자 정보 사이의 대응 관계에 따라서, 사용자가 입력한 한자의 한자 정보를 결정하는 단계 - 이 한자 정보는 한자의 발음을 포함함 - 와,
사용자가 입력한 한자의 한자 정보에 따라서, 그 한자가 복수의 발음을 갖고 있다고 결정되면, 복수의 발음 중에서, 사용자가 입력한 한자의 현재 발음을 결정하는 단계와,
한자의 머신 코드, 및 이 결정된 현재 발음인 발음을 포함하는 한자 정보를 저장하는 단계를 포함한다.
본 발명의 실시예의 다른 측면에 따라서, 한자 정보 처리 장치가 제공된다.
본 발명에 따른 한자 정보 처리 장치는
사용자가 입력한 한자의 머신 코드를 결정하는 머신 코드 결정부와,
저장되어 있는, 머신 코드와 이 머신 코드에 대응하는 한자의 한자 정보 사이의 대응 관계에 따라서, 한자 정보를 결정하는 한자 정보 결정부 - 한자의 한자 정보는 머신 코드 결정부에 의해 결정된 머신 코드에 대응하고, 한자 정보는 그 한자의 발음을 포함함 - 와,
한자 정보 결정부에 의해 결정된 한자 정보에 따라서 사용자가 입력한 한자가 복수의 발음을 갖고 있다고 결정되면, 복수의 발음 중에서, 사용자가 입력한 한자의 현재 발음을 결정하는 현재 발음 결정부와,
머신 코드 결정부에 의해 결정된 한자의 머신 코드 및 현재 발음 결정부에 의해 결정된 현재 발음인 발음을 포함하는 한자 정보를 저장하는 한자 저장부
를 포함한다.
상술한, 본 발명의 실시예에 따른 기술적인 해법 중 적어도 하나에 의해서, 애플리케이션이, 사용자가 입력한 한자의 머신 코드를 결정하고, 머신 코드와 이 머신 코드에 대응하는 한자의 한자 정보 사이의, 저장되어 있는 대응 관계에 따라서, 사용자가 입력한 한자의 한자 정보를 결정하며 - 이 한자 정보는 한자의 발음을 포함함 - , 사용자가 입력한 한자의 한자 정보에 따라서, 그 한자가 복수의 발음을 갖고 있다고 결정되면, 복수의 발음 중에서, 사용자가 입력한 한자의 현재 발음을 결정하고, 한자의 머신 코드, 및 이 결정된 현재 발음인 발음을 포함하는 한자 정보를 저장한다. 이 기술적인 해법에 따라서, 한자의 머신 코드를 저장하는 것에 더해서, 한자의 현재 발음을 포함하는 한자 정보가 저장될 수 있으며, 이로써, 저장된 한자 정보를 통해서 다성자가 구별될 수 있다.
이어지는 상세한 설명에서는 본 발명의 다른 특성 및 이점이 설명될 것이며, 부분적으로는 상세한 설명으로부터 자명할 것이고, 혹은 본 발명은 구현함으로써 이해할 수 있을 것이다. 본 발명의 목적 및 다른 이점은 상세한 설명, 청구항 및 도면에 특별히 언급된 구조에 의해 구현되고 획득될 수 있다.
상세한 설명의 일부인 도면을 통해서 본 발명을 더욱 이해할 수 있을 것이며, 도면은 본 발명을 한정하는 것이 아니라, 본 발명의 실시예와 함께 본 발명을 설명하는데 이용된다.
도 1은 종래의 기술에 따른, 사용자가 입력한 한자를 저장하는 흐름도,
도 2는 본 발명의 실시예 1에 따른, 한자를 저장하는 흐름도,
도 3은 본 발명의 실시예 1에 따른 저장된 한자를 표시하는 흐름도,
도 4는 본 발명의 실시예 2에 따른 정보 저장 장치의 개략도이다.
애플리케이션에서 한자 정보를 저장할 때 다성자를 구별하는 구현 방식을 제공하기 위해서, 본 발명의 실시예에서는 한자 정보 처리 방법 및 한자 정보 처리 장치를 제공한다. 이하, 본 발명의 바람직한 실시예가 상세한 설명의 도면을 참조하면서 설명될 것이다. 본 발명의 바람직한 실시예는 단지 예시적으로 설명하는 것일 뿐, 본 발명의 범주를 한정하는 것으로 해석되어서는 안 된다는 것을 이해할 것이다. 또한, 본 출원의 실시예 및 그 실시예의 특성은, 서로 저촉되지 않는 한 서로 결합될 수 있다.
(실시예 1)
본 발명의 실시예 1에서는 한자 정보 처리 방법을 제공한다. 이 방법은 예컨대, Outlook, 휴대 전화의 주소록, Word, Excel 및 txt와 같은 애플리케이션에서 내부적으로 수행될 수 있다. 사용자가 이 애플리케이션을 통해서 입력한 한자를 한자 저장 방법을 이용해서 저장함으로써, 저장 처리에서 다성자를 구별할 수 있다.
도 2에 도시된 바와 같이, 본 발명의 실시예 1에 따른 한자 정보 처리 방법은 주로 하기의 단계를 포함한다.
단계 201에서, 사용자가 입력한 한자의 머신 코드를 결정한다.
단계 202에서, 운영 체제에 저장되어 있는, 머신 코드와 이 머신 코드에 대응하는 한자의 한자 정보 사이의 대응 관계에 따라서, 사용자가 입력한 한자의 한자 정보를 결정하며, 이 한자 정보는 그 한자의 발음을 포함하고 있다.
단계 203에서, 사용자가 입력한 한자의 한자 정보에 따라서, 그 한자가 복수의 발음을 갖고 있는지 결정하여, 그 한자가 복수의 발음을 갖고 있다고 결정되면, 단계 204 내지 단계 205를 수행하고, 갖고 있지 않다면, 단계 206을 수행한다.
단계 204에서, 복수의 발음 중에서, 사용자가 입력한 한자의 현재 발음을 결정한다.
단계 205에서, 그 한자의 머신 코드, 및 이 결정된 현재 발음인 발음을 포함하는 한자 정보를 저장하고, 사용자가 입력한 한자를 저장하는 처리를 종료한다.
단계 206에서, 한자의 머신 코드, 및 결정된 한자의 한자 정보를 저장하고, 사용자가 입력한 한자를 저장하는 처리를 종료한다.
도 2에 도시된 처리를 수행함으로써, 한자의 머신 코드를 저장하는 것에 더해서 적어도 하나의 발음을 포함한 한자의 한자 정보가 저장되며, 이로써 다성자의 구별이 달성될 수 있다.
본 발명의 실시예 1에서는, 한자의 머신 코드에 더해서, 사용자가 입력한 한자 정보를 각각의 애플리케이션에 대해서 저장하기 위해서, 한자의 한자 정보는 운영 체제에도 저장된다. 한자 정보는 그 한자의 적어도 하나의 발음을 포함하고, 그 한자가 다성자인 경우에는, 복수의 발음이 저장된다. 이에 기초해서, 한자 발음에 대응하는 성조 및/또는 획수와 같은 정보가 더 저장될 수 있다. 이하에서는, 운영 체제에 한자를 저장하는 예를 설명한다.
Figure pct00002
이 표에서, 성조 및 획수는 선택적으로 저장될 수 있다.
본 발명의 실시예 1은 또한 상기 단계 204에 대응하는 바람직한 구현예를, 즉, 사용자가 입력한 한자의 현재 발음을 복수의 발음 중에서 결정하는 바람직한 구현예를 제공한다. 특히, 사용자가 입력한 한자의 현재 발음은 다음과 같은 방식으로 결정될 수 있다.
첫번째 방식
복수의 발음이 사용자에게 표시되고, 표시된 복수의 발음 중에서 사용자가 선택한 발음이 현재 발음으로서 결정된다. 이 첫번째 방식에서, 한자의 현재 발음은 그 한자를 입력한 사용자에 의해 선택된다.
두번째 방식
사용자가 입력한 한자의 문맥에 따라서, 그 문맥 내에서의 한자의 발음이 복수의 발음 중에서 현재 발음으로 결정된다. 이 방식을 지원하기 위해서, 서로 다른 문맥 내의 다성자의 발음이 사전에 저장될 수 있다. 예컨대, 다성자 '
Figure pct00003
'의 경우, '
Figure pct00004
'에서는 'le'로 발음되지만, '
Figure pct00005
'에서는 'yue'로 발음된다. 이러한 정보를 저장함으로써, 한자의 현재 발음은, 사용자가 입력한 한자의 문맥에 따라서 결정될 수 있다.
본 발명의 일 실시예에서, 도 2에 도시된 처리에 따라서 저장된 한자의 한자 정보는 그 한자의 발음만을 포함할 수 있다. 한자가 다성자인 경우에, 그 한자 정보에 포함된 한자의 발음이 현재 발음으로 결정된다. 예컨대, 한자 '
Figure pct00006
'의 경우에는, 하기 표에서와 같이 2개의 발음이 운영 체제에 저장된다.
Figure pct00007
사용자가 입력한 '
Figure pct00008
'의 현재 발음이 도 2에 도시된 흐름도에 따라서 'yue'로 결정되면, 사용자가 입력한 '
Figure pct00009
'에 대한, 본 발명의 실시예 1의 도 2에 도시된 처리에 따라서 저장된 정보는 다음을 포함할 수 있다.
Figure pct00010
이에 기초해서, 운영 체제에 저장된 한자 정보가 그 한자의 성조 정보 및/또는 획수에 관한 정보도 포함하고 있다면, 도 2에 도시된 흐름도에 따라서 저장된 한자 정보는 그 한자의 성조 정보 및/또는 획수에 관한 정보를 더 포함할 수 있다. 예컨대, '
Figure pct00011
'의 성조 정보 및/또는 획수에 관한 정보가 운영 체제에 저장되어 있는 경우에는, 본 발명의 실시예 1의 도 2에 도시된 처리에 따라서 '
Figure pct00012
'에 대해 저장된 정보는 다음 표에 표시된다(여기서 결정된 현재 발음은 'yue'이다).
Figure pct00013
본 발명의 실시예 1의 기술적인 해법에 따라서, 애플리케이션이 사용자가 입력한 한자를 저장하는 것에 더해서, 그 한자의 발음 및 기타 정보를 포함한 한자 정보가 저장된다. 따라서, 한자 정보를 표시할 때 한자 정보 읽기를 돕는 기능을 지원하기 위해서, 특히 상기 단계 205 혹은 단계 206을 수행하기 전에, 즉 한자의 한자 정보 머신 코드를 저장하기 전에 다음의 단계,
한자를 표시하는 것과 아울러 그 한자의 한자 정보를 표시할지 결정하고, 한자의 한자 정보 및 머신 코드를 저장할 때 그 한자의 한자 정보를 표시할지 여부에 대한 결정 정보를 저장하는 단계가 수행된다.
구체적으로, 한자를 표시하는 것과 아울러 그 한자의 한자 정보를 표시할지 결정하는 방법은 다음과 같다.
사용자는 그 한자의 한자 정보를 표시할지 여부를 선택하게 되고, 사용자의 선택 결과가 수신된다.
바람직한 실시예에 따라서, 저장된, '
Figure pct00014
'와 같은 사용자가 입력한 한자에 대한 정보는 하기 표에 표시되어 있다(여기서 현재 발음은 'yue'이다)
Figure pct00015
상기 표에서, 한자 정보를 표시할지 여부에 대한 정보는 '예' 혹은 '아니오'의 결정 정보가 될 수 있으며, 선택되어 표시될 한자 정보가 될 수도 있다. 예컨대, 사용자가 발음만을 표시할 것으로 예상되는 경우에는, 한자 정보를 표시할지 여부에 대한 정보는 '발음을 표시'가 될 수 있고, 사용자가 발음과 성보를 표시할 것으로 예상되는 경우에는, 한자 정보를 표시할지 여부에 대한 정보는 '발음과 성조를 표시'가 될 수 있다.
한자 정보를 표시할지 여부에 대한 정보를 저장하는 상기 바람직한 실시예에 따라서, 도 3에 도시된 바와 같이 한자를 표시하는 것은 다음 단계를 포함한다.
단계 301에서, 저장된 한자의 정보를 획득한다.
단계 301에서 획득한, 저장된 한자의 정보는 한자 정보, 한자의 머신 코드 및 한자 정보를 표시할지 여부에 대한 결정 정보를 포함하고 있다.
단계 302에서, 획득한 저장된 정보에 따라서, 한자의 한자 정보를 표시할지 여부를 결정하고, 한자의 한자 정보를 표시하는 경우에는 단계 303을 수행하고, 표시하지 않는 경우에는 단계 304를 수행한다.
단계 303에서, 한자를 표시함과 아울러 한자의 한자 정보를 표시하고, 처리를 종료한다.
단계 304에서, 한자를 직접 표시하고 처리를 종료한다.
도 3에 도시된 처리에 따라서, 사용자가 한자의 한자 정보를 표시하는 것을 선택한 경우에, 저장된 '
Figure pct00016
'를 표시하는 방식은 하기 표에 도시된 바와 같다.
Figure pct00017
본 발명의 실시예에 따른 바람직한 실시예에서, 한자는 저장된 한자 정보에 따라서 저장될 수도 있다. 구체적으로, 한자의 한자 정보 및 머신 코드는 다음과 같은 방식으로 저장될 수 있다.
한자의 한자 정보에 따라서, 저장된 한자의 한자 정보 내에서의, 한자의 한자 정보의 분류 시퀀스를 결정하고, 결정된 분류 시퀀스에 따라서 한자의 한자 정보 및 머신 코드를 저장하는 단계를 수행하거나,
이와 달리,
한자의 머신 코드에 따라서, 저장된 한자의 머신 코드 내에서의, 한자의 머신 코드의 분류 시퀀스를 결정하고, 결정된 분류 시퀀스에 따라서 한자의 한자 정보 및 머신 코드를 저장하는 단계를 수행한다.
상기 바람직한 실시예에서, 한자의 한자 정보에 따라서, 한자의 저장된 한자 정보 내에서 한자의 한자 정보의 분류 코드를 결정하는 단계는, 다양한 분류 규칙에 따라서 수행될 수 있다. 예컨대, 한자 정보는 그 한자의 한자 정보 내의 발음에 따른 음성 시퀀스 표에 따라서 분류될 수도 있고, 혹은 한자 정보는, 그 한자의 한자 정보에 포함된 성조에 따라서 분류될 수도 있으며, 혹은 한자 정보는 그 한자의 한자 정보에 포함된 획수에 따라서, 획수가 많은 순서로 혹은 적은 순서로 분류될 수도 있다. 특정한 분류 규칙이 필요에 따라서 유연하게 결정될 수 있으며, 본 명세서에서는 일일이 열거하지 않는다.
(실시예 2)
본 발명의 실시예 2는 한자 정보 처리 장치를 제공한다. 이 처리 장치에 의해 한자가 저장되어서 다성자가 구별될 수 있다.
도 4에 도시된 바와 같이, 본 발명의 실시예 2에 의해 제공되는 정보 처리 장치는 주로,
머신 코드 결정부(401), 한자 정보 결정부(402), 현재 발음 결정부(403) 및 한자 저장부(404)를 포함하고,
여기서,
머신 코드 결정부(401)는 사용자가 입력한 한자의 머신 코드를 결정하도록 구성된다.
한자 정보 결정부(402)는, 운영 체제에 의해 저장된, 머신 코드와, 머신 코드에 대응하는 한자의 한자 정보 사이의 대응 관계에 따라서, 머신 코드 결정부(401)에 의해 결정된 머신 코드에 대응하는 한자의 한자 정보를 결정하도록 구성되고, 이 한자 정보는 그 한자의 발음을 포함하고 있다.
현재 발음 결정부(403)는, 한자 정보 결정부(402)에 의해 결정된 한자 정보에 따라서, 사용자가 입력한 한자가 복수의 발음을 갖고 있다고 결정되면, 복수의 발음 중에서, 사용자가 입력한 한자의 현재 발음을 결정하도록 구성된다.
한자 저장부(404)는, 머신 코드 결정부(401)가 결정한 한자의 머신 코드, 및 현재 발음 결정부(403)에 의해서 현재 발음으로서 결정된 발음을 포함하는 한자 정보를 저장하도록 구성된다.
실시예 2에 따른 바람직한 구현예에서, 도 4에 도시된 장치에 포함된 현재 발음 결정부(403)는 구체적으로,
한자의 복수의 발음을 사용자에게 표시하고, 표시된 복수의 발음 중에서 사용자가 선택한 발음을 현재 발음으로서 결정하거나,
혹은,
사용자가 입력한 한자의 문맥에 따라서, 한자의 복수의 발음 중에서 그 문맥 내의 한자의 발음을 현재 발음으로서 결정하도록 구성된다.
본 발명의 실시예 2에 따른 바람직한 구현예에서, 도 4에 도시된 장치에 포함된 한자 정보 결정부(402)는 구체적으로,
운영 체제에 의해 저장된, 머신 코드와, 이 머신 코드에 대응하는 한자의 한자 정보 사이의 대응 관계에 따라서, 머신 코드 결정부(401)에 의해 결정된 머신 코드에 대응하는 한자의 한자 정보를 결정하도록 구성되며, 한자 정보는 한자의 발음을 포함하고, 또한 한자의 성조 및/또는 획수도 포함한다.
본 발명의 실시예 2에 따른 바람직한 구현예에서, 도 4에 도시된 장치에 포함된 한자 저장부(404)는 또한,
한자를 표시함과 아울러 한자의 한자 정보를 표시할지 여부를 결정하고, 한자의 머신 코드를 저장함과 아울러 한자의 한자 정보를 표시할지 여부에 대한 결정 정보를 저장하도록 구성되며, 한자 정보는 결정된 현재 발음인 발음을 포함하고 있다.
본 발명의 실시예 2에 따른 바람직한 구현예에서, 도 4에 도시된 장치에 포함된 한자 저장부(404)는 특히,
한자 정보 결정부(402)에 의해 결정된 한자 정보에 따라 저장된 한자의 한자 정보에서 한자의 한자 정보의 분류 순서를 결정하고, 결정된 분류 순서에 따라, 한자의 머신 코드 및 결정된 현재 발음인 발음을 포함하는 한자 정보를 저장하도록 구성되거나, 혹은
머신 코드 결정부(401)에 의해 결정된 한자의 머신 코드에 따라, 저장된 한자의 머신 코드에서 한자의 머신 코드의 분류 순서를 결정하고, 결정된 분류 순서에 따라 한자의 머신 코드 및 결정된 현재 발음인 발음을 포함하는 한자 정보를 저장하도록 구성된다.
한자 정보 처리 장치에 포함된 상기 유닛들은, 그 장치에 의해 수행되는 기능에 따라서 국부적으로 분할되어 있을 뿐이라는 것을 이해할 것이다. 실제 애플리케이션에서, 이 유닛들은 통합될 수도 있고 분할될 수도 있다. 본 발명의 실시예 2에 따른 한자 정보 처리 장치에 의해 수행되는 기능은 본 발명의 상기 실시예 1에 따른 한자 정보 처리 방법의 처리에 일대일로 대응하고 있다. 이 장치에 의해 수행되는 더 구체적인 처리 플로우에 대해서는 상기 실시예 1에서 상세하게 설명되었으며, 따라서, 여기서는 반복하지 않는다.
본 발명의 실시예에 따른 상기 설명한 기술적인 해법 중 적어도 하나에 의해서, 애플리케이션은 사용자가 입력한 한자의 머신 코드를 결정하고, 운영 체제에 저장된 머신 코드와 이 머신 코드에 대응하는 한자의 한자 정보 사이의 대응 관계에 따라서 사용자가 입력한 한자의 한자 정보를 결정하되, 이 한자의 한자 정보는 그 한자의 발음을 포함하고 있고, 한자 정보에 따라서 그 한자가 복수의 발음을 포함하고 있다고 결정되면, 복수의 발음 중에서 사용자가 입력한 한자의 현재 발음을 결정해서, 한자의 머신 코드 및 결정된 현재 발음인 발음을 포함한 한자 정보를 저장한다. 기술적인 해법에 따라서, 한자의 머신 코드를 저장하는 것에 더해서 한자의 현재 발음을 포함한 한자 정보가 저장될 수 있고, 이로써 저장된 한자를 통해서 다성자가 구별될 수 있다.
당업자에게는, 본 발명의 사상 및 범주로부터 벗어남없이, 본 발명에 대한 다양한 변경 및 수정이 있을 수 있다는 것을 이해할 것이다. 따라서, 본 발명의 이들 변경 및 수정이 청구의 범위 및 본 발명의 동일 기술 내에 있다면, 본 발명은 이들 변경 및 수정도 포함한다.

Claims (10)

  1. 한자 정보 처리 방법에 있어서,
    사용자가 입력한 한자의 머신 코드를 결정하는 단계와,
    머신 코드와 한자 정보 사이의 사전 저장된 대응 관계에 따라서, 상기 사용자가 입력한 상기 한자의 한자 정보를 결정하는 단계 - 상기 한자 정보는 상기 한자의 발음을 포함함 - 와,
    상기 결정된 한자 정보에 따라서, 상기 사용자가 입력한 상기 한자가 복수의 발음을 갖고 있다고 결정되면, 상기 복수의 발음 중에서, 상기 사용자가 입력한 상기 한자의 현재 발음을 결정하는 단계와,
    상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보 및 상기 머신 코드를 저장하는 단계를 포함하는
    한자 정보 처리 방법.
  2. 제 1 항에 있어서,
    상기 복수의 발음 중에서, 상기 사용자가 입력한 상기 한자의 현재 발음을 결정하는 단계는,
    상기 복수의 발음을 상기 사용자에게 표시하고, 상기 표시된 복수의 발음 중에서 상기 사용자가 선택한 발음을 상기 현재 발음으로서 결정하는 단계를 포함하거나, 혹은
    상기 사용자가 입력한 상기 한자의 문맥에 따라서, 상기 복수의 발음 중에서, 상기 문맥 내에서의 상기 사용자가 입력한 상기 한자의 발음을 상기 현재 발음으로서 결정하는 단계를 포함하는
    한자 정보 처리 방법.
  3. 제 1 항에 있어서,
    상기 한자 정보는 상기 한자의 성조(tone) 및/또는 획수를 더 포함하는
    한자 정보 처리 방법.
  4. 제 1 항 또는 제 3 항에 있어서,
    상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보 및 상기 머신 코드를 저장하는 단계 이전에,
    상기 사용자가 입력한 상기 한자를 표시함과 아울러, 상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함한 상기 한자 정보를 표시할지 여부를 결정하는 단계와,
    상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보 및 상기 머신 코드를 저장할 때, 상기 사용자가 입력한 한자의 상기 현재 발음을 포함한 상기 한자 정보를 표시할지 여부에 대한 결정 정보를 저장하는 단계를 더 포함하는
    한자 정보 처리 방법.
  5. 제 1 항 또는 제 3 항에 있어서,
    상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보 및 상기 머신 코드를 저장하는 단계는,
    상기 한자의 상기 한자 정보에 따라서, 한자의 저장된 한자 정보 내에서의, 상기 사용자가 입력한 상기 한자의 상기 한자 정보의 상기 분류 시퀀스를 결정하고, 상기 결정된 분류 시퀀스에 따라서, 상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보 및 상기 머신 코드를 저장하는 단계를 포함하거나,
    상기 사용자가 입력한 상기 한자의 상기 머신 코드에 따라서, 한자의 저장된 머신 코드 내에서의, 상기 사용자가 입력한 상기 한자의 상기 머신 코드의 상기 분류 시퀀스를 결정하고, 상기 결정된 분류 시퀀스에 따라서, 상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보 및 상기 머신 코드를 저장하는 단계를 포함하는
    한자 정보 처리 방법.
  6. 한자 정보 처리 장치에 있어서,
    사용자가 입력한 한자의 머신 코드를 결정하도록 구성된 머신 코드 결정부와,
    머신 코드와 한자 정보 사이의 사전 저장된 대응 관계에 따라서, 사용자가 입력한 한자의 한자 정보를 결정하도록 구성된 한자 정보 결정부 - 상기 한자의 한자 정보는 상기 머신 코드 결정부에 의해 결정된 상기 머신 코드에 대응하고, 상기 한자 정보는 그 한자의 발음을 포함함 - 와,
    상기 한자 정보 결정부에 의해 결정된 상기 한자 정보에 따라서 상기 사용자가 입력한 상기 한자가 복수의 발음을 갖고 있다고 결정되면, 상기 복수의 발음 중에서, 상기 사용자가 입력한 상기 한자의 현재 발음을 결정하도록 구성된 현재 발음 결정부와,
    상기 머신 코드 결정부에 의해 결정된 상기 한자의 상기 머신 코드, 및 상기 현재 발음 결정부에 의해 결정된 상기 현재 발음을 포함하는 상기 한자 정보를 저장하는 한자 저장부를 포함하는
    한자 정보 처리 장치.
  7. 제 6 항에 있어서,
    상기 현재 발음 결정부는 특히,
    상기 한자의 상기 복수의 발음을 상기 사용자에게 표시하고, 상기 표시된 복수의 발음 중에서 상기 사용자가 선택한 발음을 상기 현재 발음으로서 결정하도록 구성되거나,
    상기 사용자가 입력한 상기 한자의 문맥에 따라서, 상기 복수의 발음 중에서, 상기 문맥 내에서의 상기 사용자가 입력한 상기 한자의 발음을 상기 현재 발음으로서 결정하도록 구성되는
    한자 정보 처리 장치.
  8. 제 6 항에 있어서,
    상기 한자 정보 결정부는 특히,
    머신 코드와 한자 정보 사이의 사전 저장된 대응 관계에 따라서, 상기 머신 코드 결정부에 의해 결정된 상기 머신 코드에 대응하는 상기 사용자가 입력한 상기 한자의 상기 한자 정보를 결정하도록 구성되며,
    상기 사용자가 입력한 상기 한자의 상기 한자 정보는 상기 한자의 발음, 및 상기 한자의 성조(tone) 및/또는 획수를 포함하는
    한자 정보 처리 장치.
  9. 제 6 항 또는 제 8 항에 있어서,
    상기 한자 저장부는 또한,
    상기 사용자가 입력한 상기 한자를 표시함과 아울러 상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보를 표시할지 여부를 결정하고, 상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보 및 상기 머신 코드를 저장함과 아울러, 상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보를 표시할지 여부에 대한 결정 정보를 저장하도록 구성되는
    한자 정보 처리 장치.
  10. 제 6 항 또는 제 8 항에 있어서,
    상기 한자 저장부는 특히,
    상기 한자 정보 결정부에 의해 결정된 상기 한자 정보에 따라서, 한자의 저장된 한자 정보 내에서의, 상기 사용자가 입력한 상기 한자의 상기 한자 정보의 상기 분류 시퀀스를 결정하고, 상기 결정된 분류 시퀀스에 따라서, 상기 사용자가 입력한 상기 한자의 상기 현재 발음을 포함하는 상기 한자 정보 및 상기 머신 코드를 저장하도록 구성되거나,
    상기 머신 코드 결정부에 의해 결정된, 상기 사용자가 입력한 상기 한자의 상기 머신 코드에 따라서, 한자의 저장된 머신 코드 내에서의, 상기 사용자가 입력한 상기 한자의 상기 머신 코드의 상기 분류 시퀀스를 결정하고, 상기 결정된 분류 시퀀스에 따라서, 상기 사용자가 입력한 상기 한자의 상기 결정된 현재 발음을 포함하는 상기 한자 정보 및 상기 머신 코드를 저장하도록 구성되는
    한자 정보 처리 장치.
KR1020137018463A 2011-01-04 2012-01-04 한자 정보 처리 방법 및 한자 정보 처리 장치 KR20140018859A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110000513.9A CN102567296B (zh) 2011-01-04 2011-01-04 一种汉字信息的处理方法及汉字信息的处理装置
CN201110000513.9 2011-01-04
PCT/CN2012/000003 WO2012092845A1 (zh) 2011-01-04 2012-01-04 一种汉字信息的处理方法及汉字信息的处理装置

Publications (1)

Publication Number Publication Date
KR20140018859A true KR20140018859A (ko) 2014-02-13

Family

ID=46412741

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137018463A KR20140018859A (ko) 2011-01-04 2012-01-04 한자 정보 처리 방법 및 한자 정보 처리 장치

Country Status (4)

Country Link
US (1) US20130289974A1 (ko)
KR (1) KR20140018859A (ko)
CN (1) CN102567296B (ko)
WO (1) WO2012092845A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103853779A (zh) * 2012-12-04 2014-06-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN104142909B (zh) * 2014-05-07 2016-04-27 腾讯科技(深圳)有限公司 一种汉字注音方法及装置
CN104317505A (zh) * 2014-10-12 2015-01-28 渤海大学 一种汉语拼音的输出***及方法
CN108475478A (zh) * 2015-11-06 2018-08-31 文基圣 彩色声调显示***及其方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1040278A (zh) * 1988-08-09 1990-03-07 于永源 汉字多语种术语数据库***实现方法
CN1150275A (zh) * 1995-11-12 1997-05-21 林光荣 计算机文字-读音一体内码技术
CN1068127C (zh) * 1996-10-04 2001-07-04 吴胜远 文字信息处理方法和装置
CN100392640C (zh) * 1997-04-15 2008-06-04 英业达股份有限公司 读音符号自动标注的方法
CN1105979C (zh) * 1997-08-15 2003-04-16 英业达股份有限公司 汉语多音字的自动分析及处理的方法
CN1421803A (zh) * 2001-11-30 2003-06-04 英业达股份有限公司 可处理多音字的拼音/注音转换***及方法
CA2496872C (en) * 2004-03-17 2010-06-08 America Online, Inc. Phonetic and stroke input methods of chinese characters and phrases
CN100371987C (zh) * 2004-05-13 2008-02-27 深圳市移动核软件有限公司 使汉字自动发音的方法及使手机朗读短消息的方法
US20100235163A1 (en) * 2009-03-16 2010-09-16 Cheng-Tung Hsu Method and system for encoding chinese words
CN101930474A (zh) * 2010-09-14 2010-12-29 闫卫 汉字简易笔划检索方法

Also Published As

Publication number Publication date
CN102567296B (zh) 2016-03-30
WO2012092845A8 (zh) 2012-09-07
WO2012092845A1 (zh) 2012-07-12
CN102567296A (zh) 2012-07-11
US20130289974A1 (en) 2013-10-31

Similar Documents

Publication Publication Date Title
JP6413391B2 (ja) 変換装置、変換プログラム、及び変換方法
JP5860171B2 (ja) 入力処理方法及び装置
US20080294982A1 (en) Providing relevant text auto-completions
KR20070072723A (ko) 발음 기호를 이용한 문자열 매칭 방법 및 시스템과 그방법을 기록한 컴퓨터 판독 가능한 기록매체
JP2012079252A (ja) 情報端末装置、文字入力方法および文字入力プログラム
JP6122800B2 (ja) 電子機器、文字列表示方法、および文字列表示プログラム
JP2002290510A (ja) 特殊文字を用いて情報を携帯装置に入力するための方法および装置
KR20140018859A (ko) 한자 정보 처리 방법 및 한자 정보 처리 장치
KR101242210B1 (ko) 성조 선택 기능을 갖는 터치스크린을 이용한 중국어 입력 방법
CN1359514A (zh) 多模式数据输入设备
KR20090120442A (ko) 중국어 입력 시스템 및 방법
CN1889171A (zh) 用于识别字符/字符串的语音识别方法和***
TW201211791A (en) Chinese character input method, apparatus, and associated memory medium
KR100769032B1 (ko) 텍스트 세그먼트의 합성된 발음을 위한 문자 대 사운드변환
KR20200132070A (ko) 한자 입력 장치 및 방법
CN106648144A (zh) 基于数字键盘的词汇快捷输入方法及其装置
JP2009258369A (ja) 音声認識辞書生成装置及び音声認識処理装置
JP4675265B2 (ja) 声調及び筆画によって入力文字を決定する携帯端末及びプログラム
KR100562014B1 (ko) 이동통신 단말기에서의 중국어 문자 검색장치 및 방법
JP2005284865A (ja) 広東語入力プログラム
KR100741639B1 (ko) 기본자를 이용한 문자 표시방법
CN117917621A (zh) 汉字输入方法和***以及键盘
JP2011138281A (ja) 情報機器、表示方法及びプログラム
KR100606807B1 (ko) 중문 데이터베이스의 실시간 검색 및 정렬 방법, 그리고그를 위한 단말기
JP2021085996A (ja) 音声認識システム、音声認識方法

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
AMND Amendment