KR20010003037A - Multilingual Input Device - Google Patents

Multilingual Input Device Download PDF

Info

Publication number
KR20010003037A
KR20010003037A KR1019990023164A KR19990023164A KR20010003037A KR 20010003037 A KR20010003037 A KR 20010003037A KR 1019990023164 A KR1019990023164 A KR 1019990023164A KR 19990023164 A KR19990023164 A KR 19990023164A KR 20010003037 A KR20010003037 A KR 20010003037A
Authority
KR
South Korea
Prior art keywords
input
language
string
user
text
Prior art date
Application number
KR1019990023164A
Other languages
Korean (ko)
Inventor
장충엽
Original Assignee
장충엽
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 장충엽 filed Critical 장충엽
Priority to KR1019990023164A priority Critical patent/KR20010003037A/en
Publication of KR20010003037A publication Critical patent/KR20010003037A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

PURPOSE: A device for inputting many languages is provided to easily input foreign language or foreign sentence into a computer. CONSTITUTION: An input device inputs a first character stream of a primary language. A language dictionary database(22) stores dictionary data of many languages containing the primary language. A searching device(16) searches the first character stream or more than one character streams of a selected language from the languages dictionary database. A selecting device(24) displays a selected character stream on an application program input screen by selecting one of the searched character streams. A setting device(26) sets a kind of the primary language and operating environment variables.

Description

다국어 입력기{Multilingual Input Device}Multilingual Input Device

본 발명은 컴퓨터 소프트웨어에 관한 것으로서, 보다 상세하게는 그래픽 유저 인터페이스를 채택하는 컴퓨터 시스템에서의 언어 입력 소프트웨어에 관한 것이다.The present invention relates to computer software, and more particularly to language input software in a computer system employing a graphical user interface.

컴퓨터 시스템을 사용함에 있어서는 자국어 이외의 언어로 된 데이터를 입력해야만 하는 경우가 종종 있다. 이러한 경우의 예를 들면, 워드 프로세서를 사용하여 서류 작업을 하는 경우나, 웹브라우저를 사용하여 월드와이드웹(WWW)에서 원하는 정보를 검색하기 위해 키워드를 입력하는 경우, 또는 데이터베이스에 외국인의 성명 및 주소 등을 입력하는 경우를 들 수 있다. 이러한 응용 분야 중에서도 워드 프로세서를 사용하여 작업을 하는 경우에 있어서는 사용자가 외국어를 입력함에 있어 큰 어려움을 느끼지 않는데, 이는 대부분의 워드 프로세서가 특수문자들을 개별적으로 호출하여 삽입할 수 있는 루틴을 가지고 있기 때문이다.In using a computer system, it is often necessary to input data in a language other than the native language. For example, if you're working on paperwork using a word processor, entering a keyword to search for information on the World Wide Web using a web browser, or entering a foreigner's name and For example, an address may be input. Among these applications, when working with a word processor, the user does not have difficulty in entering a foreign language, since most word processors have routines that can call and insert special characters individually. to be.

그렇지만, WWW에서 정보를 검색하는 경우나 데이터베이스 작업을 함에 있어서는, 프로그램이 이러한 외국어 특수문자를 지원하는 경우가 거의 없기 때문에 사용자가 큰 낭패감을 느끼게 되는 경우가 적지 않다. 이에 따라 WWW 상에서 정보 검색을 하는 경우에는, 영어로 검색어를 입력해서 유사한 종류의 페이지(들)을 검색하여 해당 언어 예컨대 일본어로 된 단어를 찾은 후, 해당 외국어 단어를 드래그-앤-드롭(Drag-and-Drop) 방식으로 검색어 창에 복사한 후 재검색을 행하는 불편한 절차를 따르게 되는 것이 통례이다. 한편, 데이터베이스에 영어 이외의 제2 외국어 자료를 입력하는 경우에는, 해당 제2 외국어로 입력하는 대신에 영어로 음독을 한 후 영문자를 사용하여 입력을 하게 되는 것이 일반적이다.However, when searching for information on the WWW or when working with a database, the user rarely feels a big frustration because the program rarely supports such foreign language special characters. Accordingly, in the case of information search on the WWW, the user inputs a search word in English to search similar page (s) to find a word in a corresponding language such as Japanese, and then drags and drops the foreign language word. It is customary to follow the inconvenient procedure of re-searching after copying to the search word window using the and-Drop) method. On the other hand, when inputting a second foreign language material other than English into the database, it is common to input English using English characters after reading aloud in English instead of inputting the second foreign language.

외국어 작업을 컴퓨터에서 행함에 있어서 이와 같이 어려움을 겪게 되는 가장 큰 이유로는 각 국가마다 언어 코드 체계가 상이하다는 점을 들 수 있다. 즉, 우리 나라의 경우 KS 완성형(KSC-5601)이나 euc-kr와 같은 코드 체계가 많이 사용되는데, 마찬가지로 일본에서는 Shift JIS 코드나 EUC 코드 등이 제정되어 사용되고 있다. 한편, 중국어를 위한 코드의 경우 중국에서 주로 사용하는 간체에 대한 코드로서 GB2312 코드나 HZ(hz-gb-2312) 코드 등이 있고, 대만에서 주로 사용하는 번체 코드로서 BIG5 코드 등이 사용되고 있다.The biggest reason for this difficulty in doing foreign language work on a computer is that the language codes are different in each country. That is, in Korea, a code system such as KS completion type (KSC-5601) or euc-kr is frequently used. Similarly, in Japan, Shift JIS code or EUC code is used. On the other hand, in the case of the code for Chinese, there are GB2312 code, HZ (hz-gb-2312) code, etc. as a code for Simplified Chinese, which is mainly used in China, and BIG5 code is used as the Traditional code, which is mainly used in Taiwan.

특히, 동아시아 3개국에서 많이 사용하는 한자의 경우, 한국, 일본 및 중국에서 사용되는 코드 체계들이 각 문자를 서로 다른 코드 값으로 부호화하고 있기 때문에, 동일한 글자라 할지라도 이를 나타내는 코드는 나라마다 서로 상이하다. 이에 따라, 일본어 검색 엔진에서 "특허"(한자)라는 검색어를 사용하여 원하는 자료를 검색하고자 하는 경우, 컴퓨터 사용자의 컴퓨터 검색어 창에는 "특허"(한자)가 정확히 표시된다 해도 이에 대해 실제 검색 작업을 수행하는 일본어 검색 엔진 호스트에서는 이 검색어를 엉뚱한 문자열로 해석하여 검색을 하게 되기 때문에, 원하는 자료를 검색할 수 없게 되는 것이다.In particular, in the case of Chinese characters that are widely used in three East Asian countries, the codes used in Korea, Japan, and China encode each character with a different code value. Do. As a result, if a Japanese search engine wants to search for the desired data using the term "patent" (kanji), the computer user's computer search window displays "patent" (kanji) correctly. The running Japanese search engine host interprets the search query as an incorrect string, so the user cannot search for the desired data.

이러한 문제점을 조금이나마 해소하기 위해 유니코드 체계가 제안되었는데, 앞으로 상용화될 윈도우즈2000(등록상표일 수 있음)이나 그밖의 프로그램에서는 이러한 유니코드 체계가 본격적으로 채용될 것으로 전망된다. 유니코드는 전세계 주요 언어의 문자들을 16비트로 표시되는 65,536 자의 영역 안에 통합하는 것으로서, 우리 나라 한글의 경우 1995년 3월에 11,172자의 연속된 공간이 할당되어 이 공간 내에서 각 글자가 배정되어 사용되는 것으로 결정된 바 있다. 유니코드 체계에 따르면 한국, 중국 및 일본의 한자도 통합된 문자(Unified Ideographs) 코드로서 사용되기 때문에, 위에서 기술한 문자 및 자료의 호환성이 조금은 해소될 수 있을 것으로 예상된다.In order to solve this problem, a Unicode scheme has been proposed, and it is expected that the Unicode scheme will be adopted in Windows 2000 (which may be a registered trademark) and other programs. Unicode integrates the characters of the world's major languages into an area of 65,536 characters represented by 16 bits. In Korea, Korean, in March 1995, 11,172 consecutive spaces were allocated and each letter was allocated and used. It was decided that. According to the Unicode system, Chinese, Korean, and Japanese characters are also used as Unified Ideographs codes, so the compatibility of the characters and data described above is expected to be resolved.

그렇지만, 유니코드 체계가 정착된다고 해도 웹브라우징이나 데이터베이스처리에 있어서 외국어 입력의 어려움이 충분히 해소된다고 할 수는 없다. 그 이유로는 첫째로 문자 레벨에서 통일성을 확보한다는 것이 단어 레벨에서의 통일성까지 담보하는 것은 아니라는 것이다. 즉, 각 국가마다 특정 개념을 나타내는 단어를 구성하는 한자들이 서로 다른 경우가 많고 동일한 단어라고 의미가 상이한 경우가 많기 때문에, 개별 문자의 입력과 표시가 가능해진다 해도 구체적으로 단어를 입력함에 있어서는 여전히 어려움이 남게 된다. 또 다른 이유로는 우리 나라와 중국 및 일본에서 사용하는 단어가 모두 한자만으로 되어 있는 것이 아니라는 점을 들 수 있다. 즉, 우리 나라에서는 순수 우리말이 많이 있음은 물론이고, 한자어다 해도 실제 웹 문서상에 표시되는 문자나 데이터베이스에 수록되는 데이터는 한글로 되어 있는 경우가 대부분이고, 이는 일본의 경우에도 마찬가지이다. 중국어의 경우에 있어서는 간체가 많이 사용되는데, 이러한 간체 문자는 우리 나라나 일본에서는 거의 사용하지 않는 것들이다. 따라서, 각 외국어 단어들을 정확히 숙지하고 있지 않는 한, 컴퓨터 상에서 외국어 문장이나 문자열을 입력하는 것은 여간 어려운 것이 아니다.However, even if the Unicode system is established, the difficulty of inputting foreign languages in web browsing or database processing cannot be solved sufficiently. The reason for this is that, firstly, ensuring uniformity at the letter level does not guarantee uniformity at the word level. In other words, because the Chinese characters that form a word representing a particular concept in each country are different from each other and the same word is often different from each other, even if it is possible to input and display individual letters, it is still difficult to enter a specific word. Will remain. Another reason is that not all words used in our country, China, and Japan are single characters. In other words, in our country, there are many pure Korean words, and even if it is a Chinese character, most of the characters displayed on a web document or data contained in a database are in Korean. This is also the case in Japan. In the case of Chinese, Simplified Chinese is used. These Simplified Chinese are rarely used in Korea or Japan. Therefore, inputting foreign language sentences or strings on a computer is not difficult unless you are familiar with each foreign language word.

따라서, 단어 또는 문장 레벨에서 외국어를 실질적으로 용이하게 입력할 수 있게 해주는 방안이 강하게 요구되고 있는데, 이러한 요구는 인터넷과 컴퓨터의 대중화로 인해 외국어 입력이 필요한 경우가 빈번해짐에 따라 더욱 절실해지고 있다.Therefore, there is a strong demand for a method of easily inputting a foreign language at a word or sentence level, and this demand becomes more urgent as foreign language input is frequently required due to the popularization of the Internet and computers.

본 발명은 상술한 문제점을 해결하기 위하여 안출된 것으로서, 컴퓨터 상에서 외국어 단어 또는 문장을 용이하게 입력할 수 있게 해주는 다국어 입력기를 제공하는 것을 그 기술적 과제로 한다.SUMMARY OF THE INVENTION The present invention has been made in view of the above-described problem, and it is an object of the present invention to provide a multilingual input device that enables easy input of foreign language words or sentences on a computer.

도 1은 본 발명에 의한 다국어 입력기의 바람직한 실시예의 블록도이다.1 is a block diagram of a preferred embodiment of a multilingual input device according to the present invention.

도 2는 도 1의 다국어 입력기의 동작을 설명하기 위한 흐름도이다.2 is a flowchart illustrating an operation of the multilingual input device of FIG. 1.

도 3은 도 2에 있어서 검색 및 선택 단계를 보다 상세하게 보여주는 흐름도이다.FIG. 3 is a flowchart showing the search and selection steps in FIG. 2 in more detail.

도 4는 도 1에 도시된 다국어 사전 데이터베이스의 구조를 보여주는 도면이다.FIG. 4 is a diagram illustrating a structure of a multilingual dictionary database shown in FIG. 1.

도 5는 도 4의 각 사전 DB의 필드 구조를 보여주는 도면이다.5 is a diagram illustrating a field structure of each dictionary DB of FIG. 4.

도 6은 도 4의 각 사전 DB에 저장되는 레코드들의 일 예를 보여주는 도면이다.FIG. 6 is a diagram illustrating an example of records stored in each dictionary DB of FIG. 4.

도 7은 본 발명에 의한 다국어 입력기의 바람직한 실시예에 있어서의 기능 선택 윈도우를 보여주는 도면이다.7 is a view showing a function selection window in a preferred embodiment of the multilingual input system according to the present invention.

도 8 내지 도 13은 바람직한 실시예에 있어서 다국어 입력기의 동작을 보여주는 도면들이다.8 to 13 illustrate operations of a multilingual input apparatus in a preferred embodiment.

상기 기술적 과제를 달성하기 위한 본 발명의 다국어 입력기는 디스플레이를 포함한 데이터 처리 시스템에 있어서 상기 디스플레이에 표시되는 문서 또는 응용 프로그램 입력 화면의 소정 위치에 다수의 언어들 중 사용자가 선택하는 어느 한 언어를 사용하여 복수의 문자로 이루어진 문자열을 입력할 수 있게 해준다. 이와 같은 다국어 입력기는 사용자에 의해 선택적으로 활성화되어 구동되는 쉘 유틸리티로서 동작한다.In order to achieve the above technical problem, the multilingual input device of the present invention uses a language selected by a user from among a plurality of languages at a predetermined position of a document or an application input screen displayed on the display in a data processing system including a display. This allows you to enter a string of multiple characters. Such a multilingual input system acts as a shell utility that is selectively activated and driven by a user.

다국어 입력기에 있어서, 입력 수단은 제1 언어로 되어 있는 제1 문자열을 입력하는데 사용된다. 다국어 사전 데이터베이스는 상기 제1 언어를 포함한 상기 다수의 언어들 상호간에 단어들이 의미 맵핑에 의해 링크되어 있는 사전 데이터를 저장한다. 검색 수단은 상기 제1 문자열 또는 그 변형된 문자열과 동일한 의미를 가지며 상기 사용자에 의해 선택되는 언어로 되어 있는 하나 이상의 문자열들을 상기 다국어 사전 데이터베이스로부터 검색한다. 선택 수단은 상기 검색 수단에 의해 검색된 하나 이상의 문자열들 중 어느 하나를 선택함으로써, 선택된 문자열이 상기 응용 프로그램 입력 화면에 표시될 수 있게 해준다. 설정 수단은 상기 제1 언어의 종류 및 그밖의 동작 환경 변수를 설정할 수 있게 해준다.In the multilingual inputter, the input means is used for inputting a first character string in a first language. A multilingual dictionary database stores dictionary data in which words are linked by semantic mapping between the plurality of languages, including the first language. The search means retrieves from the multilingual dictionary database one or more strings having the same meaning as the first string or its modified string and in a language selected by the user. The selecting means selects any one of the one or more strings searched by the searching means, so that the selected string can be displayed on the application program input screen. The setting means makes it possible to set the type of the first language and other operating environment variables.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 보다 상세하게 설명한다.Hereinafter, with reference to the accompanying drawings will be described in detail a preferred embodiment of the present invention.

도 1은 본 발명에 의한 다국어 입력기의 바람직한 실시예의 블록도이다. 본 실시예에 있어서, 다국어 입력기는 모니터(2), 마우스(4) 및 키보드(6)를 구비한 컴퓨터 상에서 구현되며, 응용 프로그램(10)을 포함한다. 이러한 다국어 입력기 프로그램은 컴퓨터 사용자가 해당 아이콘을 더블클릭하거나 그밖의 일반적인 프로그램 실행 방법을 수행함으로써 활성화시킬 수 있다. 한편, 다국어 입력기 프로그램은 여타의 그래픽 유저 인터페이스(GUI)를 기반으로 한 프로그램들과 마찬가지로 윈도우의 닫기 버튼을 마우스 클릭함으로써 비활성화될 수 있다.1 is a block diagram of a preferred embodiment of a multilingual input device according to the present invention. In this embodiment, the multilingual input device is implemented on a computer with a monitor 2, a mouse 4 and a keyboard 6 and includes an application program 10. This multilingual input program can be activated by a computer user by double-clicking the icon or by performing other general program execution methods. On the other hand, the multi-language input program can be deactivated by mouse-clicking the close button of the window like other graphical user interface (GUI) -based programs.

활성화된 이후 다시 사용자에 의해 비활성화될 때까지, 다국어 입력기 프로그램은 워드 프로세서나 웹브라우저와 같은 다른 응용 프로그램과 함께 램에 상주하면서 쉘 유틸리티로서 동작한다. 따라서, 사용자는 다른 응용 프로그램 사용 중에 다국어 입력이 필요한 경우에는 언제든지 본 발명의 다국어 입력 프로그램을 구동할 수 있게 된다. 이를 위해, 도 7에 도시된 것과 같은 기능 선택 윈도우가 화면상에 표시되어 있게 되는데, 이러한 기능 선택 윈도우는 예컨대 윈도우즈95와 같은 GUI 운영시스템의 작업 표시줄에 단추 형태로 남아있을 수도 있다.Until activated and then deactivated again by the user, the multilingual input program program resides in RAM along with other applications such as word processors or web browsers and acts as a shell utility. Therefore, the user can run the multilingual input program of the present invention whenever the multilingual input is required while using another application program. To this end, a function selection window such as the one shown in FIG. 7 is displayed on the screen. The function selection window may be left in the form of a button on a task bar of a GUI operating system such as Windows 95, for example.

본 발명에 의한 다국어 입력기의 구체적 기능에 대한 이해를 돕기 위하여, 도 1에 도시된 응용 프로그램의 기술적 구성을 구체적으로 설명하기에 앞서 도 7 내지 도 13을 참조하여 다국어 입력기의 사용 및 동작 예를 먼저 살펴본다. 도 7은 본 발명에 의한 바람직한 실시예에 있어서의 다국어 입력기의 기능 선택 윈도우를 보여주고 있고, 도 8 내지 도 13은 바람직한 실시예에 있어서 다국어 입력기의 동작을 보여준다.In order to help understand the specific function of the multi-language input device according to the present invention, prior to describing the technical configuration of the application shown in FIG. 1 in detail with reference to FIGS. Take a look. 7 shows the function selection window of the multilingual input system in the preferred embodiment according to the present invention, and FIGS. 8 to 13 show the operation of the multilingual input system in the preferred embodiment.

도 7의 기능 선택 윈도우에는 복수의 아이콘들이 포함되어 있다. 첫 번째 아이콘과 두 번째 아이콘은 제1 언어 예컨대 사용자의 모국어를 입력하는 방식을 선택하는데 사용된다. 첫 번째 아이콘을 클릭하게 되면, 다국어 입력기는 마우스 노-클릭(Mouse no Click) 기능에 의하여 제1 언어 문자열들을 받아들이게 된다. 이때, 사용자가 화면상에 표시되는 텍스트 상에서 어느 한 단어 상에 마우스 포인터를 두고 일정 시간 포인터를 움직이지 않게 되면, 다국어 입력기는 해당 단어를 번역이 필요한 문자열로 인식하게 된다. 이러한 마우스 노-클릭에 의한 문자 인식 기술은 이미 충분히 공지된 것으로서, 본 발명이 속하는 분야의 당업자가 용이하게 실시할 수 있는 것이므로 이에 대한 자세한 설명은 생략하기로 한다. 한편, 도 7의 기능 선택 윈도우에 있어서, 두 번째 아이콘은 별도의 문자 입력 윈도우가 화면에 표시된 상태에서 번역이 필요한 문자열을 입력할 수 있게 해준다.The function selection window of FIG. 7 includes a plurality of icons. The first icon and the second icon are used to select a method of inputting a first language such as a native language of the user. When the first icon is clicked, the multilingual inputter accepts the first language strings by a mouse no-click function. At this time, if the user does not move the pointer over a certain time on the text displayed on the screen for a certain time, the multilingual inputter recognizes the word as a string for translation. Such a mouse no-click character recognition technology is already well known, and can be easily implemented by those skilled in the art to which the present invention pertains, a detailed description thereof will be omitted. Meanwhile, in the function selection window of FIG. 7, the second icon enables input of a character string to be translated while a separate character input window is displayed on the screen.

한편, 도 7의 기능 선택 윈도우에 있어서 다섯 번째 아이콘은 다국어 입력기의 환경 설정을 위한 것이다. 여기에서 환경 설정이 될 수 있는 항목들로서는 예컨대 사용자가 입력하는 제1 언어의 종류와, 다국어 입력기가 출력하는 제2 언어 즉 웹 브라우저 등에 최종 입력되는 언어의 종류 등을 들 수 있다. 이러한 환경 설정은 다국어 입력기를 실행할 때마다 새로이 수행해야만 하는 것은 아니며, 직전의 환경 설정 내용이 다시 사용되도록 하거나 또는 특정 언어들이 디폴트로 사용되도록 설정될 수도 있다. 한편, 어느 한 시점에 있어서 제1 언어나 제2 언어로 각각 한 가지 언어만이 사용될 수 있는 것은 아니고, 복수의 언어가 사용될 수도 있다.Meanwhile, the fifth icon in the function selection window of FIG. 7 is for setting the multilingual input device. The items that can be set in the environment include, for example, the type of the first language input by the user and the type of the second language output by the multilingual input, that is, the language finally inputted to the web browser. This configuration does not have to be performed newly each time the multilingual input method is executed, and the previous configuration may be used again, or specific languages may be set to be used by default. On the other hand, not only one language may be used as the first language or the second language at any time, but a plurality of languages may be used.

기능 선택 윈도우에 있어서 여덟 번째 아이콘은 기능 선택 윈도우를 작업 표시줄로 내려서 단추 형태로 남아있게 하기 위한 것이고, 마지막 아이콘은 다국어 입력기를 종료하기 위한 것이다. 그밖의 아이콘들은 본 발명의 다국어 입력기를 제품화함에 있어서 부가적인 기능을 부여하기 위한 것이며 본 발명의 기술적 사상과 직접 관련된 것이 아니므로, 이들에 대해서는 설명을 생략하기로 한다.The eighth icon in the function selection window is for lowering the function selection window to the taskbar so that it remains in the form of a button, and the last icon is for exiting the multilingual input method. The other icons are to impart additional functions in the commercialization of the multilingual input device of the present invention and are not directly related to the technical idea of the present invention, and thus description thereof will be omitted.

도 8 및 도 9는 마우스 노-클릭에 의해 번역할 문자열을 입력하는 경우의 일 예를 보여준다. 이들 도면에 있어서는, 번역할 제1 언어로 영어가 설정되어 있고 번역된 문자열을 표시할 제2 언어로 한글, 일본어, 중국어(간체) 및 대만어(번체)가 설정되어 있는 것으로 가정한다. 도시된 바와 같이 사용자가 화면상의 "Media" 부분에 마우스 포인터를 가져다 대고 일정시간 경과하면, 다국어 입력기는 해당 문자열을 변환 대상으로 인식하고 변환을 행하게 된다. 이에 따라, 각각의 제2 언어 별로 대표적인 문자열이 선택 윈도우 상에 표시된다. 이때, 사용자는 선택 윈도우 상에 표시된 문자열들 중 어느 하나를 선택할 수도 있고, 특정 언어에 대해 추가적인 대안을 확인하기 위해 선택 윈도우의 오른쪽 끝에 있는 추가 선택 옵션 화살표를 누를 수 있다. 도 9는 사용자가 선택 윈도우의 오른쪽 끝에 있는 화살표를 눌러서 추가적인 대안을 확인하고자 할 때 표시되는 화면을 보여준다. 여기에서는 사용자가 일본어 행에 있는 화살표를 누른 것으로 가정하는데, 이에 따라 "Media"에 대응하는 보다 많은 일본어 단어들이 또 하나의 선택 윈도우에 표시되게 된다. 사용자는 표시된 단어들을 확인하면서 자신이 의도하는 가장 적합한 단어를 선택할 수 있다. 한편, 도 8 및 도 9에 있어서 "YAHOO" 등의 문자는 등록상표이다.8 and 9 show an example of inputting a string to be translated by mouse click. In these drawings, it is assumed that English is set as the first language to be translated, and that Korean, Japanese, Simplified Chinese, and Traditional Chinese are set as the second language to display the translated character string. As shown in the figure, when the user moves the mouse pointer over the "Media" part on the screen, the multilingual input system recognizes the corresponding character string as a conversion target and performs the conversion. Accordingly, a representative character string for each second language is displayed on the selection window. At this point, the user may select any one of the strings displayed on the selection window, or press the additional selection option arrow at the right end of the selection window to identify additional alternatives for a particular language. 9 shows a screen that is displayed when the user presses the arrow at the right end of the selection window to confirm additional alternatives. It is assumed here that the user has pressed the arrow in the Japanese row, so that more Japanese words corresponding to "Media" are displayed in another selection window. The user can check the displayed words while selecting the most suitable word he intended. 8 and 9, a character such as "YAHOO" is a registered trademark.

도 10은 사용자가 도 7의 기능 선택 윈도우에서 두 번째 아이콘을 눌렀을 때 표시되는 문자 입력 윈도우의 일 예를 보여준다. 문자 입력 윈도우가 표시된 상태에서 사용자는 상단의 입력창에 변환을 희망하는 문자열을 입력할 수 있다. 사용자가 문자열 입력을 완료한 후 키보드 상의 "엔터" 키를 누르거나 검색 아이콘을 마우스 클릭하게 되면, 다국어 입력기는 설정된 제2 언어로 되어 있는 대응 문자열들을 하단의 표시창에 표시해준다. 이 경우, 제2 언어의 종류는 도 7의 기능 선택 윈도우에서 환경 설정 아이콘을 눌러서 선택될 수도 있고 도 10의 문자 입력 윈도우 자체 내에서 선택될 수도 있다. 여기에서는 한글, 일본어, 중국어 및 대만어가 모두 제2 언어로 설정되어 있다고 가정한다.FIG. 10 illustrates an example of a text input window displayed when a user presses a second icon in the function selection window of FIG. 7. While the text input window is displayed, the user can input a character string to be converted in the upper input window. When the user presses the "Enter" key on the keyboard or mouse clicks the search icon after completing the input of the string, the multilingual input unit displays corresponding strings in the set second language on the lower display window. In this case, the type of the second language may be selected by pressing an environment setting icon in the function selection window of FIG. 7 or may be selected within the text input window itself of FIG. 10. It is assumed here that Korean, Japanese, Chinese, and Taiwanese are all set as the second language.

도 11은 사용자가 "brown"이라는 단어를 변환하기 위해 문자 입력 윈도우에 이 단어를 입력한 예를 보여준다. 이러한 경우, 도시된 바와 같이 표시창에 "brown"에 의미상으로 대응되는 각 언어의 문자열들이 표시창에 표시된다. 이때, 표시되는 각 문자열이 어느 언어에 따른 표현인지를 명확히 보여주기 위해, 바람직한 실시예에 있어서는 각 문자열 앞에 해당 언어를 사용하는 국가의 국기가 표시된다. 한편, 도 12는 사용자가 "computer"라는 단어를 변환하기 위해 문자 입력 윈도우에 이 단어를 입력한 예를 보여준다. 이 경우에 있어서도, 표시창에는 "computer"에 의미상으로 대응되는 각 언어의 문자열들이 표시창에 표시된다. 도 11 및 도 12와 같이 표시창에 문자열들이 표시된 상태에서 사용자가 어느 한 문자열을 선택한 후 예컨대 '삽입' 아이콘을 클릭하게 되면, 해당 문자열은 다국어 입력기와 함께 활성화되어 있는 타 응용 프로그램에 입력될 수 있게 된다. 이러한 타 응용 프로그램으로는 예컨대 웹브라우저나 워드 프로세서 또는 데이터베이스 등을 들 수 있다.11 shows an example in which the user enters this word in a character input window to convert the word "brown". In this case, as shown, the text strings of each language semantically corresponding to "brown" are displayed on the display window. At this time, in order to clearly show in which language each string is displayed, in a preferred embodiment, a flag of a country using the language is displayed before each string. Meanwhile, FIG. 12 shows an example in which the user inputs the word in the character input window to convert the word "computer". In this case also, the display window displays character strings of each language semantically corresponding to "computer". 11 and 12, when the user selects a string and clicks an 'insert' icon, for example, while the strings are displayed on the display window, the string can be input to another application that is activated together with the multilingual input device. do. Such other applications include, for example, a web browser, a word processor or a database.

이러한 문자 입력 윈도우의 크기는 사용자에 의해 그 크기가 쉽게 가변될 수 있다. 도 13은 워드 프로세서에 외국어를 입력하기 위한 소형 문자 입력 윈도우를 보여준다. 제1 및 제2 언어로 영어와 중국어가 각각 선택되어 있는 상태에서 도 11 및 도 12와 관련하여 설명한 것과 유사한 방식으로 사용자가 입력창에 "astronaut"이라는 단어를 입력하고 검색 명령을 실행하면, "astronaut"에 대응하는 중국어 단어가 표시창에 표시된다. 사용자가 '삽입' 아이콘을 클릭하거나 해당 중국어 단어를 클릭하게 되면, 이 중국어 단어는 예컨대 워드 프로세서와 같은 응용 프로그램의 커서 위치에 옮겨져 표시될 수 있게 된다.The size of such a text input window can be easily changed by the user. 13 shows a small character input window for inputting a foreign language into a word processor. When the user enters the word "astronaut" in the input box and executes a search command in a manner similar to that described with reference to FIGS. 11 and 12 with English and Chinese selected as the first and second languages, respectively, The Chinese word corresponding to "astronaut" is displayed on the display. When the user clicks on the 'insert' icon or clicks a corresponding Chinese word, the Chinese word can be displayed at the cursor position of an application such as a word processor.

다시 도 1을 참조하여, 다국어 입력기를 구현하기 위한 응용 프로그램(10)의 구성 및 기능을 설명하기로 한다. 응용 프로그램(10)은 사용자 인터페이스(12), 메인 제어부(14), 검색부(16), 형태소 분석부(18), 유사단어 생성부(20), 다국어 사전 데이터베이스(22), 선택부(24) 및 설정 테이블(26)을 포함한다. 이러한 기능 블록들은 하나의 프로그램 내에서 함수 형태로 작성될 수 있다. 바람직한 실시예에 있어서 이러한 함수는 모듈 단위로 작성되지만, 후술하는 기능을 수행하도록 하는 범위 내에서 클래스를 근간으로 한 객체지향적 프로그래밍에 의해 구현될 수도 있다.Referring to FIG. 1 again, the configuration and function of the application program 10 for implementing the multilingual input system will be described. The application program 10 may include a user interface 12, a main controller 14, a searcher 16, a morpheme analyzer 18, a pseudoword generator 20, a multilingual dictionary database 22, and a selector 24. ) And a setting table 26. These functional blocks can be written in the form of functions within a program. In a preferred embodiment, such a function is written in a module unit, but may be implemented by object-oriented programming based on a class within the scope to perform the functions described below.

사용자 인터페이스(12)는 사용자가 다국어 입력기를 조작하기 위해 입력하는 명령을 받아들여서 메인 제어부(14)에 전달하고, 메인 제어부(14)로부터의 출력 데이터를 사용자 컴퓨터의 디스플레이(2)에 표시해준다. 즉, 사용자 인터페이스(12)는 사용자의 제어 명령을 인식하여 도 7의 기능 선택 윈도우나 도 10 및 도 13의 문자 입력 윈도우를 디스플레이(2)에 표시해주며, 사용자가 입력하는 검색어 즉 제1 언어 문자열을 인식하여 메인 제어부(14)에 전달한다. 또한 사용자 인터페이스(12)는 마우스 노-클릭 기능이 활성화되어 있을 때 마우스 포인터가 가리키는 문자열을 인식하여 메인 제어부(14)에 전달한다. 아울러, 사용자 인터페이스(12)는 검색 결과 도출된 제2 언어 문자열들을 메인 제어부(14)로부터 전달받아 디스플레이(2) 상에 표시해준다.The user interface 12 receives a command inputted by the user to manipulate the multilingual input device, transmits the command to the main control unit 14, and displays the output data from the main control unit 14 on the display 2 of the user computer. That is, the user interface 12 recognizes a user's control command and displays the function selection window of FIG. 7 or the character input window of FIGS. 10 and 13 on the display 2, and the search word input by the user, that is, the first language string. It recognizes and delivers to the main control unit 14. In addition, the user interface 12 recognizes a character string indicated by the mouse pointer and transmits it to the main controller 14 when the mouse no-click function is activated. In addition, the user interface 12 receives the second language strings derived from the search result from the main controller 14 and displays the second language strings on the display 2.

메인 제어부(14)는 프로그램의 전반적인 흐름을 제어하고 다른 기능 블록들의 동작을 제어한다. 검색부(16)는 메인 제어부(14)를 통해 사용자가 입력한 제1 언어 문자열에 대응하는 제2 언어 문자열들을 데이터베이스(22)로부터 검색한다. 이때, 사용자가 입력한 제1 언어 문자열은 기본형의 문자열이 아니라, 문법적으로 변형된 형태를 가질 수도 있고 또는 복합 문자열일 수도 있다. 이러한 경우 검색부(16)는 제2 언어 문자열들을 데이터베이스(22)로부터 직접 즉 1회적으로 검색하지 못하게 될 수 있게 된다. 이러한 경우 검색부(16)는 형태소 분석부(18)에 제1 언어 문자열을 전달하여, 형태소 분석부(18)가 그 문자열에 대해 형태소 분석을 수행하도록 할 수 있다. 또한, 검색부(16)는 유사단어 생성부(20)에 상기 제1 언어 문자열을 전달하여, 유사단어 생성부(20)가 사용자에 의해 입력된 제1 언어 문자열과 유사한 문자열들을 생성하도록 할 수도 있다. 검색부(16)는 형태소 분석부(18) 또는 유사단어 생성부(20)로부터 출력되는 문자열들을 토대로 데이터베이스(22)를 다시 검색하게 된다.The main controller 14 controls the overall flow of the program and controls the operation of other functional blocks. The search unit 16 searches for the second language strings corresponding to the first language string input by the user through the main controller 14 from the database 22. In this case, the first language string input by the user may not have a basic type string but may have a grammatically modified form or a complex string. In this case, the searching unit 16 may not search the second language strings directly from the database 22, that is, once. In this case, the search unit 16 may transfer the first language string to the morpheme analyzer 18 so that the morpheme analyzer 18 performs morphological analysis on the string. In addition, the searcher 16 may transfer the first language string to the pseudoword generator 20 to cause the pseudoword generator 20 to generate strings similar to the first language string input by the user. have. The searcher 16 searches the database 22 again based on the character strings output from the morpheme analyzer 18 or the similar word generator 20.

선택부(24)는 검색부(16)에 의해 활성화되며, 검색부(16)가 검색을 완료한 후 사용자가 설정한 출력 언어 설정에 적합한 문자열만이 사용자에게 출력될 수 있게 해준다. 또한, 사용자가 복수의 문자열 중 하나를 최종 선택하였을 때, 선택부(24)는 해당 문자열이 사용자가 구동하고 있는 타 응용 프로그램에 입력될 수 있도록 해준다. 한편, 본 발명의 다른 실시예에 있어서는 선택부(24)가 사용자 인터페이스(12)나 메인 제어부(14)에 의해 활성화되거나 제어될 수도 있다. 설정 테이블(26)은 사용자가 설정한 환경 변수 값들을 사용자 인터페이스(12) 또는 메인 제어부(14)를 통해 전달받아 저장한다.The selector 24 is activated by the searcher 16, and after the searcher 16 completes the search, only a string suitable for the output language set by the user can be output to the user. In addition, when the user finally selects one of the plurality of character strings, the selector 24 allows the character string to be input to another application program that the user runs. Meanwhile, in another embodiment of the present invention, the selector 24 may be activated or controlled by the user interface 12 or the main controller 14. The setting table 26 receives and stores environment variable values set by the user through the user interface 12 or the main controller 14.

다국어 사전 데이터베이스(22)의 구조가 도 4에 도시되어 있다. 도시된 바와 같이, 데이터베이스(22)는 본 발명의 다국어 입력기에 채용되는 각 언어가 1:1로 대응하여 구비되는 복수의 개별 사전 DB들을 포함한다. 본 실시예에 있어서 다국어 입력기는 5 개 국어간의 변환을 수행할 수 있으며, 이에 따라 20개의 언어 사전이 마련된다. 그렇지만, 다국어 입력기가 사용되는 지역에 따라 이들 사전 DB들 중 일부만이 사용자에게 제공될 수 있음은 물론이다. 각 개별 사전 DB들은 의미 맵핑 방식에 의해 각 언어들의 단어들이 1:1로 연계된 형태로 사전 데이터를 저장한다.The structure of the multilingual dictionary database 22 is shown in FIG. As shown, the database 22 includes a plurality of individual dictionary DBs in which each language employed in the multilingual input device of the present invention corresponds to 1: 1. In this embodiment, the multilingual input device can perform conversion between five languages, and thus, 20 language dictionaries are provided. However, of course, only some of these dictionary databases may be provided to the user, depending on the region where the multilingual input system is used. Each individual dictionary DB stores dictionary data in a form in which words of each language are linked 1: 1 by semantic mapping.

도 5는 도 4의 각 사전 DB의 필드 구조를 보여준다. 본 실시예에 있어서, 각 사전 DB는 '단어', '의미', '발음', '품사' 및 '추가정보' 필드를 포함한다. '단어' 필드는 언어 변환의 대상이 되는 제1 언어 문자열로 기능을 하는 단어를 나타내며, '의미' 필드는 상기 '단어'에 해당하는 제2 언어 문자열을 나타낸다. '발음', '품사' 및 '추가정보' 필드는 사용자가 언어 변환시 참고할 수 있도록 하기 위한 것이다. 보다 구체적으로 설명하면, '발음' 필드는 영어식 표기법에 의한 제1 언어 문자열 또는 제2 언어 문자열의 발음을 저장하고, '품사' 필드는 제1 언어 문자열의 품사를 나타내며, '추가정보' 필드는 해당 문자열의 속성, 물질, 용도 등의 추가적인 특성 정보를 저장하게 된다.FIG. 5 shows the field structure of each dictionary DB of FIG. 4. In the present embodiment, each dictionary DB includes 'word', 'meaning', 'pronounced', 'part of speech' and 'additional information' fields. The 'word' field indicates a word functioning as a first language string to be converted into a language, and the 'meaning' field indicates a second language string corresponding to the 'word'. The 'pronounced', 'part of speech' and 'additional information' fields are for the user to refer to when converting the language. More specifically, the 'pronounce' field stores the pronunciation of the first language string or the second language string in English notation, the 'part of speech' field indicates the part of speech of the first language string, and the 'additional information' field. Stores additional property information such as attributes, substances and uses of the string.

한편, 하나의 제1 언어 문자열에 대해 제2 언어 문자열은 복수가 될 수 있다. 이에 따라 각 사전 DB에 있어서는 각각의 제1 언어 문자열에 대해 존재하는 복수의 제2 언어 문자열을 모두 저장해둘 필요가 있다. 도 6은 도 4의 각 사전 DB에 저장되는 레코드들의 일 예를 보여준다. 도 6에서 볼 수 있는 바와 같이, 하나의 제1 언어 문자열에 대해 복수의 제2 언어 문자열이 존재하는 경우 각각의 제2 언어 문자열에 대하여 별도의 레코드가 형성되어 저장된다. 예를 들어 하나의 제1 언어 문자열(단어#1)에 대하여 다섯 개의 의미 즉 제2 문자열(의미#1 - 의미#5)이 존재하는 경우, 해당 제1 언어 문자열에 대해서는 다섯 개의 레코드가 존재하게 된다.Meanwhile, the second language string may be plural for one first language string. Accordingly, in each dictionary DB, it is necessary to store all the plurality of second language strings existing for each first language string. FIG. 6 shows an example of records stored in each dictionary DB of FIG. 4. As shown in FIG. 6, when a plurality of second language strings exist for one first language string, a separate record is formed and stored for each second language string. For example, if there are five meanings (one meaning # 1-meaning # 5) for one first language string (word # 1), five records exist for that first language string. do.

본 발명의 다국어 입력기는 다음과 같이 동작한다. 도 2는 도 1의 다국어 입력기의 동작을 설명하기 위한 흐름도이다. 타 응용 프로그램에 대한 입력 대기 상태에서(제30단계) 다국어 입력기의 아이콘을 더블클릭하거나 여타의 방법으로 실행 명령을 인가하면, 다국어 입력기는 활성화된다(제30단계). 다국어 입력기가 활성화되면, 도 7과 같은 기능 선택 윈도우가 화면상에 표시된다(제34단계). 이때 사용자는 기능 선택 윈도우 상에서 환경 설정을 위한 아이콘을 클릭하여 다국어 입력기의 동작 환경을 설정할 수 있다(제36단계). 여기에서 환경 설정이 될 수 있는 항목들로서는 사용자가 입력하는 제1 언어의 종류와, 다국어 입력기가 출력하는 제2 언어 즉 웹 브라우저 등에 최종 입력되는 언어의 종류가 될 수 있다. 아울러, 사용자는 기능 선택 윈도우 상에서 제1 언어의 입력 방식을 선택할 수도 있다. 위에서 기술한 바와 같이, 환경 설정은 다국어 입력기를 실행할 때마다 새로이 수행해야만 하는 것은 아니며, 직전의 환경 설정 내용이 다시 사용되도록 하거나 또는 특정 언어들이 디폴트로 사용되도록 설정될 수도 있다.The multilingual input device of the present invention operates as follows. 2 is a flowchart illustrating an operation of the multilingual input device of FIG. 1. In the waiting state for input to another application (step 30), if the user double-clicks the icon of the multi-language input method or otherwise executes an execution command, the multi-language input device is activated (step 30). When the multilingual input unit is activated, the function selection window shown in FIG. 7 is displayed on the screen (step 34). In this case, the user may set an operation environment of the multilingual inputter by clicking an icon for setting an environment on a function selection window (step 36). The items that may be set as the environment may be a type of a first language input by a user and a type of a language that is finally input to a second language output by a multilingual input, that is, a web browser. In addition, the user may select an input method of the first language on the function selection window. As described above, the configuration does not have to be performed newly each time the multilingual input method is executed, and the previous configuration may be used again, or specific languages may be set to be used by default.

사용자가 설정된 입력 방식으로 검색 단어를 입력하면(제38단계), 응용 프로그램(10)의 검색부(16)는 데이터베이스(22) 내에서 검색 단어에 해당하는 제2 언어의 문자열을 검색하게 된다(제40단계). 이때 검색된 제2 언어 문자열들이 표시창에 표시되어 사용자가 그 중 하나를 선택할 수 있게 된다(제42단계). 사용자가 표시창에 표시된 문자열들 중 하나를 선택하게 되면(제44단계), 응용 프로그램(10)의 선택부(24)는 선택된 문자열이 입력 대기 상태에 있는 타 응용 프로그램의 커서 위치에 삽입될 수 있게 해준다(제46단계).When the user inputs a search word using the set input method (step 38), the search unit 16 of the application program 10 searches for the string of the second language corresponding to the search word in the database 22 ( Step 40). In this case, the searched second language strings are displayed on the display window so that the user can select one of them (step 42). When the user selects one of the strings displayed on the display window (step 44), the selection unit 24 of the application program 10 allows the selected character string to be inserted at the cursor position of another application in the waiting state for input. (Step 46).

도 2에 있어서의 제40 내지 제46단계를 도 3을 참조하여 상세하게 설명한다. 먼저, 검색부(16)는 데이터베이스(22) 내에서 사용자가 입력한 검색 단어와 동일한 문자열을 검색하게 된다(제50단계). 검색 결과 입력된 문자열과 동일한 의미를 가지는 문자열이 1개 있는 경우, 선택부(24)는 사용자의 명령에 응답하여 검색된 문자열을 타 응용 프로그램의 커서 위치에 삽입하게 된다(제54단계). 그렇지만, 입력된 문자열과 동일한 의미를 가지는 문자열이 여러 개 발견된 경우에는 사용자의 선택에 따라 그 중 하나만이 타 응용 프로그램의 커서 위치에 삽입된다(제56단계, 제58단계).The 40th to 46th steps in FIG. 2 will be described in detail with reference to FIG. 3. First, the search unit 16 searches for the same character string as the search word input by the user in the database 22 (step 50). When there is one string having the same meaning as the input string as a result of the search, the selecting unit 24 inserts the searched string at the cursor position of another application in response to a user's command (step 54). However, when a plurality of strings having the same meaning as the input string is found, only one of them is inserted at the cursor position of another application program (steps 56 and 58).

한편, 입력된 문자열과 동일한 의미를 가지는 문자열이 데이터베이스(22) 내에서 발견되지 않은 경우, 검색부(16)는 형태소 분석부(18)에 해당 문자열의 형태소 분석을 의뢰하게 된다. 형태소 분석부(18)는 다음과 같이 문자열에 대해 형태소 분석을 수행한다(제60단계). 먼저, 사용자가 입력한 문자열이 한글인 경우에 있어서는, 조사 또는 과거형이나 복수형 등을 나타내는 어미가 있는지를 판단하여, 이러한 조사나 어미가 있는 경우에는 이를 제거하게 된다. 사용자가 입력한 문자열이 영어인 경우에 있어서는, 복수형, 과거형 또는 진행형 등의 어미가 있는지를 판단하여, 이러한 어미가 있는 경우에는 이를 제거하게 된다. 입력된 문자열이 일본어인 경우에 있어서는, 조사나 복수형을 나타내는 어미, 또는 동사/형용사/형용동사 등의 활용형이 어미에 있는지를 판단하고, 이를 제거하게 된다. 한편, 입력된 문자열이 중국어인 경우에 있어서는, 연사(접속사)나 형용사 어미, 조사 또는 부사 등이 어미에 있는지 판단하고, 이를 제거하게 된다.On the other hand, when a string having the same meaning as the input string is not found in the database 22, the search unit 16 requests the morphological analysis unit 18 to morphological analysis of the string. The morpheme analysis unit 18 performs morphological analysis on the character string as follows (step 60). First, if the character string input by the user is Korean, it is determined whether there is an ending indicating a survey or a past or plural form, and if there is such a survey or ending, it is removed. In the case where the string input by the user is English, it is determined whether there is a plural form, a past form, or a progressive form, and if there is such a ending, it is removed. In the case where the input character string is Japanese, it is judged whether or not a usage form such as a search or a plural form or a verb / adjective / adjective verb is present in the mother and removed. On the other hand, in the case where the input character string is Chinese, it is judged whether or not a speaker (adjunct), an adjective ending, an investigation or an adverb is in the ending, and is removed.

형태소 분석을 완료한 후, 형태소 분석부(18)는 원형이라 판단된 변형 문자열을 검색부(16)에 제공하여, 검색부(16)가 변형 문자열에 대해 다시 데이터베이스를 검색하도록 하게 된다(제62단계). 검색 결과 변형 문자열과 동일한 의미를 가지는 문자열이 1개 있는 경우, 선택부(24)는 검색된 문자열을 타 응용 프로그램의 커서 위치에 삽입하게 된다(제66단계). 그렇지만, 입력된 문자열과 동일한 의미를 가지는 문자열이 여러 개 발견된 경우에는 사용자의 선택에 따라 그 중 하나만이 타 응용 프로그램의 커서 위치에 삽입된다(제68단계, 제70단계).After the morphological analysis is completed, the morpheme analysis unit 18 provides the search string 16 with the modified character string determined to be circular, so that the search unit 16 searches the database for the modified string again (62th). step). If there is one string having the same meaning as the modified string as a result of the search, the selecting unit 24 inserts the searched string at the cursor position of another application program (step 66). However, when a plurality of strings having the same meaning as the input string is found, only one of them is inserted at the cursor position of another application program (steps 68 and 70).

한편, 변형 문자열과 동일한 의미를 가지는 문자열이 데이터베이스(22) 내에서 발견되지 않은 경우, 검색부(16)는 유사단어 생성부(20)에 사용자가 입력한 문자열과 유사한 문자열의 생성을 의뢰하게 된다. 유사단어 생성부(20)는 입력된 문자열을 토대로 유사 문자열을 생성하게 된다(제72단계). 바람직한 실시예에 있어서, 유사 문자열을 생성함에 있어서는 최장일치법과 최단일치법이 사용된다. 최장일치법이라 함은 사용자가 입력한 문자열을 전방절단 또는 후방절단 방식에 의해 한 문자씩 삭제해나가는 것을 의미하고, 최단일치법이란 최소의 문자로부터 시작해서 한 문자씩 추가해나가는 것을 의미한다.On the other hand, if a string having the same meaning as the modified string is not found in the database 22, the search unit 16 requests the similar word generation unit 20 to generate a string similar to the string input by the user. . The pseudoword generator 20 generates a pseudostring based on the input string (step 72). In a preferred embodiment, the longest match method and the shortest match method are used to generate a similar character string. The longest matching method means that the character string input by the user is deleted one character by the front cutting or the back cutting method, and the shortest matching method means adding one character starting from the minimum character.

유사단어 생성부(20)는 생성한 유사 문자열들을 순차적으로 검색부(16)에 제공하여, 검색부(16)가 일련의 유사 문자열에 대해 다시 데이터베이스를 검색하도록 하게 된다(제74단계). 검색 결과 변형 문자열과 동일한 의미를 가지는 문자열이 1개 있는 경우, 선택부(24)는 검색된 문자열을 타 응용 프로그램의 커서 위치에 삽입하게 된다(제78단계). 그렇지만, 입력된 문자열과 동일한 의미를 가지는 문자열이 여러 개 발견된 경우에는 사용자의 선택에 따라 그 중 하나만이 타 응용 프로그램의 커서 위치에 삽입된다(제80단계, 제82단계). 한편, 유사 문자열과 동일한 의미를 가지는 문자열이 데이터베이스(22) 내에서 발견되지 않은 경우, 사용자에게 안내 메시지가 전달된 후 검색 절차가 종료된다.The similar word generator 20 sequentially provides the generated similar character strings to the searcher 16 so that the searcher 16 searches the database again for the series of similar character strings (step 74). If there is one string having the same meaning as the modified string as a result of the search, the selecting unit 24 inserts the searched string at the cursor position of another application program (step 78). However, when a plurality of strings having the same meaning as the input string are found, only one of them is inserted at the cursor position of another application program (steps 80 and 82). On the other hand, if a string having the same meaning as the similar string is not found in the database 22, the search procedure is terminated after the guide message is delivered to the user.

이상의 설명은 본 발명의 바람직한 실시예들을 단지 예시하는 것으로서, 본 발명은 이에 한정되지 않고 다양하게 변형될 수 있다. 예컨대, 바람직한 실시예에 있어서는 응용 프로그램(10)내에 검색 결과 도출된 제2 언어 문자열들을 사용자의 명령에 응답하여 선택하는 선택부(24)가 도입되었지만, 본 발명의 다른 실시예에 있어서는 이러한 선택부(24)가 존재하지 않을 수 있으며 메인 제어부(14)나 사용자 인터페이스(12)가 이러한 기능을 수행할 수도 있다. 또한, 형태소 분석부(18)와 유사단어 생성부(20)는 검색부(16)와 통합되어 하나의 모듈로서 존재할 수도 있다. 아울러, 데이터베이스(22)의 필드 구조나 사전 DB 종류 등도 쉽게 변형될 수 있음은 물론이다.The above description merely illustrates preferred embodiments of the present invention, and the present invention is not limited thereto and may be variously modified. For example, in the preferred embodiment, the selection unit 24 for selecting the second language strings derived from the search in response to a user's command has been introduced in the application program 10. However, in another embodiment of the present invention, the selection unit 24 is such a selection unit. 24 may not exist and the main control 14 or the user interface 12 may perform this function. In addition, the morpheme analyzer 18 and the similar word generator 20 may be integrated with the searcher 16 and exist as a module. In addition, the field structure of the database 22, the type of dictionary DB, etc. can be easily modified.

한편, 이상의 실시예는 다국어 입력기를 사용하는 컴퓨터 시스템 또는 여타의 데이터 처리 장치의 운영 체제가 유니코드 체계를 토대로 구축된 것을 전제로 하여 기술되었지만, 본 발명의 다른 실시예는 종래의 국가별 코드 체계를 따르는 컴퓨터 시스템 또는 여타의 데이터 처리 장치에 구현될 수도 있다. 이러한 실시예에 있어서는, 서로 다른 코드 체계들에 의한 문자들이 디스플레이 상에 표시될 수 있도록 하기 위해 별도의 폰트 DB가 응용 프로그램 내에 포함되는 것이 바람직하다. 물론 이러한 폰트 DB를 별도로 구축하는 대신에, 도 4의 개별 사전 DB에 있어서 도 5의 필드 구조에 폰트 필드를 추가할 수도 있다.On the other hand, while the above embodiment has been described on the premise that the operating system of a computer system or other data processing apparatus using a multilingual input system is built on the Unicode system, another embodiment of the present invention is a conventional country code system. It may be implemented in a computer system or other data processing apparatus that conforms to. In this embodiment, it is desirable that a separate font DB is included in the application program so that characters from different code systems can be displayed on the display. Of course, instead of building the font DB separately, the font field may be added to the field structure of FIG. 5 in the individual dictionary DB of FIG. 4.

따라서, 본 발명은 이상의 실시예에 한정되지 않고, 복수의 의미 맵핑된 문자열 쌍을 구비한 사전 데이터베이스를 토대로 하여 문자열을 다국어로 입력할 수 있게 한다는 기술적 사상을 기초로 하여 후술하는 특허청구범위에 의해 해석되어야만 한다.Accordingly, the present invention is not limited to the above embodiments, but is based on the technical spirit of allowing a character string to be input in multiple languages based on a dictionary database having a plurality of semantic mapped character string pairs. It must be interpreted.

상술한 바와 같이, 본 발명에 따르면 사용자가 예컨대 자신의 모국어로 단어 등 문자열을 입력한 후 쉽게 제2 언어로 변환하여 타 응용 프로그램에 적용할 수 있기 때문에, 외국어의 입력이 용이해진다. 이와 같은 본 발명의 다국어 입력기는 윈도우즈와 같은 GUI 운영 체제에서 종래에 사용되던 IME(Input Method Editor)와 비교될 수도 있다. 그렇지만, IME에 있어서는 사용자가 직접 각 문자열을 타이핑함에 있어 외국어 문자나 한자를 문자 단위로 쉽게 찾아줄 수 있도록 해주는 것에 불과할 뿐이며, 문자열 단위로 외국어를 입력할 수 있게 해주는 것은 아니다. 이에 반해, 본 발명은 메뉴 선택 방식에 의해 의미 맵핑된 사전 데이터를 검색함으로써 외국어를 단어나 구절과 같은 문자열 단위로 입력할 수 있게 해준다. 따라서, 사용자는 해당 외국어의 자판 구조나 각 단어의 발음 방법 등을 기억하고 있어야 할 필요가 없으며, 이러한 자판 및 발음 구조를 몰라도 용이하게 외국어를 입력할 수 있게 되는 효과가 있다.As described above, according to the present invention, since a user inputs a character string such as a word in his or her native language and then easily converts it into a second language and applies it to another application program, input of a foreign language becomes easy. Such a multilingual input device of the present invention may be compared with an input method editor (IME) conventionally used in a GUI operating system such as Windows. However, in IME, it is only to make it easy to find foreign language characters or kanji characters by character in typing each string directly, and it does not allow to input foreign languages by character string. In contrast, the present invention enables to input a foreign language in units of strings such as words or phrases by searching for dictionary data mapped semanticly by a menu selection method. Therefore, the user does not need to remember the keyboard structure of the foreign language or the pronunciation method of each word, and there is an effect that the user can easily input the foreign language without knowing the keyboard and pronunciation structure.

Claims (8)

디스플레이를 포함한 데이터 처리 시스템에 있어서 상기 디스플레이에 표시되는 응용 프로그램 입력 화면의 소정 위치에 다수의 언어들 중 사용자가 선택하는 어느 한 언어를 사용하여 복수의 문자로 이루어진 문자열을 입력하기 위한 다국어 입력기로서,In the data processing system including a display as a multilingual input device for inputting a character string of a plurality of characters using any language selected by the user from a plurality of languages at a predetermined position of the application program input screen displayed on the display, 제1 언어로 되어 있는 제1 문자열을 입력하기 위한 입력 수단;Input means for inputting a first character string in a first language; 상기 제1 언어를 포함한 상기 다수의 언어들 상호간에 단어들이 의미 맵핑에 의해 링크되어 있는 사전 데이터를 저장하는 다국어 사전 데이터베이스;A multilingual dictionary database storing dictionary data in which words are linked by semantic mapping between the plurality of languages including the first language; 상기 제1 문자열 또는 그 변형된 문자열과 동일한 의미를 가지며 상기 사용자에 의해 선택되는 언어로 되어 있는 하나 이상의 문자열들을 상기 다국어 사전 데이터베이스로부터 검색하기 위한 검색 수단; 및Retrieving means for retrieving from said multilingual dictionary database one or more character strings that have the same meaning as said first character string or its modified character string and are in a language selected by said user; And 상기 검색 수단에 의해 검색된 하나 이상의 문자열들 중 어느 하나를 선택함으로써, 상기 입력 화면의 소정 위치에 표시될 수 있게 하기 위한 선택 및 제어 수단을 포함하는 다국어 입력기.Selecting and controlling means for selecting one of the one or more character strings searched by said searching means to be displayed at a predetermined position of said input screen. 제1항에 있어서,The method of claim 1, 상기 제1 언어의 종류 및 그밖의 동작 환경 변수를 설정하기 위한 설정 수단을 더 포함하는 다국어 입력기.And setting means for setting the type of the first language and other operating environment variables. 제2항에 있어서, 상기 입력 수단은The method of claim 2, wherein the input means 상기 디스플레이에 문자 입력 윈도우를 표시해주고 사용자가 상기 제1 문자열을 상기 문자 입력 윈도우에 입력하도록 한 후, 상기 문자 입력 윈도우에 입력된 문자열들을 검출하는 윈도우 입력 수단을 포함하는 다국어 입력기.And a window input means for displaying a text input window on the display and allowing the user to input the first text string into the text input window, and then detecting the text strings input into the text input window. 제2항에 있어서, 상기 입력 수단은The method of claim 2, wherein the input means 상기 디스플레이에 표시되는 텍스트 상에서 사용자가 포인팅 수단에 의해 특정하는 위치에 있는 문자열을 인식하여 검출하는 포인터 입력 수단을 포함하는 다국어 입력기.And a pointer input means for recognizing and detecting a character string at a location specified by a pointing means by a user on text displayed on the display. 제2항에 있어서, 상기 입력 수단은The method of claim 2, wherein the input means 상기 디스플레이에 문자 입력 윈도우를 표시해주고 사용자가 상기 제1 문자열을 상기 문자 입력 윈도우에 입력하도록 한 후, 상기 문자 입력 윈도우에 입력된 문자열들을 검출하는 윈도우 입력 수단; 및Window input means for displaying a text input window on the display and allowing a user to input the first text string into the text input window, and then detecting the text strings input into the text input window; And 상기 디스플레이에 표시되는 텍스트 상에서 사용자가 포인팅 수단에 의해 특정하는 위치에 있는 문자열을 인식하여 검출하는 포인터 입력 수단을 포함하고,A pointer input means for recognizing and detecting a character string at a position specified by a user by a pointing means on text displayed on the display; 상기 사용자가 상기 설정 수단을 설정하는 바에 따라 상기 윈도우 입력 수단 및 상기 마우스 입력 수단 중 어느 하나가 활성화되는 다국어 입력기.And one of the window input means and the mouse input means is activated as the user sets the setting means. 제1항에 있어서, 상기 검색 수단은The method of claim 1 wherein said retrieval means 상기 제1 문자열에 대해 형태소 분석을 수행하여 상기 제1 문자열의 기본적 문자열 형태를 생성하는 형태소 분석부; 및A morpheme analysis unit configured to generate a basic string form of the first string by performing a morpheme analysis on the first string; And 상기 제1 문자열에 대해 형태소 분석이외의 방법으로 상기 제1 문자열과 유사한 변형 문자열을 생성하는 유사단어 생성부를 포함하는 다국어 입력기.And a pseudo word generator for generating a modified character string similar to the first character string by a method other than morphological analysis of the first character string. 제1항에 있어서, 상기 데이터 처리 시스템은 상기 다수의 언어들을 하나의 코드 체계에 의해 표시하는 것을 특징으로 하는 다국어 입력기.The multilingual input system of claim 1, wherein the data processing system displays the plurality of languages by a single code system. 제1항에 있어서, 상기 데이터 처리 시스템은 상기 다수의 언어들 중 적어도 일부를 다른 언어와 서로 다른 코드 체계에 의해 표시하며,The data processing system of claim 1, wherein the data processing system displays at least some of the plurality of languages by a different code system from another language, 상기 다국어 사전 데이터베이스는 상기 서로 다른 코드가 상기 디스플레이에 표시될 수 있도록 하기 위한 폰트 데이터를 포함하는 다국어 입력기.And the multilingual dictionary database includes font data for allowing the different codes to be displayed on the display.
KR1019990023164A 1999-06-21 1999-06-21 Multilingual Input Device KR20010003037A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990023164A KR20010003037A (en) 1999-06-21 1999-06-21 Multilingual Input Device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990023164A KR20010003037A (en) 1999-06-21 1999-06-21 Multilingual Input Device

Publications (1)

Publication Number Publication Date
KR20010003037A true KR20010003037A (en) 2001-01-15

Family

ID=19593717

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990023164A KR20010003037A (en) 1999-06-21 1999-06-21 Multilingual Input Device

Country Status (1)

Country Link
KR (1) KR20010003037A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010067827A (en) * 2001-04-02 2001-07-13 금하연 multi-languages Chinese characters database structure
KR20020038671A (en) * 2002-05-07 2002-05-23 조남녀 Multilingual menu manufacturing and printing application based ASP technology
KR101042907B1 (en) * 2009-05-21 2011-06-21 엔에이치엔(주) Method and apparatus for providing an online dictionary service

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010067827A (en) * 2001-04-02 2001-07-13 금하연 multi-languages Chinese characters database structure
KR20020038671A (en) * 2002-05-07 2002-05-23 조남녀 Multilingual menu manufacturing and printing application based ASP technology
KR101042907B1 (en) * 2009-05-21 2011-06-21 엔에이치엔(주) Method and apparatus for providing an online dictionary service

Similar Documents

Publication Publication Date Title
US4829423A (en) Menu-based natural language understanding system
EP0686286B1 (en) Text input transliteration system
US7447624B2 (en) Generation of localized software applications
CN101520786B (en) Method for realizing input method dictionary and input method system
US20080300859A1 (en) System and Method for Automatic Natural Language Translation of Embedded Text Regions in Images During Information Transfer
JP2004516527A (en) System and method for computer assisted writing with cross language writing wizard
Anthony AntConc (Windows, Macintosh OS X, and Linux)
JPH07114558A (en) Chinese character conversion correcting process system
JP2000089882A (en) Language translation and learning supporting system and program storage medium
EP0118187A1 (en) Menu-based natural language understanding system
KR20010003037A (en) Multilingual Input Device
JP2011210149A (en) Character string conversion device, retrieval device, character string conversion method, and character string conversion program
JPS62197864A (en) Language information offering device
EP1221082B1 (en) Use of english phonetics to write non-roman characters
JPH07114565A (en) Electronic dictionary
JPH0668140A (en) Electronic translation system
JP2023177418A (en) Kanji information conversion of japanese input system
JP2023152349A (en) Kanji-kana conversion for Japanese input system
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JPH04174069A (en) Language understanding assisting device
KR100863418B1 (en) Method for Processing Hyper Link of Computer Based Document
JP2023169063A (en) KEARM learning conversion of Japanese input system
JP5338482B2 (en) Chinese sentence example search device and program
JP3316884B2 (en) Language translator
KR100916816B1 (en) Method and system for reducing error in chouon and sokuon and providing function of finding a japanese alphabet in japanese input unit by using japanese alias database

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application