JP4018673B2 - Multiple choice language test question automatic creation program - Google Patents

Multiple choice language test question automatic creation program Download PDF

Info

Publication number
JP4018673B2
JP4018673B2 JP2004221450A JP2004221450A JP4018673B2 JP 4018673 B2 JP4018673 B2 JP 4018673B2 JP 2004221450 A JP2004221450 A JP 2004221450A JP 2004221450 A JP2004221450 A JP 2004221450A JP 4018673 B2 JP4018673 B2 JP 4018673B2
Authority
JP
Japan
Prior art keywords
sentence
language
creating
choice
corpus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004221450A
Other languages
Japanese (ja)
Other versions
JP2006039353A (en
Inventor
英一郎 隅田
史昭 菅谷
誠一 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
KDDI Corp
Original Assignee
ATR Advanced Telecommunications Research Institute International
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International, KDDI Corp filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2004221450A priority Critical patent/JP4018673B2/en
Publication of JP2006039353A publication Critical patent/JP2006039353A/en
Application granted granted Critical
Publication of JP4018673B2 publication Critical patent/JP4018673B2/en
Anticipated expiration legal-status Critical
Active legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

この発明は試験問題を自動的に作成するための装置に関し、特に、多肢選択式の言語試験問題を自動的に作成するための装置に関する。   The present invention relates to an apparatus for automatically creating a test question, and more particularly to an apparatus for automatically creating a multiple-choice language test question.

語学教育用試験には、いわゆる記述式問題と多肢選択式問題とがある。語学教育用試験は、学習者の学習習熟度を測定する上で欠くことができないものであり、そのために語学教師は試験問題作成に多大な時間を割いている。したがって、問題作成を容易にする方策が求められている。   Language education tests include so-called descriptive questions and multiple-choice questions. The language education test is indispensable for measuring the learner's learning proficiency level. For this reason, language teachers spend a great deal of time creating test questions. Therefore, there is a need for measures that facilitate problem creation.

記述式試験問題と多肢選択試験問題とを比較すると、両者には以下のような相違がある。まず記述式試験問題については、問題を作成することは比較的容易である。しかし、記述式試験の場合、問題に対する解答の入力および採点が難しいという問題がある。特に採点は採点者の主観によってかなり異なってくるという問題がある。また記述式試験の場合には、採点を機械化することが非常に難しいという問題もある。   Comparing the descriptive test problem with the multiple-choice test problem, there are the following differences. First, for descriptive test questions, it is relatively easy to create a question. However, in the case of a descriptive test, there is a problem that it is difficult to input and score an answer to the question. In particular, there is a problem that scoring varies considerably depending on the subjectivity of the grader. In the case of a descriptive test, there is also a problem that it is very difficult to mechanize the scoring.

これと比較して多肢選択言語試験問題の場合、解答入力が容易で、採点も容易であるという長所を備えている。さらに、評価者による採点の揺れがない、という意味で客観的であるという長所もある。そのため、大量の受験者がある場合や、コンピュータベースの試験(CBT)では多肢選択式試験が広く用いられる。また、「いつでもどこでも学習」という目標を標榜するいわゆるeラーニングでは、携帯電話またはPDA(Portable Digital Assistant)等のモバイル機器特有の問題、例えば画面が小さい、入力装置が貧弱である、等という制約から考えて、多肢選択言語試験問題が重要な役割を担うと考えられる。   Compared to this, the multiple-choice language test question has the advantage that it is easy to input an answer and easy to score. In addition, it has the advantage of being objective in the sense that there are no fluctuations in scoring by the evaluator. Therefore, when there are a large number of examinees or in a computer-based test (CBT), a multiple-choice test is widely used. In addition, so-called e-learning advocating the goal of “learning anytime, anywhere” is due to problems specific to mobile devices such as mobile phones or PDAs (Portable Digital Assistants), such as restrictions such as small screens and poor input devices. In view of this, the multiple-choice language test questions may play an important role.

しかし、多肢選択式試験の場合、問題を作成する手間が記述式試験と比較してかなり大きいという問題がある。特に、学習対象のドメイン(旅行会話、ビジネス会話、ニュース等)に合致し、かつ被験者の到達目標に合致した問題を作成することは困難だという課題がある。学習対象のドメインにおいて長年の経験または蓄積を持たない教育機関の場合、所望のドメインの多肢選択言語試験問題を、所定の到達レベルに合致させて作成することは非常に困難である。そうした問題を解決しようとすれば、多大な人員を動員することが必要になり、試験問題作成のコストが高くなる要因となっている。何らかの形で多肢選択言語試験問題を自動的に作成できるようになれば、そうした問題が解決され、好ましい。   However, in the case of a multiple-choice type test, there is a problem that the time and effort required to create a problem is considerably large compared to a descriptive test. In particular, there is a problem that it is difficult to create a problem that matches the domain to be learned (travel conversation, business conversation, news, etc.) and that matches the target of the subject. For educational institutions that do not have many years of experience or accumulation in the domain to be learned, it is very difficult to create a multiple-choice language test problem for a desired domain in accordance with a predetermined level of achievement. In order to solve such a problem, it is necessary to mobilize a large number of personnel, which is a factor in increasing the cost of preparing the test questions. It would be desirable to be able to automatically create a multiple choice language test question in some way and that would be solved.

それゆえに本発明の目的は、多肢選択言語試験問題を自動的に作成するようにコンピュータを機能させることができるプログラムを提供することである。 Therefore, an object of the present invention is to provide a program that allows a computer to function to automatically create a multiple choice language test question.

本発明の他の目的は、多肢選択言語試験問題であって、所望のドメインの問題を自動的に作成するようにコンピュータを機能させることができるプログラムを提供することである。 Another object of the present invention is to provide a program that allows a computer to function to automatically create a problem of a desired domain that is a multiple choice language test problem.

本発明のさらに他の目的は、多肢選択言語試験問題であって、所望のドメインの所望の到達レベル問題を自動的に作成するようにコンピュータを機能させることができるプログラムを提供することである。 Still another object of the invention is a multiple-choice language exam is to provide a program capable of making a computer function to automatically create the desired levels reached problems desired domain .

本発明の第1の局面に係る多肢選択言語試験問題自動作成プログラムは、コンピュータ読取可能なコーパスを記憶するためのコーパス記憶手段と、選択肢作成のための、単語辞書、シソーラス、単語に関連した誤りを集めた誤りリスト、若しくは単語の頻度及び重要度とともにリストした単語リスト、又はこれらの任意の組合せを含む言語情報をコンピュータ読取可能な形式で記憶するための言語情報記憶手段と、コーパス記憶手段に記憶されたコーパスから、予め定める選択方式にしたがって多肢選択言語試験問題の元となる文を選択するための文選択手段と、文選択手段により選択された文を構成する構成要素のうち、多肢選択の対象箇所とする構成要素を所定の条件により決定するための構成要素決定手段と、言語情報記憶手段に記憶された言語情報のうち、当該決定された構成要素に関連する言語情報に基づいて、構成要素決定手段により決定された構成要素に対し所与の条件を充足する置換候補を作成するための置換候補作成手段と、選択された文において、決定された構成要素を置換候補で置換することにより得られる文の妥当性を、当該得られる文中に含まれる前記置換候補を含む構成要素列の、所定のコーパス中における出現頻度に基づく統計的基準にしたがって判定するための妥当性判定手段と、妥当性判定手段により文が妥当でないと判定された置換候補と、元となる文とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための問題作成手段としてコンピュータを機能させるA program for automatically creating a multiple-choice language test question according to the first aspect of the present invention relates to a corpus storage means for storing a computer-readable corpus , a word dictionary, a thesaurus, and a word for creating options . Language information storage means and corpus storage means for storing linguistic information in a computer-readable format including an error list in which errors are collected, a word list listed together with the frequency and importance of words, or any combination thereof From the corpus stored in the sentence selection means for selecting the sentence that is the basis of the multiple-choice language test problem according to a predetermined selection method, and among the components that constitute the sentence selected by the sentence selection means, a component determining means for determining the components of the target portion of the multiple-choice by a predetermined condition, stored in the language information storage unit Of the language information, based on the language information related to the determined component replacement for creating replacement candidate satisfying the Shi pairs components determined by the configuration element determination means given conditions In the selected sentence, the validity of the sentence obtained by replacing the determined constituent element with the replacement candidate in the selected sentence is determined in accordance with a predetermined element of the constituent string including the replacement candidate included in the obtained sentence. Validity determination means for determining in accordance with statistical criteria based on the appearance frequency in the corpus of the corpus, replacement candidates determined by the validity determination means that the sentence is not valid, and the original sentence in a predetermined form a problem preparing means for preparing multiple-choice language test questions causing a computer to function and by combining.

コーパス記憶手段から文が選択され、その中の所定条件を充足する構成要素に対する置換候補が作成される。当該構成要素を置換候補で置換した後の文の妥当性を、文中に含まれる置換候補を含む構成要素列の、所定のコーパス中における出現頻度に基づく統計的基準にしたがって妥当性判定手段で判定し、文が妥当でないと判定された置換候補と、最初に選択された元となる文とを所定の形態に組合わせることで多肢選択言語試験問題が自動的に作成される。コーパスを変えれば所望のドメインまたはレベルの多肢選択言語試験問題を自動的に作成できる。さらに、置換候補のうち、置換によって得られる文が妥当でないものだけを残すことで、最初に選ばれた文との組合せにより、適切な多肢選択言語試験問題を作成できる。問題文および選択肢集合を人間が考えたり、問題としての正しさを検証したりする必要がなく、短い時間に大量の多肢選択言語試験問題を作成できる。 A sentence is selected from the corpus storage means, and a replacement candidate for a component satisfying a predetermined condition is created. The validity of the sentence after replacing the component with a replacement candidate is determined by the validity determination means according to a statistical criterion based on the frequency of occurrence of the component string containing the replacement candidate included in the sentence in a predetermined corpus. Then, the multiple choice language test question is automatically created by combining the replacement candidate determined to be invalid and the original sentence selected first, in a predetermined form. If you change the corpus, you can automatically create multiple-choice language questions with the desired domain or level. Furthermore, by leaving only the sentence that is not valid from the replacement candidates, it is possible to create an appropriate multiple-choice language test question in combination with the sentence selected first. A large number of multiple-choice language test questions can be created in a short period of time without the need for humans to think about question sentences and option sets or to verify the correctness of problems.

好ましくは、置換候補作成手段は、言語情報記憶手段に記憶された言語情報のうち、当該決定された構成要素に関連する言語情報に基づいて、決定された構成要素に対する複数個の置換候補を作成するための手段を含み、問題作成手段は、選択された文のうち、決定された構成要素を空所で置換した問題文を作成するための手段と、複数個の置換候補のうち、妥当性判定手段で文が妥当でないと判定された予め定める所定個数の置換候補と、決定された構成要素とからなる選択肢集合を作成するための選択肢作成手段と、問題文と選択肢集合とを所定の問題形式に整形するための整形手段とを含む。 Preferably, the replacement candidate creating unit creates a plurality of replacement candidates for the determined component based on language information related to the determined component among the language information stored in the language information storage unit. includes means for, problems creating means, among the selected sentence, means for creating a substituted problem statement the determined component in space, among the plurality of replacement candidates, reasonable An option creation means for creating an option set consisting of a predetermined number of replacement candidates determined by the sex determination means and a predetermined number of replacement candidates determined, and a problem sentence and an option set as a predetermined Shaping means for shaping into a problem form.

さらに好ましくは、問題作成手段は、選択された文のうち、決定された構成要素を、妥当性判定手段により文が妥当でないと判定された置換候補で置換して問題文を作成するための手段と、問題文のうち、置換候補と、置換候補以外の所定個数の単語または単語群とを選択肢候補として表示するように問題文を整形するための整形手段とを含む。 More preferably, problems creating means, among the selected sentence, the determined components for making substitution to issue statements appropriateness determination means the substitution candidate is determined that statement is not valid Means and a shaping means for shaping the question sentence so as to display a candidate for replacement and a predetermined number of words or word groups other than the candidate for replacement as option candidates.

好ましくは、多肢選択言語試験問題自動作成プログラムはさらに、所与の条件に関するユーザの入力を受け、条件付置換候補作成手段に与えるための手段としてコンピュータを機能させるPreferably, the multiple-choice language test question automatic creation program further causes the computer to function as a means for receiving input from the user regarding a given condition and giving it to the conditional replacement candidate creation means.

多肢選択言語試験問題自動作成プログラムは、さらに、複数個のコーパスからなるコーパス群を記憶するためのコンピュータ読取可能なコーパス群記憶手段から、ユーザによって指定されたコーパスを読出してコーパス記憶手段に格納するためのコーパス読出手段としてコンピュータを機能させるThe automatic program for creating multiple-choice language test questions further reads a corpus designated by the user from the computer-readable corpus group storage means for storing a corpus group consisting of a plurality of corpora and stores it in the corpus storage means The computer is made to function as a corpus reading means for doing this .

好ましくは、コーパスは第1言語の文と第2言語の文との対訳を複数個含むバイリンガルコーパスであり、文選択手段は、コーパス記憶手段に記憶されたバイリンガルコーパスから、選択方式にしたがって多肢選択言語試験問題の元となる対訳を選択するための対訳選択手段を含む。   Preferably, the corpus is a bilingual corpus including a plurality of parallel translations of sentences in the first language and sentences in the second language, and the sentence selecting means is selected from the bilingual corpora stored in the corpus storage means according to the selection method. A bilingual selection means for selecting a bilingual source of the selected language test question is included.

さらに好ましくは、構成要素決定手段は、選択された対訳の第2言語の文の構成要素のうち、所定条件を充足する構成要素を決定するための手段を含み、置換候補作成手段は、言語情報記憶手段に記憶された言語情報に基づいて、決定された構成要素に対する複数個の第2言語の置換候補を作成するための手段を含み、問題作成手段は、選択された対訳の第1言語の文と、選択された対訳の第2言語の文のうち、決定された構成要素を空所で置換した文とを含む問題文を作成するための手段と、複数個の置換候補のうち、妥当性判定手段により文が妥当でないと判定された予め定める所定個数の第2言語の置換候補と、決定された構成要素とからなる選択肢集合を作成するための選択肢作成手段と、問題文と選択肢集合とを所定の問題形式に整形するための整形手段とを含む。 More preferably, the constituent element determining means includes means for determining a constituent element satisfying a predetermined condition among the constituent elements of the selected bilingual sentence in the second language, and the replacement candidate creating means includes the language information. based on the stored language information in the storage means includes means for creating a replacement candidate in the plurality of second language for the determined components, problems creating means, the first language of the selected translation And a means for creating a question sentence including the sentence in which the determined component is replaced with a blank space among the sentences in the second language of the selected parallel translation, and among a plurality of replacement candidates, Option creation means for creating a set of choices consisting of a predetermined number of second language replacement candidates determined in advance by the validity judgment means and the determined constituent elements, and question sentences and options A set with a given problem form And a shaping means for the form.

題作成手段は、選択された対訳の第1言語の文と、選択された対訳の第2言語の文のうち、決定された構成要素を、妥当性判定手段により文が妥当でないと判定された置換候補で置換して得られた文とを含む問題文を作成するための手段と、問題文の第2言語の文のうち、置換候補と、置換候補以外の所定個数の単語または単語群とを選択肢候補として表示するように問題文を整形するための整形手段とを含んでもよい。 Problem creating means is determined and sentence in the first language of the selected translation, of the sentence in the second language of the selected translation, the determined elements, the statement is not valid due appropriateness determination means Means for creating a question sentence including a sentence obtained by replacement with a replacement candidate, and a replacement candidate and a predetermined number of words or word groups other than the replacement candidate among sentences in the second language of the question sentence And a shaping means for shaping the question sentence so as to be displayed as option candidates.

好ましくは、構成要素決定手段は、選択された対訳の第2言語の文全体を所定条件を充足する構成要素として決定するための手段を含み、置換候補作成手段は、言語情報記憶手段に記憶された言語情報に基づいて、選択された対訳の第1言語の文を機械翻訳するための複数の機械翻訳手段を含み、問題作成手段は、選択された対訳の第2言語の文、および複数の機械翻訳手段による翻訳結果のうち、妥当性判定手段により妥当でないと判定された文からなる選択肢集合を作成するための手段と、選択された対訳の第1言語の文と、選択肢集合とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための手段とを含む。 Preferably, the constituent element determining means includes means for determining an entire sentence in the second language of the selected parallel translation as a constituent element satisfying a predetermined condition, and the replacement candidate creating means is stored in the language information storage means. based on the language information includes a plurality of machine translation means for mechanically translating the sentence of the first language of the selected translation, issue creation means, second language sentence of the selected translation, and more A means for creating an option set composed of sentences determined not to be valid by the validity determination means, a sentence in the first language of the selected parallel translation, and an option set. Means for creating a multiple choice language test question by combining in a predetermined form.

さらに好ましくは、多肢選択言語試験問題自動作成プログラムは、文選択手段、構成要素決定手段、置換候補作成手段、妥当性判定手段、および問題作成手段を制御して、所定個数の多肢選択言語試験問題を作成させるための制御手段としてコンピュータを機能させるMore preferably, multiple-choice language exam automatic creation program statement selected means, component determining means, substituted candidate creating unit, adequacy judging means, and controls the and problems creating means, a predetermined number of multi A computer functions as a control means for creating a limb selection language test question.

[多肢選択言語試験問題の概要]
多肢選択言語試験問題には、図1に示す空所補充問題、図3に示す誤り検出問題、図示しない正解文または誤り文選択問題等がある。以下に述べる実施の形態に係る多肢選択言語試験問題の作成装置は、少なくとも空所補充問題と誤り検出問題との双方を含む複数種類の多肢選択言語試験問題を作成することができる。
[Overview of multiple choice language test questions]
The multiple-choice language test problem includes a space filling problem shown in FIG. 1, an error detection problem shown in FIG. 3, a correct answer sentence or an error sentence selection problem (not shown), and the like. An apparatus for creating a multiple-choice language test problem according to an embodiment described below can create a plurality of types of multi-choice language test problems including at least both a space filling problem and an error detection problem.

まず、図1に示す空所補充問題について説明する。図1を参照して、空所補充問題では、受験者は正しい文となるように選択肢26から選択して問題文22中の空所24を補充することが要求される。   First, the empty space replenishment problem shown in FIG. 1 will be described. Referring to FIG. 1, in the empty space replenishment question, the examinee is required to replenish the empty space 24 in the question sentence 22 by selecting from the options 26 so that the sentence becomes a correct sentence.

本実施の形態に係る装置では、こうした空所補充問題では、正解は文をなし、不正解は文をなさないことを利用する。また、正解が誤りなく作成できるように、模範的な文を集めたコーパスを準備し、当該コーパスに含まれる文を種として、多肢選択言語試験問題を作成する。   In the device according to the present embodiment, in such empty space replenishment problem, it is utilized that the correct answer is a sentence and the incorrect answer is a sentence. In addition, a corpus that collects exemplary sentences is prepared so that correct answers can be created without error, and a multiple-choice language test question is created using the sentences included in the corpus as seeds.

より具体的には、模範的な文を集めたコーパスに基づいて、問題と選択肢(正解と不正解との候補)を生成する。正解はコーパスから抽出できる。問題と不正解の選択肢候補との組合せの各々について、文として妥当か否かを判定する。ここでは不正解の選択肢候補を生成するので、上記判定で文として妥当と判定されたものは、選択肢から除外する。以下の実施の形態では所定の方法で文の妥当性を計算し、妥当性が所定のしきい値を下回るもののみを選択肢として残す。   More specifically, questions and options (candidates for correct and incorrect answers) are generated based on a corpus that collects exemplary sentences. The correct answer can be extracted from the corpus. It is determined whether or not each combination of a question and an incorrect answer option candidate is valid as a sentence. Here, since incorrect option candidates are generated, those that are determined to be appropriate as sentences in the above determination are excluded from the options. In the following embodiment, the validity of a sentence is calculated by a predetermined method, and only those whose validity falls below a predetermined threshold are left as options.

図2に、例として、問題と解の候補とから生成される文群30を示す。図2を参照して、この文群は全部で5つの文40、42、44、46および48を含む。下線を引いた部分が解候補であり、その中で太字で示したものが正解である。図2に示す例では、1番目の文40と5番目の文48との双方とも正解となる。一般的に多肢選択の場合、選択肢の個数と正解の個数は一定である。本明細書では、特に断らない限り、前者を4、後者を1とする。したがってこの場合には1番目の選択肢40または5番目の選択肢48を削除する。   FIG. 2 shows, as an example, a sentence group 30 generated from a problem and a solution candidate. Referring to FIG. 2, this sentence group includes a total of five sentences 40, 42, 44, 46 and 48. The underlined portion is a solution candidate, and the one shown in bold is the correct answer. In the example shown in FIG. 2, both the first sentence 40 and the fifth sentence 48 are correct. In general, in the case of multiple choice, the number of options and the number of correct answers are constant. In the present specification, the former is 4 and the latter is 1 unless otherwise specified. Therefore, in this case, the first option 40 or the fifth option 48 is deleted.

誤り検出問題も、空所補充問題とほぼ同様に実現できる。図3に誤り検出問題の例50を示す。図3を参照して、この問題は、文52の4つの選択肢a)〜d)の中から誤り部分を選択する、というものである。この場合には、最初に文を決め、選択肢として単語を決め、その中の一つに関して単語の置換を行なって、文の妥当性検査で非文になることを確認すればよい。なお、最初に置換単語の位置を決めてから、他の選択肢を決めるようにしても同じことである。   The error detection problem can be realized in almost the same way as the empty space filling problem. FIG. 3 shows an example 50 of the error detection problem. Referring to FIG. 3, the problem is that an error part is selected from the four options a) to d) of the sentence 52. In this case, a sentence is first determined, a word is determined as an option, word substitution is performed on one of the sentences, and it is confirmed that the sentence is validated as a non-sentence. Note that the same is true if the alternative word is determined after the position of the replacement word is determined first.

[第1の実施の形態]
<構成>
以下、こうした手順を実現するための一実施の形態に係る装置の構成および動作について説明する。なお、以下の装置は本発明の一実施の形態に過ぎず、本発明が以下の実施の形態に限定されることはない。
[First Embodiment]
<Configuration>
Hereinafter, the configuration and operation of an apparatus according to an embodiment for realizing such a procedure will be described. The following apparatus is merely one embodiment of the present invention, and the present invention is not limited to the following embodiment.

図4に、本実施の形態に係る多肢選択言語試験問題作成システム60をブロック図形式で示す。図4を参照して、この多肢選択言語試験問題作成システム60は、問題作成の条件を設定するためにユーザが使用する条件選択部62と、種々のドメインに応じた問題の種文となる正しい文をそれぞれ含む、複数のコーパスからなるコーパス群66と、条件選択部62により設定された条件にしたがい、指定されたドメインにふさわしいコーパスをコーパス群66から選択し、上記した空所補充問題と誤り検出問題とのいずれかからなる多肢選択言語試験問題74を自動的に作成するための問題作成装置64と、問題作成装置64が問題を作成する際に参照する種々の言語情報データを記憶する各種データ記憶部68とを含む。問題作成装置64はまた、いわゆるインターネット70を用いて、多肢選択言語試験問題の作成中に文の妥当性をチェックする機能を持つ。   FIG. 4 shows a multiple-choice language test question creation system 60 according to the present embodiment in the form of a block diagram. Referring to FIG. 4, this multiple-choice language test question creation system 60 is a condition selection unit 62 used by the user to set conditions for question creation, and serves as a seed for questions according to various domains. A corpus group 66 composed of a plurality of corpuses each including a correct sentence and a corpus suitable for a designated domain are selected from the corpus group 66 according to the conditions set by the condition selection unit 62, and the above-described empty space replenishment problem A problem creation device 64 for automatically creating a multiple-choice language test question 74 consisting of any of the error detection problems and various language information data to be referred to when the problem creation device 64 creates a problem Various data storage units 68. The question creation device 64 also has a function of checking the validity of a sentence during creation of a multiple choice language test question using the so-called Internet 70.

多肢選択言語試験問題作成システム60はいわゆるコンピュータシステムで実現されることが想定されている。条件選択部62は、図示しないキーボードと、マウス等のポインティングデバイスと、条件設定の画面を用いた入出力を行なうためのソフトウェアおよび表示装置等からなる。本実施の形態においては、条件選択部62は、以下のような条件を指定する。   It is assumed that the multiple-choice language test question creation system 60 is realized by a so-called computer system. The condition selection unit 62 includes a keyboard (not shown), a pointing device such as a mouse, software for performing input / output using a condition setting screen, a display device, and the like. In the present embodiment, the condition selection unit 62 specifies the following conditions.

(1)問題作成の対象となるドメイン
(2)作成する多肢選択言語試験問題の種別(空所補充問題または誤り検出問題)
(3)作成する問題の個数
(4)問題作成時の種文の選択条件
(5)空所補充問題の際の空所の位置の決定条件
(6)空所補充問題の選択肢作成の際の条件
(7)候補の妥当性の検証方式
問題作成装置64は、後述するようにコンピュータハードウェアと、当該コンピュータ上で実行されるコンピュータプログラムとにより実現される。コーパス群66および各種データ記憶部68は、本実施の形態では、問題作成装置64を実現するものと同じコンピュータ内に設けられた記憶装置により実現される。
(1) Domain to be created (2) Type of multiple choice language test question to be created (vacancy refilling problem or error detection problem)
(3) Number of questions to be created (4) Specified sentence selection conditions at the time of question creation (5) Conditions for determining the position of the vacant space for the vacancy replenishment problem (6) Condition (7) Candidate Validity Verification Method The problem creating device 64 is realized by computer hardware and a computer program executed on the computer, as will be described later. In this embodiment, the corpus group 66 and the various data storage units 68 are realized by a storage device provided in the same computer as that for realizing the problem creation device 64.

問題作成装置64は、条件選択部62を用いてユーザにより指定されたドメインのコーパスをコーパス群66から選択するためのコーパス選択部80と、コーパス選択部80により選択されたコーパスを記憶するためのコーパス記憶部82と、条件選択部62を用いてユーザにより指定された条件にしたがって、コーパス記憶部82に格納されているコーパスの中から問題の元となる種文を選択するための種文選択部84とを含む。   The problem creating device 64 uses the condition selection unit 62 to select a corpus of a domain designated by the user from the corpus group 66, and stores the corpus selected by the corpus selection unit 80. A corpus storage unit 82 and a seed sentence selection for selecting a seed sentence that is a source of a problem from among corpora stored in the corpus storage part 82 according to a condition specified by a user using the condition selection unit 62 Part 84.

問題作成装置64はさらに、種文選択部84により選択された種文の中で、条件選択部62を用いてユーザにより指定された問題の種別に応じ、空所補充問題の作成の際には指定された条件にしたがった位置の単語を空所として選択し、誤り検出問題の作成の際には、選択肢となる単語位置を選択肢の数だけ選択し、問題の種別を示す情報および種文とともに出力するための問題位置選択部86と、問題位置選択部86から与えられた種文に対し、問題の種別を示す情報と問題位置とにしたがい、各種データ記憶部68に記憶された各種データを参照しながら選択肢を作成することにより、多肢選択言語試験の選択肢候補を生成するための選択肢候補生成処理部88と、選択肢候補生成処理部88により作成された選択肢候補に関連する文の各々に対し、その妥当性を判定するために、インターネット70を検索するための妥当性判定用データ検索部92と、選択肢候補生成処理部88から受取る選択肢候補に関連する文の各々に対し、妥当性判定用データ検索部92を用いて妥当性判定用データを検索し、文として妥当性を判定するとともに、条件選択部62から与えられる問題種別に応じ、問題自体の適切さをも判定するための妥当性判定部90とを含む。   Further, the problem creating device 64 further creates a space filling problem according to the type of problem designated by the user using the condition selecting unit 62 among the seed sentences selected by the seed sentence selecting unit 84. Select the word at the position according to the specified condition as a blank, and when creating an error detection problem, select the word position that will be the choice as many as the number of choices, along with information indicating the type of the problem and the seed sentence Various data stored in the various data storage unit 68 are output in accordance with the information indicating the problem type and the problem position for the problem position selection unit 86 for output and the seed sentence given from the problem position selection unit 86. An option candidate generation processing unit 88 for generating option candidates for a multiple-choice language test by creating an option while referring to a sentence related to the option candidate generated by the option candidate generation processing unit 88 In order to determine the validity, the validity determination data search unit 92 for searching the Internet 70 and the sentence related to the option candidate received from the option candidate generation processing unit 88 are valid. In order to search the validity determination data using the sex determination data search unit 92 and determine the validity as a sentence, and also determine the appropriateness of the problem itself according to the problem type given from the condition selection unit 62 The validity determination unit 90 is included.

妥当性判定部90は、選択肢候補の妥当性の判定の結果、問題が適切なものでないと判定された場合には、当該問題を破棄し、種文選択部84に対して次の問題作成を指示する機能を持つ。   When the validity determination unit 90 determines that the problem is not appropriate as a result of determining the validity of the option candidates, the validity determination unit 90 discards the problem and creates a next problem for the seed sentence selection unit 84. Has a function to direct.

問題作成装置64はさらに、妥当性判定部90によって適切と判定された問題を、問題の種類に応じた適切なフォーマットに整形するための整形部94と、整形部94により整形された問題に対して、インターネット70上のデータおよび各種データ記憶部68に記憶されたデータの中から、問題に関連した情報(例文、定義、語義等)を付与するための関連情報付与処理部96と、関連情報付与処理部96から出力される、関連情報が付与されかつ整形された問題を多肢選択言語試験問題74として記憶装置に書込む処理を行なうための出力部98とを含む。   The problem creation device 64 further includes a shaping unit 94 for shaping the problem determined to be appropriate by the validity determination unit 90 into an appropriate format according to the type of problem, and the problem shaped by the shaping unit 94. A related information addition processing unit 96 for assigning information (example sentence, definition, meaning, etc.) related to the problem from the data on the Internet 70 and the data stored in the various data storage unit 68; And an output unit 98 for performing a process of writing, as a multiple-choice language test question 74, a problem to which related information is given and shaped, which is output from the assignment processing unit 96, into a storage device.

なお、多肢選択言語試験問題の場合には、異なる問題文中に同じ単語が出現することは望ましくない。そのため、問題作成装置64は、出力部98により出力された多肢選択言語試験問題中の選択肢を記憶するための既出選択肢記憶部100を含み、選択肢候補生成処理部88は、問題作成時に既出選択肢記憶部100を参照して、既出の単語が後続の問題中に含まれないように、問題作成の際の単語の選択を行なう機能を持つ。   In the case of multiple choice language test questions, it is not desirable that the same word appears in different question sentences. Therefore, the question creating device 64 includes the already-presented option storage unit 100 for storing the options in the multiple-choice language test question output by the output unit 98, and the option candidate generation processing unit 88 is the already-chosen options at the time of problem creation. With reference to the memory | storage part 100, it has the function to select the word at the time of question preparation so that the already-existing word may not be included in a subsequent question.

図5は、コーパス記憶部82に記憶されたコーパス110の構成例を示す。図5を参照して、コーパス110は本実施の形態ではモノリンガルコーパスであって、複数個の例文116を含む。各例文116は、識別番号(ID)112と、本文114とを含む。コーパス群66に含まれるコーパスは、全て同じフォーマットである必要はないが、問題作成装置64の構成を簡単にするために、統一されたフォーマットであることが望ましい。   FIG. 5 shows a configuration example of the corpus 110 stored in the corpus storage unit 82. Referring to FIG. 5, corpus 110 is a monolingual corpus in the present embodiment and includes a plurality of example sentences 116. Each example sentence 116 includes an identification number (ID) 112 and a text 114. The corpuses included in the corpus group 66 do not have to be all in the same format, but in order to simplify the configuration of the problem creating apparatus 64, it is desirable that the corpora be in a unified format.

図6は、図4に示す各種データ記憶部68の構成を示す。図6を参照して、各種データ記憶部68は、選択肢を作成する際に使用する、ある単語に関連した誤りを誤りの種類にしたがって集めた複数のリストからなる誤りリスト120と、単語に関する辞書122と、同義語、反義語等を収録するとともに、単語の間の類似関係等を収録したシソーラス124と、所定の単語を、その頻度および重要度とともにリストした単語リスト126とを含む。   FIG. 6 shows the configuration of various data storage units 68 shown in FIG. Referring to FIG. 6, various data storage unit 68 uses error list 120 including a plurality of lists in which errors related to a certain word are collected according to the type of error, and a dictionary related to words, which are used when creating options. 122, a thesaurus 124 that records synonyms, antonyms, and the like, and similar relationships between words, and a word list 126 that lists predetermined words along with their frequencies and importance levels.

誤りリスト120は、綴りの似た語の集合を集めたリスト130と、ある単語と、その単語に対して綴りを誤った単語とからなる集合を集めたリスト132と、いわゆる和製英語を正しい英語単語(単語列)とともに集めたリスト134とを含む。   The error list 120 includes a list 130 in which a set of words with similar spellings is collected, a list 132 in which a set of a certain word and a word misspelled with respect to the word is collected, and so-called Japanese-English. And a list 134 collected together with words (word strings).

リスト130に含まれる単語の集合の例として、「moss,miss,mess」がある。リスト132に含まれる単語の集合の例としては、「flight,fright,flit,flite」等がある。リスト134に含まれる単語の集合の例としては、「nighter(ナイター),night game」がある。   As an example of a set of words included in the list 130, there is “moss, miss, message”. As an example of a set of words included in the list 132, there are “flight, flight, flit, flite” and the like. As an example of a set of words included in the list 134, there is “night (night), night game”.

後述するように、本実施の形態に係る多肢選択言語試験問題作成システム60は、コンピュータハードウェアおよびその上で実行されるソフトウェアにより実現可能である。図7に、多肢選択言語試験問題作成システム60を実現するためのソフトウェアを構成するプログラムのメイン処理の流れをフローチャート形式で示す。以下、図7を参照してこのプログラムの制御構造について説明する。   As will be described later, the multiple-choice language test question creation system 60 according to the present embodiment can be realized by computer hardware and software executed thereon. FIG. 7 shows the flow of the main process of the program constituting the software for realizing the multiple choice language test question creation system 60 in the form of a flowchart. Hereinafter, the control structure of the program will be described with reference to FIG.

図7を参照して、このプログラムが起動されると、ステップ140で設定の読込みが行なわれる。この設定は、図4に示す条件選択部62により設定され、記憶装置等に書き込まれていたものである。続いてステップ142で、読込んだ設定にしたがって、試験の種別を判定する。試験の種別が空所補充問題の場合にはステップ144に進む。試験の種別が誤り検出問題の場合にはステップ146に進む。以下同様に、選択された試験の種別にしたがい、適切なステップ144〜148の処理が実行される。   Referring to FIG. 7, when this program is activated, settings are read in step 140. This setting is set by the condition selection unit 62 shown in FIG. 4 and written in the storage device or the like. Subsequently, in step 142, the type of test is determined according to the read setting. If the test type is a vacancy replenishment problem, the process proceeds to step 144. If the test type is an error detection problem, the process proceeds to step 146. Similarly, appropriate processes in steps 144 to 148 are executed in accordance with the selected test type.

図8にステップ144で実行される空所補充問題の作成処理を行なうプログラムの制御構造をフローチャート形式で示す。図8を参照して、まずステップ150で作成中の問題番号を表す変数iに0を代入する。ステップ152で変数iに1を加算する。ステップ154で変数iの値が、作成する問題数として設定された値MAXを超えたか否かを判定する。変数iの値が値MAXを超えていれば処理を終了する。変数iの値が値MAX以下であれば制御はステップ156に進む。   FIG. 8 is a flowchart showing a control structure of a program for performing the empty space replenishment problem creation process executed in step 144. Referring to FIG. 8, first, in step 150, 0 is substituted into variable i representing the problem number being created. In step 152, 1 is added to the variable i. In step 154, it is determined whether or not the value of the variable i exceeds the value MAX set as the number of problems to be created. If the value of the variable i exceeds the value MAX, the process is terminated. If the value of variable i is less than or equal to value MAX, control proceeds to step 156.

ステップ156では、図4に示すコーパス記憶部82に記憶された文の中から所定の方法で種文を選択する。なお、図9を参照して後述するように、このステップで選択する種文については、長さに制限を設けてある。   In step 156, a seed sentence is selected by a predetermined method from the sentences stored in the corpus storage unit 82 shown in FIG. As will be described later with reference to FIG. 9, the length of the seed sentence selected in this step is limited.

続いてステップ158で、種文の中で空所とする位置を決定する。空所の位置も、全体の中からランダムに選択したり、品詞および単語の位置等を条件として選んだりすることができる。例えば、「最左の動詞(例えば「I lost the return ticket of my flight」の「lost」)」、「頻度の高い前置詞(例えば上記「of」)」、または「最右の限定詞(例えば上記「my」)」等を選択することができる。   Subsequently, in step 158, a position to be vacant in the seed sentence is determined. The position of the vacant space can also be selected randomly from the whole, or can be selected on the basis of the part of speech and the position of the word. For example, “leftmost verb (eg“ lost ”in“ I lost the return ticket of my flight ”)”, “frequent preposition (eg“ of ”above)”, or “rightmost determiner (eg above) "My") "etc. can be selected.

さらにステップ160で、選択肢候補からなる選択肢集合を作成する。このステップでは、ステップ158で選択された空所位置に存在していた単語を「正解」として保存(記憶)した上で、誤りの選択肢候補を複数個だけ作成し、i番目の問題に対する選択肢候補集合Aiとする。本実施の形態では、作成される選択肢候補の最大個数はM個とし、各選択肢候補をAi,mと表す(1≦m≦M)。ステップ160での処理の詳細については図10を参照して後述する。なお、後述するように、ステップ160の処理では、既出の問題に含まれる単語と同じ単語を選択肢候補とすることは不適当と考えられるので、そのような単語は選択肢候補としない。 In step 160, an option set made up of option candidates is created. In this step, after saving (storing) the word existing in the empty position selected in step 158 as “correct answer”, a plurality of error option candidates are created, and option candidates for the i-th problem are created. Let it be set A i . In the present embodiment, the maximum number of option candidates created is M, and each option candidate is represented as A i, m (1 ≦ m ≦ M). Details of the processing in step 160 will be described later with reference to FIG. As will be described later, in the process of step 160, it is considered inappropriate to select the same word as the word included in the already-explained problem as an option candidate. Therefore, such a word is not regarded as an option candidate.

この後、ステップ162で以下の繰返しを制御するための繰返制御変数mに0を代入する。ステップ164で変数mに1を算する。続いてステップ166で変数mの値が値Mを超えたか否かが判定される。変数mの値が値Mを超えた場合、制御はステップ172に進む。それ以外の場合、制御はステップ168に進む。ステップ172以下の処理については後述する。 Thereafter, in step 162, 0 is substituted into a repetition control variable m for controlling the following repetition. 1 to the summing variable m in step 164. Subsequently, at step 166, it is determined whether or not the value of the variable m exceeds the value M. If the value of variable m exceeds value M, control proceeds to step 172. Otherwise, control proceeds to step 168. The processing after step 172 will be described later.

ステップ168では、選択肢候補Ai,mを含む文が妥当な文かどうかを判定する。本実施の形態では、インターネット70を利用して文の妥当性を判定する。具体的には、本実施の形態では、空所の前後の内容語までの単語列と選択肢とからなる単語列をインターネット70のウェブにおいて検索し、あれば選択肢候補Ai,mを含む文が妥当な文だと判定する。ここでの目的は、誤りとして選択肢候補を見つけることであるから、選択肢候補Ai,mを含む文が妥当な文だと判定された場合、ステップ170で選択肢候補の集合Aiから選択肢候補Ai,mを削除し、ステップ164に戻る。さもなければ選択肢候補Ai,mを含む文は非文であって選択肢候補Ai,mは選択肢として適当であるから選択肢候補集合Aiに残し、何もせずステップ164に戻る。 In step 168, it is determined whether or not the sentence including the option candidates A i, m is a valid sentence. In the present embodiment, the validity of the sentence is determined using the Internet 70. Specifically, in this embodiment, a word string formed of a word sequence and choice of up before and after the content words of the cavity searches in U E Bed Internet 70, including choice candidates A i, a m if Judge that the sentence is valid. The purpose here is, since it is possible to find alternatives candidate as an error, selection candidates Ai, if the sentence containing the m is determined to be a valid statement, choice candidates Ai from the set A i choice candidate in step 170, Delete m and return to step 164. Otherwise, the sentence including the option candidate A i, m is a non-sentence, and the option candidate A i, m is suitable as an option, so that it remains in the option candidate set A i and returns to step 164 without doing anything.

ステップ166で変数mの値が値Mを上回ると、制御はステップ172に進む。ステップ172では、選択肢候補の集合Aiに含まれる要素の数|Ai|が2より大きいか否か(すなわち3以上か)を判定する。2より大きい場合にはステップ174に進むが、それ以外の場合には選択肢の数が不足し問題を構成できないので、この選択肢集合Aiについては問題作成をやめることとし、ステップ156に戻って次の種文の選択からやり直す。 If the value of variable m exceeds value M at step 166, control proceeds to step 172. In step 172, it is determined whether or not the number of elements | A i | included in the option candidate set A i is greater than 2 (that is, 3 or more). If it is greater than 2, the process proceeds to step 174. In other cases, the problem cannot be constructed because the number of options is insufficient, so that the problem creation is stopped for this option set A i , and the process returns to step 156 to the next. Redo from the selection of seeds.

ステップ174では、選択肢集合Aiに正解の選択肢を加え、ランダムな順番に配列してその内容を整形して、図1に示すような問題とする。ステップ176で、各選択肢についてウェブで検索した例文、辞書から読みだした語義等の関連情報をこの問題に付与する。さらにステップ178で、この問題を既出選択肢として図4に示す既出選択肢記憶部100のような記憶装置に記憶する。この情報は、ステップ160での選択肢候補の作成処理で使用される。 In step 174, correct choices are added to the choice set A i , arranged in a random order, and the contents are shaped to give a problem as shown in FIG. In step 176, related information such as example sentences searched on the web for each option, meanings read from the dictionary, and the like are given to the problem. Further, in step 178, this problem is stored as an existing option in a storage device such as the existing option storage unit 100 shown in FIG. This information is used in the option candidate creation process in step 160.

さらに、ステップ180において、このようにして作成された問題を所定の記憶装置に出力する。この後制御はステップ152に戻り、次の問題の作成を開始する。   In step 180, the problem created in this way is output to a predetermined storage device. Thereafter, control returns to step 152 to begin creating the next question.

図9を参照して、図8のステップ156で行なわれる種文選択処理について説明する。まずステップ181で、種文候補をコーパスの中から選択する。この際、本実施の形態では、種文の選択方式は複数の方式の中からユーザが指定できるようになっている。例えば種文を全くランダムに選択したり、文の属性(長さ、頻度、読みやすさ等)に関する条件、文に含まれる文法事項または文の使われる場面、例えば動詞を含む文、感嘆文、特定の前置詞を含む文、等の条件等で絞った中からランダムに選択したり、上記した属性の値にしたがって所定の順番で選択したりすることができる。   With reference to FIG. 9, the seed sentence selection process performed in step 156 of FIG. 8 will be described. First, in step 181, a seed sentence candidate is selected from the corpus. At this time, in the present embodiment, the user can designate a seed sentence selection method from a plurality of methods. For example, selecting a seed sentence at random, conditions regarding sentence attributes (length, frequency, readability, etc.), grammatical items included in the sentence or scenes where the sentence is used, such as sentences containing verbs, exclamation sentences, It is possible to select at random from narrowed down conditions such as a sentence including a specific preposition, etc., or to select in a predetermined order according to the above attribute values.

ステップ182では、ステップ181で選択した種文候補の形態素長が所定のしきい値TH1より大きいか否かを判定する。このような判定をするのは、あまりにも短い文では情報が足りず、受験者が選択肢を選ぶのが難しくなり、試験が成立しない可能性があるためである。形態素長がしきい値TH1より大きければステップ184に進み、それ以外の場合には種文として不適当であるためステップ181に戻り、次の種文候補の選択を行なう。一方、ステップ184では、形態素長が別のしきい値TH2(TH2>TH1)より小さいか否かを判定する。このような判定を行なうのは、問題文が長いと、場所をとり、例えば携帯電話等の狭い画面上に問題を表示するには不都合である可能性があるためである。形態素長がしきい値TH2より小さければこの種文候補を種文として種文選択の処理を終了する。さもなければステップ181に戻り、次の種文候補の選択から繰返す。   In step 182, it is determined whether or not the morpheme length of the seed sentence candidate selected in step 181 is greater than a predetermined threshold value TH1. Such a determination is made because there is not enough information in a too short sentence, it becomes difficult for the examinee to select an option, and the test may not be established. If the morpheme length is larger than the threshold value TH1, the process proceeds to step 184. Otherwise, the process returns to step 181 because it is inappropriate as a seed sentence, and the next seed sentence candidate is selected. On the other hand, in step 184, it is determined whether or not the morpheme length is smaller than another threshold value TH2 (TH2> TH1). Such a determination is made because if the problem sentence is long, it may be inconvenient to take a place and display the problem on a narrow screen such as a mobile phone. If the morpheme length is smaller than the threshold value TH2, the seed sentence selection process is terminated using this seed sentence candidate as a seed sentence. Otherwise, return to Step 181 and repeat from the selection of the next seed sentence candidate.

図10に、図8のステップ160で実行される選択肢候補作成処理の詳細をフローチャート形式で示す。図10を参照して、まずステップ190で、選択肢候補からなる集合Aiを空集合φとし、繰返制御変数jに0を代入する。ステップ191で変数jに1を加算する。ステップ192で変数jの値が選択肢候補の最大数Mを超えたか否かを判定する。jがMを超えた場合、この選択肢候補作成処理を終了する。jがM以下であればステップ193に進む。 FIG. 10 is a flowchart showing details of the option candidate creation process executed in step 160 of FIG. Referring to FIG. 10, first, in step 190, set A i consisting of option candidates is set to empty set φ, and 0 is assigned to repetition control variable j. In step 191, 1 is added to the variable j. In step 192, it is determined whether the value of the variable j exceeds the maximum number M of option candidates. If j exceeds M, the option candidate creation process is terminated. If j is M or less, the process proceeds to step 193.

ステップ193では、選択肢候補の単語を、図4に示す各種データ記憶部68を参照して選択する。この場合、以下のような選択の仕方が可能である。   In step 193, the candidate word is selected with reference to the various data storage units 68 shown in FIG. In this case, the following selection method is possible.

(1)問題位置の単語を置換しても文法を逸脱しないように、選択肢の単語の品詞、活用(過去形、単数現在等)を維持して別の単語に置換える。この場合、辞書122から単語をランダムに選択したり、シソーラス124から類義語または反義語を選択したり、単語リスト126から単語の頻度順、重要度順に単語を取出して置換したりできる。   (1) Maintaining the part of speech and utilization (past tense, singular present, etc.) of an alternative word and replacing it with another word so as not to deviate from the grammar even if the word in question is replaced In this case, words can be randomly selected from the dictionary 122, synonyms or antonyms can be selected from the thesaurus 124, and words can be extracted from the word list 126 and replaced in the order of word frequency and importance.

(2)単語を置換することで文法を逸脱するように、当該位置の単語の語基を維持して、品詞、活用(過去形、単数現在等)を置換える。例えば辞書122を参照して単語の活用形を変化させたり、ある単語を、当該単語に対応する別品詞の単語に置換する。   (2) The part of speech and the utilization (past tense, singular present, etc.) are replaced while maintaining the word base of the word at the position so as to deviate from the grammar by replacing the word. For example, referring to the dictionary 122, the utilization form of the word is changed, or a certain word is replaced with a word with a different part of speech corresponding to the word.

(3)頻度の高い誤りを再現するように、当該位置の単語を含む誤り単語の集合を図6に示す誤りリスト120から取出し、その中の単語で置換する。例えば、図6に示すように,綴りの似た語、綴りの誤っている語、和製英語等で元の単語位置を置換する。   (3) A set of error words including the word at the position is taken out from the error list 120 shown in FIG. 6 and replaced with the words in the error list 120 so as to reproduce errors with high frequency. For example, as shown in FIG. 6, the original word position is replaced with a similar spelling word, a misspelled word, Japanese-made English, or the like.

選択肢候補を選択した後、ステップ194において当該単語の頻度を各種データ記憶部68を参照して調べ、その頻度が所定のしきい値TH3より小さいか否かを判定する。頻度があまりに低い単語の場合、受験者は、見慣れないという理由だけで選択肢の単語が不正解であると考えてしまう可能性があり、選択肢として不適当と考えられるためである。したがってステップ194において頻度がしきい値TH3より小さいと判定された場合、ステップ193に戻り、次の選択肢候補を選択する。さもなければステップ195に進む。   After selecting an option candidate, in step 194, the frequency of the word is checked with reference to various data storage units 68, and it is determined whether or not the frequency is smaller than a predetermined threshold value TH3. This is because, in the case of words that are too infrequent, the examinee may think that the word of the choice is incorrect just because he / she is not familiar with it, and is considered inappropriate as an option. Therefore, if it is determined in step 194 that the frequency is smaller than the threshold value TH3, the process returns to step 193 to select the next option candidate. Otherwise, go to step 195.

ステップ195では、選択肢候補が既に作成した問題に出現した単語と同じか否かについて、図4に示す既出選択肢記憶部100に記憶された内容を参照して判定する。既出の単語は選択肢候補として妥当でないため、このような判定を行なう。したがって、選択肢候補が既出単語であればステップ193に戻り、次の選択肢候補について上記した処理を繰返す。既出単語でなければ、ステップ196に進み、この選択肢候補を選択肢候補集合Aiに追加する。この後ステップ191に戻る。 In step 195, it is determined whether or not the option candidate is the same as the word that has already appeared in the created problem with reference to the content stored in the already-existing option storage unit 100 shown in FIG. Such determination is made because the already-existing word is not valid as an option candidate. Therefore, if the option candidate is an existing word, the process returns to step 193, and the above-described processing is repeated for the next option candidate. If not, the process proceeds to step 196, and this option candidate is added to the option candidate set A i . Thereafter, the process returns to step 191.

以上が、例えば問題作成装置64が空所補充問題を作成する場合に実行されるプログラムのフローチャートである。   The above is a flowchart of the program executed when, for example, the problem creating device 64 creates the empty space refilling problem.

一方、図7に示すステップ146で実行される誤り検出問題の作成処理も、同様のプログラムにより実現できる。図11に、本実施の形態の問題作成装置64において採用したプログラムの制御構造をフローチャート形式で示す。図11において、図8と同じ処理には同じ参照番号を付す。したがってそれらについての詳細な説明は繰返さない。   On the other hand, the error detection problem creation processing executed in step 146 shown in FIG. 7 can also be realized by a similar program. FIG. 11 is a flowchart showing the control structure of the program adopted in the problem creating apparatus 64 of this embodiment. In FIG. 11, the same processes as those in FIG. Therefore, detailed description thereof will not be repeated.

図11において、ステップ156で種文を選択した後、制御はステップ200に進む。ステップ200では、選択肢として種文の中の所定個数(デフォルトは4個であるが、ユーザによる指定が可能である。)の単語を決定し、そのうちの一つを誤り単語位置として選択する。   In FIG. 11, after selecting a seed sentence in step 156, control proceeds to step 200. In step 200, a predetermined number of words (4 by default, but can be specified by the user) are selected as options, and one of them is selected as an error word position.

続いてステップ202で、選択された単語を別の単語で置換することにより、種文Biを別の文Bi 'に変換する。本実施の形態では、ここでの置換単語は、図6に示す誤りリスト120の各リストを用いて決定する。なお、ステップ200で選択肢として決定された単語と、ステップ202で決定された置換単語とは、いずれもこれより前の問題(空所補充/誤り検出の別を問わない。)において既出の単語ではないものとする。またこの置換単語は、後に記載する実験では内容語に限定し、機能語は候補から外している。 Then in step 202, by replacing the selected word in another word, to convert the Tanebun B i to another sentence B i '. In the present embodiment, the replacement word here is determined using each list of the error list 120 shown in FIG. It should be noted that the word determined as an option in step 200 and the replacement word determined in step 202 are both words that have already been mentioned in the previous problem (regardless of whether space filling or error detection is used). Make it not exist. This replacement word is limited to the content word in the experiment described later, and the function word is excluded from the candidates.

ステップ204で、置換後の文Bi 'が非文か否かを判定する。この判定は、図8のステプ168で行なう処理と同様の処理により実現できる。文Bi 'が非文であれば、この文Bi 'を誤り検出問題の問題とすることができる。 In step 204, it is determined whether or not the replaced sentence B i is a non-sentence. This determination can be realized by a process similar to the process performed in step 168 of FIG. If the sentence B i is a non-sentence, this sentence B i can be regarded as an error detection problem.

したがってステップ206で文Bi 'を整形して図3に示すような問題とする。ステップ208で、ステップ204の判定においてインターネット70等から取得した例文、辞書から取得した語義情報等を関連情報としてこの問題に付与する。ステップ210で、この問題を既出選択肢として図4の既出選択肢記憶部100に記憶する。ステップ212でこの問題を出力する。この後、ステップ152に戻り、次の問題の作成を行なう。 Therefore, the sentence B i is shaped in step 206 to give a problem as shown in FIG. In step 208, the example sentence acquired from the Internet 70 or the like in the determination of step 204, the meaning information acquired from the dictionary, etc. are assigned to this problem as related information. In step 210, this problem is stored as an existing option in the existing option storage unit 100 of FIG. In step 212, this problem is output. Thereafter, the process returns to step 152 to create the next problem.

こうして、誤り検出問題についても、自動的に作成することができる。これ以外にも多肢選択言語試験問題の形式はあるが、それらはいずれも上で説明したものと同様の考え方で実現できる。したがってここではそれら個々についてのプログラムの制御構造については説明しない。   In this way, an error detection problem can be automatically created. There are other forms of multiple-choice language test questions, but they can be realized in the same way as described above. Therefore, the control structure of each program will not be described here.

<動作>
上に説明した多肢選択言語試験問題作成システム60は以下のように動作する。図4を参照して、予め様々なドメインおよびレベルに対応したコーパス群66が準備されているものとする。また、問題を作成するための誤りリスト120、辞書122、シソーラス124、および単語リスト126についても予め準備されているものとする。
<Operation>
The multiple choice language test question creation system 60 described above operates as follows. Referring to FIG. 4, it is assumed that corpus groups 66 corresponding to various domains and levels are prepared in advance. It is also assumed that an error list 120, a dictionary 122, a thesaurus 124, and a word list 126 for creating a problem are prepared in advance.

ユーザは、条件選択部62を使用して種々の設定を行なう。例えば問題の対象となるドメイン、多肢選択言語試験問題の種別、作成する問題の数、作成しようとする問題のレベル、等を指定する。   The user performs various settings using the condition selection unit 62. For example, the domain to be questioned, the type of multiple choice language test question, the number of questions to be created, the level of the question to be created, etc. are designated.

コーパス選択部80は、ユーザによる指定に応答して、コーパス群66の中から適切なドメインで適切なレベルのコーパスを選択し、コーパス記憶部82に格納する。   The corpus selection unit 80 selects an appropriate level corpus in the appropriate domain from the corpus group 66 in response to the designation by the user, and stores it in the corpus storage unit 82.

種文選択部84は、条件選択部62により指定された条件にしたがって、コーパス記憶部82に格納されたコーパス中から種文を選択し、指定された条件とともに問題位置選択部86に与える。問題位置選択部86は、例えば作成すべき問題が空所補充問題であれば、どの単語を空所とするかを決定する。作成すべき問題が誤り検出問題であれば、問題位置選択部86は種文の中で選択肢となる単語位置を決定し、さらにどの単語を誤り単語で置換するかを決定する。なおこの順序は逆でもよい。   The seed sentence selection unit 84 selects a seed sentence from the corpus stored in the corpus storage unit 82 in accordance with the condition specified by the condition selection unit 62, and provides the selected problem sentence to the problem position selection unit 86 together with the specified condition. For example, if the problem to be created is a vacancy replenishment problem, the problem position selection unit 86 determines which word is vacant. If the problem to be created is an error detection problem, the problem position selection unit 86 determines a word position as an option in the seed sentence, and further determines which word is replaced with the error word. This order may be reversed.

選択肢候補生成処理部88は、問題位置選択部86により問題位置が決定された種文を受け、各種データ記憶部68を参照して、問題の種別に応じ選択肢候補を生成する。例えば問題が空所補充問題であれば、例えば図6に示すシソーラス124を参照し、問題位置の単語と同じ意味コードを持つ単語を選んで選択肢集合を作成する。   The option candidate generation processing unit 88 receives the seed sentence in which the problem position is determined by the problem position selection unit 86, refers to the various data storage units 68, and generates option candidates according to the type of the problem. For example, if the problem is an empty space replenishment problem, for example, a thesaurus 124 shown in FIG.

妥当性判定部90は、こうして生成された選択肢候補が妥当か否かを判定する。空所補充問題であれば、選択肢集合に含まれる単語を空所に補充した文が、一つを除いて非文となるか否かを判定する。また誤り検出問題であれば、問題位置に誤り単語を挿入した結果得られた文が非文となるか否かを判定する。この際、妥当性判定部90は、妥当性判定用データ検索部92を用いてインターネット70上のウェブを検索し、文の妥当性を判定する。   The validity determination unit 90 determines whether the option candidate thus generated is valid. If it is a space filling problem, it is determined whether a sentence in which words included in the option set are filled in the space becomes a non-sentence except for one. If it is an error detection problem, it is determined whether or not a sentence obtained as a result of inserting an error word at the problem position becomes a non-sentence. At this time, the validity determination unit 90 searches the web on the Internet 70 using the validity determination data search unit 92 and determines the validity of the sentence.

空所補充問題の場合、選択肢集合に含まれる単語を種文の空所に補充した文が、一つ(正解)を除いてすべて非文と判定されれば、妥当性判定部90は選択肢候補を整形部94に与える。誤り検出問題の場合、種文のうち問題位置に誤り単語を挿入して得られた文が非文であれば、妥当性判定部90はこの問題を整形部94に与える。それ以外の場合には、妥当性判定部90は選択肢候補生成処理部88から与えられた問題を破棄する。妥当性判定部90は、問題を採用した場合も、そうでない場合も、種文選択部84に再度問題の作成を開始することを指示する信号を与える。   In the case of an empty space supplementation problem, if all sentences except for one (correct answer) are determined to be non-sentences except for one (correct answer), the validity determination unit 90 selects an option candidate. Is given to the shaping unit 94. In the case of an error detection problem, if the sentence obtained by inserting the error word at the problem position in the seed sentence is a non-sentence, the validity determination unit 90 gives this problem to the shaping unit 94. In other cases, the validity determination unit 90 discards the problem given from the option candidate generation processing unit 88. Whether or not the problem is adopted, the validity determination unit 90 gives a signal that instructs the seed sentence selection unit 84 to start creating the problem again.

整形部94は、妥当性判定部90から問題が与えられると、問題の種類に応じて適切な形に整形し関連情報付与処理部96に与える。関連情報付与処理部96は、インターネット70から得られた例文、および各種データ記憶部68から得られた単語の語義等の関連情報を選択肢に付与し、出力部98に与える。出力部98は、この問題を既出選択肢記憶部100に書込んだ後,多肢選択言語試験問題74として問題を出力する。   When a problem is given from the validity determination unit 90, the shaping unit 94 shapes it into an appropriate shape according to the type of the problem and gives it to the related information addition processing unit 96. The related information addition processing unit 96 assigns example information obtained from the Internet 70 and related information such as word meanings obtained from the various data storage units 68 to the options, and provides them to the output unit 98. The output unit 98 writes this problem in the existing choice storage unit 100 and then outputs the problem as a multiple-choice language test question 74.

種文選択部84は、妥当性判定部90から次の問題の作成を指示する信号が与えられると、既に作成した問題数が条件選択部62から指定された問題数に達したか否かを判定し、達した場合に処理を終了する。達していない場合には、種文選択部84は次の種文をコーパス記憶部82から選択し、問題位置選択部86に与える。   When the signal for instructing the creation of the next question is given from the validity determination unit 90, the seed sentence selection unit 84 determines whether or not the number of questions already created has reached the number of questions specified by the condition selection unit 62. If it is determined and reached, the process is terminated. If not reached, the seed sentence selection unit 84 selects the next seed sentence from the corpus storage unit 82 and gives it to the problem position selection unit 86.

以下、種文選択部84、問題位置選択部86、選択肢候補生成処理部88、妥当性判定部90、妥当性判定用データ検索部92、整形部94、関連情報付与処理部96、出力部98および既出選択肢記憶部100により、指定された個数の問題が作成されるまで既に述べた動作が繰返される。   Hereinafter, the seed sentence selection unit 84, the problem position selection unit 86, the option candidate generation processing unit 88, the validity determination unit 90, the validity determination data search unit 92, the shaping unit 94, the related information addition processing unit 96, and the output unit 98. The already-described option storage unit 100 repeats the above-described operation until a specified number of questions are created.

なお、上記した妥当性の判定では、空所の前後の内容語までの単語列と、選択肢とからなる単語列がウェブ上に存在するか否かを基準とした。しかし本発明はそのような実施の形態には限定されない。これ以外にも、ウェブにおいて元の文の空所部分を選択肢候補Ai,m で置換した文を検索し、あれば妥当な文だと判定する方法、選択肢候補Ai,mを含む文を構成する全てのNグラム(たとえばトライグラム)がウェブ上で見つけられたら妥当な文だと判定する方法、ウェブから求めたNグラム尤度を用いて選択肢候補Ai,mを含む文尤度を計算し、所定のしきい値以上であれば妥当な文と判定する方法、等がある。なお最後に挙げた方法では、ウェブのNグラムの頻度としては、通常の単語列の頻度ではなく、検索システムで検索できた単語列を含む文書の数、すなわち文書頻度dfに置換える。例えば、バイグラムwの文書頻度をdf(w)、ユニグラムwの文書頻度をdf(wとすると、バイグラム文書尤度P(w)はdf(w)/df(w)とる。 The validity determination described above is based on whether or not a word string consisting of a word string up to the content word before and after the empty space and an option exists on the web. However, the present invention is not limited to such an embodiment. In addition to this, a method of searching for a sentence in which a blank portion of the original sentence is replaced with the option candidate A i, m on the web and determining that it is a valid sentence if there is a sentence including the option candidate A i, m A method of determining that all N-grams (for example, trigrams) constituting a sentence are valid if found on the web, and a sentence likelihood including option candidates A i, m using the N-gram likelihood obtained from the web There is a method of calculating and determining an appropriate sentence if it exceeds a predetermined threshold. In the last method, the frequency of the web N-gram is replaced with the number of documents including the word string that can be searched by the search system, that is, the document frequency df, instead of the normal word string frequency. For example, bigram w 1 the document frequency of w 2 df (w 1 w 2 ), when the document frequency of the unigram w 1 and df (w 1), bigram document likelihood P (w 1 w 2) is df (w 1 w 2) / df (w 1) and that Do not.

<実験>
上記した実施の形態に係る多肢選択言語試験問題作成システム60について、実験によりその有効性を検証した。実験では、コーパス群66として旅行会話とビジネス会話という二つのドメインのコーパスを準備し、多肢選択言語試験問題作成システム60により得られた問題を複数の受験者に解かせた結果と、各受験者のTOEIC(登録商標)スコアとが相関しているか否かを調べることで多肢選択言語試験問題作成システム60の有効性を検証した。
<Experiment>
The effectiveness of the multiple-choice language test question creation system 60 according to the above-described embodiment was verified by experiments. In the experiment, a corpus of two domains of travel conversation and business conversation was prepared as a corpus group 66, and the results obtained by letting multiple examinees solve the problem obtained by the multiple choice language test question creation system 60, and each test The effectiveness of the multiple-choice language test question creation system 60 was verified by examining whether or not the TOEIC (registered trademark) score of the person was correlated.

実験では、以下のオプションを使用した。上記したいずれかのコーパスを選択し、種文を順に選択させる。問題は空所補充問題とする。空所位置は種文の最左の動詞とする。選択肢候補としては、問題位置の単語と同じ意味コードを持つ単語をシソーラス124から選択する。妥当性判定では、選択肢候補の前後の内容語までをキーにしてウェブで文書頻度(妥当性判定用データ検索部92で検索できた単語列を含む文書の個数)を求め、これが0のものを選択肢とする。   The following options were used in the experiment. Select one of the above corpora, and select the seed sentence in order. The problem is a void filling problem. The vacant position is the leftmost verb in the seed sentence. As an option candidate, a word having the same meaning code as the word at the problem position is selected from the thesaurus 124. In the validity determination, the document frequency (the number of documents including the word string that can be searched by the validity determination data search unit 92) is obtained on the web using the content words before and after the option candidate as a key. As an option.

種文としては、形態素数が6未満、または21以上の文を除いた。また、選択肢候補から頻度9未満の単語を除いた。既出の問題で選択肢として採用された単語列は、別の問題では選択肢候補から除いた。妥当性判定用データ検索部92としては、GOOGLE(登録商標)を用いた。   As a seed sentence, sentences having a morpheme number of less than 6 or 21 or more were excluded. Also, words with a frequency of less than 9 were excluded from the choice candidates. The word string adopted as an option in the previous problem was excluded from the option candidates in another problem. As the validity determination data search unit 92, GOOGLE (registered trademark) was used.

こうして作成した問題を、TOEICスコアが既知の受験者に解かせ、項目反応理論(大友賢二著、「項目応答理論入門」、大修館書店、1996年等の教科書を参照されたい。)によって受験者の英語能力(θ)を推定した。受験者のTOEICスコアを横軸に、受験者の推定英語能力θを縦軸にして示したのが図12のグラフである。図12に示すように、両者の相関は82%と高かった。このことから、上記した実施の形態に係る多肢選択言語試験問題作成システム60によって自動作成した多肢選択問題/空所補充問題が受験者の英語能力を計測するのに有効であることが検証できた。
Candidates who have a TOEIC score should solve the problem created in this way, and examinee by item response theory (refer to textbooks such as Kenji Otomo, “Introduction to Item Response Theory”, Daishukan Shoten, 1996). English ability (θ) was estimated. The horizontal axis TOEIC score candidates, to that shown by the estimated English language candidates θ to the vertical axis is the graph of Figure 12. As shown in FIG. 12, the correlation between the two was as high as 82%. From this, it is verified that the multiple choice question / vacancy replacement problem automatically created by the multiple choice language test question creation system 60 according to the above-described embodiment is effective in measuring the English ability of the examinee. did it.

なお、本実験では、パーソナルコンピュータ1台で、1時間ほどの間に20、000問の多肢選択言語試験問題を作成した。従来、英語の検定試験の運営機関では、問題作成および整備に数年の時間をかけている。しかもそうした機関で準備された問題数は4、000問程度である。したがって、本実施の形態に係る多肢選択言語試験問題作成システム60が問題作成の上で非常に有効であることが分かる。   In this experiment, a 20,000-question multiple choice language test question was created in one personal computer in about an hour. Traditionally, institutions that administer English proficiency tests have taken several years to create and maintain questions. Moreover, the number of problems prepared by such institutions is around 4,000. Therefore, it can be seen that the multiple-choice language test question creating system 60 according to the present embodiment is very effective in creating a question.

[第2の実施の形態]
第1の実施の形態では、種文をソースとしてモノリンガルのコーパスを用いた。しかし、本発明はモノリンガルのコーパスを用いたものに限定されない。例えば、この第2の実施の形態のように、対訳を集めたバイリンガルコーパスを用いて多肢選択言語試験問題を作成することもできる。バイリンガルコーパスを種文のソースとして用いると、原文が制約として働く多肢選択言語試験問題を実現できる。
[Second Embodiment]
In the first embodiment, a monolingual corpus is used with a seed sentence as a source. However, the present invention is not limited to the one using a monolingual corpus. For example, as in the second embodiment, a multiple-choice language test question can be created using a bilingual corpus in which parallel translations are collected. If a bilingual corpus is used as a seed source, a multiple-choice language test problem in which the original text acts as a constraint can be realized.

<構成>
図13に、本実施の形態に係る多肢選択言語試験問題作成システム220の構成をブロック図形式で示す。図13を参照して、多肢選択言語試験問題作成システム220は、第1の実施の形態で使用された条件選択部62と同様の条件選択部222と、複数のバイリンガルコーパスを含むバイリンガルコーパス群234と、複数の機械翻訳装置226と、第1の実施の形態で使用した各種データ記憶部68と同様、図6に示すような各種データを記憶するための各種データ記憶部228と、条件選択部222、複数の機械翻訳装置226、各種データ記憶部228、およびインターネット230に接続され、条件選択部222により指定された条件にしたがって多肢選択言語試験問題232を自動的に作成するための問題作成装置224とを含む。
<Configuration>
FIG. 13 is a block diagram showing the configuration of the multiple-choice language test question creation system 220 according to the present embodiment. Referring to FIG. 13, a multiple-choice language test question creation system 220 includes a condition selection unit 222 similar to the condition selection unit 62 used in the first embodiment, and a bilingual corpus group including a plurality of bilingual corpora. 234, a plurality of machine translation devices 226, various data storage units 228 for storing various data as shown in FIG. 6, as well as various data storage units 68 used in the first embodiment, and condition selection A problem for automatically creating a multiple-choice language test question 232 connected to the unit 222, the plurality of machine translation devices 226, various data storage units 228, and the Internet 230 according to the conditions specified by the condition selection unit 222 Creating device 224.

各種データ記憶部228は図4に示す各種データ記憶部68と同様のデータを記憶している。したがってその構成についてはここでは説明は繰返さない。   The various data storage unit 228 stores the same data as the various data storage unit 68 shown in FIG. Therefore, the description thereof will not be repeated here.

複数の機械翻訳装置226は、本実施の形態では互いに異なる方式の機械翻訳装置からなっている。機械翻訳装置226は、後述するように誤り選択肢となる文を作成するために使用される。   In the present embodiment, the plurality of machine translation devices 226 are made up of different types of machine translation devices. The machine translation device 226 is used to create a sentence that becomes an error option, as will be described later.

問題作成装置224は、条件選択部222を用いてユーザが与える指示にしたがい、バイリンガルコーパス群234から一つのバイリンガルコーパスを選択するためのコーパス選択部240と、コーパス選択部240により選択されたバイリンガルコーパスを記憶するためのバイリンガルコーパス記憶部242を含む。このバイリンガルコーパスとしては、一般的には受験者の母語の文と、試験の対象となる言語の文との対訳文を多数含むものを選択する。例えば日本人に英語の試験を課す場合であれば、バイリンガルコーパスとして日本語と英語の対訳を多数含むものを用いる。本実施の形態では、日本語と英語とのバイリンガルコーパスを用いるものとする。この場合、複数の機械翻訳装置226は、いずれも日本語から英語への翻訳を行なうものを用いる。   The problem creation device 224 uses a corpus selection unit 240 for selecting one bilingual corpus from the bilingual corpus group 234 according to an instruction given by the user using the condition selection unit 222, and the bilingual corpus selected by the corpus selection unit 240. A bilingual corpus storage unit 242 is stored. As this bilingual corpus, generally, a bilingual corpus is selected that includes a large number of parallel translations of a sentence in the native language of the examinee and a sentence in the language to be examined. For example, when an English test is imposed on a Japanese person, a bilingual corpus including many Japanese and English translations is used. In this embodiment, a bilingual corpus of Japanese and English is used. In this case, a plurality of machine translation devices 226 are used that translate from Japanese to English.

問題作成装置224はさらに、バイリンガルコーパス記憶部242に記憶されたバイリンガルコーパスから、問題を作成するための種文を含む対訳を選択するための種文選択部244と、種文選択部244により選択された対訳のうちの英語の文について、空所補充問題における空所、誤り検出問題における選択肢位置等を選択するための問題位置選択部246とを含む。なお、後述するように、本実施の形態では、原文である日本語を提示してそれに対する複数の訳文から正しいものを選ぶ、という問題形式も可能である。そうした問題を作成する場合には、問題位置選択部246は英語の文全体をまとめて問題位置とする。   The question creation device 224 is further selected from a bilingual corpus stored in the bilingual corpus storage unit 242 by a seed sentence selection unit 244 for selecting a parallel translation including a seed sentence for creating a question, and a seed sentence selection unit 244. The English sentence of the translated text includes a problem position selection unit 246 for selecting a space in the space replacement problem, an option position in the error detection problem, and the like. As will be described later, in the present embodiment, a problem form in which the original Japanese is presented and the correct one is selected from a plurality of translated sentences is also possible. When creating such a problem, the problem position selection unit 246 collectively sets the entire English sentence as the problem position.

問題作成装置224はさらに、種文を含む対訳を受け、条件選択部222を用いてユーザにより指定された問題形式にしたがって選択肢候補を作成するための選択肢候補生成処理部248と、選択肢候補生成処理部248により生成された選択肢候補についてインターネット230を検索した結果に基づいて妥当性を判定し、問題として適切なもののみを残し、不適切なものを削除するための妥当性判定部250と、妥当性判定部250からの要求に応じてインターネット230を検索し、結果を妥当性判定部250に返すための妥当性判定用データ検索部252とを含む。   The question creation device 224 further receives a parallel translation including a seed sentence, and creates a choice candidate generation unit 248 for creating a choice candidate according to a question format specified by the user using the condition selection unit 222, and a choice candidate generation process. A validity determination unit 250 for determining validity based on a result of searching the Internet 230 for the option candidates generated by the unit 248, leaving only appropriate ones as problems and deleting inappropriate ones; A validity determination data search unit 252 for searching the Internet 230 in response to a request from the sex determination unit 250 and returning the result to the validity determination unit 250 is included.

選択肢候補生成処理部248が行なう選択肢候補生成処理は、作成すべき多肢選択言語試験問題の形式によって異なる。図14に、本実施の形態に係る問題作成装置224によって作成可能な多肢選択言語試験問題の例を示す。図14を参照して、問題作成装置224により作成可能な問題は、問題270のように日本語の原文を与えて対応の英語文の空所に、ある単語を適切に活用したものを選択肢から選ぶ問題、問題272のように日本語の原文を与えてそれに対応する適切な英語の訳文を4つの選択肢から選択する問題、問題274のように日本語の原文を与え、対応する英語の訳文の空所に補充すべき適切な単語を選択する問題、問題276のように日本語の複合語を与え、それに対する正しい訳語を選択肢から選ぶ問題、等がある。空所補充問題の場合の作成方法は基本的に第1の実施の形態と同様である。問題272の場合には、前述した複数の機械翻訳装置226に原文を与えることにより生成される英文を誤答として準備することができる。問題276の場合には、日本語の複合語の要素単語の各々を各種データ記憶部228内の辞書を使って翻訳し、それら訳語を組合せて誤答を生成できる。   The option candidate generation processing performed by the option candidate generation processing unit 248 differs depending on the format of the multiple choice language test question to be created. FIG. 14 shows an example of a multiple choice language test question that can be created by the question creation device 224 according to the present embodiment. Referring to FIG. 14, problems that can be created by the problem creating device 224 are selected from the options in which a Japanese original sentence is given and an appropriate word is used in the corresponding English sentence space as in question 270. The question to choose, the problem of selecting the appropriate English translation corresponding to the Japanese sentence as shown in question 272, the problem of selecting the appropriate English translation from the four options, the problem of selecting the corresponding Japanese translation as given in Japanese There are a problem of selecting an appropriate word to be filled in the empty space, a problem of giving a Japanese compound word as in question 276, and selecting a correct translation from the choices, and the like. The creation method for the empty space replenishment problem is basically the same as that of the first embodiment. In the case of the problem 272, an English sentence generated by giving the original sentence to the plurality of machine translation devices 226 described above can be prepared as an incorrect answer. In the case of the problem 276, each element word of the Japanese compound word can be translated using a dictionary in the various data storage unit 228, and an erroneous answer can be generated by combining these translated words.

これらいずれの場合にも、種文選択部244が選ぶ種文に日本語の文が含まれているため、図14に示すように問題文に日本語文を添えることが可能になる。この場合、例えば空所補充問題では、受験者は、英語だけでなく日本語も制約条件として考慮し解答する。したがって、種文が短くても解答することが容易になり、短い文でも種文として採用できるという効果がある。   In any of these cases, since the Japanese sentence is included in the seed sentence selected by the seed sentence selecting unit 244, it is possible to attach the Japanese sentence to the question sentence as shown in FIG. In this case, for example, in the empty space replenishment problem, the examinee considers not only English but also Japanese as a constraint condition and answers it. Therefore, it is easy to answer even if the seed sentence is short, and there is an effect that even a short sentence can be adopted as a seed sentence.

再び図13を参照して、問題作成装置224はさらに、妥当性判定部250によって問題として適切と判定されたものを問題形式にあわせて整形するための整形部254と、整形部254により整形された問題に、インターネット230から検索された用例、各種データ記憶部228に記憶されている語義、用法等の情報を付与するための関連情報付与処理部256と、関連情報付与処理部256により関連情報が付された問題を多肢選択言語試験問題232として外部の記憶装置に書込むための出力部258と、出力部258により出力される問題中の選択肢を記憶するための既出選択肢記憶部260とを含む。   Referring again to FIG. 13, the problem creating device 224 is further shaped by the shaping unit 254 for shaping what is determined to be appropriate as a problem by the validity judgment unit 250 according to the problem format, and the shaping unit 254. The related information addition processing unit 256 for adding information such as examples retrieved from the Internet 230, meanings stored in various data storage units 228, and usage information, and the related information addition processing unit 256 An output unit 258 for writing the question marked with a multiple choice language test question 232 to an external storage device, and an existing option storage unit 260 for storing the options in the problem output by the output unit 258; including.

<動作>
多肢選択言語試験問題作成システム220は以下のように動作する。空所補充問題については、多肢選択言語試験問題作成システム220の動作は第1の実施の形態に係る多肢選択言語試験問題作成システム60と同様の動作を行なう。異なるのは、選択する種文が日本語の文と英語の文との対訳からなること、短い文でも種文として使用できること、問題文に日本語の文を制約条件として追加すること、等である。従って以下では、図14に示す問題272を作成するときの多肢選択言語試験問題作成システム220の動作について説明する。
<Operation>
The multiple choice language test question creation system 220 operates as follows. For the empty space supplementation problem, the operation of the multiple-choice language test question creation system 220 performs the same operation as that of the multiple-choice language test question creation system 60 according to the first embodiment. The difference is that the selected seed sentence consists of a parallel translation of a Japanese sentence and an English sentence, that even a short sentence can be used as a seed sentence, a Japanese sentence is added to the problem sentence as a constraint condition, etc. is there. Therefore, hereinafter, the operation of the multiple-choice language test question creation system 220 when creating the question 272 shown in FIG. 14 will be described.

条件選択部222によって、問題272のような多肢選択言語試験問題を作成することが指定されたものとする。予めバイリンガルコーパス記憶部242には、ユーザの指示にしたがいコーパス選択部240がバイリンガルコーパス群234から選択したコーパスが記憶されているものとする。以下の説明では、このコーパスは日本語と英語のバイリンガルコーパスであるものとする。   Assume that the condition selection unit 222 is designated to create a multiple-choice language test question such as the question 272. It is assumed that the corpus selected by the corpus selection unit 240 from the bilingual corpus group 234 according to a user instruction is stored in the bilingual corpus storage unit 242 in advance. In the following description, this corpus is assumed to be a bilingual corpus of Japanese and English.

種文選択部244は、バイリンガルコーパス記憶部242に記憶されたコーパスの中から種文となる対訳を一組選択する。この選択の際、種文の長さとしては、日本語の文と英語の文との双方について考慮する。ただし、選ばれる種文は、第1の実施の形態の場合より短くてもよい。   The seed sentence selection unit 244 selects a pair of parallel translations as a seed sentence from the corpus stored in the bilingual corpus storage unit 242. At the time of this selection, both the Japanese sentence and the English sentence are considered as the length of the seed sentence. However, the selected seed sentence may be shorter than in the case of the first embodiment.

問題位置選択部246は、問題272のように複数の文のうちから適切な文を選択する問題の場合、種文全体を問題位置として選択し選択肢候補生成処理部248に与える。   In the case of a problem of selecting an appropriate sentence from a plurality of sentences like the problem 272, the problem position selection unit 246 selects the entire seed sentence as the problem position and gives it to the option candidate generation processing unit 248.

選択肢候補生成処理部248は、与えられた種文の対訳のうち、日本語の文を機械翻訳装置226に与え、機械翻訳させる。例えば、種文が「好きなデザートはアイスクリームです。」と「My favorite dessert is ice cream.」という文との対訳である場合を考える。選択肢候補生成処理部248は、この日本語の文「好きなデザートはアイスクリームです。」を複数の機械翻訳装置226の各々に与え、その結果を受取る。選択肢候補生成処理部248は、受取った機械翻訳結果と、種文の対訳とを妥当性判定部250に与える。   The option candidate generation processing unit 248 gives a Japanese sentence to the machine translation device 226 among the parallel translations of the given seed sentence, and causes the machine translation apparatus 226 to perform machine translation. For example, consider a case where the seed sentence is a translation of the sentence “My favorite dessert is ice cream.” And “My favorite dessert is ice cream.” The option candidate generation processing unit 248 gives this Japanese sentence “favorite dessert is ice cream” to each of the plurality of machine translation devices 226 and receives the result. The option candidate generation processing unit 248 gives the received machine translation result and the parallel translation of the seed sentence to the validity determination unit 250.

妥当性判定部250は、機械翻訳結果の各々を選択肢候補とし、妥当性判定用データ検索部252を用いたインターネットの検索を行ない、第1の実施の形態で行なったのと同様に、非文か否かの判定を行なう。非文でない候補は捨て、非文となる候補のみ残す。非文となる候補の数が2以下であれば、選択肢の数が不足する。したがって選択肢候補生成処理部248は、処理中の種文に関する問題作成を中止し、種文選択部244に対して次の種文選択を指示する。非文となる候補の数が3以上の場合、選択肢候補生成処理部248は、そのうち3つの文のみ選択して、種文の対訳とともに整形部254に与える。妥当性判定部250はこのとき、種文選択部244に対して次の種文の選択を指示する。これに応答して、種文選択部244は次の種文を選択し、次の問題の作成が開始される。   The validity determination unit 250 uses each of the machine translation results as option candidates, performs an Internet search using the validity determination data search unit 252, and performs a non-sentence in the same manner as in the first embodiment. It is determined whether or not. Discard non-sentence candidates and leave only non-sentence candidates. If the number of non-sentence candidates is 2 or less, the number of options is insufficient. Therefore, the option candidate generation processing unit 248 stops the problem creation related to the seed sentence being processed, and instructs the seed sentence selection unit 244 to select the next seed sentence. When the number of candidates for non-sentences is 3 or more, the option candidate generation processing unit 248 selects only three sentences and gives them to the shaping unit 254 together with the parallel translation of the seed sentences. At this time, the validity determination unit 250 instructs the seed sentence selection unit 244 to select the next seed sentence. In response to this, the seed sentence selection unit 244 selects the next seed sentence, and creation of the next question is started.

妥当性判定部250から選択肢候補と種文の対訳とを受取った整形部254は、図14に示す問題272のような形式に問題を整形する。この際、整形部254は、種文のうちの英語文と選択肢候補とをマージし、乱数にしたがってa)、b)、c)、d)のいずれかに配置する。   The shaping unit 254 that has received the option candidate and the parallel translation of the seed sentence from the validity determination unit 250 shapes the problem into a format like the problem 272 shown in FIG. At this time, the shaping unit 254 merges the English sentence of the seed sentence and the option candidate, and places them in any one of a), b), c), and d) according to a random number.

関連情報付与処理部256は、このように整形された問題に対し、インターネット230から検索した用例、各種データ記憶部228に記憶されている語義、同義語、反義語、関連単語等の情報を付与し出力部258に与える。   The related information addition processing unit 256 gives information such as examples retrieved from the Internet 230, meanings, synonyms, antonyms, and related words stored in various data storage units 228 to the problem thus shaped. This is given to the output unit 258.

出力部258は、この問題を多肢選択言語試験問題232として外部記憶装置に出力する。出力部258はまた、出力する問題文中の単語を既出選択肢記憶部260に格納する。   The output unit 258 outputs this problem to the external storage device as a multiple-choice language test question 232. The output unit 258 also stores the words in the question sentence to be output in the already-existing option storage unit 260.

以上の処理を繰返し、条件選択部222を用いてユーザが指定しただけの数の問題が作成できたら処理を終了する。   The above process is repeated, and when the number of problems specified by the user using the condition selection unit 222 has been created, the process ends.

以上のようにこの実施の形態の多肢選択言語試験問題作成システム220によれば、バイリンガルコーパスを用いるため、コーパス中の原文を制約として用いる問題を作成することができる。そのため、受験者は問題文が短くても答えを選択することができるようになる。その結果、コーパスをより有効に利用して、多くの種類の多肢選択言語試験問題を作成することが可能になる。   As described above, according to the multiple-choice language test question creation system 220 of this embodiment, since a bilingual corpus is used, a problem using the original text in the corpus as a constraint can be created. Therefore, the examinee can select an answer even if the question sentence is short. As a result, it is possible to create many types of multiple choice language test questions using the corpus more effectively.

また、上記第1の実施の形態、第2の実施の形態のいずれにおいても、様々な属性のコーパスを準備してそこから種文を選択することにより、試験の対象のドメイン(旅行会話、ビジネス会話、ニュース等)、対象となる受験者のレベル(中学、高校、大学等教育機関の別、または各種検定のランク等)に容易に対応することができる。例えば、特定の教科書の特定単元に出現する文(およびその訳文)を含むコーパスを準備することにより、その教科書が想定している学習者(例えば中学1年、高校3年、ビジネス英語受講者等)の学習レベルに適した多肢選択言語試験問題を容易に、かつ短時間のうちに作成することができる。   Also, in both the first embodiment and the second embodiment, by preparing a corpus having various attributes and selecting a seed sentence from the corpus, a domain to be tested (travel conversation, business) Conversation, news, etc.) and the level of the target examinee (junior high school, high school, university, etc., or the rank of various examinations). For example, by preparing a corpus that includes sentences (and their translations) that appear in a specific unit of a specific textbook, the learner assumed by that textbook (for example, junior high school 1st year, high school 3rd year, business English students, etc.) The multiple choice language test questions suitable for the learning level can be created easily and in a short time.

さらに、コーパス、辞書、シソーラス等を言語ごとに準備することで、複数の言語についても容易に多肢選択言語試験問題を作成できる。また、対訳辞書の言語の組合せを様々にかえることにより、受験者の母語と、試験の対象となる言語との多様な組合せを容易に実現できる。   Furthermore, by preparing a corpus, a dictionary, a thesaurus, and the like for each language, a multiple-choice language test question can be easily created for a plurality of languages. In addition, by changing the combination of languages in the bilingual dictionary, various combinations of the examinee's mother tongue and the language to be tested can be easily realized.

また、インターネット、辞書、シソーラス等を検索することにより、誤答となる選択肢には、適切な用例、語義、同義語、類義語、反義語等を関連情報として付加することができるので、単に問題を解くだけのための問題ではなく、教育効果をあげることが期待できる問題を作成できる。   Also, by searching the Internet, dictionary, thesaurus, etc., it is possible to add appropriate examples, meanings, synonyms, synonyms, antonyms, etc. as related information to options that become incorrect answers, so you can simply solve the problem You can create a problem that can be expected to have an educational effect.

なお、上記した実施の形態では、たとえば携帯電話のように狭い画面を使用して多肢選択言語試験問題を提供する場合を想定し、そのために問題文が長くなることを避けている。しかし、この制限は本質的なものではなく、たとえば問題文を提示するスペースに特に制限がない場合等には、問題文の長さを制限する必要はない。   In the above-described embodiment, for example, a case where a multiple-choice language test question is provided using a narrow screen such as a mobile phone is assumed, and therefore, the problem sentence is prevented from becoming long. However, this restriction is not essential. For example, when the space for presenting the question sentence is not particularly restricted, it is not necessary to restrict the length of the question sentence.

また、上記した実施の形態では、選択肢候補の妥当性を検査するに際してインターネット上のウェブページを検索し、その結果を用いている。ウェブページは極めて大規模なコーパスと考えることができるので、そこにおける、ある単語列からなる言語表現の出現頻度は、当該言語表現の妥当性を近似できると考えられる。つまり、頻度が大きければその言語表現が極めてよく使用されることの現れであり、頻度が非常に低いかまたはゼロであれば、それはその言語表現が非文法的であるか、不自然な表現であることが期待できる。したがって、上記したようにインターネットを用いることで妥当性検査を精度良く行なうことが期待できる。   In the above-described embodiment, when checking the validity of the option candidates, a web page on the Internet is searched and the result is used. Since a web page can be considered as an extremely large corpus, the appearance frequency of a linguistic expression composed of a certain word string can approximate the validity of the linguistic expression. In other words, if the frequency is high, it is an indication that the linguistic expression is very often used. If the frequency is very low or zero, it means that the linguistic expression is ungrammatical or unnatural. You can expect to be there. Therefore, it can be expected that the validity check is performed with high accuracy by using the Internet as described above.

もっとも、文法的であるにもかかわらず新規な表現はどのウェブページにものっていない可能性もあるし、正しい表現が全ていずれかのウェブページ上にあるという保証はない。したがって上記した妥当性検査はあくまで近似的なものと理解されるべきである。したがって、正しい文からなる大規模なコーパスを、ウェブの代わりに使用することもできる。   Of course, though it is grammatical, the new expression may not be on any web page, and there is no guarantee that all the correct expressions are on any web page. Therefore, it should be understood that the validity check described above is only approximate. Thus, a large corpus of correct sentences can be used instead of the web.

[コンピュータによる実現]
なお、上記した第1の実施の形態に係る問題作成装置64、および第2の実施の形態に係る問題作成装置224はいずれも、コンピュータシステムと、当該コンピュータシステムにより実行されるコンピュータプログラムと、当該コンピュータシステム内の記憶装置または外部記憶装置に格納されるデータとにより実現できる。図15はこのコンピュータシステム330の外観を示し、図16はコンピュータシステム330の内部構成を示す。
[Realization by computer]
Each of the problem creation device 64 according to the first embodiment and the problem creation device 224 according to the second embodiment includes a computer system, a computer program executed by the computer system, This can be realized by data stored in a storage device in the computer system or an external storage device. FIG. 15 shows the external appearance of the computer system 330, and FIG. 16 shows the internal configuration of the computer system 330.

図15を参照して、このコンピュータシステム330は、FD(フレキシブルディスク)ドライブ352およびCD−ROM(コンパクトディスク読出専用メモリ)ドライブ350を有するコンピュータ340と、いずれもコンピュータ340に接続されるキーボード346、マウス348、およびモニタ342とを含む。   Referring to FIG. 15, this computer system 330 includes a computer 340 having an FD (flexible disk) drive 352 and a CD-ROM (compact disk read only memory) drive 350, and a keyboard 346 that is connected to the computer 340. A mouse 348 and a monitor 342.

図16を参照して、コンピュータ340は、FDドライブ352およびCD−ROMドライブ350に加えて、CPU(中央処理装置)356と、CPU356、FDドライブ352およびCD−ROMドライブ350に接続されたバス366と、ブートアッププログラム等を記憶する読出専用メモリ(ROM)358と、バス366に接続され、プログラム命令、システムプログラム、および作業データ等を記憶するランダムアクセスメモリ(RAM)360とを含む。コンピュータシステム330はさらに、プリンタ344を含んでいる。   Referring to FIG. 16, in addition to FD drive 352 and CD-ROM drive 350, computer 340 includes CPU (central processing unit) 356 and bus 366 connected to CPU 356, FD drive 352 and CD-ROM drive 350. And a read only memory (ROM) 358 for storing a boot-up program and the like, and a random access memory (RAM) 360 connected to the bus 366 for storing a program command, a system program, work data, and the like. Computer system 330 further includes a printer 344.

ここでは示さないが、コンピュータ340はさらにローカルエリアネットワーク(LAN)への接続を提供するネットワークアダプタボードを含んでもよい。   Although not shown here, the computer 340 may further include a network adapter board that provides a connection to a local area network (LAN).

コンピュータシステム330に上記した問題作成装置64または問題作成装置224としての動作を行なわせるためのコンピュータプログラムは、CD−ROMドライブ350またはFDドライブ352に挿入されるCD−ROM362またはFD364に記憶され、さらにハードディスク354に転送される。または、プログラムは図示しないネットワークを通じてコンピュータ340に送信されハードディスク354に記憶されてもよい。プログラムは実行の際にRAM360にロードされる。CD−ROM362から、FD364から、またはネットワークを介して、直接にRAM360にプログラムをロードしてもよい。   A computer program for causing the computer system 330 to operate as the problem creation device 64 or the problem creation device 224 is stored in a CD-ROM 362 or FD 364 inserted in the CD-ROM drive 350 or FD drive 352, and Transferred to the hard disk 354. Alternatively, the program may be transmitted to the computer 340 through a network (not shown) and stored in the hard disk 354. The program is loaded into the RAM 360 when executed. The program may be loaded directly into the RAM 360 from the CD-ROM 362, from the FD 364, or via a network.

このプログラムは、コンピュータ340に上記した問題作成装置64または問題作成装置224としての動作を行なわせる複数の命令を含む。このために必要な基本的機能のいくつかはコンピュータ340上で動作するオペレーティングシステム(OS)またはサードパーティのプログラム、もしくはコンピュータ340にインストールされる各種ツールキットのモジュールにより提供される。したがって、このプログラムはこの実施の形態のシステムおよび方法を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られるように制御されたやり方で適切な機能または「ツール」を呼出すことにより、上記した問題作成装置64または224としての動作を実現するための命令のみを含んでいればよい。コンピュータシステム330の動作は周知であるので、ここでは繰り返さない。   This program includes a plurality of instructions that cause the computer 340 to operate as the problem creation device 64 or the problem creation device 224 described above. Some of the basic functions required for this are provided by operating system (OS) or third party programs running on the computer 340 or various toolkit modules installed on the computer 340. Therefore, this program does not necessarily include all functions necessary for realizing the system and method of this embodiment. This program calls out an appropriate function or “tool” in a controlled manner so as to obtain a desired result, thereby realizing the operation as the problem creating device 64 or 224 described above. Only need to be included. The operation of computer system 330 is well known and will not be repeated here.

なお、上記した実施の形態の説明では、例えば図7に示すように、作成する対象となる選択肢問題の種類に応じて、プログラムの主要部分を全く別のものとしている。しかし本発明はそのような実施の形態に限定されるわけではなく、共通の処理を実行する部分は同一のプログラムコードが実行されるようにしてもよい。また、上記説明では、制御構造の説明として便宜的にフローチャートを用いたが、実際のプログラムがこのようなフローチャートにより表された制御構造を持っているとは限らない。例えばオブジェクト指向プログラムのように、個々のオブジェクトが別々に動作し、全体として上に示した実施の形態の装置の機能を実現するものであってもかまわない。   In the above description of the embodiment, for example, as shown in FIG. 7, the main part of the program is completely different depending on the type of option problem to be created. However, the present invention is not limited to such an embodiment, and the same program code may be executed in portions that execute common processing. In the above description, a flowchart is used for convenience of description of the control structure. However, an actual program does not necessarily have the control structure represented by such a flowchart. For example, like an object-oriented program, each object may operate separately, and the functions of the apparatus of the above-described embodiment as a whole may be realized.

さらに、上記実施の形態では、コーパス、条件選択部、問題作成装置の各部、および多肢選択言語試験問題を記憶する記憶装置がすべて同一の場所にあるものとして説明した。しかし本発明はそのような実施の形態に限定されるわけではない。例えば問題作成装置がインターネットに接続されたあるコンピュータにより実現され、条件選択部が無線電話網およびインターネットを通じて当該コンピュータに接続可能な携帯電話のような情報端末装置で実現されてもよい。また、多肢選択言語試験問題を蓄積せず、条件選択部を介して問題の作成要求があるごとに、問題作成装置によって多肢選択言語試験問題を作成し、要求の送信元に返信するような構成を採ってもよい。   Furthermore, in the above-described embodiment, the corpus, the condition selection unit, each unit of the problem creation device, and the storage device that stores the multiple-choice language test questions are all assumed to be in the same place. However, the present invention is not limited to such an embodiment. For example, the problem creation device may be realized by a computer connected to the Internet, and the condition selection unit may be realized by an information terminal device such as a mobile phone that can be connected to the computer through a wireless telephone network and the Internet. Also, do not accumulate multiple-choice language test questions, create a multiple-choice language test question using the question creation device each time a question creation request is made via the condition selection unit, and send it back to the request sender A simple configuration may be adopted.

今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味および範囲内でのすべての変更を含む。   The embodiment disclosed herein is merely an example, and the present invention is not limited to the above-described embodiment. The scope of the present invention is indicated by each of the claims after taking into account the description of the detailed description of the invention, and all modifications within the meaning and scope equivalent to the wording described therein are intended. Including.

空所補充問題の例を示す図である。It is a figure which shows the example of an empty space replenishment problem. 問題作成の途中で得られる問題と解の候補とから生成される文群を模式的に示す図である。It is a figure which shows typically the sentence group produced | generated from the problem obtained in the middle of question preparation, and the solution candidate. 誤り検出問題の例を示す図である。It is a figure which shows the example of an error detection problem. 第1の実施の形態に係る多肢選択言語試験問題作成システム60のブロック図である。1 is a block diagram of a multiple-choice language test question creation system 60 according to a first embodiment. FIG. コーパス記憶部82に記憶されるコーパス110の構成の一例を示す図である。3 is a diagram illustrating an example of a configuration of a corpus 110 stored in a corpus storage unit 82. FIG. 各種データ記憶部68に記憶される各種データの構成の一例を示す図である。It is a figure which shows an example of a structure of the various data memorize | stored in the various data storage part. 第1の実施の形態に係る多肢選択言語試験問題作成システム60を実現するコンピュータプログラムの制御構造を示すフローチャートである。It is a flowchart which shows the control structure of the computer program which implement | achieves the multiple choice language test question creation system 60 which concerns on 1st Embodiment. 空所補充問題を作成するコンピュータプログラムの制御構造を示すフローチャートである。It is a flowchart which shows the control structure of the computer program which produces an empty space replenishment problem. 種文選択処理のフローチャートである。It is a flowchart of a seed sentence selection process. 選択肢候補作成処理のフローチャートである。It is a flowchart of an option candidate creation process. 誤り検出問題を作成するコンピュータプログラムの制御構造を示すフローチャートである。It is a flowchart which shows the control structure of the computer program which produces an error detection problem. 実験により得られた問題を受験者に解かせて得た受験者の英語能力(θ)と、受験者のTOEICスコアとの相関を示すグラフである。It is a graph which shows the correlation with the candidate's English ability ((theta)) obtained by making a candidate solve the problem obtained by experiment, and a candidate's TOEIC score. 本発明の第2の実施の形態に係る多肢選択言語試験問題作成システム220のブロック図である。It is a block diagram of the multiple choice language test question creation system 220 concerning the 2nd Embodiment of this invention. 第2の実施の形態において作成可能な多肢選択言語試験問題の種々の形式を模式的に示す図である。It is a figure which shows typically the various forms of the multiple choice language test question which can be created in 2nd Embodiment. コンピュータシステムの外観図である。1 is an external view of a computer system. 図15に示すコンピュータのブロック図である。FIG. 16 is a block diagram of the computer shown in FIG. 15.

符号の説明Explanation of symbols

60,220 多肢選択言語試験問題作成システム、62,222 条件選択部、64,224 問題作成装置、66 コーパス群、68,228 各種データ記憶部、70,230 インターネット、80 コーパス選択部、82 コーパス記憶部、84,244 種文選択部、86,246 問題位置選択部、88,248 選択肢候補生成処理部、90,250 妥当性判定部、92,252 妥当性判定用データ検索部、94,254 整形部、96,256 関連情報付与処理部、98,258 出力部、100,260 既出選択肢記憶部、242 バイリンガルコーパス記憶部   60,220 Multiple Choice Language Test Question Creation System, 62,222 Condition Selection Unit, 64,224 Question Creation Device, 66 Corpus Group, 68,228 Various Data Storage Units, 70,230 Internet, 80 Corpus Selection Unit, 82 Corpus Storage unit, 84, 244 Seed sentence selection unit, 86, 246 Problem position selection unit, 88, 248 Option candidate generation processing unit, 90, 250 Validity determination unit, 92, 252 Validity determination data search unit, 94, 254 Shaping unit, 96, 256 related information adding processing unit, 98, 258 output unit, 100, 260 existing option storage unit, 242 bilingual corpus storage unit

Claims (10)

コンピュータ読取可能なコーパスを記憶するためのコーパス記憶手段と、
選択肢作成のための、単語辞書、シソーラス、単語に関連した誤りを集めた誤りリスト、若しくは単語の頻度及び重要度とともにリストした単語リスト、又はこれらの任意の組合せを含む言語情報をコンピュータ読取可能な形式で記憶するための言語情報記憶手段と、
前記コーパス記憶手段に記憶された前記コーパスから、予め定める選択方式にしたがって多肢選択言語試験問題の元となる文を選択するための文選択手段と、
前記文選択手段により選択された文を構成する構成要素のうち、多肢選択の対象箇所とする構成要素を所定の条件により決定するための構成要素決定手段と、
前記言語情報記憶手段に記憶された前記言語情報のうち、当該決定された構成要素に関連する言語情報に基づいて、前記構成要素決定手段により決定された構成要素に対し所与の条件を充足する置換候補を作成するための置換候補作成手段と、
前記選択された文において、前記決定された構成要素を前記置換候補で置換することにより得られる文に含まれる前記置換候補を含む構成要素列、所定のコーパス中において検索するための検索手段と、
前記検索手段による検索結果に応答し、前記置換候補の各々に対し、前記構成要素列の前記所定のコーパス中における出現頻度を表す統計的尺度を前記検索手段による検索結果に基づいて算出するための算出手段と、
前記置換候補のうち、前記算出手段により算出された前記統計的尺度が予め定められたしきい値よりも小さな置換候補と、前記元となる文とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための問題作成手段としてコンピュータを機能させる、多肢選択言語試験問題自動作成プログラム。
Corpus storage means for storing a computer-readable corpus;
Computer-readable linguistic information including word dictionary, thesaurus, list of errors related to the word, or a list of words listed with the frequency and importance of the word, or any combination thereof, for making choices Language information storage means for storing in a form;
Sentence selection means for selecting a sentence that is a source of a multiple choice language test question from the corpus stored in the corpus storage means according to a predetermined selection method;
Among the constituent elements constituting the sentence selected by the sentence selecting means, the constituent element determining means for determining a constituent element that is a target location for multiple selection according to a predetermined condition;
Of the language information stored in the language information storage unit, a given condition is satisfied for the component determined by the component determination unit based on language information related to the determined component A replacement candidate creation means for creating a replacement candidate;
In the selected sentence, the determined components included in the sentence which is obtained by replacing the replacement candidate, the components string including the replacement candidate, for Oite search in a given corpus Search means;
In response to a search result by the searching means, wherein for each of replacement candidate, to calculate a statistical measure of the appearance frequency definitive in said predetermined corpus of the component string based on the search result by the searching means Means for calculating
Among the replacement candidates, multiple-choice selection is performed by combining a replacement candidate whose statistical measure calculated by the calculating means is smaller than a predetermined threshold and the original sentence in a predetermined form. An automatic multiple-choice language test question creation program that causes a computer to function as a question creation means for creating a language test question.
前記置換候補作成手段は、
前記言語情報記憶手段に記憶された前記言語情報のうち、当該決定された構成要素に関連する言語情報に基づいて、前記決定された構成要素に対する複数個の置換候補を作成するための手段を含み、
前記問題作成手段は、
前記選択された文のうち、前記決定された構成要素を空所で置換した問題文を作成するための手段と、
前記複数個の置換候補のうち、前記算出手段により算出された前記統計的尺度が前記しきい値よりも小さな予め定める所定個数の置換候補と、前記決定された構成要素とからなる選択肢集合を作成するための選択肢作成手段と、
前記問題文と前記選択肢集合とを所定の問題形式に整形するための整形手段とを含む、請求項1に記載の多肢選択言語試験問題自動作成プログラム。
The replacement candidate creating means includes:
Means for creating a plurality of replacement candidates for the determined component based on language information related to the determined component of the language information stored in the language information storage unit ,
The problem creating means is:
Means for creating a question sentence in which the determined component of the selected sentence is replaced with a space;
Among the plurality of replacement candidates, an option set including a predetermined number of replacement candidates in which the statistical measure calculated by the calculation unit is smaller than the threshold and the determined component is created. Choice creation means to
The multiple-choice language test question automatic creation program according to claim 1, further comprising: shaping means for shaping the question sentence and the option set into a predetermined question form.
前記問題作成手段は、
前記選択された文のうち、前記決定された構成要素を、前記算出手段により算出された前記統計的尺度が前記しきい値よりも小さいと判定された置換候補で置換して問題文を作成するための手段と、
前記問題文のうち、前記置換候補と、前記置換候補以外の所定個数の単語または単語群とを選択肢候補として表示するように前記問題文を整形するための整形手段とを含む、請求項1に記載の多肢選択言語試験問題自動作成プログラム。
The problem creating means is:
Among the selected sentence, the determined component, the statistical measure that is calculated by the calculation means to create a replacement to issue statements in small intention determination has been substituted candidates than the threshold value Means for
2. The shaping unit for shaping the question sentence so as to display the replacement candidate and a predetermined number of words or word groups other than the replacement candidate as option candidates. Multiple-choice language test question automatic creation program described.
さらに、前記所与の条件を指定するユーザの入力を受け、当該指定された所与の条件を前記置換候補作成手段に与えるための手段としてコンピュータを機能させる、請求項1に記載の多肢選択言語試験問題自動作成プログラム。 The multiple-choice selection according to claim 1, further comprising a computer functioning as a means for receiving a user's input designating the given condition and providing the designated given condition to the replacement candidate creating means. Language test question automatic creation program. さらに、複数個のコーパスからなるコーパス群を記憶するためのコンピュータ読取可能なコーパス群記憶手段から、ユーザによって指定されたコーパスを読出して前記コーパス記憶手段に格納するためのコーパス読出手段としてコンピュータを機能させる、請求項1に記載の多肢選択言語試験問題自動作成プログラム。 Further, the computer functions as a corpus reading means for reading a corpus designated by a user from a computer-readable corpus group storing means for storing a corpus group consisting of a plurality of corpora and storing it in the corpus storing means. The program for automatically creating multiple-choice language test questions according to claim 1. 前記コーパスは第1言語の文と第2言語の文との対訳を複数個含むバイリンガルコーパスであり、
前記文選択手段は、前記コーパス記憶手段に記憶された前記バイリンガルコーパスから、前記選択方式にしたがって多肢選択言語試験問題の元となる対訳を選択するための対訳選択手段を含む、請求項1に記載の多肢選択言語試験問題自動作成プログラム。
The corpus is a bilingual corpus including a plurality of parallel translations of sentences in a first language and sentences in a second language,
The sentence selection means includes a parallel translation selection means for selecting a parallel translation that is a source of a multiple-choice language test question according to the selection method from the bilingual corpus stored in the corpus storage means. Multiple-choice language test question automatic creation program described.
前記構成要素決定手段は、前記選択された対訳の前記第2言語の文の構成要素のうち、前記所定条件を充足する構成要素を決定するための手段を含み、
前記置換候補作成手段は、
前記言語情報記憶手段に記憶された前記言語情報に基づいて、前記決定された構成要素に対する複数個の前記第2言語の置換候補を作成するための手段を含み、
前記問題作成手段は、
前記選択された対訳の前記第1言語の文と、前記選択された対訳の前記第2言語の文のうち、前記決定された構成要素を空所で置換した文とを含む問題文を作成するための手段と、
前記複数個の置換候補のうち、前記算出手段により算出された前記統計的尺度が前記しきい値よりも小さいと判定された予め定める所定個数の前記第2言語の置換候補と、前記決定された構成要素とからなる選択肢集合を作成するための選択肢作成手段と、
前記問題文と前記選択肢集合とを所定の問題形式に整形するための整形手段とを含む、請求項6に記載の多肢選択言語試験問題自動作成プログラム。
The component determining means includes means for determining a component that satisfies the predetermined condition among the components of the sentence in the second language of the selected parallel translation,
The replacement candidate creating means includes:
Means for creating a plurality of replacement candidates for the second language for the determined component based on the language information stored in the language information storage means;
The problem creating means is:
Creating a question sentence including the sentence in the first language of the selected parallel translation and a sentence in which the determined component is replaced with a blank space among the sentences in the second language of the selected parallel translation Means for
Among the plurality of replacement candidates, the statistical measure that is calculated and replacement candidate of the second language a predetermined number of predetermined intended is determined smaller than the threshold value, which is the determined by the calculating means Choice creation means for creating a choice set consisting of components;
The multiple-choice language test question automatic creation program according to claim 6, comprising shaping means for shaping the question sentence and the option set into a predetermined question format.
前記問題作成手段は、
前記選択された対訳の前記第1言語の文と、前記選択された対訳の前記第2言語の文のうち、前記決定された構成要素を、前記算出手段により算出された前記統計的尺度が前記しきい値よりも小さいと判定された置換候補で置換して得られた文とを含む問題文を作成するための手段と、
前記問題文の前記第2言語の文のうち、前記置換候補と、前記置換候補以外の所定個数の単語または単語群とを選択肢候補として表示するように前記問題文を整形するための整形手段とを含む、請求項6に記載の多肢選択言語試験問題自動作成プログラム。
The problem creating means is:
Of the sentence in the first language of the selected parallel translation and the sentence in the second language of the selected parallel translation, the statistical measure calculated by the calculating means is the statistical measure calculated by the calculating means. means for creating a problem statement including a statement obtained by substituting at small the Most the determined replacement candidate than the threshold value,
Shaping means for shaping the question sentence so as to display the replacement candidate and a predetermined number of words or word groups other than the replacement candidate among the sentences in the second language of the question sentence as option candidates; The multiple-choice language test question automatic creation program according to claim 6, comprising:
前記構成要素決定手段は、前記選択された対訳の前記第2言語の文全体を前記所定条件を充足する構成要素として決定するための手段を含み、
前記置換候補作成手段は、前記言語情報記憶手段に記憶された言語情報に基づいて、前記選択された対訳の前記第1言語の文を機械翻訳するための複数の機械翻訳手段を含み、
前記問題作成手段は、
前記選択された対訳の前記第2言語の文、および前記複数の機械翻訳手段による翻訳結果のうち、前記算出手段により算出された前記統計的尺度が前記しきい値よりも小さいと判定された文からなる選択肢集合を作成するための手段と、
前記選択された対訳の前記第1言語の文と、前記選択肢集合とを所定の形態に組合せることにより多肢選択言語試験問題を作成するための手段とを含む、請求項6に記載の多肢選択言語試験問題自動作成プログラム。
The component determining means includes means for determining the entire sentence in the second language of the selected parallel translation as a component satisfying the predetermined condition,
The replacement candidate creating means includes a plurality of machine translation means for machine translating the sentence in the first language of the selected parallel translation based on language information stored in the language information storage means,
The problem creating means is:
The second language sentence of the selected translation, and of the translation result by the plurality of machine translation unit, wherein the statistical measure that is calculated by the calculating means is the Most determined smaller than the threshold value statements Means for creating a set of choices comprising:
The multi-selection language test problem according to claim 6, comprising means for creating a multiple choice language test question by combining the sentence of the first language of the selected parallel translation and the set of choices in a predetermined form. Automatic creation program for limb choice language test questions.
前記文選択手段、前記構成要素決定手段、前記置換候補作成手段、前記検索手段、前記算出手段、および前記問題作成手段を制御して、所定個数の多肢選択言語試験問題を作成させるための制御手段としてさらにコンピュータを機能させる、請求項1〜請求項9のいずれかに記載の多肢選択言語試験問題自動作成プログラム。 Control for creating a predetermined number of multiple-choice language test questions by controlling the sentence selection means, the constituent element determination means, the replacement candidate creation means, the search means , the calculation means , and the question creation means The multiple-choice language test question automatic creation program according to any one of claims 1 to 9, further causing a computer to function as a means.
JP2004221450A 2004-07-29 2004-07-29 Multiple choice language test question automatic creation program Active JP4018673B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004221450A JP4018673B2 (en) 2004-07-29 2004-07-29 Multiple choice language test question automatic creation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004221450A JP4018673B2 (en) 2004-07-29 2004-07-29 Multiple choice language test question automatic creation program

Publications (2)

Publication Number Publication Date
JP2006039353A JP2006039353A (en) 2006-02-09
JP4018673B2 true JP4018673B2 (en) 2007-12-05

Family

ID=35904395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004221450A Active JP4018673B2 (en) 2004-07-29 2004-07-29 Multiple choice language test question automatic creation program

Country Status (1)

Country Link
JP (1) JP4018673B2 (en)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4820197B2 (en) * 2006-03-31 2011-11-24 株式会社日本統計事務センター Capability value estimation method, capability value estimation device, and computer program
JP5317093B2 (en) * 2008-04-07 2013-10-16 シャープ株式会社 Learning content generation device, learning content generation method, program for causing a computer to function as the learning content generation device, and computer-readable recording medium storing the program
JP5401859B2 (en) * 2008-07-29 2014-01-29 富士通株式会社 Problem creation program, problem creation apparatus, and problem creation method
JP5182954B2 (en) * 2009-07-10 2013-04-17 日本電信電話株式会社 Cavity problem generator and program thereof
JP5515150B2 (en) * 2010-05-17 2014-06-11 公立大学法人首都大学東京 Learning support device, learning support system, and learning support program
JP5664978B2 (en) * 2011-08-22 2015-02-04 日立コンシューマエレクトロニクス株式会社 Learning support system and learning support method
KR101853091B1 (en) * 2017-05-19 2018-04-27 (주)뤼이드 Method, apparatus and computer program for providing personalized educational contents through user response prediction framework with machine learning
KR102231967B1 (en) * 2018-01-16 2021-03-25 최보연 Making system for test questions and method thereof
KR102149972B1 (en) * 2018-01-16 2020-09-03 최보연 Making system for test questions and method thereof
KR102149961B1 (en) * 2018-01-19 2020-09-07 최보연 Making system for test questions and method thereof
KR102143051B1 (en) * 2018-01-19 2020-08-13 최보연 Making system for test questions and method thereof
KR102195082B1 (en) * 2018-12-19 2020-12-24 최보연 Method for test questions
JP6930754B2 (en) * 2019-09-09 2021-09-01 atama plus株式会社 Learning support device and questioning method
CN111353037B (en) * 2020-02-27 2021-06-22 北京字节跳动网络技术有限公司 Topic generation method and device and computer readable storage medium
JP7019770B1 (en) 2020-09-29 2022-02-15 瑞穂 東海林 Computer systems and computer programs
KR102427321B1 (en) * 2020-11-30 2022-07-28 정재훈 Training system for auto generating and providing question

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2840119B2 (en) * 1990-08-01 1998-12-24 富士通株式会社 Automatic correct answer extraction method
JPH05281898A (en) * 1992-03-30 1993-10-29 Toshiba Corp Teaching support system
JPH07261653A (en) * 1994-03-25 1995-10-13 Hitachi Ltd Practice question forming and assisting system
JP4326107B2 (en) * 2000-03-23 2009-09-02 富士通株式会社 Problem creating apparatus and recording medium
JP2003173131A (en) * 2001-12-06 2003-06-20 Japan Research Institute Ltd Question generating system, education system using question generating system, question generating program, and recording medium with the program recorded thereon
JP2004085734A (en) * 2002-08-23 2004-03-18 Sanyo Electric Co Ltd Question preparation method, question preparation, question providing device, and computer program

Also Published As

Publication number Publication date
JP2006039353A (en) 2006-02-09

Similar Documents

Publication Publication Date Title
US10325517B2 (en) Systems and methods for extracting keywords in language learning
Paradis et al. Children's second language acquisition of English complex syntax: The role of age, input, and cognitive factors
JP4018673B2 (en) Multiple choice language test question automatic creation program
US9959776B1 (en) System and method for automated scoring of texual responses to picture-based items
Wu et al. Chinese spelling check evaluation at SIGHAN bake-off 2013
US8700382B2 (en) Personal text assistant
US9342499B2 (en) Round-trip translation for automated grammatical error correction
Thompson et al. A generative model for semantic role labeling
Herring et al. ‘I saw the madre’: evaluating predictions about codeswitched determiner-noun sequences using Spanish–English and Welsh–English data
Beinborn et al. Predicting the difficulty of language proficiency tests
US20070073532A1 (en) Writing assistance using machine translation techniques
JP4827163B2 (en) Test question distribution system
Lotz et al. Omission and other sins: Tracking the quality of online machine translation output over four years
Park et al. Is the sky pure today? AwkChecker: an assistive tool for detecting and correcting collocation errors
KR20090035346A (en) Language stydy method which accomplishes a vocabulary analysis
Kao et al. Design and development of the sentence-based collocation recommender with error detection for academic writing
Hermas L2 and L3 ultimate attainment: an investigation of two parameters
Xiang et al. Multiple constraints on second language processing of English dative alternation
JP7084003B1 (en) English composition correction result analysis system
Collentine et al. A corpus analysis of the structural elaboration of Spanish heritage language learners
Hamed Automatic generation of lexical recognition tests using natural language processing
Romagnoli Connecting Chinese Written Discourse: A Case Study Based on Italian Learners
Schwegler Diachronic Applications in Hispanic Linguistics ed. by Eva Núñez Méndez
Alreshidi et al. Auto-Extracting Method of Cognates Words in Arabic and English Languages
Adams Spelling correction and morphological analysis to aid electronic dictionary look-up

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070828

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070920

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4018673

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110928

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130928

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250