JP2007094291A

JP2007094291A - 自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体

Info

Publication number: JP2007094291A
Application number: JP2005286580A
Authority: JP
Inventors: Tetsuo Suga; 哲夫須賀
Original assignee: Individual
Current assignee: Individual
Priority date: 2005-09-30
Filing date: 2005-09-30
Publication date: 2007-04-12

Abstract

【課題】文脈に依存した自然言語知識の取得と広範囲な学習能力を実現する自然言語学習システムの言語知識の学習方式を記録した記録媒体を提供する。
【解決手段】この自然言語学習システム１は、仮想生活経験に基づいて自然言語知識を学習し、その結果取得する自然言語知識は仮想生活経験の文脈に依存した自然言語知識（文脈依存的な知識構造）となり、この学習・取得した自然言語知識を利用するために、該自然言語知識をプログラムの形式で自動生成して格納しデータ・ベースを自動的に構築する。
【選択図】図１

Description

本発明は、自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体に関する。

従来の、人間が日常的に使っている自然言語をコンピュータに理解および処理させるシステムである自動言語処理システムは、辞書からの語彙知識の移植、文法書からの構文規則群の移植に依存するいわゆるデータ・ドリブンで動作するものであった。
特になし特になし

上述した従来自動言語処理システムは、従来技術の人工知能開発おいては、「文脈依存的な知識構造」が乗り越え難い障壁の一つとなっているという技術的課題がある。

また、その自然言語学習システムには広範囲な学習能力が欠如しているという欠点があった。

また、従来技術のデータ・ベース組み込みによる自然言語学習システムが日本語、英語などの特定言語に制約されてしまうという限界があった。

また、辞書項目を移植した語彙データ・ベースに依存して処理するシステムであるので、膨大な容量の辞書データを予め格納するためのハードディスクなどの大きな記憶容量を必要とし、その大きなデータ検索等の処理のためにコンピュータの処理速度が遅くなるという欠点を有するものであった。

また、その自然言語学習システムの制作に要するデータ・ベースおよびルール・ベースの組み込みには膨大な労力コストがかかるという欠点があった。
本発明は以上のような従来技術の欠点に鑑みてなされたものであって、その目的は、文脈に依存した自然言語知識の取得と広範囲な学習能力を実現する自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体を提供することを目的としている。

本発明の前記ならびのそのほかの目的と新規な特徴は次の説明を添付図面と照らし合わせて読むと、より完全に明らかになるであろう。

ただし、図面はもっぱら解説のためであって、本発明の技術的範囲をそれらのみに限定するものではない。

上記目的を達成するために、本発明は次ぎに述べるような構成となっている。

＜請求項１記載の発明＞
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」は任意のヒトなどの「動作」を核として記述され、この「動作」のカテゴリに対応する動作主体、動作対象、動作受容体、動作起点、動作着点、道具使用などの「動作カテゴリ特性」に区別する該時間軸と該「動作カテゴリ特性」という２次元のマトリックスで表現される表現方式である自然言語学習システムの言語知識の学習方式を構成している。

＜請求項２記載の発明＞
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の２つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が一箇所差単語原理によるものであり、この一箇所差単語原理は、二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであるとみなして一箇所差統合原理を適用して文型規則を取得する原理のことである自然言語学習システムの言語知識の学習方式を構成している。

＜請求項３記載の発明＞
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の２つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が一箇所差成句原理によるものであり、この一箇所差成句原理は、異なる文長の文１と文２には一箇所差単語原理（二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであるとみなす原理）は適合しないが、記憶されている学習済みの文型規則に前記文１と前記文２に含まれるものがある場合は、その含まれる文型規則部分を成句とし、ただ一つの単語と同等であるとみなして一箇所差統合原理を適用して文型規則を取得する原理のことである自然言語学習システムの言語知識の学習方式を構成している。

＜請求項４記載の発明＞
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の２つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が分節文統合原理によるものであり、この分節文統合原理は、記憶済みの文型規則と取得された「素文」によりこの取得された「素文」を文型規則に統合する場合において、例えば記憶済みの「素文」から対応する「素文」が検出され、この検出された対応する「素文」が文型規則として統合可能な「素文」であると判明した場合には、個々の単語や単語群が一致していなくても、統合して新たな文型規則に集約するという原理である自然言語学習システムの言語知識の学習方式を構成している。

＜請求項５記載の発明＞
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文に含まれる個々の単語に関する処理の学習」であって、この「文に含まれる個々の単語に関する処理の学習」が、（１）語形についての学習および（２）語の用法と意味の学習という二つの側面に分けられ処理されようになっていて、前記「語形についての学習」が、同じ単語の語形変化についてその語形変化処理プログラムを自動生成して格納し、これにより取得された２つの単語からまったく同一語形変化処理プログラムが生成された場合は、その２つの単語は語形変形を共有するものであることを識別できるようにし、前記取得された語形変形を共有する２つの単語を同一の語形変化として集約するものであり、前記「語の用法と意味の学習」が、単語の知識は該単語がどのような文型にどのような語形で表れ得るかという用例データ側面と該単語がどのような意味表現であるかという意味表現側面という二つの側面で処理され、前記単語の処理は常に前記用例データ側面と前記意味表現側面が並列的に処理・記憶され、且つ、その学習されたことも常に並列的に処理・記憶されるものである自然言語学習システムの言語知識の学習方式を構成している。

＜請求項６記載の発明＞
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文に関係する仮想生活経験処理の学習」であって、この「文に関係する仮想生活経験処理の学習」が、複数の「筋書き」を比較して、偶発的な「情景」要因を除外する操作を重ねることにより、形式的な「筋書き」を取得する学習である自然言語学習システムの言語知識の学習方式を構成している。

＜請求項７記載の発明＞
「筋書き」に基づいて行われる学習処理が請求項２に記載の「文処理の学習」、請求項３に記載の「文処理の学習」、請求項４に記載の「文処理の学習」、請求項５に記載の「文に含まれる個々の単語に関する処理の学習」、請求項６に記載の「文に関係する仮想生活経験処理の学習」およびそれらを総合して必要に応じてプログラムを自動生成するという学習処理である自然言語学習システムの言語知識の学習方式を構成している。

＜請求項８記載の発明＞
請求項１に記載の発明の構成において、「筋書き」に基づいて行われる学習処理が請求項２に記載の「文処理の学習」、請求項３に記載の「文処理の学習」、請求項４に記載の「文処理の学習」、請求項５に記載の「文に含まれる個々の単語に関する処理の学習」、請求項６に記載の「文に関係する仮想生活経験処理の学習」およびそれらを総合して必要に応じてプログラムを自動生成するという学習処理である自然言語学習システムの言語知識の学習方式を構成している。

＜請求項９記載の発明＞
請求項１〜８いずれか記載の発明の構成において、自然言語学習システムが単語知識、構文知識およびデータのゼロからスタートするものであり、日本語、英語、仏語、スワヒリ語などの任意の自然言語を学習する自然言語学習システムである自然言語学習システムの言語知識の学習方式を構成している。

＜請求項１０記載の発明＞
請求項１〜９いずれか記載の自然言語学習システムの言語知識の学習方式のコンピュータプログラムを具備してなる自然言語学習プログラムを記録した記録媒体を構成している。

以上の説明から明らかなように、本発明にあっては次に列挙する効果が得られる。
（１）単語知識、構文知識およびデータのまったく無いゼロからスタートして自然言語知識を取得し記憶（格納、貯蔵、蓄積）していくことを可能とするものであり、且つ、データのゼロからのスタートにより言語の制約を受けることなく日本語、英語、仏語、スワヒリ語などの任意の自然言語の使用を可能とするとともに、請求項１〜６に記載のそれぞれ新規の発明である言語知識の学習方式を統合した自然言語学習システムを構成することにより、確かに動作する自然言語学習システムを実現できるという効果を得ることができる。
（２）本発明で実現される自然言語学習システムは単語知識、構文知識およびデータのゼロとすることが最適であり、ゼロスタートとすることにより辞書などの膨大なデータを持つことなく、高速処理を実現できるという効果を得ることができる。
（３）学習性能を基礎とする自然言語学習システムを構成するので、現存する世界中のいかなる言語にも対応できるので、語学習に類する仕事（例えば：暗号解読システム、任意の言語間の翻訳辞書）に適用できる。
（４）達成する言語知識は「文脈依存性」を充足するとともに、広範囲な学習能力を付与されるという効果を得ることができる。これにより、自然言語を核としたＰＣ用ＯＳの制作（本発明の自然言語学習システムをロム化してコンピュータＯＳの核として組み込むなど。）、自然言語を核とした家電組み込み用ＯＳの制作、自然言語を用いた要求説明によりプログラムを自動的に出力するコンピュータの製作、ロムチップ化してロボット用頭脳として学習機能を具えたロボットの製作などを可能とするものである。
（５）仮想生活経験を時間軸と動作カテゴリ特性という２次元のマトリックス（２次元リスト）で表現するものは、時間軸に沿って動作カテゴリの定数が配列された「筋書き」はその２次元リストのままに記憶庫に格納して検索可能な「筋書き」記憶データとでき、それが時間に沿ったデータであることにより、「文脈」を定義することを可能とする。
（６）一箇所差単語原理による処理は、二箇所（またはそれ以上）に違いのある素文を文形態の類似性に依拠して統合すると「ホンがない」、「埒もない」という２つの素文を統合して「（ホン埒）（がも）ない」という文型規則を生み出すことが可能となり、この文型規則から、「*−埒がない−*」という非文を生み出す誤りが生じることになるが、一箇所差単語原理処理によりこのような誤りを回避するという役割を果たす。
（７）一箇所差成句原理による処理は、一箇所差単語原理処理は素文の集合から文型規則を学習するときに等しい文長の素文を統合する役割を担うが、一箇所差成句原理処理は文の階層構造（入れ子構造）の学習を可能にするという役割をはたす。
（８）分節文統合原理による処理は、特異な成句表現を誤って統合してしまわないようにする役割をはたす。従来型の自然言語処理システムでは文法書に記載されている文型規則を事前に移植して用いるのであるが、本発明では一箇所差単語原理と一箇所差成句原理と分節文統合原理とによって、生活経験を通じて取得される素文をデータとして、文法書にあるような文型規則を自動学習するとともに、文法書に記載されることのない文型規則をも自動学習し、文生成のための文型規則をルールベースとして自己増殖することを可能としている。
（９）「文に含まれる個々の単語に関する処理の学習」は、従来型の辞書項目を転写する方式では単語の意味はそれ自体も文という単語系列でつくられている。例：（これだと「いく」という語の意味は「居場所の変化」のようなかたちになり、語と語の堂々めぐりになっている）のだが、本発明が実現する自然言語学習システムでは意味が「形式的筋書き」で表現される。（「いく」の意味は「動作主体Ｗ動作起点Ｐ１着点Ｐ２」のようなプログラムとなる）。すなわち日本語でも英語でもどの言語でも意味表示は同じ形式となり直接翻訳が可能になるだけでなく、Ｗ、Ｐ１、Ｐ２という引数にどんな定数を代入するかにより適切な解釈、適切な動作を生み出すことを可能とする。
（１０）「文に関係する仮想生活経験処理の学習」は、従来型の辞書項目を転写する方式では語の意味は文を用いて説明されるだけであるが、本発明では「仮想生活経験」の共通形式を取り出してプログラムを生成し、そのプログラムが意味を構成し、ことばによることばの定義ということにならない。たとえば、「これもホンだ」という文入力のある「筋書き」、「それも殺人事件だ」という文入力の生じる「筋書き」などには、同じモノゴトがくり返し現れる、という「形式的筋書き」が抽出できる。これにより、文の意味が直接「情景」として解釈されたり、行為として実現されたりする利点のほかに、「も(英語なら”ａｌｓｏ”)」という単語の意味は「くり返しという筋書き」で定義されることとなる。このことにより、日本語でも英語でもそのほかのどの言語でも意味を直接に翻訳可能にする。

以下、図面に示す本発明を実施するための最良の形態を詳細に説明する。
＜第１の実施形態＞

図１〜図５に示す本発明を実施するための最良の形態である第１の実施形態において１は自然言語学習システムであって、この自然言語学習システム１は、仮想生活経験に基づいて自然言語知識を学習し、その結果取得する自然言語知識は仮想生活経験の文脈に依存した自然言語知識（文脈依存的な知識構造）となり、この学習・取得した自然言語知識を利用するために、該自然言語知識をプログラムの形式で自動生成して格納しデータ・ベースを自動的に構築する。

したがって、自然言語学習システム１は単語知識も構文知識もそれらにかかる辞書などのデータもまったく有しないゼロでスタートすることを可能とするものである。データ・ゼロからスタートするものでは、制約なしにあらゆる自然言語文字を使用することを可能とする。すなわち、英語、日本語、仏語、スワヒリ語など任意の自然言語を学習することができ、その学習により取得される自然言語知識は仮想生活経験の文脈に依存した自然言語知識となる。

したがって、自然言語学習システム１は与えられた文を単語に分解したり、文と文を比べて異同を判断したり、言葉を仮想生活経験と比べて意味判断のモデルを取得しプログラムを自動生成する一般的能力（基本プログラム＝処理部２および記憶庫１０）を備えている。すなわち、ものごとを比べて共通性と違いに気付く能力および経験したものと学習したものを格納していく能力だけは初期から持っている。

自然言語学習システム１の意味学習は仮想生活経験を重ねるにつれて進む。すなわち、自然言語学習システム１では仮想生活経験から意味が実際に生じている。この仮想生活経験と意味の関係という両者の関係は、「生産的忘却」というからくりで説明することができる。

「生産的忘却」：いくつもの仮想生活経験がかさなり、それが類似の仮想生活経験であることにより自然言語学習システム１は忘却ということがおこる。それはただ忘れることではなく、複数の類似仮想生活経験の共通の部分を統合するなどして新たな仮想生活経験の形式として格納していく。それは述語関数の系列であり、自然言語学習システム１はこのような関数を自力でプログラムする。このようにして、「複数の類似仮想経験を忘却し、引き換えに新たな仮想生活経験の形式＝仮想生活経験のフォーマット」を獲得することを生産的忘却」という。

自然言語学習システム１の意味学習は、仮想生活経験を重ねるにつれて進む。
１）いくつかの類似した仮想生活経験についてその共通部分を選ぶ。
２）付随して共通したことばがあるならこれも共通のことばとして選ぶ。
３）ことばを「筋書き」（仮想生活経験の時間軸に沿った「情景」の連鎖）に関連させて記憶（内的な辞書）する。

このように学習された内的な辞書によって言語理解と発話などの出力などが行われる。自然言語学習システム１の意味理解は「筋書き」に準拠してなされるのである。
例：
＃１お母さんが入ってきて「オハヨウ」といいました。
＃２お父さんが入ってきて「オハヨウ、システム１君」といいました。
＃３など、など。

これらの仮想生活経験とそこに含まれたことばから自然言語学習システム１は次のような「オハヨウ」というプログラムを生成し格納する。
例：
「筋書き」の名前 ‐ OHAYO
「筋書き」のパラミータ ‐ FromAnyHuman ToAnyObject
「筋書き」使用条件の制約 ‐ NewComer

このような関数（手続き）プログラムが自然言語学習システム１自身によって制作されると、自然言語学習システム１はつぎのようにしてこれを使用する。
(OHAYO system1 mama) − 母親に対して自分がいいます。
(OHAYO Meg system1) − メグちゃんが自分に挨拶することを了解します。
(OHAYO papa mama)− 父親が母親に挨拶していることを了解します。
「筋書き」に準拠することのよい点：
１）文脈に応じた意味把握（実用意味論）を実現する。
２）日常のコミュニケーションの多くが誤解とすれ違いに終始することを説明できる。

自然言語学習システム１はAllegro Common LISPやMacintosh Common LISPなどのプログラミング言語が使用できるが、本実施の形態ではＬＩＳＰを使用している。LISPには下記のようなすぐれた点がある。
１）自然言語学習システム１は自分自身でプログラムを生成するが、ＬＩＳＰベースだとこういうことがすぐできる。
２）ほかのプログラム言語ではやりにくいシンボル処理に圧倒的に強く、数値計算もＣやＦＯＲＴＲＡＮなどに負けない。
３）学習に要する時間は、学習者の個性に合えば数日でマスターできる。
４）プログラム開発の速さが抜群である。

自然言語学習システム１は、ことばを初めて経験するときからふたつの単語の関係を比較し、関係をみつけるとその関係をあらわすプログラムを自動生成し格納する。
例：
-単語１−単語２ ---> 関係プログラム ---> 応用例
like - likes ---> &suf-s (&suf-s 'aim) -> aims
easy - easier ---> &del-y-suf-ier (&del-y-suf-ier 'lucky) -> luckier
ureshii - urepii ---> &del-shii-suf-pii (&del-shii-suf-pii osorosii) -> osoropii
dameda - dameyade ---> &del-da-suf-yade (&del-da-suf-yade 'souda) -> souyade
gewohnt - ungewohntheit --> &pre-un-suf-heit (&pre-un-suf-heit 'geschlacht) -> ungeschlachtheit

このような関係処理プログラムは自然言語学習システム１が自分でつくる（自動生成）。

従来の自然言語学習システムはシステムの外側の人間が単語の形の変化規則を予め教えておくが、自然言語学習システム１はこのような規則を自力でつくり応用できる。

自分でつくったプログラムを自然言語学習システム１は次のように応用することがでる。文の形についても同じである。自然言語学習システム１は仮想生活経験を通じて意味の理解も同じように獲得していく。
例：
「昼食」という経験：
昼食の経験１お母さんと一緒にミルクとサンドイッチ
昼食の経験２お母さん、お姉さんと一緒にミルクとスパゲッティ
昼食の経験３ひとりでジュースとハンバーグライス
など、など

自然言語学習システム１はこうした昼食経験の共通部分をとりだして記憶庫に格納する。格納するのは、共通部分を「筋書き」としてプログラムしたものである。

それは次のような形をしている。
「筋書き」の名前：昼食（英語世界だと lunch ）
「筋書き」のパラミータ：いっしょのヒトいつどこでのみものたべものその他
「筋書き」の使用上の制約：たべもの昼ころ／その日2回目

こうして「筋書き」が出来上がると、具体的なエピソード記憶は回想しにくくなる。また新しい昼食経験の記憶は「筋書き」のパラミータに特定の事物を代入する形で記憶される。
例：昼食（一緒のヒト：ＡＢチャン、時間：11時半、のみもの：ミルクセーキ、たべもの：チャンポン、）

自然言語学習システム１の処理部２の仮想生活経験に準拠した自然言語知識の学習アルゴリズムは図１に示すように、
１．仮想世界の設定Ｓ１、
２．仮想生活経験の取得Ｓ２、
３．言語経験の分離抽出Ｓ３、
４．仮想生活経験の学習処理Ｓ４、
５．自然言語経験の学習処理Ｓ５、
６．生活的情報と言語的情報の関連付けによる言語知識の形成（言語知識形成処理Ｓ６）、
７．仮想生活経験の記憶、言語知識の記憶、言語経験の記憶（記憶処理Ｓ７）、
８．ＬｉｍｉｔＳ８、
というようになっている。

自然言語学習システム１の自然言語知識の学習アルゴリズムの各定義と構成について説明する。
１．仮想世界の設定Ｓ１
・｛仮想世界｝とは

ヒト、モノ、動物などの「対象」がシンボリックに定義されて配置される仮想空間のことである。
・｛シンボリックに定義｝とは

実物ではなく、また画像でもなく、文字によるシンボル情報で表現されることである。
・｛対象｝とは

対象の記述単位は[属性 − 属性値]の対である（例えば属性：[色合い−赤]、属性値：[形状−球]のように）。そのような単位の階層的集積がヒト、モノ、などの仮想存在を定義する（例えばリンゴという仮想存在は、[リンゴ：色合い−赤] [形状−球」 [大きさ−…] [他の属性−属性値] ）のように）。
・｛仮想世界の定義｝

仮想世界は「対象」が任意の個数、任意の場所に配置された「対の集合」で定義されることになる（例えば [世界−[ [リンゴ−[・・・]] [ホン− [・・・] [ヒト１−[・・・]] ・・・ ]]のように）。
２．仮想生活経験の取得Ｓ２
・｛仮想生活経験の表現様式｝

仮想世界は、時間の経過とともに変化するのが普通（例えばヒトが何かの動作を行うことによる変化）であるが、変化しないままのこともある。任意の時点の仮想世界の状況を「情景」と呼ぶ。時間軸に沿った「情景」の系列を取得することは自然言語学習システム１の仮想生活経験を定義するものとなる（例えばヒト１がリンゴをたべる、など。）。自然言語学習システム１はこのように表現された仮想生活経験に準拠して学習を進める。
・{動作を核とする仮想生活経験の表現方式}

仮想生活経験は時間軸に沿った「情景」の連鎖によって記述されることとなる。これは一種の物語とみなすことができ「筋書き」と呼ぶ。自然言語学習システム１では「筋書き」は「（任意のヒトの）動作」を核として記述される。「動作」には例えば、移動、指さし、手渡し、話し、などの任意のカテゴリが設定され得る。それら「動作」のカテゴリに対応して、動作主体、動作対象、動作受容体、動作起点、動作着点、道具使用などの特性が区分される。（例えばヒト１がヒト２に１冊のホンを手渡す、という「筋書き」ならば、ヒト１が動作主体であり、ホンは動作対象、ヒト２は動作受容体、ヒト１が動作起点、ヒト２が動作着点となる。）、このようにして、自然言語学習システム１では、仮想生活経験が図２に示すように、時間軸と動作カテゴリ特性という２次元のマトリックス（２次元リスト）で表現される。

時間軸に沿って動作カテゴリの定数が配列された「筋書き」はその２次元リストのままに仮想生活経験記憶庫３に格納され、検索可能な「筋書き」記憶データとなる。また、それが時間に沿ったデータであることにより、「文脈」を定義することが可能となる。
３．言語経験の分離抽出Ｓ３

「筋書き」（仮想生活経験の連鎖）のなかで、例えば：動作カテゴリが「話し」である行を検出して、その動作対象の列に含まれている何らかの文を取り出し素文記憶庫４に格納する。

図２では、（t4 カテゴリ＝話し動作対象＝「これあげる」）（ｔ5 カテゴリ＝手わたし動作対象＝ホン）（t6 カテゴリ＝話し動作対象＝「ありがとう」）を検出して、その動作対象の列に含まれている文「これあげる」および「ありがとう」を取り出し、下位システムである素文記憶庫４に格納され、検索可能な素文記憶データとなり、それ以後の「文型規則」抽出に利用される。
４．仮想生活経験の学習処理Ｓ４

「筋書き」に基づいて行われる仮想生活経験の学習処理Ｓ４は
４．１文処理の学習Ｓ４１、
４．２文に含まれる個々の単語に関する処理の学習（単語処理Ｓ４２）、
４．３文に関係する仮想生活経験処理の学習（仮想生活経験の学習処理Ｓ４３）、
４．４それらを総合して必要に応じてプログラムを自動生成する（総合処理Ｓ４４）という４つの側面に大別される。

この４つの側面について説明する。
４．１文処理の学習Ｓ４１

ヒトが発話したままの未処理の文を「素文」と呼び素文記憶庫４に格納する。

複数の「素文」を類似性に基づいて統合した形式を「文型規則」と呼び文型規則記憶庫５に格納される。

自然言語学習システム１は２つ以上の「素文」を比較して類似の文型を統合して文型規則を構成する。その統合の根底には一箇所差統合原理処理４１１と分節文統合原理処理４１２という２つの構成原理による処理がある。

自然言語学習システム１には「素文」の集合から構文規則を導くアルゴリズムをその構成要素としてもつ。従来型の自然言語処理システムでは文法書に記載されている文型規則を事前に移植して用いるのであるが、自然言語学習システム１では、これら二つの原理によって、仮想生活経験を通じて取得される素文をデータとして、文法書にあるような文型規則を自動学習するとともに、文法書に記載されることのない文型規則をも自動学習し、文生成のための文型規則をルールベースとして自己増殖する。

２つの構成原理について説明する。
４．１．１一箇所差統合原理処理Ｓ４１１

一箇所差統合原理処理Ｓ４１１には一箇所差単語原理処理Ｓ４１１ａと一箇所差成句原理処理Ｓ４１１ｂとがある。
[一箇所差単語原理処理Ｓ４１１ａ]

一箇所差単語原理処理Ｓ４１１ａは、二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであると見なし、一箇所差統合原理処理Ｓ４１１を適用して新たな文型規則を集約する原理である。

例えば「ここは駅に近い」を文１、「あそこは駅に近い」を文２とすると、文１の「ここ」と文２の「あそこ」は文の文頭という同じ位置にあり、それ以外の語群はまったく同一であるから「（ここあそこ）は駅に近い」という文型規則が取得される。新に取得された文型規則は文型規則記憶庫５に記憶される。

二箇所（またはそれ以上）に違いのある素文を文形態の類似性に依拠して統合すると「ホンがない」、「埒もない」という２つの素文を統合して「（ホン埒）（がも）ない」という文型規則を生み出すことが可能となり、この文型規則から、「*−埒がない−*」という非文を生み出す誤りが生じることになるが、一箇所差単語原理処理Ｓ４１１ａによりこのような誤りを回避することができる。
[一箇所差成句原理処理Ｓ４１１ｂ]

一箇所差成句原理処理Ｓ４１１ｂは（図４の流れ図の下方ブロックで「一語あつかいで統合」とあるのを例解する。）は、「私はそう思う」を文１、「私はそれはいけないと思う」を文２とする。これは文長が異なるので、一箇所差単語原理処理Ｓ４１１ａに適合しない。しかし、自然言語学習システム１には学習済みの文型規則を格納する文型規則記憶庫５がある。もしこの文型規則記憶庫５の中に「（これそれあれ）（がは）（いいいけない）」のような文型規則が記憶済みであるならば、「それはいけないと」までの部分を成句とし、ただ一つの単語と同等であると見なしてしまって一箇所差統合原理処理Ｓ４１１を適用することが、できるということである。この場合、結果として「（私あなた）（はも）（そう [それはいけないと]）（思う）」のような文型規則が取得されることになる。新に取得された文型規則は文型規則記憶庫５に記憶される。

「一箇所差単語原理処理Ｓ４１１ａ」は素文の集合から文型規則を学習するときに等しい文長の素文を統合する役割を担うが、「一箇所差成句原理処理Ｓ４１１ｂ」は文の階層構造（入れ子構造）の学習を可能にするという役割をはたす。
４．１．２分節文統合原理処理Ｓ４１２

図３の流れ図の中断にある「分節文統合原理処理Ｓ４１２」について説明する。

「（私あなた）（はが）（学生教師）（だです）」という文型規則が文型規則記憶庫５に記憶済みで、「あなたも町長です」のような「素文」が取得されたとする。このような場合にこの「素文」を文型規則に統合すること（「（私あなた）（はがも）（学生教師町長）（だです）」という文型規則）を一般的に許してしまうと、誤った文を出力することになる危険を生む。しかし、例えば素文記憶庫４に「彼も市民です」という「素文」が検出されることによるなどの理由で）「（あなたかれ）も（町長市民）です」のように文型規則として分節可能な（統合可能な）「素文」である、と判明することもあり得る。そのような場合には、個々の単語や単語群が一致していなくても、統合することができるという原理が成立って、「（私あなた彼）」（はがも）（学生教師町長市民）（だです）」のような文型規則に集約できる。これを分節文統合原理処理という。これは「埒もない」、「にべもない」などの特異な成句表現を誤って統合してしまわないために必要な原理である。新に取得された文型規則は文型規則記憶庫５に記憶される。
従来型の自然言語処理システムでは文法書に記載されている文型規則を事前に移植して用いるのであるが、自然言語学習システム１では、これら二つの原理と「分節文統合原理処理Ｓ４１２」とによって、生活経験を通じて取得される素文をデータとして、文法書にあるような文型規則を自動学習するとともに、文法書に記載されることのない文型規則をも自動学習し、文生成のための文型規則をルールベースとして自己増殖する。
４．２文に含まれる個々の単語に関する処理の学習（単語処理Ｓ４２）

自然言語学習システム１の学習は単語の集合から語形の変形規則を導き、それをプログラムとして自動生成したり、仮想生活経験に依存した意味形式をプログラムとして自動生成するような、プログラム自動生成アルゴリズムである。その学習は文型規則だけではなく、平行して文中の単語についても行われ、その内容は語形についての学習（語形処理Ｓ４２１）および語の用法と意味の学習（語の用法・意味処理Ｓ４２２）、という２つの側面から行われる。
４．２．１語形についての学習（語形処理Ｓ４２１）

単語は文のなかでさまざまに変形される。自然言語学習システム１は、「いく」と「いかない」のような、同じ単語の語形変化を学習するにあたり、その語形変化規則処理プログラムを自動生成して語形変化規則記憶庫６に格納し、以後の言語処理に利用する。「いく」と「いかない」を例とすれば、その語形変化規則を自動生成プログラムの形式で生成し、そのプログラムに例えばＦ１というインデックスを付して語形変化規則記憶庫６に格納する。後に、「聞く」と「聞かない」、「空く」と「空かない」、などからまったく同一プログラムが生成されることになれば、２つの単語は語形変形を共有することが識別できるので、同一の語形変形として集約した語形変形規則を自動生成プログラムの形式で語形変化規則記憶庫６に格納する。
４．２．２語の用法と意味の学習（語の用法・意味処理Ｓ４２２）

自然言語学習システム１は、単語について学習された知識を２つの側面に分けて単語記憶庫７に格納する。１つの側面は、その単語が、どのような文型にどのような語形で表され得るか、という用例データである。もう１つの側面は、単語の意味表現である。単語の知識は常にこれら二つの側面が並列的に処理され、学習されたことも並列的に単語記憶庫７に記憶される。これは既存の自然言語学習システムで言えば辞書システムに相当するものが自動的に取得され構成されていくに等しい。

自然言語学習システム１の単語の意味表現は、その単語が出現した「筋書き」（仮想生活経験の連鎖）の比較から抽出され、複数の「筋書き」に一貫して表れる「情景」（任意の時点の仮想世界の状況）を形式化することにより「形式的筋書き」としてつくられる。この形式的「筋書き」は仮想生活経験の比較を通じて自動的に学習、構成、記憶されていく。すなわち自然言語学習システム１の言語学習方式は、仮想生活経験を形式化した意味表現をつくる言語学習方式であり、「筋書き」に準拠した意味表現をつくる言語学習方式である。

従来型の辞書項目を転写する方式では単語の意味はそれ自体も文という単語系列でつくられている（これだと「いく」という語の意味は「居場所の変化」のようなかたちになり、語と語の堂々めぐりになっている）のだが、自然言語学習システム１では意味が「形式的筋書き」で表現される（「いく」の意味は「動作主体Ｗ動作起点Ｐ１着点Ｐ２」のようなプログラムとなる）ので、日本語でも英語でもどの言語でも意味表示は同じ形式となり直接翻訳が可能になるだけでなく、Ｗ、Ｐ１、Ｐ２という引数にどんな定数を代入するかにより適切な解釈、適切な動作を生み出すことが可能となる。
４．３文に関係する仮想生活経験処理の学習（仮想生活経験の学習処理Ｓ４３）（「筋書き」の部分「筋書き」（部分的仮想生活経験連鎖）の類似性抽出）

複数の類似した「筋書き」（仮想生活経験の連鎖）を比較して、偶然的な「情景」要因を除外する操作を重ねることにより、形式的な「筋書き」が取得される。例えば、「こんにちは」という挨拶の「筋書き」は多様である。「ヒト１がヒト２に近づいて挨拶する」という「筋書き」と、「ヒト２がヒト３に遠くから挨拶する」という「筋書き」とには、同じ要素（ヒトがヒトに挨拶する）と異なる要素（近づいて、と、遠くから）とが混在する。偶発的な「近づく」ということ、あるいは動作主体が変化すること、などの偶発的な「情景」要因を除外していくと、「挨拶」という「筋書き」は「動作−話しかける」、「動作主体−任意のヒト」、「動作対象−別のヒト」、「動作起点−任意の位置」、「動作着点−任意の位置」という動作記述の形式的要因のみに縮約されることとなる。仮想生活経験の部分的「筋書き」を比べて、類似した要因だけを抽出し、偶発的な「情景」要因を除外して形式的「筋書き」を取得することが自然言語学習システム１の学習内容となる。

例えば、「いく」とか「つかむ」とかの動作が含まれた仮想生活経験を学習する場合、自然言語学習システム１は取得した形式的な「筋書き」をもとにプログラムを自動生成する。例えば、「つかむ」という動作を記述するプログラムは、「動作−把握」、「動作主体−任意のヒト」、「動作対象−近隣に位置する任意のモノまたはヒト」、などを引数とするプログラムとなるのである。このプログラムは、例えば、「花子が人形をつかむ」という文入力が与えられた場合、「動作−つかむ」、「動作主体−花子」、「動作対象−人形」のように引数へ定数を代入し、具体的な「筋書き」を再構成することによってその文の意味解釈を実現する。あるいはまた、「本をとりなさい」と命令されたときに、「動作主体−自然言語学習システム１」、「動作対象−本」のように定数化して可動プランを取得する。

このように自然言語学習システム１は仮想生活経験をもとにプログラムを自動生成して学習成果を仮想生活経験記憶庫３に格納していく。

従来型の辞書項目を転写する方式では語の意味は文を用いて説明されるだけであるが、自然言語学習システム１では「仮想生活経験」の共通形式を取り出してプログラム生成し、そのプログラムが意味を構成し、ことばによることばの定義ということにならない。たとえば、「これもホンだ」という文入力のある「筋書き」、「それも殺人事件だ」という文入力の生じる「筋書き」などには、同じモノゴトがくり返し現れる、という「形式的筋書き」が抽出できる。これにより、文の意味が直接「情景」として解釈されたり、行為として実現されたりする利点のほかに、「も(英語なら”ａｌｓｏ”)」という単語の意味は「くり返しという筋書き」で定義されることとなる。このことにより、日本語でも英語でもそのほかのどの言語でも意味が直接に翻訳可能になる。
４．４それらを総合して必要に応じてプログラムを自動生成（総合処理Ｓ４４）

「文処理の学習」「文に含まれる個々の単語に関する処理の学習」「文に関係する仮想生活経験処理の学習」等を総合して必要に応じてプログラムを自動生成する。

自然言語学習システム１は文データでも単語データでも仮想生活経験データでも二つ以上のデータを取得しては比較し共通構造の抽出処理を行うが、その処理の形式はプログラム自動生成ということによっている。ただし生成されたプログラムは各々の対応する文型規則記憶庫５、単語記憶庫７、仮想生活経験記憶庫３に格納される前に、当該記憶庫に同一インデックスのものがあるか否かをチェックし、すでに格納済みならばそのインデックスの重みを増加させるだけで済ませる。既成のものに同一インデックスのものがなければ、新たに格納する必要が生じたとして格納する。ここでも生成されるプログラムが全面的な新規構成プログラムである場合と格納済みプログラムの組み合わせ構成プログラムの場合とが区別される。（たとえば「いく」、「くる」、「手に取る」などの単語の意味がプログラム格納されているときに、「（Ｘを）とってくる」という単語の意味をプログラム生成するには、Ｘを動作着点として「くる「手に取る「いく」Ｘ」」という入れ子形式のプログラム動作をつくればよいからである。このような可能性が見つからない場合は新たなプログラム生成が必要になる。
５．自然言語経験の学習処理Ｓ５（関連付け）

自然言語学習システム１は単語の意味記述を形式化された「筋書き」と関連させて実現する。例えば、「リンゴ」という単語の意味は「動作−指示」、「動作主体−ヒト」、「動作対象−任意のリンゴ」という「筋書き」をもって定義される。「たべる」という単語の意味は「動作−食事」、「動作主体−任意のヒト」、「動作対象−任意のモノ」という「筋書き」で定義され、単語記憶庫７に意味登録される。単語記憶庫７にこのように関連付けられた意味登録をもつと、「彼がリンゴをたべる」という文は「動作主体−（彼女ではなく）彼」、「動作対象」−（バナナではなく）リンゴ」のような具体化された「筋書き」に翻訳されて解釈されることに
なる。
６．生活的情報と言語的情報の関連付けによる言語知識の形成（言語知識形成処理Ｓ６）

複数の文（既有の文型規則を含む）から新に統合に成功した文型規則は言語知識のひとつの側面である。複数の部分的仮想生活経験連鎖（部分的「筋書き」）の比較から形式化に成功して得られた形式的「筋書き」（意味「筋書き」）はもう一つの側面である。

これらが生じるたびに自然言語学習システム１は文型規則記憶庫５、単語記憶庫７に格納済みの該当データを書き換える。
７．記憶処理Ｓ７（記憶庫１０）

仮想生活経験を仮想生活経験記憶庫３へ、

仮想生活経験から分離抽出された文を素文記憶庫４へ、

学習済みの言語知識については文型規則を文型規則記憶庫５へ、

語形変化規則を語形変化規則記憶庫６へ、

単語について学習された知識・意味を単語記憶７（辞書、意味記憶）へ、
それぞれ記憶（格納・貯蔵・蓄積）する。
８．ＬｉｍｉｔＳ８

任意の数で定義される最終ステップ。

上記の説明により図１に示す処理部２の全体的な処理の流れを説明する。
[仮想世界の設定Ｓ１]

仮想世界の設定Ｓ１では任意の仮想生活世界を設定する。たとえば自然言語学習システム１のほかに仮想人間として母親が、名前、位置、可能な動作（話す、指さす、つかむ、離す、移動する、など）、身長、体重、などの属性に属性値を与えられて定義され、同様に、父親、きょうだい、ともだち、などの人間が定義され、さらに、本がタイトル、サイズ、ページ、値段、色合い、などで定義され、以下同様に、別の本や、別のモノが定義される。このようにして仮想世界が設定される。
[仮想生活経験の取得Ｓ２]

仮想生活経験の取得Ｓ２では自然言語学習システム１の（外側にいるユーザ）が任意の人間役を演じて仮想世界に参入し仮想生活経験を作り出す。たとえば、母親役を演じて、自然言語学習システム１の位置に近づき、本を指差す動作を作り出し、「あの本は青い」と発話する動作を演じる。この「情景」は自然言語学習システム１に「仮想生活経験」として取得され、仮想生活経験記憶庫３に格納される。
[言語経験の分離抽出Ｓ３]

言語経験の分離抽出Ｓ３ではこの仮想生活経験の発話データのみを抽出し、文型規則記憶庫５に適合文型がみつかり、また、単語記憶庫７で適合する「筋書き」プログラム（意味プログラム）がみつかるなら、解釈成功とする。そうでなければ、その素文を素文記憶庫４に格納する。たとえば上の例なら「あの本は青い」という素文である。
[仮想生活経験の学習処理Ｓ４]
仮想生活経験の学習処理Ｓ４では言語経験の分離抽出Ｓ３で解釈成功に到達しなければ、仮想生活経験記憶庫３で当該「仮想生活経験」と動作カテゴリが同一のものを検索し、みつかれば、共通構造を抽出しこれを「筋書き」としてプログラム生成し文型規則記憶庫５に格納する。

[自然言語経験の学習処理Ｓ５]

自然言語経験の学習処理Ｓ５では言語経験の分離抽出Ｓ３で解釈成功に到達しなければ、素文記憶庫４内を検索して、一箇所差統合原理処理Ｓ４１１による文型規則統合処理を行い、統合に成功すれば文型規則記憶庫５に格納する。たとえば上例なら、「（あのこの）（本箱）は（赤い黒い青い）」などになる。
[言語知識形成処理Ｓ６]

言語知識形成処理Ｓ６では素文を一語ごとにわけ、意味学習に成功していない単語を、仮想生活経験記憶庫３の検索から生成された「筋書き」プログラムと対応させて、単語記憶庫７に格納する。並列して、単語記憶庫７内から各語の類似形を比較して、可能なものについて語形変化プログラムを生成し、これを語形変化規則記憶庫６に格納する。
[記憶処理Ｓ７]

記憶処理Ｓ７では記憶庫３、４、５、６、７における重複の削除を行う。
[ＬｉｍｉｔＳ８]

ＬｉｍｉｔＳ８では一定量（目安は「筋書き」数にして１０から２０）をこえるか否か判定し、超えなければ仮想生活経験の取得Ｓ２以下へ戻り、こえたら、仮想生活経験の取得Ｓ２以下をやめて、格納しステム３、４、５、６、７の最終的な重複処理をバッチ処理して終わる。

こうした学習経験を仮想世界の設定を取り替えて多数回くり返すことにより、次第に任意の言語について全側面の「文脈依存的な」学習を実現していく。
＜第２の実施形態＞

図６は本発明を実施するための最良の形態である第2の実施形態において、自然言語学習システム１を暗号解読学習システム２０として使用した場合のものである。

自然言語学習システム１においては暗号文も自然言語も同じ処理が可能であるから、暗号解読処理システム２０は、「もう一つの言語」の獲得処理にすぎない。

従来の暗号解読処理システムはみな暗号学という体系の「計量言語学的な処理」、いいかえれば統計的推測処理に依存している。暗号解読学習システム２０は図６のように「言語学習処理」でこれに対処するところが際立った特色である。

ブロック２１の「暗号文集合」と「事例イベントの集合」を具体化するために、ある販売チェーン店が週末特売品名を中央仕入れ部に暗号で指令するものと想定しよう。競争相手が４週間分のその指令文（らしき暗号）のデータと週末の特売品名データを入手したとする。たとえば、ABNSC%Dという暗号文で品物Ａが500単位特売され、EBFTG$Hで品物Ｂが400単位、IBJKK$Lで品物Ｃが400単位、MBNSO#Pで品物Ａが300単位特売された、というのが4週分のデータ（Ｄ１，Ｄ２，Ｄ３，Ｄ４）であるとする。

ブロック２２は暗号文と特売品イベントが時間的な関係により対応づけられることを示す。

ブロック２３では共通性抽出による暗号文文型規則の抽出と特売イベントという「筋書き」の形式化がなされ、一字おきに適切語がならぶ文型規則が把握され、％が５に対応する、などの意味論が把握される。（データＤ１とＤ４の共通性より、BS←→品物Ａが得られ、データＤ１，Ｄ２，Ｄ３，Ｄ４の共通性より、B←→品物の指定指令が得られる、などによる。）これは計量言語学的にはデータが足りずでき難いことである。
＜第３の実施形態＞

図７に示す本発明を実施するための最良の形態である第３の実施形態において自然言語学習システム１をＯＳ４０（オペレーティングシステム）として使用した場合のものであり、ＰＣ用のＯＳとして使用するも、ロボットに組み込んでＯＳとして使用するも、仕様はおなじである。その要点は「ユーザが日常の言語を用いて発する指令を受容するシステム」ということである。

第一次ロム化の部分は、自然言語学習システム１がロム化されており、その学習機能が搭載されたOSまたはロボットに、ユーザが話しなれている言語または方言（たとえばタガログ語のユーザならタガログ語をLとする）を学習するための「筋書き」データの必要十分なものをロム化したDVDなどを読み込ませ、あらかじめLの言語能力を学習させるブロックである。

ここまでの部分をテストした上で性能に問題がないことを確認できれば、これまでの学習結果全体をロム化の上、ロム化された自然言語学習システム１と組み合わせて搭載したOSまたはロボットとすることも可能であるが、これは任意言語に対応する目的を捨て、特定言語Lに限定された仕様となる。

このように設計構築されたOSまたはロボットのシステムはユーザが自然言語で話すことばを理解することができ、その要求に対応する行為プログラムを自動生成できて、その自動生成されたプログラム自体がユーザの要求する仕事を実現するユーティリティを内蔵することになる。ユーザはそのユーティリティの仕事満足度をテストして、さらに完了を求める場合も、特段の準備なく、自然言語で不満な点を伝え、要求することで足りる。

自然言語学習システム１が従来技術ではなしえない次世代型のOSでありロボットとなるのは、生活経験に依拠して文脈依存型のプログラム自動生成を行うことを特色としているからである。

本発明は主にコンピュータ関連産業等で利用される。

本発明の第１の実施の形態の原理を示す流れ図。本発明の第１の実施の形態の「筋書き」記述マトリックス図。本発明の第１の実施の形態の一箇所差単語原理処理を示す流れ図。本発明の第１の実施の形態の一箇所差成句原理処理を示す流れ図。本発明の第１の実施の形態を示すブロック図。本発明の第２の実施の形態の流れ図。本発明の第３の実施の形態の流れ図。

符号の説明

１：自然言語学習システム、
２：処理部、
３：仮想生活経験記憶庫、
４：素文記憶庫、
５：文型規則記憶庫、
６：語形変化規則記憶庫、
７：単語記憶庫、
１０：記憶庫、
Ｓ１：仮想世界の設定、
Ｓ２：仮想生活経験の取得（仮想生活経験の取得処理部）、
Ｓ３：言語経験の分離抽出（言語経験の分離抽出部）、
Ｓ４：仮想生活経験の学習処理（仮想生活経験の学習処理部）、
Ｓ４１：文処理の学習（文処理の学習処理部）、
Ｓ４１１ａ：一箇所差単語原理処理（一箇所差単語原理処理部）、
Ｓ４１１ｂ：一箇所差成句原理処理（一箇所差成句原理処理部）、
Ｓ４１２：分節文統合原理処理（分節文統合原理処理部）、
Ｓ４２：単語処理（単語処理部）、
Ｓ４２１：語形処理（語形処理部）、
Ｓ４２２：語の用法・意味処理（語の用法・意味処理部）、
Ｓ４３：仮想生活経験の学習処理（仮想生活経験の学習処理部）、
Ｓ４４：総合処理（総合処理部）、
Ｓ５：自然言語経験の学習処理（自然言語経験の学習処理部）、
Ｓ６：言語知識形成処理（言語知識形成処理部）、
Ｓ７：記憶処理（記憶処理部）、
Ｓ８：Ｌｉｍｉｔ、
２０：暗号解読処理システム、
２１：ブロック、
２２：ブロック、
２３：ブロック、
４０：ＯＳ。

Claims

ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」は任意のヒトなどの「動作」を核として記述され、この「動作」のカテゴリに対応する動作主体、動作対象、動作受容体、動作起点、動作着点、道具使用などの「動作カテゴリ特性」に区別する該時間軸と該「動作カテゴリ特性」という２次元のマトリックスで表現される表現方式であることを特徴とする自然言語学習システムの言語知識の学習方式。
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の２つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が一箇所差単語原理によるものであり、この一箇所差単語原理は、二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであるとみなして一箇所差統合原理を適用して文型規則を取得する原理のことである、ことを特徴とする自然言語学習システムの言語知識の学習方式。
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の２つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が一箇所差成句原理によるものであり、この一箇所差成句原理は、異なる文長の文１と文２には一箇所差単語原理（二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであるとみなす原理）は適合しないが、記憶されている学習済みの文型規則に前記文１と前記文２に含まれるものがある場合は、その含まれる文型規則部分を成句とし、ただ一つの単語と同等であるとみなして一箇所差統合原理を適用して文型規則を取得する原理のことである、ことを特徴とする自然言語学習システムの言語知識の学習方式。
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の２つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が分節文統合原理によるものであり、この分節文統合原理は、記憶済みの文型規則と取得された「素文」によりこの取得された「素文」を文型規則に統合する場合において、例えば記憶済みの「素文」から対応する「素文」が検出され、この検出された対応する「素文」が文型規則として統合可能な「素文」であると判明した場合には、個々の単語や単語群が一致していなくても、統合して新たな文型規則に集約するという原理である、ことを特徴とする自然言語学習システムの言語知識の学習方式。
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文に含まれる個々の単語に関する処理の学習」であって、この「文に含まれる個々の単語に関する処理の学習」が、（１）語形についての学習および（２）語の用法と意味の学習という二つの側面に分けられ処理されようになっていて、前記「語形についての学習」が、同じ単語の語形変化についてその語形変化処理プログラムを自動生成して格納し、これにより取得された２つの単語からまったく同一語形変化処理プログラムが生成された場合は、その２つの単語は語形変形を共有するものであることを識別できるようにし、前記取得された語形変形を共有する２つの単語を同一の語形変化として集約するものであり、前記「語の用法と意味の学習」が、単語の知識は該単語がどのような文型にどのような語形で表れ得るかという用例データ側面と該単語がどのような意味表現であるかという意味表現側面という二つの側面で処理され、前記単語の処理は常に前記用例データ側面と前記意味表現側面が並列的に処理・記憶され、且つ、その学習されたことも常に並列的に処理・記憶されるものである、ことを特徴とする自然言語学習システムの言語知識の学習方式。
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文に関係する仮想生活経験処理の学習」であって、この「文に関係する仮想生活経験処理の学習」が、複数の「筋書き」を比較して、偶発的な「情景」要因を除外する操作を重ねることにより、形式的な「筋書き」を取得する学習であることを特徴とする自然言語学習システムの言語知識の学習方式。
「筋書き」に基づいて行われる学習処理が請求項２に記載の「文処理の学習」、請求項３に記載の「文処理の学習」、請求項４に記載の「文処理の学習」、請求項５に記載の「文に含まれる個々の単語に関する処理の学習」、請求項６に記載の「文に関係する仮想生活経験処理の学習」およびそれらを総合して必要に応じてプログラムを自動生成するという学習処理であることを特徴とする自然言語学習システムの言語知識の学習方式。
「筋書き」に基づいて行われる学習処理が請求項２に記載の「文処理の学習」、請求項３に記載の「文処理の学習」、請求項４に記載の「文処理の学習」、請求項５に記載の「文に含まれる個々の単語に関する処理の学習」、請求項６に記載の「文に関係する仮想生活経験処理の学習」およびそれらを総合して必要に応じてプログラムを自動生成するという学習処理であることを特徴とする請求項１記載の自然言語学習システムの言語知識の学習方式。
自然言語学習システムが単語知識、構文知識およびデータのゼロからスタートするものであり、日本語、英語、仏語、スワヒリ語などの任意の自然言語を学習する自然言語学習システムであることを特徴とする請求項１〜８いずれか記載の自然言語学習システムの言語知識の学習方式。
請求項１〜９いずれか記載の自然言語学習システムの言語知識の学習方式のコンピュータプログラムを具備してなることを特徴とする自然言語学習プログラムを記録した記録媒体。