JP2007094291A - 自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体 - Google Patents

自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2007094291A
JP2007094291A JP2005286580A JP2005286580A JP2007094291A JP 2007094291 A JP2007094291 A JP 2007094291A JP 2005286580 A JP2005286580 A JP 2005286580A JP 2005286580 A JP2005286580 A JP 2005286580A JP 2007094291 A JP2007094291 A JP 2007094291A
Authority
JP
Japan
Prior art keywords
learning
sentence
natural language
knowledge
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005286580A
Other languages
English (en)
Inventor
Tetsuo Suga
哲夫 須賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2005286580A priority Critical patent/JP2007094291A/ja
Publication of JP2007094291A publication Critical patent/JP2007094291A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】文脈に依存した自然言語知識の取得と広範囲な学習能力を実現する自然言語学習システムの言語知識の学習方式を記録した記録媒体を提供する。
【解決手段】この自然言語学習システム1は、仮想生活経験に基づいて自然言語知識を学習し、その結果取得する自然言語知識は仮想生活経験の文脈に依存した自然言語知識(文脈依存的な知識構造)となり、この学習・取得した自然言語知識を利用するために、該自然言語知識をプログラムの形式で自動生成して格納しデータ・ベースを自動的に構築する。
【選択図】図1

Description

本発明は、自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体に関する。
従来の、人間が日常的に使っている自然言語をコンピュータに理解および処理させるシステムである自動言語処理システムは、辞書からの語彙知識の移植、文法書からの構文規則群の移植に依存するいわゆるデータ・ドリブンで動作するものであった。
特になし 特になし
上述した従来自動言語処理システムは、従来技術の人工知能開発おいては、「文脈依存的な知識構造」が乗り越え難い障壁の一つとなっているという技術的課題がある。
また、その自然言語学習システムには広範囲な学習能力が欠如しているという欠点があった。
また、従来技術のデータ・ベース組み込みによる自然言語学習システムが日本語、英語などの特定言語に制約されてしまうという限界があった。
また、辞書項目を移植した語彙データ・ベースに依存して処理するシステムであるので、膨大な容量の辞書データを予め格納するためのハードディスクなどの大きな記憶容量を必要とし、その大きなデータ検索等の処理のためにコンピュータの処理速度が遅くなるという欠点を有するものであった。
また、その自然言語学習システムの制作に要するデータ・ベースおよびルール・ベースの組み込みには膨大な労力コストがかかるという欠点があった。
本発明は以上のような従来技術の欠点に鑑みてなされたものであって、その目的は、文脈に依存した自然言語知識の取得と広範囲な学習能力を実現する自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体を提供することを目的としている。
本発明の前記ならびのそのほかの目的と新規な特徴は次の説明を添付図面と照らし合わせて読むと、より完全に明らかになるであろう。
ただし、図面はもっぱら解説のためであって、本発明の技術的範囲をそれらのみに限定するものではない。
上記目的を達成するために、本発明は次ぎに述べるような構成となっている。
<請求項1記載の発明>
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」は任意のヒトなどの「動作」を核として記述され、この「動作」のカテゴリに対応する動作主体、動作対象、動作受容体、動作起点、動作着点、道具使用などの「動作カテゴリ特性」に区別する該時間軸と該「動作カテゴリ特性」という2次元のマトリックスで表現される表現方式である自然言語学習システムの言語知識の学習方式を構成している。
<請求項2記載の発明>
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の2つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が一箇所差単語原理によるものであり、この一箇所差単語原理は、二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであるとみなして一箇所差統合原理を適用して文型規則を取得する原理のことである自然言語学習システムの言語知識の学習方式を構成している。
<請求項3記載の発明>
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の2つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が一箇所差成句原理によるものであり、この一箇所差成句原理は、異なる文長の文1と文2には一箇所差単語原理(二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであるとみなす原理)は適合しないが、記憶されている学習済みの文型規則に前記文1と前記文2に含まれるものがある場合は、その含まれる文型規則部分を成句とし、ただ一つの単語と同等であるとみなして一箇所差統合原理を適用して文型規則を取得する原理のことである自然言語学習システムの言語知識の学習方式を構成している。
<請求項4記載の発明>
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の2つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が分節文統合原理によるものであり、この分節文統合原理は、記憶済みの文型規則と取得された「素文」によりこの取得された「素文」を文型規則に統合する場合において、例えば記憶済みの「素文」から対応する「素文」が検出され、この検出された対応する「素文」が文型規則として統合可能な「素文」であると判明した場合には、個々の単語や単語群が一致していなくても、統合して新たな文型規則に集約するという原理である自然言語学習システムの言語知識の学習方式を構成している。
<請求項5記載の発明>
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文に含まれる個々の単語に関する処理の学習」であって、この「文に含まれる個々の単語に関する処理の学習」が、(1)語形についての学習および(2)語の用法と意味の学習という二つの側面に分けられ処理されようになっていて、前記「語形についての学習」が、同じ単語の語形変化についてその語形変化処理プログラムを自動生成して格納し、これにより取得された2つの単語からまったく同一語形変化処理プログラムが生成された場合は、その2つの単語は語形変形を共有するものであることを識別できるようにし、前記取得された語形変形を共有する2つの単語を同一の語形変化として集約するものであり、前記「語の用法と意味の学習」が、単語の知識は該単語がどのような文型にどのような語形で表れ得るかという用例データ側面と該単語がどのような意味表現であるかという意味表現側面という二つの側面で処理され、前記単語の処理は常に前記用例データ側面と前記意味表現側面が並列的に処理・記憶され、且つ、その学習されたことも常に並列的に処理・記憶されるものである自然言語学習システムの言語知識の学習方式を構成している。
<請求項6記載の発明>
ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文に関係する仮想生活経験処理の学習」であって、この「文に関係する仮想生活経験処理の学習」が、複数の「筋書き」を比較して、偶発的な「情景」要因を除外する操作を重ねることにより、形式的な「筋書き」を取得する学習である自然言語学習システムの言語知識の学習方式を構成している。
<請求項7記載の発明>
「筋書き」に基づいて行われる学習処理が請求項2に記載の「文処理の学習」、請求項3に記載の「文処理の学習」、請求項4に記載の「文処理の学習」、請求項5に記載の「文に含まれる個々の単語に関する処理の学習」、請求項6に記載の「文に関係する仮想生活経験処理の学習」およびそれらを総合して必要に応じてプログラムを自動生成するという学習処理である自然言語学習システムの言語知識の学習方式を構成している。
<請求項8記載の発明>
請求項1に記載の発明の構成において、「筋書き」に基づいて行われる学習処理が請求項2に記載の「文処理の学習」、請求項3に記載の「文処理の学習」、請求項4に記載の「文処理の学習」、請求項5に記載の「文に含まれる個々の単語に関する処理の学習」、請求項6に記載の「文に関係する仮想生活経験処理の学習」およびそれらを総合して必要に応じてプログラムを自動生成するという学習処理である自然言語学習システムの言語知識の学習方式を構成している。
<請求項9記載の発明>
請求項1〜8いずれか記載の発明の構成において、自然言語学習システムが単語知識、構文知識およびデータのゼロからスタートするものであり、日本語、英語、仏語、スワヒリ語などの任意の自然言語を学習する自然言語学習システムである自然言語学習システムの言語知識の学習方式を構成している。
<請求項10記載の発明>
請求項1〜9いずれか記載の自然言語学習システムの言語知識の学習方式のコンピュータプログラムを具備してなる自然言語学習プログラムを記録した記録媒体を構成している。
以上の説明から明らかなように、本発明にあっては次に列挙する効果が得られる。
(1)単語知識、構文知識およびデータのまったく無いゼロからスタートして自然言語知識を取得し記憶(格納、貯蔵、蓄積)していくことを可能とするものであり、且つ、データのゼロからのスタートにより言語の制約を受けることなく日本語、英語、仏語、スワヒリ語などの任意の自然言語の使用を可能とするとともに、請求項1〜6に記載のそれぞれ新規の発明である言語知識の学習方式を統合した自然言語学習システムを構成することにより、確かに動作する自然言語学習システムを実現できるという効果を得ることができる。
(2)本発明で実現される自然言語学習システムは単語知識、構文知識およびデータのゼロとすることが最適であり、ゼロスタートとすることにより辞書などの膨大なデータを持つことなく、高速処理を実現できるという効果を得ることができる。
(3)学習性能を基礎とする自然言語学習システムを構成するので、現存する世界中のいかなる言語にも対応できるので、語学習に類する仕事(例えば:暗号解読システム、任意の言語間の翻訳辞書)に適用できる。
(4)達成する言語知識は「文脈依存性」を充足するとともに、広範囲な学習能力を付与されるという効果を得ることができる。これにより、自然言語を核としたPC用OSの制作(本発明の自然言語学習システムをロム化してコンピュータOSの核として組み込むなど。)、自然言語を核とした家電組み込み用OSの制作、自然言語を用いた要求説明によりプログラムを自動的に出力するコンピュータの製作、ロムチップ化してロボット用頭脳として学習機能を具えたロボットの製作などを可能とするものである。
(5)仮想生活経験を時間軸と動作カテゴリ特性という2次元のマトリックス(2次元リスト)で表現するものは、時間軸に沿って動作カテゴリの定数が配列された「筋書き」はその2次元リストのままに記憶庫に格納して検索可能な「筋書き」記憶データとでき、それが時間に沿ったデータであることにより、「文脈」を定義することを可能とする。
(6)一箇所差単語原理による処理は、二箇所(またはそれ以上)に違いのある素文を文形態の類似性に依拠して統合すると「ホン が ない」、「埒 も ない」という2つの素文を統合して「(ホン 埒) (が も) ない」という文型規則を生み出すことが可能となり、この文型規則から、「*−埒 が ない−*」という非文を生み出す誤りが生じることになるが、一箇所差単語原理処理によりこのような誤りを回避するという役割を果たす。
(7)一箇所差成句原理による処理は、一箇所差単語原理処理は素文の集合から文型規則を学習するときに等しい文長の素文を統合する役割を担うが、一箇所差成句原理処理は文の階層構造(入れ子構造)の学習を可能にするという役割をはたす。
(8)分節文統合原理による処理は、特異な成句表現を誤って統合してしまわないようにする役割をはたす。従来型の自然言語処理システムでは文法書に記載されている文型規則を事前に移植して用いるのであるが、本発明では一箇所差単語原理と一箇所差成句原理と分節文統合原理とによって、生活経験を通じて取得される素文をデータとして、文法書にあるような文型規則を自動学習するとともに、文法書に記載されることのない文型規則をも自動学習し、文生成のための文型規則をルールベースとして自己増殖することを可能としている。
(9)「文に含まれる個々の単語に関する処理の学習」は、従来型の辞書項目を転写する方式では単語の意味はそれ自体も文という単語系列でつくられている。例:(これだと「いく」という語の意味は「居場所の変化」のようなかたちになり、語と語の堂々めぐりになっている)のだが、本発明が実現する自然言語学習システムでは意味が「形式的筋書き」で表現される。(「いく」の意味は「動作主体W 動作起点P1 着点P2」のようなプログラムとなる)。すなわち日本語でも英語でもどの言語でも意味表示は同じ形式となり直接翻訳が可能になるだけでなく、W、P1、P2という引数にどんな定数を代入するかにより適切な解釈、適切な動作を生み出すことを可能とする。
(10)「文に関係する仮想生活経験処理の学習」は、従来型の辞書項目を転写する方式では語の意味は文を用いて説明されるだけであるが、本発明では「仮想生活経験」の共通形式を取り出してプログラムを生成し、そのプログラムが意味を構成し、ことばによることばの定義ということにならない。たとえば、「これ も ホン だ」という文入力のある「筋書き」、「それ も 殺人事件 だ」という文入力の生じる「筋書き」などには、同じモノゴトがくり返し現れる、という「形式的筋書き」が抽出できる。これにより、文の意味が直接「情景」として解釈されたり、行為として実現されたりする利点のほかに、「も(英語なら”also”)」という単語の意味は「くり返しという筋書き」で定義されることとなる。このことにより、日本語でも英語でもそのほかのどの言語でも意味を直接に翻訳可能にする。
以下、図面に示す本発明を実施するための最良の形態を詳細に説明する。
<第1の実施形態>
図1〜図5に示す本発明を実施するための最良の形態である第1の実施形態において1は自然言語学習システムであって、この自然言語学習システム1は、仮想生活経験に基づいて自然言語知識を学習し、その結果取得する自然言語知識は仮想生活経験の文脈に依存した自然言語知識(文脈依存的な知識構造)となり、この学習・取得した自然言語知識を利用するために、該自然言語知識をプログラムの形式で自動生成して格納しデータ・ベースを自動的に構築する。
したがって、自然言語学習システム1は単語知識も構文知識もそれらにかかる辞書などのデータもまったく有しないゼロでスタートすることを可能とするものである。データ・ゼロからスタートするものでは、制約なしにあらゆる自然言語文字を使用することを可能とする。すなわち、英語、日本語、仏語、スワヒリ語など任意の自然言語を学習することができ、その学習により取得される自然言語知識は仮想生活経験の文脈に依存した自然言語知識となる。
したがって、自然言語学習システム1は与えられた文を単語に分解したり、文と文を比べて異同を判断したり、言葉を仮想生活経験と比べて意味判断のモデルを取得しプログラムを自動生成する一般的能力(基本プログラム=処理部2および記憶庫10)を備えている。すなわち、ものごとを比べて共通性と違いに気付く能力および経験したものと学習したものを格納していく能力だけは初期から持っている。
自然言語学習システム1の意味学習は仮想生活経験を重ねるにつれて進む。すなわち、自然言語学習システム1では仮想生活経験から意味が実際に生じている。この仮想生活経験と意味の関係という両者の関係は、「生産的忘却」というからくりで説明することができる。
「生産的忘却」:いくつもの仮想生活経験がかさなり、それが類似の仮想生活経験であることにより自然言語学習システム1は忘却ということがおこる。それはただ忘れることではなく、複数の類似仮想生活経験の共通の部分を統合するなどして新たな仮想生活経験の形式として格納していく。それは述語関数の系列であり、自然言語学習システム1はこのような関数を自力でプログラムする。このようにして、「複数の類似仮想経験を忘却し、引き換えに新たな仮想生活経験の形式=仮想生活経験のフォーマット」を獲得することを生産的忘却」という。
自然言語学習システム1の意味学習は、仮想生活経験を重ねるにつれて進む。
1)いくつかの類似した仮想生活経験についてその共通部分を選ぶ。
2)付随して共通したことばがあるならこれも共通のことばとして選ぶ。
3)ことばを「筋書き」(仮想生活経験の時間軸に沿った「情景」の連鎖)に関連させて記憶(内的な辞書)する。
このように学習された内的な辞書によって言語理解と発話などの出力などが行われる。自然言語学習システム1の意味理解は「筋書き」に準拠してなされるのである。
例:
#1 お母さんが入ってきて「オハヨウ」といいました。
#2 お父さんが入ってきて「オハヨウ、システム1君」といいました。
#3 など、など。
これらの仮想生活経験とそこに含まれたことばから自然言語学習システム1は次のような 「オハヨウ」というプログラムを生成し格納する。
例:
「筋書き」の名前 ‐ OHAYO
「筋書き」のパラミータ ‐ FromAnyHuman ToAnyObject
「筋書き」使用条件の制約 ‐ NewComer
このような関数(手続き)プログラムが自然言語学習システム1自身によって制作されると、自然言語学習システム1はつぎのようにしてこれを使用する。
(OHAYO system1 mama) − 母親に対して自分がいいます。
(OHAYO Meg system1) − メグちゃんが自分に挨拶することを了解します。
(OHAYO papa mama)− 父親が母親に挨拶していることを了解します。
「筋書き」に準拠することのよい点:
1)文脈に応じた意味把握(実用意味論)を実現する。
2)日常のコミュニケーションの多くが誤解とすれ違いに終始することを説明できる。
自然言語学習システム1はAllegro Common LISPやMacintosh Common LISPなどのプログラミング言語が使用できるが、本実施の形態ではLISPを使用している。LISPには下記のようなすぐれた点がある。
1)自然言語学習システム1は自分自身でプログラムを生成するが、LISPベースだとこういうことがすぐできる。
2)ほかのプログラム言語ではやりにくいシンボル処理に圧倒的に強く、数値計算もCやFORTRANなどに負けない。
3)学習に要する時間は、学習者の個性に合えば数日でマスターできる。
4)プログラム開発の速さが抜群である。
自然言語学習システム1は、ことばを初めて経験するときからふたつの単語の関係を比較し、関係をみつけるとその関係をあらわすプログラムを自動生成し格納する。
例:
-単語1−単語2 ---> 関係プログラム ---> 応用例
like - likes ---> &suf-s (&suf-s 'aim) -> aims
easy - easier ---> &del-y-suf-ier (&del-y-suf-ier 'lucky) -> luckier
ureshii - urepii ---> &del-shii-suf-pii (&del-shii-suf-pii osorosii) -> osoropii
dameda - dameyade ---> &del-da-suf-yade (&del-da-suf-yade 'souda) -> souyade
gewohnt - ungewohntheit --> &pre-un-suf-heit (&pre-un-suf-heit 'geschlacht) -> ungeschlachtheit
このような関係処理プログラムは自然言語学習システム1が自分でつくる(自動生成)。
従来の自然言語学習システムはシステムの外側の人間が単語の形の変化規則を予め教えておくが、自然言語学習システム1はこのような規則を自力でつくり応用できる。
自分でつくったプログラムを自然言語学習システム1は次のように応用することがでる。文の形についても同じである。自然言語学習システム1は仮想生活経験を通じて意味の理解も同じように獲得していく。
例:
「昼食」という経験:
昼食の経験1 お母さんと一緒にミルクとサンドイッチ
昼食の経験2 お母さん、お姉さんと一緒にミルクとスパゲッティ
昼食の経験3 ひとりでジュースとハンバーグライス
など、など
自然言語学習システム1はこうした昼食経験の共通部分をとりだして記憶庫に格納する。格納するのは、共通部分を「筋書き」としてプログラムしたものである。
それは次のような形をしている。
「筋書き」の名前: 昼食(英語世界だと lunch )
「筋書き」のパラミータ: いっしょのヒト いつ どこで のみもの たべもの その他
「筋書き」の使用上の制約: たべもの 昼ころ/その日2回目
こうして「筋書き」が出来上がると、具体的なエピソード記憶は回想しにくくなる。 また新しい昼食経験の記憶は「筋書き」のパラミータに特定の事物を代入する形で記憶される。
例: 昼食(一緒のヒト:ABチャン、 時間:11時半、 のみもの:ミルクセーキ、たべもの:チャンポン、)
自然言語学習システム1の処理部2の仮想生活経験に準拠した自然言語知識の学習アルゴリズムは図1に示すように、
1.仮想世界の設定S1、
2.仮想生活経験の取得S2、
3.言語経験の分離抽出S3、
4.仮想生活経験の学習処理S4、
5.自然言語経験の学習処理S5、
6.生活的情報と言語的情報の関連付けによる言語知識の形成(言語知識形成処理S6)、
7.仮想生活経験の記憶、言語知識の記憶、言語経験の記憶(記憶処理S7)、
8.LimitS8、
というようになっている。
自然言語学習システム1の自然言語知識の学習アルゴリズムの各定義と構成について説明する。
1.仮想世界の設定S1
・{仮想世界}とは
ヒト、モノ、動物などの「対象」がシンボリックに定義されて配置される仮想空間のことである。
・{シンボリックに定義}とは
実物ではなく、また画像でもなく、文字によるシンボル情報で表現されることである。
・{対象}とは
対象の記述単位は[属性 − 属性値]の対である(例えば 属性:[色合い−赤]、属性値:[形状−球]のように)。そのような単位の階層的集積がヒト、モノ、などの仮想存在を定義する(例えば リンゴという仮想存在は、[リンゴ:色合い−赤] [形状−球」 [大きさ−…] [他の属性−属性値] )のように)。
・{仮想世界の定義}
仮想世界は「対象」が任意の個数、任意の場所に配置された「対の集合」で定義されることになる(例えば [世界−[ [リンゴ−[・・・]] [ホン− [・・・] [ヒト1−[・・・]] ・・・ ]]のように)。
2.仮想生活経験の取得S2
・{仮想生活経験の表現様式}
仮想世界は、時間の経過とともに変化するのが普通(例えば ヒトが何かの動作を行うことによる変化)であるが、変化しないままのこともある。任意の時点の仮想世界の状況を「情景」と呼ぶ。時間軸に沿った「情景」の系列を取得することは自然言語学習システム1の仮想生活経験を定義するものとなる(例えば ヒト1がリンゴをたべる、など。)。自然言語学習システム1はこのように表現された仮想生活経験に準拠して学習を進める。
・{動作を核とする仮想生活経験の表現方式}
仮想生活経験は時間軸に沿った「情景」の連鎖によって記述されることとなる。これは一種の物語とみなすことができ「筋書き」と呼ぶ。自然言語学習システム1では「筋書き」は「(任意のヒトの)動作」を核として記述される。「動作」には例えば、移動、指さし、手渡し、話し、などの任意のカテゴリが設定され得る。それら「動作」のカテゴリに対応して、動作主体、動作対象、動作受容体、動作起点、動作着点、道具使用などの特性が区分される。(例えば ヒト1がヒト2に1冊のホンを手渡す、という「筋書き」ならば、ヒト1が動作主体であり、ホンは動作対象、ヒト2は動作受容体、ヒト1が動作起点、ヒト2が動作着点となる。)、このようにして、自然言語学習システム1では、仮想生活経験が図2に示すように、時間軸と動作カテゴリ特性という2次元のマトリックス(2次元リスト)で表現される。
時間軸に沿って動作カテゴリの定数が配列された「筋書き」はその2次元リストのままに仮想生活経験記憶庫3に格納され、検索可能な「筋書き」記憶データとなる。また、それが時間に沿ったデータであることにより、「文脈」を定義することが可能となる。
3.言語経験の分離抽出S3
「筋書き」(仮想生活経験の連鎖)のなかで、例えば:動作カテゴリが「話し」である行を検出して、その動作対象の列に含まれている何らかの文を取り出し素文記憶庫4に格納する。
図2では、(t4 カテゴリ=話し 動作対象=「これあげる」)(t5 カテゴリ=手わたし 動作対象=ホン)(t6 カテゴリ=話し 動作対象=「ありがとう」)を検出して、その動作対象の列に含まれている文「これあげる」および「ありがとう」を取り出し、下位システムである素文記憶庫4に格納され、検索可能な素文記憶データとなり、それ以後の「文型規則」抽出に利用される。
4.仮想生活経験の学習処理S4
「筋書き」に基づいて行われる仮想生活経験の学習処理S4は
4.1 文処理の学習S41、
4.2 文に含まれる個々の単語に関する処理の学習(単語処理S42)、
4.3 文に関係する仮想生活経験処理の学習(仮想生活経験の学習処理S43)、
4.4 それらを総合して必要に応じてプログラムを自動生成する(総合処理S44)という4つの側面に大別される。
この4つの側面について説明する。
4.1 文処理の学習S41
ヒトが発話したままの未処理の文を「素文」と呼び素文記憶庫4に格納する。
複数の「素文」を類似性に基づいて統合した形式を「文型規則」と呼び文型規則記憶庫5に格納される。
自然言語学習システム1は2つ以上の「素文」を比較して類似の文型を統合して文型規則を構成する。その統合の根底には一箇所差統合原理処理411と分節文統合原理処理412という2つの構成原理による処理がある。
自然言語学習システム1には「素文」の集合から構文規則を導くアルゴリズムをその構成要素としてもつ。従来型の自然言語処理システムでは文法書に記載されている文型規則を事前に移植して用いるのであるが、自然言語学習システム1では、これら二つの原理によって、仮想生活経験を通じて取得される素文をデータとして、文法書にあるような文型規則を自動学習するとともに、文法書に記載されることのない文型規則をも自動学習し、文生成のための文型規則をルールベースとして自己増殖する。
2つの構成原理について説明する。
4.1.1 一箇所差統合原理処理S411
一箇所差統合原理処理S411には一箇所差単語原理処理S411aと一箇所差成句原理処理S411bとがある。
[一箇所差単語原理処理S411a]
一箇所差単語原理処理S411aは、二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであると見なし、一箇所差統合原理処理S411を適用して新たな文型規則を集約する原理である。
例えば 「ここ は 駅 に 近い」を文1、「あそこは 駅 に 近い」を文2とすると、文1の「ここ」と文2の「あそこ」は文の文頭という同じ位置にあり、それ以外の語群はまったく同一であるから「(ここ あそこ) は 駅 に 近い」という文型規則が取得される。新に取得された文型規則は文型規則記憶庫5に記憶される。
二箇所(またはそれ以上)に違いのある素文を文形態の類似性に依拠して統合すると「ホン が ない」、「埒 も ない」という2つの素文を統合して「(ホン 埒) (が も) ない」という文型規則を生み出すことが可能となり、この文型規則から、「*−埒 が ない−*」という非文を生み出す誤りが生じることになるが、一箇所差単語原理処理S411aによりこのような誤りを回避することができる。
[一箇所差成句原理処理S411b]
一箇所差成句原理処理S411bは(図4の流れ図の下方ブロックで「一語あつかいで統合」とあるのを例解する。)は、「私 は そう 思う」を文1、「私 は それ は いけない と 思う」を文2とする。これは文長が異なるので、一箇所差単語原理処理S411aに適合しない。しかし、自然言語学習システム1には学習済みの文型規則を格納する文型規則記憶庫5がある。もしこの文型規則記憶庫5の中に「(これ それ あれ) (が は) (いい いけない)」のような文型規則が記憶済みであるならば、「それ は いけない と」までの部分を成句とし、ただ一つの単語と同等であると見なしてしまって一箇所差統合原理処理S411を適用することが、できるということである。この場合、結果として「(私 あなた) (は も) (そう [それ は いけない と]) (思う)」のような文型規則が取得されることになる。新に取得された文型規則は文型規則記憶庫5に記憶される。
「一箇所差単語原理処理S411a」は素文の集合から文型規則を学習するときに等しい文長の素文を統合する役割を担うが、「一箇所差成句原理処理S411b」は文の階層構造(入れ子構造)の学習を可能にするという役割をはたす。
4.1.2 分節文統合原理処理S412
図3の流れ図の中断にある「分節文統合原理処理S412」について説明する。
「(私 あなた) (は が) (学生 教師) (だ です)」という文型規則が文型規則記憶庫5に記憶済みで、「あなた も 町長 です」のような「素文」が取得されたとする。このような場合にこの「素文」を文型規則に統合すること(「(私 あなた) (は が も) (学生 教師 町長) (だ です)」という文型規則)を一般的に許してしまうと、誤った文を出力することになる危険を生む。しかし、例えば素文記憶庫4に「彼 も 市民 です」という「素文」が検出されることによるなどの理由で)「(あなた かれ) も (町長 市民) です」のように文型規則として分節可能な(統合可能な)「素文」である、と判明することもあり得る。そのような場合には、個々の単語や単語群が一致していなくても、統合することができるという原理が成立って、「(私 あなた 彼)」 (は が も) (学生 教師 町長 市民) (だ です)」のような文型規則に集約できる。これを分節文統合原理処理という。これは「埒 も ない」、「にべ も ない」などの特異な成句表現を誤って統合してしまわないために必要な原理である。新に取得された文型規則は文型規則記憶庫5に記憶される。
従来型の自然言語処理システムでは文法書に記載されている文型規則を事前に移植して用いるのであるが、自然言語学習システム1では、これら二つの原理と「分節文統合原理処理S412」とによって、生活経験を通じて取得される素文をデータとして、文法書にあるような文型規則を自動学習するとともに、文法書に記載されることのない文型規則をも自動学習し、文生成のための文型規則をルールベースとして自己増殖する。
4.2 文に含まれる個々の単語に関する処理の学習(単語処理S42)
自然言語学習システム1の学習は単語の集合から語形の変形規則を導き、それをプログラムとして自動生成したり、仮想生活経験に依存した意味形式をプログラムとして自動生成するような、プログラム自動生成アルゴリズムである。その学習は文型規則だけではなく、平行して文中の単語についても行われ、その内容は語形についての学習(語形処理S421)および 語の用法と意味の学習(語の用法・意味処理S422)、という2つの側面から行われる。
4.2.1 語形についての学習(語形処理S421)
単語は文のなかでさまざまに変形される。自然言語学習システム1は、「いく」と「いかない」のような、同じ単語の語形変化を学習するにあたり、その語形変化規則処理プログラムを自動生成して語形変化規則記憶庫6に格納し、以後の言語処理に利用する。「いく」と「いかない」を例とすれば、その語形変化規則を自動生成プログラムの形式で生成し、そのプログラムに例えばF1というインデックスを付して語形変化規則記憶庫6に格納する。後に、「聞く」と「聞かない」、「空く」と「空かない」、などからまったく同一プログラムが生成されることになれば、2つの単語は語形変形を共有することが識別できるので、同一の語形変形として集約した語形変形規則を自動生成プログラムの形式で語形変化規則記憶庫6に格納する。
4.2.2 語の用法と意味の学習(語の用法・意味処理S422)
自然言語学習システム1は、単語について学習された知識を2つの側面に分けて単語記憶庫7に格納する。1つの側面は、その単語が、どのような文型にどのような語形で表され得るか、という用例データである。もう1つの側面は、単語の意味表現である。単語の知識は常にこれら二つの側面が並列的に処理され、学習されたことも並列的に単語記憶庫7に記憶される。これは既存の自然言語学習システムで言えば辞書システムに相当するものが自動的に取得され構成されていくに等しい。
自然言語学習システム1の単語の意味表現は、その単語が出現した「筋書き」(仮想生活経験の連鎖)の比較から抽出され、複数の「筋書き」に一貫して表れる「情景」(任意の時点の仮想世界の状況)を形式化することにより「形式的筋書き」としてつくられる。この形式的「筋書き」は仮想生活経験の比較を通じて自動的に学習、構成、記憶されていく。すなわち自然言語学習システム1の言語学習方式は、仮想生活経験を形式化した意味表現をつくる言語学習方式であり、「筋書き」に準拠した意味表現をつくる言語学習方式である。
従来型の辞書項目を転写する方式では単語の意味はそれ自体も文という単語系列でつくられている(これだと「いく」という語の意味は「居場所の変化」のようなかたちになり、語と語の堂々めぐりになっている)のだが、自然言語学習システム1では意味が「形式的筋書き」で表現される(「いく」の意味は「動作主体W 動作起点P1 着点P2」のようなプログラムとなる)ので、日本語でも英語でもどの言語でも意味表示は同じ形式となり直接翻訳が可能になるだけでなく、W、P1、P2という引数にどんな定数を代入するかにより適切な解釈、適切な動作を生み出すことが可能となる。
4.3 文に関係する仮想生活経験処理の学習(仮想生活経験の学習処理S43)(「筋書き」の部分「筋書き」(部分的仮想生活経験連鎖)の類似性抽出)
複数の類似した「筋書き」(仮想生活経験の連鎖)を比較して、偶然的な「情景」要因を除外する操作を重ねることにより、形式的な「筋書き」が取得される。例えば、「こんにちは」という挨拶の「筋書き」は多様である。「ヒト1がヒト2に近づいて挨拶する」という「筋書き」と、「ヒト2がヒト3に遠くから挨拶する」という「筋書き」とには、同じ要素(ヒトがヒトに挨拶する)と異なる要素(近づいて、 と、 遠くから)とが混在する。偶発的な「近づく」ということ、あるいは動作主体が変化すること、などの偶発的な「情景」要因を除外していくと、「挨拶」という「筋書き」は「動作−話しかける」、「動作主体−任意のヒト」、「動作対象−別のヒト」、「動作起点−任意の位置」、「動作着点−任意の位置」という動作記述の形式的要因のみに縮約されることとなる。仮想生活経験の部分的「筋書き」を比べて、類似した要因だけを抽出し、偶発的な「情景」要因を除外して形式的「筋書き」を取得することが自然言語学習システム1の学習内容となる。
例えば、「いく」とか「つかむ」とかの動作が含まれた仮想生活経験を学習する場合、自然言語学習システム1は取得した形式的な「筋書き」をもとにプログラムを自動生成する。例えば、「つかむ」という動作を記述するプログラムは、「動作−把握」、「動作主体−任意のヒト」、「動作対象−近隣に位置する任意のモノまたはヒト」、などを引数とするプログラムとなるのである。このプログラムは、例えば、「花子 が 人形 を つかむ」という文入力が与えられた場合、「動作−つかむ」、「動作主体−花子」、「動作対象−人形」のように引数へ定数を代入し、具体的な「筋書き」を再構成することによってその文の意味解釈を実現する。あるいはまた、「本 を とりなさい」と命令されたときに、「動作主体−自然言語学習システム1」、「動作対象−本」のように定数化して可動プランを取得する。
このように自然言語学習システム1は仮想生活経験をもとにプログラムを自動生成して学習成果を仮想生活経験記憶庫3に格納していく。
従来型の辞書項目を転写する方式では語の意味は文を用いて説明されるだけであるが、自然言語学習システム1では「仮想生活経験」の共通形式を取り出してプログラム生成し、そのプログラムが意味を構成し、ことばによることばの定義ということにならない。たとえば、「これ も ホン だ」という文入力のある「筋書き」、「それ も 殺人事件 だ」という文入力の生じる「筋書き」などには、同じモノゴトがくり返し現れる、という「形式的筋書き」が抽出できる。これにより、文の意味が直接「情景」として解釈されたり、行為として実現されたりする利点のほかに、「も(英語なら”also”)」という単語の意味は「くり返しという筋書き」で定義されることとなる。このことにより、日本語でも英語でもそのほかのどの言語でも意味が直接に翻訳可能になる。
4.4 それらを総合して必要に応じてプログラムを自動生成(総合処理S44)
「文処理の学習」「文に含まれる個々の単語に関する処理の学習」「文に関係する仮想生活経験処理の学習」等を総合して必要に応じてプログラムを自動生成する。
自然言語学習システム1は文データでも単語データでも仮想生活経験データでも二つ以上のデータを取得しては比較し共通構造の抽出処理を行うが、その処理の形式はプログラム自動生成ということによっている。ただし生成されたプログラムは各々の対応する文型規則記憶庫5、単語記憶庫7、仮想生活経験記憶庫3に格納される前に、当該記憶庫に同一インデックスのものがあるか否かをチェックし、すでに格納済みならばそのインデックスの重みを増加させるだけで済ませる。既成のものに同一インデックスのものがなければ、新たに格納する必要が生じたとして格納する。ここでも生成されるプログラムが全面的な新規構成プログラムである場合と格納済みプログラムの組み合わせ構成プログラムの場合とが区別される。(たとえば「いく」、「くる」、「手に取る」などの単語の意味がプログラム格納されているときに、「(Xを)とってくる」という単語の意味をプログラム生成するには、Xを動作着点として「くる「手に取る「いく」 X」」という入れ子形式のプログラム動作をつくればよいからである。このような可能性が見つからない場合は新たなプログラム生成が必要になる。
5.自然言語経験の学習処理S5(関連付け)
自然言語学習システム1は単語の意味記述を形式化された「筋書き」と関連させて実現する。例えば、「リンゴ」という単語の意味は「動作−指示」、「動作主体−ヒト」、「動作対象−任意のリンゴ」という「筋書き」をもって定義される。「たべる」という単語の意味は「動作−食事」、「動作主体−任意のヒト」、「動作対象−任意のモノ」という「筋書き」で定義され、単語記憶庫7に意味登録される。単語記憶庫7にこのように関連付けられた意味登録をもつと、「彼 が リンゴ を たべる」という文は「動作主体−(彼女ではなく)彼」、「動作対象」−(バナナではなく)リンゴ」のような具体化された「筋書き」に翻訳されて解釈されることに
なる。
6.生活的情報と言語的情報の関連付けによる言語知識の形成(言語知識形成処理S6)
複数の文(既有の文型規則を含む)から新に統合に成功した文型規則は言語知識のひとつの側面である。複数の部分的仮想生活経験連鎖(部分的「筋書き」)の比較から形式化に成功して得られた形式的「筋書き」(意味「筋書き」)はもう一つの側面である。
これらが生じるたびに自然言語学習システム1は文型規則記憶庫5、単語記憶庫7に格納済みの該当データを書き換える。
7.記憶処理S7(記憶庫10)
仮想生活経験を仮想生活経験記憶庫3へ、
仮想生活経験から分離抽出された文を素文記憶庫4へ、
学習済みの言語知識については文型規則を文型規則記憶庫5へ、
語形変化規則を語形変化規則記憶庫6へ、
単語について学習された知識・意味を単語記憶7(辞書、意味記憶)へ、
それぞれ記憶(格納・貯蔵・蓄積)する。
8.LimitS8
任意の数で定義される最終ステップ。
上記の説明により図1に示す処理部2の全体的な処理の流れを説明する。
[仮想世界の設定S1]
仮想世界の設定S1では任意の仮想生活世界を設定する。たとえば自然言語学習システム1のほかに仮想人間として母親が、名前、位置、可能な動作(話す、指さす、つかむ、離す、移動する、など)、身長、体重、などの属性に属性値を与えられて定義され、同様に、父親、きょうだい、ともだち、などの人間が定義され、さらに、本がタイトル、サイズ、ページ、値段、色合い、などで定義され、以下同様に、別の本や、別のモノが定義される。このようにして仮想世界が設定される。
[仮想生活経験の取得S2]
仮想生活経験の取得S2では自然言語学習システム1の(外側にいるユーザ)が任意の人間役を演じて仮想世界に参入し仮想生活経験を作り出す。たとえば、母親役を演じて、自然言語学習システム1の位置に近づき、本を指差す動作を作り出し、「あの本は青い」と発話する動作を演じる。この「情景」は自然言語学習システム1に「仮想生活経験」として取得され、仮想生活経験記憶庫3に格納される。
[言語経験の分離抽出S3]
言語経験の分離抽出S3ではこの仮想生活経験の発話データのみを抽出し、文型規則記憶庫5に適合文型がみつかり、また、単語記憶庫7で適合する「筋書き」プログラム(意味プログラム)がみつかるなら、解釈成功とする。そうでなければ、その素文を素文記憶庫4に格納する。たとえば上の例なら「あの本は青い」という素文である。
[仮想生活経験の学習処理S4]
仮想生活経験の学習処理S4では言語経験の分離抽出S3で解釈成功に到達しなければ、仮想生活経験記憶庫3で当該「仮想生活経験」と動作カテゴリが同一のものを検索し、みつかれば、共通構造を抽出しこれを「筋書き」としてプログラム生成し文型規則記憶庫5に格納する。
[自然言語経験の学習処理S5]
自然言語経験の学習処理S5では言語経験の分離抽出S3で解釈成功に到達しなければ、素文記憶庫4内を検索して、一箇所差統合原理処理S411による文型規則統合処理を行い、統合に成功すれば文型規則記憶庫5に格納する。たとえば上例なら、「(あの この)(本 箱)は(赤い 黒い 青い)」などになる。
[言語知識形成処理S6]
言語知識形成処理S6では素文を一語ごとにわけ、意味学習に成功していない単語を、仮想生活経験記憶庫3の検索から生成された「筋書き」プログラムと対応させて、単語記憶庫7に格納する。並列して、単語記憶庫7内から各語の類似形を比較して、可能なものについて語形変化プログラムを生成し、これを語形変化規則記憶庫6に格納する。
[記憶処理S7]
記憶処理S7では記憶庫3、4、5、6、7における重複の削除を行う。
[LimitS8]
LimitS8では一定量(目安は「筋書き」数にして10から20)をこえるか否か判定し、超えなければ仮想生活経験の取得S2以下へ戻り、こえたら、仮想生活経験の取得S2以下をやめて、格納しステム3、4、5、6、7の最終的な重複処理をバッチ処理して終わる。
こうした学習経験を仮想世界の設定を取り替えて多数回くり返すことにより、次第に任意の言語について全側面の「文脈依存的な」学習を実現していく。
<第2の実施形態>
図6は本発明を実施するための最良の形態である第2の実施形態において、自然言語学習システム1を暗号解読学習システム20として使用した場合のものである。
自然言語学習システム1においては暗号文も自然言語も同じ処理が可能であるから、暗号解読処理システム20は、「もう一つの言語」の獲得処理にすぎない。
従来の暗号解読処理システムはみな暗号学という体系の「計量言語学的な処理」、いいかえれば統計的推測処理に依存している。暗号解読学習システム20は図6のように「言語学習処理」でこれに対処するところが際立った特色である。
ブロック21の「暗号文集合」と「事例イベントの集合」を具体化するために、ある販売チェーン店が週末特売品名を中央仕入れ部に暗号で指令するものと想定しよう。競争相手が4週間分のその指令文(らしき暗号)のデータと週末の特売品名データを入手したとする。たとえば、ABNSC%Dという暗号文で品物Aが500単位特売され、EBFTG$Hで品物Bが400単位、IBJKK$Lで品物Cが400単位、MBNSO#Pで品物Aが300単位特売された、というのが4週分のデータ(D1,D2,D3,D4)であるとする。
ブロック22は暗号文と特売品イベントが時間的な関係により対応づけられることを示す。
ブロック23では共通性抽出による暗号文文型規則の抽出と特売イベントという「筋書き」の形式化がなされ、一字おきに適切語がならぶ文型規則が把握され、%が5に対応する、などの意味論が把握される。(データD1とD4の共通性より、BS←→品物Aが得られ、データD1,D2,D3,D4の共通性より、B←→品物の指定指令が得られる、などによる。)これは計量言語学的にはデータが足りずでき難いことである。
<第3の実施形態>
図7に示す本発明を実施するための最良の形態である第3の実施形態において自然言語学習システム1をOS40(オペレーティングシステム)として使用した場合のものであり、PC用のOSとして使用するも、ロボットに組み込んでOSとして使用するも、仕様はおなじである。その要点は「ユーザが日常の言語を用いて発する指令を受容するシステム」ということである。
第一次ロム化の部分は、自然言語学習システム1がロム化されており、その学習機能が搭載されたOSまたはロボットに、ユーザが話しなれている言語または方言(たとえばタガログ語のユーザならタガログ語をLとする)を学習するための「筋書き」データの必要十分なものをロム化したDVDなどを読み込ませ、あらかじめLの言語能力を学習させるブロックである。
ここまでの部分をテストした上で性能に問題がないことを確認できれば、これまでの学習結果全体をロム化の上、ロム化された自然言語学習システム1と組み合わせて搭載したOSまたはロボットとすることも可能であるが、これは任意言語に対応する目的を捨て、特定言語Lに限定された仕様となる。
このように設計構築されたOSまたはロボットのシステムはユーザが自然言語で話すことばを理解することができ、その要求に対応する行為プログラムを自動生成できて、その自動生成されたプログラム自体がユーザの要求する仕事を実現するユーティリティを内蔵することになる。ユーザはそのユーティリティの仕事満足度をテストして、さらに完了を求める場合も、特段の準備なく、自然言語で不満な点を伝え、要求することで足りる。
自然言語学習システム1が従来技術ではなしえない次世代型のOSでありロボットとなるのは、生活経験に依拠して文脈依存型のプログラム自動生成を行うことを特色としているからである。
本発明は主にコンピュータ関連産業等で利用される。
本発明の第1の実施の形態の原理を示す流れ図。 本発明の第1の実施の形態の「筋書き」記述マトリックス図。 本発明の第1の実施の形態の一箇所差単語原理処理を示す流れ図。 本発明の第1の実施の形態の一箇所差成句原理処理を示す流れ図。 本発明の第1の実施の形態を示すブロック図。 本発明の第2の実施の形態の流れ図。 本発明の第3の実施の形態の流れ図。
符号の説明
1:自然言語学習システム、
2:処理部、
3:仮想生活経験記憶庫、
4:素文記憶庫、
5:文型規則記憶庫、
6:語形変化規則記憶庫、
7:単語記憶庫、
10:記憶庫、
S1:仮想世界の設定、
S2:仮想生活経験の取得(仮想生活経験の取得処理部)、
S3:言語経験の分離抽出(言語経験の分離抽出部)、
S4:仮想生活経験の学習処理(仮想生活経験の学習処理部)、
S41:文処理の学習(文処理の学習処理部)、
S411a:一箇所差単語原理処理(一箇所差単語原理処理部)、
S411b:一箇所差成句原理処理(一箇所差成句原理処理部)、
S412:分節文統合原理処理(分節文統合原理処理部)、
S42:単語処理(単語処理部)、
S421:語形処理(語形処理部)、
S422:語の用法・意味処理(語の用法・意味処理部)、
S43:仮想生活経験の学習処理(仮想生活経験の学習処理部)、
S44:総合処理(総合処理部)、
S5:自然言語経験の学習処理(自然言語経験の学習処理部)、
S6:言語知識形成処理(言語知識形成処理部)、
S7:記憶処理(記憶処理部)、
S8:Limit、
20:暗号解読処理システム、
21:ブロック、
22:ブロック、
23:ブロック、
40:OS。

Claims (10)

  1. ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」は任意のヒトなどの「動作」を核として記述され、この「動作」のカテゴリに対応する動作主体、動作対象、動作受容体、動作起点、動作着点、道具使用などの「動作カテゴリ特性」に区別する該時間軸と該「動作カテゴリ特性」という2次元のマトリックスで表現される表現方式であることを特徴とする自然言語学習システムの言語知識の学習方式。
  2. ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の2つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が一箇所差単語原理によるものであり、この一箇所差単語原理は、二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであるとみなして一箇所差統合原理を適用して文型規則を取得する原理のことである、ことを特徴とする自然言語学習システムの言語知識の学習方式。
  3. ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の2つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が一箇所差成句原理によるものであり、この一箇所差成句原理は、異なる文長の文1と文2には一箇所差単語原理(二つの文がただ一語を除けば残りはまったく同じ構造で、その一語の文内位置も同じであるとき、ただそのときに限って、二つは文型が同じであるとみなす原理)は適合しないが、記憶されている学習済みの文型規則に前記文1と前記文2に含まれるものがある場合は、その含まれる文型規則部分を成句とし、ただ一つの単語と同等であるとみなして一箇所差統合原理を適用して文型規則を取得する原理のことである、ことを特徴とする自然言語学習システムの言語知識の学習方式。
  4. ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文処理の学習」であって、この「文処理の学習」が、ヒトが発話したままの未処理の文である「素文」の2つ以上を比較して類似の文型を統合するという、類似性に基づいて統合する形式である文型規則を構成するものであり、前記「類似性に基づいて統合する形式」が分節文統合原理によるものであり、この分節文統合原理は、記憶済みの文型規則と取得された「素文」によりこの取得された「素文」を文型規則に統合する場合において、例えば記憶済みの「素文」から対応する「素文」が検出され、この検出された対応する「素文」が文型規則として統合可能な「素文」であると判明した場合には、個々の単語や単語群が一致していなくても、統合して新たな文型規則に集約するという原理である、ことを特徴とする自然言語学習システムの言語知識の学習方式。
  5. ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文に含まれる個々の単語に関する処理の学習」であって、この「文に含まれる個々の単語に関する処理の学習」が、(1)語形についての学習および(2)語の用法と意味の学習という二つの側面に分けられ処理されようになっていて、前記「語形についての学習」が、同じ単語の語形変化についてその語形変化処理プログラムを自動生成して格納し、これにより取得された2つの単語からまったく同一語形変化処理プログラムが生成された場合は、その2つの単語は語形変形を共有するものであることを識別できるようにし、前記取得された語形変形を共有する2つの単語を同一の語形変化として集約するものであり、前記「語の用法と意味の学習」が、単語の知識は該単語がどのような文型にどのような語形で表れ得るかという用例データ側面と該単語がどのような意味表現であるかという意味表現側面という二つの側面で処理され、前記単語の処理は常に前記用例データ側面と前記意味表現側面が並列的に処理・記憶され、且つ、その学習されたことも常に並列的に処理・記憶されるものである、ことを特徴とする自然言語学習システムの言語知識の学習方式。
  6. ヒト、モノ、動物などの「属性と属性値」の対を記述単位とした「対象」が、文字により定義され配置される仮想世界を形成し、任意の時点の前記仮想世界の状況である「情景」、時間軸に沿った該「情景」の系列の取得により該仮想世界の仮想生活経験が定義され、この仮想生活経験に基づいて自然言語知識を学習して該仮想生活経験の文脈に依存した自然言語知識を取得するとともに、前記自然言語知識を利用するための知識をプログラムの形式で自動生成して格納する自然言語学習システムの言語知識の学習方式であって、前記仮想生活経験の表現方式が、時間軸に沿った前記「情景」の連鎖によって記述される「筋書き」として記述され、この「筋書き」に基づいて行われる学習処理が「文に関係する仮想生活経験処理の学習」であって、この「文に関係する仮想生活経験処理の学習」が、複数の「筋書き」を比較して、偶発的な「情景」要因を除外する操作を重ねることにより、形式的な「筋書き」を取得する学習であることを特徴とする自然言語学習システムの言語知識の学習方式。
  7. 「筋書き」に基づいて行われる学習処理が請求項2に記載の「文処理の学習」、請求項3に記載の「文処理の学習」、請求項4に記載の「文処理の学習」、請求項5に記載の「文に含まれる個々の単語に関する処理の学習」、請求項6に記載の「文に関係する仮想生活経験処理の学習」およびそれらを総合して必要に応じてプログラムを自動生成するという学習処理であることを特徴とする自然言語学習システムの言語知識の学習方式。
  8. 「筋書き」に基づいて行われる学習処理が請求項2に記載の「文処理の学習」、請求項3に記載の「文処理の学習」、請求項4に記載の「文処理の学習」、請求項5に記載の「文に含まれる個々の単語に関する処理の学習」、請求項6に記載の「文に関係する仮想生活経験処理の学習」およびそれらを総合して必要に応じてプログラムを自動生成するという学習処理であることを特徴とする請求項1記載の自然言語学習システムの言語知識の学習方式。
  9. 自然言語学習システムが単語知識、構文知識およびデータのゼロからスタートするものであり、日本語、英語、仏語、スワヒリ語などの任意の自然言語を学習する自然言語学習システムであることを特徴とする請求項1〜8いずれか記載の自然言語学習システムの言語知識の学習方式。
  10. 請求項1〜9いずれか記載の自然言語学習システムの言語知識の学習方式のコンピュータプログラムを具備してなることを特徴とする自然言語学習プログラムを記録した記録媒体。
JP2005286580A 2005-09-30 2005-09-30 自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体 Pending JP2007094291A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005286580A JP2007094291A (ja) 2005-09-30 2005-09-30 自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005286580A JP2007094291A (ja) 2005-09-30 2005-09-30 自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2007094291A true JP2007094291A (ja) 2007-04-12

Family

ID=37980042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005286580A Pending JP2007094291A (ja) 2005-09-30 2005-09-30 自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2007094291A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489517A (zh) * 2018-05-09 2019-11-22 鼎捷软件股份有限公司 虚拟助理的自动学习方法及***
CN112259089A (zh) * 2019-07-04 2021-01-22 阿里巴巴集团控股有限公司 语音识别方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489517A (zh) * 2018-05-09 2019-11-22 鼎捷软件股份有限公司 虚拟助理的自动学习方法及***
CN110489517B (zh) * 2018-05-09 2023-10-31 鼎捷软件股份有限公司 虚拟助理的自动学习方法及***
CN112259089A (zh) * 2019-07-04 2021-01-22 阿里巴巴集团控股有限公司 语音识别方法及装置

Similar Documents

Publication Publication Date Title
US11144597B2 (en) Computer generated emulation of a subject
KR102170563B1 (ko) 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치
CN110782900B (zh) 协作ai讲故事
Papegaaij Word expert semantics: an interlingual knowledge-based approach
Pesina et al. Words Functioning in Lexicon
US10803850B2 (en) Voice generation with predetermined emotion type
CN109086408A (zh) 文本生成方法、装置、电子设备及计算机可读介质
CN110457466A (zh) 生成访谈报告的方法、计算机可读存储介质和终端设备
KR20200046523A (ko) 인공지능 기반의 자동 로고생성 시스템 및 이를 이용한 로고생성 서비스 방법
CN110297906A (zh) 生成访谈报告的方法、计算机可读存储介质和终端设备
CN110457424A (zh) 生成访谈报告的方法、计算机可读存储介质和终端设备
Origlia et al. FANTASIA: a framework for advanced natural tools and applications in social, interactive approaches
Zhang et al. ConceptEVA: concept-based interactive exploration and customization of document summaries
Czachesz Network analysis of biblical texts
Li et al. Data-driven alibi story telling for social believability
Baymurzina et al. Dream technical report for the alexa prize 4
Park et al. Visual language integration: A survey and open challenges
CN117194638A (zh) 素材生成方法、模型训练方法、特征提取方法及设备
JP2007094291A (ja) 自然言語学習システムの言語知識の学習方式および自然言語学習プログラムを記録した記録媒体
JP7044245B2 (ja) 対話システム補強装置及びコンピュータプログラム
Zulfikar et al. Memoro: Using Large Language Models to Realize a Concise Interface for Real-Time Memory Augmentation
Kedziorski Understanding and Generating Multi-Sentence Texts
KR20190094738A (ko) 검색어에서 적어도 하나의 키워드를 추출하는 방법, 전자 장치 및 컴퓨터 판독 가능한 기록 매체
Hämäläinen Generating Creative Language-Theories
Zhao et al. Beyond Words: An Intelligent Human‐Machine Dialogue System with Multimodal Generation and Emotional Comprehension