JP7177105B2

JP7177105B2 - 文書から認知・非認知能力を推定する能力推定プログラム、装置及び方法

Info

Publication number: JP7177105B2
Application number: JP2020013360A
Authority: JP
Inventors: 雄一石川
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2020-01-30
Filing date: 2020-01-30
Publication date: 2022-11-22
Anticipated expiration: 2040-01-30
Also published as: JP2021119374A

Description

本発明は、文書から文書作成者に係る情報を推定する技術に関する。

教育現場においては、児童や生徒に対し、その能力に応じたきめ細かな指導を可能にするべく、児童や生徒の能力を定常的且つ定量的に把握することが重要となっている。

ここで近年、特に児童の能力を、認知能力と非認知能力の２つに分けて捉えることが一般的になりつつある。このうち認知能力は、「文字が読める」「うまくブロックを積み上げられる」「三角形と四角形と五角形を区別できる」といったような認知に関する能力を指し、例えば知能指数（ＩＱ）がその指標としての代表例である。

一方、非認知能力は、勉強等の物事への取り組みがうまくいかないときに諦めることなく、「どうしてかな」「こうやってみよう」「これがだめなら、ああやってみよう」等、目標が達成するまで努力したり、我慢したりする能力、さらに感情をコントロールする能力を指す。この非認知能力の尺度としては、「根気」と「一貫性」で構成される「やりぬく力」の指標であるＧＲＩＴが代表的である。

このように学習指導を行うにあたり重要な情報となり得る認知能力と非認知能力であるが、そのいずれを求めるにしても従来、質問紙や専用のアプリケーション等を利用した、定量的な能力測定が一般的に行われてきた。例えば、認知能力としての知能指数を測定するべく、種々の検査用紙が用意されており、さらに、非認知能力としてのＧＲＩＴを測定するための例えば12問で構成される標準的な質問紙も、広く利用可能となっている。

しかしながら、このような従来の能力測定手法は、測定自体や、さらには測定の準備（例えば教師による測定内容の説明や回答方法の指導等）のために相当の時間を要するので、頻繁な測定が困難となっている。また、児童によっては質問紙の質問内容が十分に理解できなかったり、（特に非認知能力測定では）大人からの評価を気にして本来の自分とは異なるあるべき姿を思い描いて回答したりすることも想定され、能力測定結果の信頼性を確保することが難しいという課題を抱えている。

このような従来手法の課題を解決するべく、例えば非特許文献１には、個人が作成した文章から当該個人の性格を推定する技術が開示されている。この技術では特に、ソーシャルメディアへの書き込み内容には、人が無意識に認知してそこから取捨選択した情報が多く含まれているとして、そのテキストから筆者の性格を推定している。

また、特許文献１には、デジタルペンで入力された手書き文字から性格を推定する技術が開示されている。この技術では、手書きの文字や絵の時空間情報を定量化して特徴量を抽出することによって、書き手の精神・心理・生理状態を判定している。さらに、特許文献２には、電子ペンと情報端末とサーバを備えており、短時間で詳細な性格分析を行うことのできる性格分析システムが開示されている。

このように、これらの先行文献では、質問紙等を用いることなく、デジタルペン等で入力されたものを含めた手書き文字や文章から、性格を分析・推定する手法が提案されているのである。この点教育現場でも、児童の手書きによるテスト答案や作文等は、日常的に且つ頻繁に作成されるのであり、また、このような児童による作成文書は、作成者である児童の能力を反映した情報を含むと考えられる。したがって、このような作成文書から児童の能力を推定することができれば、上述したような従来の課題が十分に解決可能となるのである。

特開２０１０－１３１２８０号公報特開２００７－７９８９１号公報

上條浩一, 那須川哲哉, 「人の気づきに迫る -認知科学，心理学からのアプローチ-：6．パーソナリティという見地からの認知 -テキストの筆者の性格推定の取組みを通じて-」, 情報処理, vol.58, No.4, pp.305-309, ２０１７年

しかしながら、非特許文献１や特許文献１及び２に記載されたような従来技術は、上述したように今後益々重要視される認知能力や非認知能力を推定対象としておらず、また認知能力や非認知能力そのものを推定するようには設計されていない。

特に、非特許文献１に記載された技術では、単語の意味情報のみが推定に用いられており、例えば文字の大きさや位置、色や濃淡といった文字属性情報は、推定に使用されていない。ここで、このような単語の意味情報は、推定対象者における言語の学習状況等にも依存し、単なる学習量とは別の指標である認知能力や非認知能力の推定に対し、好適であるとは言えないと考えられる。

さらに、特許文献１及び２に記載された技術においても、文字の大きさについて言及してはいるが、文字の位置、色や濃淡といった文字属性情報はやはり、推定に使用されていない。また特に、これらの技術ではあくまで手書き文字を対象としており、近年、教育現場でも増加しているワープロソフトウェアやプレゼンテーション資料作成ソフトウェア等によって作成された文書には対応することができない。例えば太字や斜体、下線付き、網掛け等の文字効果に関する情報や、明朝体、ゴシック体等のフォントタイプといったような文字形状に関する情報は考慮の対象外となっている。

そこで、本発明は、文書における文字に係る特徴から、その作成主体の認知能力及び／又は非認知能力を推定可能な能力推定プログラム、装置及び方法を提供することを目的とする。

本発明によれば、作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定可能なコンピュータを機能させる能力推定プログラムであって、
当該文書の文字における形状、サイズ及び位置のうちの少なくとも１つに係る量、及び／又は当該量の変動分に係る量である文字特徴量を、認知能力及び／又は非認知能力に係る値を出力可能な構築済みのモデルに入力し、当該モデルからの出力に基づいて、当該文書の作成主体の認知能力及び／又は非認知能力に係る情報を決定する能力決定手段
としてコンピュータを機能させる能力推定プログラムが提供される。

この本発明による能力推定プログラムの一実施形態として、本能力推定プログラムは、当該文書内の複数の文書領域における文書領域毎に又は１つ若しくは複数の文書領域について、当該文書領域内の文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
能力決定手段は、当該文書領域について生成された当該文字特徴量と、この文字特徴量に係る文書領域に係る情報とを、構築済みの当該モデルに入力することも好ましい。

また、本発明による能力推定プログラムの他の実施形態として、本能力推定プログラムは、当該文書内の複数の文書領域における文書領域毎に又は２つ以上の文書領域につき、当該文書領域内の文字における形状、サイズ及び位置のうちの少なくとも１つに係る量を生成して、互いに異なる文書領域について生成した当該量の間の変動分に係る量である当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
能力決定手段は、少なくとも当該変動分に係る量である文字特徴量と、この文字特徴量に係る文書領域に係る情報とを、構築済みの当該モデルに入力することも好ましい。

また、上述したいずれの実施形態についても、当該文書領域は、（ａ）当該文書を複数の区域に分割した場合の当該区域、（ｂ）当該文書において所定の窓枠をスライドさせつつ規定した枠内区域、又は（ｃ）当該文書において予め目的別に設定された区域であることも好ましい。

さらに、本発明による能力推定プログラムの更なる他の実施形態として、本能力推定プログラムは、予め設定された複数の文字種別における文字種別毎に又は１つ若しくは複数の文字種別について、当該文字種別に属する文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
能力決定手段は、当該文字種別について生成された当該文字特徴量と、この文字特徴量に係る文字種別に係る情報とを、構築済みの当該モデルに入力することも好ましい。

また、上記の文字種別に係る実施形態において、当該文字種別は、文字を取り囲んで包含する領域である文字領域における高さと幅との比に基づき予め分類されたものであることも好ましい。

さらに、本発明による能力推定プログラムの更なる他の実施形態として、本能力推定プログラムは、当該文書の文字のうち、出現頻度が所定以上である文字、又は出現頻度が高いものとして設定された文字種別に属する文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させることも好ましい。

また、本発明による能力推定プログラムにおいて取り扱われる当該文字特徴量は、当該文書の文字における、（ａ）当該文書全体の中での位置に係る量、（ｂ）当該文書内の所定の範囲若しくは基準に対する位置に係る量、及び（ｃ）他の文字に対する位置に係る量のうちの少なくとも１つ、及び／又は（ｄ）これらの量の変動分に係る量のうちの少なくとも１つを含むことも好ましい。

さらに、本発明による能力推定プログラムの更なる他の実施形態として、能力決定手段は、当該文書の作成主体について取得された属性情報も、構築済みの当該モデルに入力することも好ましい。

本発明によれば、また、作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定する能力推定装置であって、
当該文書の文字における形状、サイズ及び位置のうちの少なくとも１つに係る量、及び／又は当該量の変動分に係る量である文字特徴量を、認知能力及び／又は非認知能力に係る値を出力可能な構築済みのモデルに入力し、当該モデルからの出力に基づいて、当該文書の作成主体の認知能力及び／又は非認知能力に係る情報を決定する能力決定手段
を有する能力推定装置が提供される。

本発明によれば、さらに、作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定可能なコンピュータにおける能力推定方法であって、
当該文書の文字における形状、サイズ及び位置のうちの少なくとも１つに係る量、及び／又は当該量の変動分に係る量である文字特徴量を入力とし、認知能力及び／又は非認知能力に係る値を出力可能なモデルを構築するステップと、
能力推定対象である作成主体が作成した文書における当該文字特徴量を、構築済みの当該モデルに入力し、当該モデルからの出力に基づいて、当該作成主体の認知能力及び／又は非認知能力に係る情報を決定するステップと
を有する能力推定方法が提供される。

本発明の能力推定プログラム、装置及び方法によれば、文書における文字に係る特徴から、その作成主体の認知能力及び／又は非認知能力を推定することができる。

本発明による能力推定装置の一実施形態における機能構成を示す機能ブロック図である。本発明の一実施形態に係る文字位置特徴量を説明するための模式図である。本発明に係る能力決定部における文書領域特徴量を用いた能力推定処理における２つの実施形態を説明するための模式図である。

以下、本発明の実施形態について、図面を用いて詳細に説明する。

［能力推定装置］
図１は、本発明による能力推定装置の一実施形態における機能構成を示す機能ブロック図である。

図１に示した本実施形態の能力推定装置１は、（例えば小学校において児童によって作成された提出物であるテスト答案や作文等の）文書に係る文書データを保存・管理している文書データベース（ＤＢ）２から、例えば通信によって取得された文書データを用い、当該文書の作成主体（例えば児童）における認知能力及び／又は非認知能力を推定する装置である。

ここで、認知能力は、「文字が読める」「うまくブロックを積み上げられる」「三角形と四角形と五角形を区別できる」といったような認知に関する能力を指し、例えば知能指数（ＩＱ）がその指標の代表例として挙げられる。

一方、非認知能力は、勉強等の物事への取り組みがうまくいかないときに諦めることなく、「どうしてかな」「こうやってみよう」「これがだめなら、ああやってみよう」等、目標が達成するまで努力したり、我慢したりする能力、さらに感情をコントロールする能力を指す。この非認知能力の尺度としては、「根気」と「一貫性」で構成される「やりぬく力」の指標であるＧＲＩＴが代表的である。また、「心の知能指数」であるＥＱ（Emotional Intelligence Quotient）も、非認知能力の尺度として周知となっている。

このような認知能力や非認知能力は、例えば教育現場、特に小学校において、児童に対する教育・指導に役立つ重要な情報として認識されている。

また、能力推定装置１は、
（ア）作成主体（例えば児童）が手書きで作成した文書（に係る文書データ）から、又は
（イ）作成主体（例えば児童）が、ワープロソフトウェアやプレゼンテーション資料作成ソフトウェア等を搭載した又は利用可能な機器を介し、文字を選択、調整又は決定して作成した文書（の文書データ）から、
当該作成主体（例えば児童）の認知能力及び／又は非認知能力を推定可能となっており、具体的にその特徴として、
（Ａ）上記の文書の文字における（ａ）形状、サイズ及び位置のうちの少なくとも１つに係る量、及び／又は、（ｂ）当該量の変動分に係る量である「文字特徴量」を、認知能力及び／又は非認知能力に係る値を出力可能な構築済みの「モデル」に入力し、この「モデル」からの出力に基づいて、当該文書の作成主体（例えば児童）の認知能力及び／又は非認知能力に係る情報を決定する能力決定部１１５
を有している。

ここで、上記（Ａ）の「文字特徴量」は本実施形態において、能力推定装置１の特徴量生成部１１１によって生成される量であり、後に詳細に説明するが、本発明における種々の実施形態における特徴量として様々な態様をとることができる量となっている。

このように、能力推定装置１によれば、文書における文字に係る特徴を示す「文字特徴量」から、その作成主体（例えば児童）の認知能力及び／又は非認知能力を推定することができる。さらに、従来手法である質問紙調査等と比較して、準備や本処理の手間を大幅に削減し、より短時間で認知能力及び／又は非認知能力を推定することも可能となるのである。

またさらに、従来の質問紙調査等の手法では、被験者（例えば児童）が質問内容を十分に理解できなかったり、本来の自分とは異なるあるべき姿を思い描いて回答したりすることも想定され、測定結果に対する高い信頼性を確保するのが困難であった。これに対し能力推定装置１においては、「文字特徴量」は通常、作成主体（例えば児童）によって意識的に制御・調整されることのない量となっているので、その能力推定結果について、より高い信頼性が見込まれるのである。

なお、本発明に係る作成主体によって作成された文書は当然、児童による提出物に限定されるものではない。例えば、生徒、学生、受験者、被験者や、社員、グループ構成員、さらには所定調査の対象者や希望者等、上記（ア）や上記（イ）の文書を作成した者であって、認知能力や非認知能力の推定対象となり得る者であれば、種々様々な者が本発明に係る作成主体に該当し得るのである。

また、能力推定装置１は、図１に示したように本実施形態において、文書データ及び属性情報を外部から通信によって取得する装置となっているが、勿論、これらのデータ・情報を通信以外の方法で取得する、例えばスタンドアローンの装置であってもよい。

さらに、能力推定装置１は、図１に示したように本実施形態において、上記（Ａ）の能力決定部１１５以外の機能構成部である特徴量生成部１１１、文字種別特定部１１２、コンテキスト特定部１１３及びモデル構築部１１４をも備えた装置となっているが、これらの少なくとも１つが外部の装置に含まれるような装置形態をとることも可能である。例えば、複数のサーバの全体によって、図１に示したような能力推定装置１の機能を実現することもできるのである。

［装置機能構成、能力推定プログラム及び方法］
同じく図１の機能ブロック図によれば、能力推定装置１は、通信インタフェース部１０１と、文書保存部１０２と、属性情報保存部１０３と、能力情報保存部１０４と、キーボード（ＫＢ）１０５と、ディスプレイ（ＤＰ）１０６と、プロセッサ・メモリとを有する。

ここで、このプロセッサ・メモリは、本発明による能力推定プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この能力推定プログラムを実行することによって、能力推定処理を実施する。このことから、能力推定装置１は、当該能力推定処理専用の装置であってもよいが、本発明による能力推定プログラムを搭載した、クラウドサーバ、非クラウドサーバ、パーソナル・コンピュータ（ＰＣ）、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等とすることもできる。

さらに、プロセッサ・メモリは、文字形状特徴量生成部１１１ａ、文字サイズ特徴量生成部１１１ｂ、文字位置特徴量生成部１１１ｃ、文字変動特徴量生成部１１１ｄ、文書領域特徴量生成部１１１ｅ、文字種別特徴量生成部１１１ｆ、作成主体属性特徴量生成部１１１ｇ、及び文字検出部１１１ｚを有する特徴量生成部１１１と、文字種別特定部１１２と、コンテキスト特定部１１３と、モデル構築部１１４と、能力決定部１１５と、通信制御部１２１と、入出力制御部１２２とを有する。

なおここで、特徴量生成部１１１は、文字形状特徴量生成部１１１ａ、文字サイズ特徴量生成部１１１ｂ及び文字位置特徴量生成部１１１ｃのうちの少なくとも１つを備えたものであってもよい。ただし、上述したような種々の特徴量生成部を有することによって、より高い推定精度の実現に貢献するような特徴量を構成可能になるのである。

また、以上に述べた機能構成部は、プロセッサ・メモリに保存された能力推定プログラムの機能と捉えることができる。また、図１における能力推定装置１の機能構成部間を矢印で接続して示した処理の流れは、本発明による能力推定方法の一実施形態としても理解される。

同じく図１の機能ブロック図において、文書保存部１０２は、文書ＤＢ２から通信インタフェース部１０１及び通信制御部１２１を介して、
（ア）「手書き文書データ」：作成主体（例えば児童）が手書きで作成した文書の文書データ（例えば当該文書をスキャン若しくは撮影して生成した文書電子データや、手書き用デバイスを用いて入力パネルを介し入力された文書データ）、又は／及び
（イ）「非手書き文書データ」：作成主体（児童）が、ワープロソフトウェアやプレゼンテーション資料作成ソフトウェア等を搭載した又は利用可能な機器を介し、文字を選択、調整又は決定して作成した文書の文書データ（文書電子データ）
を取得し、当該「（手書き及び／又は非手書き」文書データ」を作成主体（児童）の対象ＩＤに紐づけて保存・管理する。

ここで、上記（イ）における文字の「選択、調整又は決定」は本実施形態において、文字形状（例えばフォントタイプ等）、文字サイズ（例えばフォントサイズ等）、及び文字位置（例えばページ（用紙）内の文字座標）のうちの少なくとも１つについての作成主体自身による選択、調整又は決定を意味するものとすることができる。

また、属性情報保存部１０３は、属性情報ＤＢ３から通信インタフェース部１０１及び通信制御部１２１を介して、作成主体（児童）の属性情報、例えば、性別、体格情報（身長、体重、座高等）、年齢、学習進捗情報（例えば、所属学年や、習熟度別のクラス分けを実施している場合の所属クラス等）等のうちの少なくとも１つを取得し、当該属性情報を作成主体（児童）の対象ＩＤに紐づけて保存・管理する。

ここで、上記の属性情報は、後に詳細に説明するが１つの好適な実施形態として、作成主体属性特徴量生成部１１１ｇが作成主体属性特徴量を生成するのに使用される。また、当該属性情報としては、認知能力及び／又は非認知能力の推定の際、文字特徴量とともに説明変数となり得るようなものならば、上記以外にも様々なものが採用可能となっている。

なお、文書ＤＢ２及び属性情報ＤＢ３は、例えば小学校が管理する同一のサーバに格納又は接続され、共通の対象ＩＤ（例えば児童のＩＤ）で管理されているものであることも好ましい。

同じく図１の機能ブロック図において、特徴量生成部１１１の文字検出部１１１ｚは、文書保存部１０２から取り出した、その作成主体の能力を推定すべき文書データから、当該文書データに含まれる各文字の文字データ（以後、文字と略称する場合もあり）を検出し、当該文字の文字情報を決定する。

ここで、上記（ア）の「手書き文書データ」（又はそれに係る文書）の場合、文字検出部１１１ｚは、公知の文字認識技術、例えばＯＣＲ（Optical Character Recognition）やディープラーニング文字認識等を用いて文字を検出し、さらに、検出した文字における形状、サイズ及び位置のうちの少なくとも１つに係る文字情報、すなわち、文字形状情報、文字サイズ情報、及び／又は文字位置情報を決定してもよい。

例えば文字検出部１１１ｚは、各文字に外接する文字矩形領域を検出し、各文字矩形領域における
（ａ）縦横比（縦長（高さ）と横幅との比の値）、
（ｂ）面積、縦長（高さ）、横幅、及び対角線長等のうちの少なくとも１つ、及び
（ｃ）ページ（用紙）内の位置座標
をそれぞれ、各文字についての文字形状情報、文字サイズ情報、及び文字位置情報とすることができる。ここで、文字サイズ情報は、ピクセルやセンチメートル等の単位で示された絶対的なサイズに係る情報としてもよく、または、用紙のサイズや、用紙から余白領域を除いた文字記入可能範囲のサイズとの比で示される相対的なサイズに係る情報であってもよい。

また、上記（ｃ）のページ（用紙）内の位置座標としては、例えば後に参照する図２にも示したように、ページ（用紙）上の基準点を原点とした（水平方向軸及び垂直方向軸を有する）２次元位置座標系を設定した場合における、文字矩形領域の代表位置（例えば当該領域の中心や四隅のいずれか）の位置座標値を採用することができる。ここで、上記の基準点は、ページ（用紙）や文字記入可能範囲における中心や四隅のいずれかとしてもよい。

一方、上記（イ）の「非手書き文書データ」の場合、文字検出部１１１ｚは、当該文書データ内に含まれる各文字の「文字属性情報」を取り出し又は抽出し、当該文字属性情報を、文字形状情報、文字サイズ情報、及び文字位置情報のうちの少なくとも１つとすることができる。または、当該文字属性情報に基づいて、上述した「手書き文書データ」の場合と同様の文字形状情報、文字サイズ情報、及び文字位置情報のうちの少なくとも１つを生成してもよい。またさらに、文字検出部１１１ｚは、これらの生成した情報から、各文字の文字矩形領域を決定してもよい。

ここで、上記の「文字属性情報」は、当該文字において指定されている、
（ａ）文字形状（例えば明朝体、ゴシック体等のフォントタイプや、（太字、下線付き、斜体、影付き等の）文字飾り情報等。さらに本実施形態では文字色等もここに含む）
（ｂ）文字サイズ（例えばフォントサイズ等）、及び
（ｃ）文字位置（例えばページ内の位置座標）
のうちの少なくとも１つに係る情報となっている。

＜文字形状特徴量＞
同じく図１の機能ブロック図において、特徴量生成部１１１の文字形状特徴量生成部１１１ａは、文字検出部１１１ｚから、モデル構築用の又は能力推定対象としての文書データを構成する文字についての文字形状情報を受け取り、当該文字形状情報に基づき、当該文書データの「文字形状特徴量」を生成する。

ここで、この「文字形状特徴量」として、受け取った文字形状情報が手書き文書データに係るものである場合、例えば、当該文字形状情報に含まれる個々の文字の文字矩形領域における縦横比についての（全文字での）統計値、例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも１つ、を採用することができる。

一方、受け取った文字形状情報が非手書き文書データに係るものである場合、「文字形状特徴量」として、例えば、
（ａ）フォントタイプ統計値：当該文字形状情報（に係る文字属性情報）に含まれる個々の文字において採用されているフォントタイプの（文書データ全体での）種類数、及び、所定の若しくは個々のフォントタイプを採用している文字の数における全文字数に対する割合（比の値）、のうちの少なくとも１つ、
（ｂ）文字飾り情報：当該文字形状情報（に係る文字属性情報）に含まれる個々の文字で使用されている文字飾りの（文書データ全体での）種類数、及び、所定の若しくは個々の文字飾りを使用している文字の数における全文字数に対する割合（比の値）、のうちの少なくとも１つ、
（ｃ）文字色統計値：当該文字形状情報（に係る文字属性情報）に含まれる個々の文字で使用されている文字色の（文書データ全体での）種類数、所定の若しくは個々の文字色を使用している文字の数における全文字数に対する割合（比の値）、及び、複数色が使用されている場合における文字色の統一性を示す値（例えば基準色からの色空間距離の統計値（例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも１つ）、のうちの少なくとも１つ
のうちの少なくとも１つを採用することができる。

なお、上記（ｂ）の文字飾り情報において、文字飾りの種類数をカウントする際、複数種類の文字飾りが同一の文字に使用されている場合、これらの文字飾りの組合せを、１つの別種の文字飾りとして扱ってもよく、または、当該文字において、これら複数種類の文字飾りをそれぞれ個別にカウントしてもよい。

また、上記の文字属性に係る値である（ａ）フォントタイプ統計値、（ｂ）文字飾り情報、及び（ｃ）文字色統計値はいずれも、他の文字属性種別となる文字属性毎に算出された値の組（セット）としてもよい。例えば、フォントタイプ統計値を、フォントサイズの設定可能値毎に、文字色の種別毎に、及び／又は文字飾りの種別毎に算出し、これら算出された値のセットを、「文字形状特徴量」に採用することができる。

さらに、受け取った文字形状情報が非手書き文書データに係るものである場合、「文字形状特徴量」として、以上に説明した値に加えて又は以上に説明した値に代えて、手書き文書データの場合と同様の「文字矩形領域における縦横比についての統計値」を採用してもよい。

また特に、手書き文書データの場合に好適な態様となるが、「文字形状特徴量」は、予め設定された文字種別毎に算出されてもよい。例えば（この後用いる図２（Ｅ）に示したような）文字形状の縦横比が所定以上に高い高縦横比文字（例えば数字の「１」）や、文字形状の縦横比が所定以上に低い低縦横比文字（例えば漢字の「一」や長音「ー」等）は、作成主体（例えば児童）の認知能力や非認知能力にかかわらず必然的に、その形状が他の文字と比べてより偏る傾向にあると考えられる。

そこで、高縦横比文字や低縦横比文字を含めた複数の文字種別を予め設定しておき、これらの文字種別毎に「文字形状特徴量」を算出・決定することによって、作成主体（例えば児童）の認知能力や非認知能力にかかわらず必然的に発生する文字形状の差異が、能力推定結果に与えてしまう影響を抑制することも可能となるのである。

また、個々の文字毎に「文字形状特徴量」を算出することも可能ではあるが、例えば漢字を含む場合は文字の種類が膨大となり、実際には特徴量としてまとめることが困難となってしまう。そこで上述したように、予め設定した文字種別毎に「文字形状特徴量」を算出することも好ましいのである。

さらに、「文字形状特徴量」は、
（ａ）文書データ全体において所定回数以上若しくは所定頻度以上で出現する文字種別である「頻出文字」を特定した上で、又は
（ｂ）出現頻度が高い文字種別として予め「頻出文字」を設定した上で、
当該「頻出文字」を含む文字種別毎に、又は当該「頻出文字」についてだけ算出されてもよい。これにより、出現頻度の低い文字についてはその特徴をとらない又は別に分けることによって、文字形状特徴量の統計量としての信頼性を担保することも可能となる。

なお、以上に述べたような、文書データに含まれる各文字の「文字種別」は、文字種別特定部１１２において、公知の例えば機械学習を用いた画像認識技術を用いて決定される。例えば各文字を当該画像認識技術によって、予め設定した文字種別に分類してもよい。

＜文字サイズ特徴量＞
同じく図１の機能ブロック図において、特徴量生成部１１１の文字サイズ特徴量生成部１１１ｂは、文字検出部１１１ｚから、モデル構築用の又は能力推定対象としての文書データを構成する文字についての文字サイズ情報を受け取り、当該文字サイズ情報に基づき、「文字サイズ特徴量」を生成する。

ここで、この「文字サイズ特徴量」として、受け取った文字サイズ情報が非手書き文書データに係るものである場合、例えば、
・フォントサイズ統計値：当該文字形状情報（に係る文字属性情報）に含まれる個々の文字におけるフォントサイズについての（全文字での）統計値（例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも１つ）、
を採用することができる。

この文字属性に係る値であるフォントサイズ統計値は、他の文字属性種別となる文字属性毎に算出された値の組（セット）としてもよい。例えば、フォントサイズ統計値を、フォントタイプの種別毎に、文字色の種別毎に、及び／又は文字飾りの種別毎に算出し、これら算出された値のセットを、文字サイズ特徴量に採用することもできる。

また、「文字サイズ特徴量」として、手書き文書データ及び非手書き文書データの別によらず、例えば文字の記入・入力されるページ（用紙）上に文字枠が設定されている場合に、この文字枠に対する文字の相対的なサイズを算出し、当該相対サイズを文字サイズ特徴量に採用してもよい。ここで、文字枠に対する文字の相対的なサイズは、例えば、当該文字に係る文字矩形領域の面積と当該文字枠の面積との比の値としてもよく、または、当該文字に係る文字矩形領域の縦長（若しくは横幅）と当該文字枠の縦長（若しくは横幅）との比の値とすることもできる。

また、上記の文字枠とは、例えば、
（ａ）原稿用紙や(漢字練習帳等の)学習ノートに設けられた、一枠に１つの文字を記入・入力させるためのマス目の枠や、
（ｂ）テストの答案用紙等に設けられた氏名や回答の記載枠、さらには、
（ｃ）プレゼンテーション用の資料に含まれる特定の文字入力領域を囲む文字領域枠
といったようなものを指す。なお文書データにおいては、この文字枠は勿論、当該文書データの中に含まれる、上記（ａ）、（ｂ）、（ｃ）等に相当する枠の設定位置情報となる。

ちなみに、文字枠は、必ずしも矩形であるとは限らず、楕円形や、矩形以外の多角形であってもよい。さらに、ページ（用紙）上の所定の領域を指定する基準となるもの、例えば自身の上方に文字を記入・入力することを促す線分（文字基準下線）も、ここでは広い意味で当該文字枠に該当するものとする。

また、このような文字枠の検出は、特徴量生成対象の文書データがスキャンデータのような画像データの場合、公知の例えば機械学習を用いた画像認識技術によって実施することができる。またこの際、文字枠とともに、この文字枠内に記入・入力された文字も合せて検出することも好ましい。

さらに、ワープロソフトウェアやプレゼンテーション資料作成ソフトウェア等によって作成された文書データの場合には、当該文書データに含まれる属性情報（を含む文字サイズ情報）から、文字枠と当該文字枠内に記入・入力された文字とを特定することが可能となる。

また、「文字サイズ特徴量」として、受け取った文字サイズ情報が手書き文書データに係るものである場合、例えば、
・手書き文字サイズ統計値：当該文字サイズ情報（に係る文字属性情報）に含まれる個々の文字におけるサイズ（例えば面積、縦長（高さ）、横幅及び対角線長等のうちの少なくとも１つ）についての（全文字での）統計値（例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも１つ）
を採用することができる。

なお、上記の手書き文字サイズ統計値は、個々の作成主体（例えば児童）についての絶対値として算出されるものであるが、変更態様として、複数の作成主体（例えば児童）の手書き文字サイズ統計値群の中における相対値として算出されてもよい。例えば、複数の作成主体（例えば１つのクラスの全児童）を母集団として、個々の作成主体（例えば児童）における絶対値としての手書き文字サイズ統計値における（ａ）偏差値や、（ｂ）当該母集団の平均値や分散から算出されるＺ得点を、相対値としての手書き文字サイズ統計値としてもよい。

また特に、手書き文書データの場合に好適な態様となるが、「文字サイズ特徴量」は、予め設定された文字種別毎に算出されてもよい。例えば、
（ａ）促音文字（「っ」,「ッ」）、
（ｂ）拗音文字（「ぁ」,「ぃ」,「ぅ」,・・・）、
（ｃ）高縦横比文字（例えば数字の「１」）、
（ｄ）低縦横比文字（例えば漢字の「一」や長音「ー」等）や、
（ｅ）句読点文字（「。」,「、」）
といったような種別の文字は、作成主体（例えば児童）が文書データ全体において文字サイズをできるだけ均等にするように意識していたとしても、他の種別の文字と比べて必然的に、文字矩形領域における面積、縦長、横幅及び対角線長のうちの少なくとも１つが大幅に小さくなる。

そこで、上記（ａ）～（ｅ）を含めた複数の文字種別を予め設定しておき、これらの文字種別毎に「文字サイズ特徴量」を算出・決定することによって、作成主体（例えば児童）の認知能力や非認知能力にかかわらず必然的に発生する文字サイズの差異が、能力推定結果に与えてしまう影響を抑制することもできるのである。

また、個々の文字毎に「文字サイズ特徴量」を算出することも可能ではあるが、漢字を含む場合は文字の種類が膨大となり、実際には特徴量としてまとめることが困難となってしまう。そこで上述したように、予め設定した文字種別毎に「文字サイズ特徴量」を算出することも好ましいのである。

さらに、「文字サイズ特徴量」は、
（ａ）文書データ全体において所定回数以上若しくは所定頻度以上で出現する文字種別である「頻出文字」を特定した上で、又は
（ｂ）出現頻度が高い文字種別として予め「頻出文字」を設定した上で、
当該「頻出文字」を含む文字種別毎に、又は当該「頻出文字」についてだけ算出されてもよい。これにより、出現頻度の低い文字についてはその特徴をとらない又は別に分けることによって、文字サイズ特徴量の統計量としての信頼性を担保することも可能となる。

＜文字位置特徴量＞
同じく図１の機能ブロック図において、特徴量生成部１１１の文字位置特徴量生成部１１１ｃは、文字検出部１１１ｚから、モデル構築用の又は能力推定対象としての文書データを構成する文字についての文字位置情報を受け取り、当該文字位置情報に基づき、「文字位置特徴量」を生成する。

ここで以下、図２も適宜用いて、「文字位置特徴量」の具体的な内容について詳細に説明を行う。

なお以下、特徴量決定対象が手書き文書データであるとして、様々な文字位置特徴量の態様を説明するが、これらの態様の文字位置特徴量は、文書生成の際に使用するソフトウェアにもよるが、非手書き文書データを取り扱う場合にも適用され得るものとなっている。

文字位置特徴量生成部１１１ｃは、より具体的に、文字位置情報である各文字についてのページ（用紙）内での位置座標を取得し、これらの位置座標に基づき、「文字位置特徴量」を生成することも好ましい。

例えば、図２（Ａ）に示したように、ページ（用紙）に設定されたＸＹ位置座標系における、各文字に係る文字矩形領域の代表位置（例えば当該領域の中心や四隅のいずれか）の位置座標値（（X, Y）又はX若しくはY）を、各文字の文字位置特徴量としてもよい。また、マス目枠等の文字枠に設定されたxy位置座標系における文字矩形領域の代表位置の位置座標値（（x, y）又はx若しくはy）を、各文字の文字位置特徴量とすることもできる。

さらに、図２（Ｂ）に示したように、氏名記載部や本文記載部といったような文字記入・入力領域に設定された位置座標系における、各文字の文字矩形領域の代表位置の位置座標値を、各文字の文字位置特徴量とすることも可能である。

また、図２（Ｃ）に示したように、各文字の文字矩形領域と、その近傍となる文字の文字矩形領域との「間隔」（例えばdx_c，dy_c，sx_c及びsy_cのうちの少なくとも１つ）を、各文字の文字位置特徴量としてもよい。なお、このような文字間の「間隔」は、上下左右のいずれかに隣接する文字との間隔としてもよく、または、上下左右のいずれかの方向において所定文字数分だけ離隔した文字との間隔（例えば文字矩形領域の中心間の距離）とすることもできる。

さらに、図２（Ｄ）に示したように、各文字の文字矩形領域の代表位置（例えば当該領域の中心や四隅のいずれか）と、文字基準下線との位置関係を示す値（例えばd_L，sx_L及びsy_Lのうちの少なくとも１つ）を、各文字の文字位置特徴量としてもよい。

次いで、以上に述べたような各文字の文字位置特徴量に対し、文書データ全体や該当する文字記入・入力領域全体での統計値（例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも１つ）を算出し、当該統計値を「文字位置特徴量」とすることも好ましいのである。

さらにまた、文字位置特徴量生成部１１１ｃは、「文字位置特徴量」として、
（ａ）（例えば横書き文書における）同一行の文字群の文字矩形領域列における上端位置若しくは下端位置の斉一性を示す値（例えば、上端位置若しくは下端位置のy(Y)座標値の標準偏差の逆数）、又は
（ｂ）（例えば縦書き文書における）同一列の文字群の文字矩形領域列における左端位置若しくは右端位置の斉一性を示す値（例えば、左端位置若しくは右端位置のx(X)座標値の標準偏差の逆数）
を採用することも可能である。

また、「文字位置特徴量」は、予め設定された文字種別毎に算出されてもよい。例えば、図２（Ｅ）に示すような高縦横比文字（例えば数字の「１」）や、低縦横比文字（例えば漢字の「一」や長音「ー」等）は、文字位置の斉一性が高く見える、すなわち互いの位置が揃って見える文字群（文章）の中においても、所定方向で隣接している文字との間で、文字矩形領域における上下左右端のいずれかのx(X)若しくはy(Y)座標値の差が際立って大きくなってしまう。そこで、高縦横比文字や低縦横比文字を含む複数の文字種別を予め設定しておき、これらの文字種別毎に「文字位置特徴量」を算出・決定することも好ましい。

これにより、作成主体（例えば児童）の認知能力や非認知能力にかかわらず必然的に発生する文字位置の相対的なばらつきが、能力推定結果に与えてしまう影響を抑制することもできる。また、文書データの有する文字位置の斉一性をより正確に反映した文字位置特徴量を生成することも可能となるのである。

また、個々の文字毎に「文字位置特徴量」を算出することも可能ではあるが、漢字を含む場合は文字の種類が膨大となり、実際には特徴量としてまとめることが困難となってしまう。そこで上述したように、予め設定した文字種別毎に「文字位置特徴量」を算出することも好ましいのである。

さらに、「文字位置特徴量」は、
（ａ）文書データ全体において所定回数以上若しくは所定頻度以上で出現する文字種別である「頻出文字」を特定した上で、又は
（ｂ）出現頻度が高い文字種別として予め「頻出文字」を設定した上で、
当該「頻出文字」を含む文字種別毎に、又は当該「頻出文字」についてだけ算出されてもよい。これにより、出現頻度の低い文字についてはその特徴をとらない又は別に分けることによって、文字位置特徴量の統計量としての信頼性を担保することも可能となる。

＜文字変動特徴量＞
図１の機能ブロック図に戻って、文字変動特徴量生成部１１１ｄは、文書データ内に複数の文書領域が予め設定されている状況において、
（ア）文書領域毎に生成された、又は２つ以上の所定の文書領域について生成された「文字形状特徴量」における、互いに異なる文書領域に係る当該「文字形状特徴量」の間の変動分に係る量、
（イ）文書領域毎に生成された、又は２つ以上の所定の文書領域について生成された「文字サイズ特徴量」における、互いに異なる文書領域に係る当該「文字サイズ特徴量」の間の変動分に係る量、及び
（ウ）文書領域毎に生成された、又は２つ以上の所定の文書領域について生成された「文字位置特徴量」における、互いに異なる文書領域に係る当該「文字位置特徴量」の間の変動分に係る量
のうちの少なくとも１つを含む量を、「文字変動特徴量」として生成する。

例えば、第１の文書領域について生成された「第１の文字形状特徴量」、「第１の文字サイズ特徴量」及び「第１の文字位置特徴量」と、第２の文書領域について生成された「第２の文字形状特徴量」、「第２の文字サイズ特徴量」及び「第２の文字位置特徴量」とから、
（ア’）「形状変動特徴量」＝「第２の文字形状特徴量」－「第１の文字形状特徴量」、
（イ’）「サイズ変動特徴量」＝「第２の文字サイズ特徴量」－「第１の文字サイズ特徴量」、及び
（ウ’）「位置変動特徴量」＝「第２の文字位置特徴量」－「第１の文字位置特徴量」
のうちの少なくとも１つを算出し、算出した当該「少なくとも１つ」を「文字変動特徴量」とすることができる。なお、この例では変動量として差をとっているが、勿論それに限定されず、例えば比（例えば「第２の文字形状特徴量」／「第１の文字形状特徴量」）をとることも可能である。

ここで、予め設定される「文書領域」としては、
（ａ）文書データを複数の区域（例えば３等分した結果である３つの区域）に分割した場合の当該区域、
（ｂ）文書データにおいて所定の窓枠（ウィンドウ）をスライドさせつつ規定した、連続しており互いに重畳部分を有する枠内区域、又は
（ｃ）文書データにおいて予め目的別に設定された区域（例えば序章区域、本章区域、及び終章区域）
を採用することができる。

このように、「文字変動特徴量」を文字特徴量に採用することによって、作成主体（例えば児童）の認知能力や非認知能力が、文書中における文字形状、文字サイズや文字位置の変動に対して与える影響も確実に取り込んだ特徴量を生成することも可能となるのである。

＜コンテキストに係る文字変動特徴量＞
また、文字変動特徴量生成部１１１ｄは、以上に説明したような文書領域に係る「文字変動特徴量」の一態様として特に、文書の（前後関係、文脈や、背景等としての）コンテキストによる文字形状、文字サイズや文字位置の変動を反映した「文字変動特徴量」を算出することも好ましい。

ここでこの場合、コンテキスト特定部１１３は、このようなコンテキストに係る「文字変動特徴量」を算出する際に用いる文書領域（以後、コンテキスト領域とも称する）を決定する。このコンテキスト特定部１１３で決定されるコンテキスト領域は、例えば、
（ａ）自身に含まれる文字量における文書データ全体に対する割合が33％となる序盤領域、この序盤領域に続いて当該割合が34％となる中盤領域、及び当該割合が残りの33%となる終盤領域、といったように、自身の有する文字量の全文字量に対する割合をもって規定される複数の文書領域、又は
（ｂ）文書データ中のタイトル記載部、氏名記載部、及び本文記載部、といったように、目的別に予め設定される複数の文書領域
とすることができる。

次いで、文字変動特徴量生成部１１１ｄは、
（ａ）コンテキスト特定部１１３で決定されたコンテキスト領域毎に生成された、又は２つ以上の所定のコンテキスト領域について生成された「文字形状特徴量」における、互いに異なるコンテキスト領域に係る当該「文字形状特徴量」の間の変動分に係る量、
（ｂ）コンテキスト特定部１１３で決定されたコンテキスト領域毎に生成された、又は２つ以上の所定のコンテキスト領域について生成された「文字サイズ特徴量」における、互いに異なるコンテキスト領域に係る当該「文字サイズ特徴量」の間の変動分に係る量、及び
（ｃ）コンテキスト特定部１１３で決定されたコンテキスト領域毎に生成された、又は２つ以上の所定のコンテキスト領域について生成された「文字位置特徴量」における、互いに異なるコンテキスト領域に係る当該「文字位置特徴量」の間の変動分に係る量、
のうちの少なくとも１つを含む量を、「文字変動特徴量」として生成する。

このように、コンテキスト領域を考慮した「文字変動特徴量」を生成することにより、作成主体（例えば児童）の作成した文書における文字が、当該作成主体の有する認知能力や非認知能力に応じ、当該文書のコンテキストによって変化する現象を確実に捉え、認知・非認知能力推定に活かすことが可能となる。

例えば、一人の児童が作成した文書において、その前半では文字サイズや文字位置の斉一性が保持たれているものの、後半になるにしたがい、そのような斉一性が失われていくといったことは少なからず発生し得る。こうした文書のコンテキストによる文字の態様の変化にも、作成主体の認知・非認知能力が反映されている可能性があり、その変化を「文字変動特徴量」として確実に捉えることが、認知・非認知能力推定の精度向上に貢献するのである。

＜文書領域特徴量＞
同じく図１の機能ブロック図において、文書領域特徴量生成部１１１ｅは、この後、認知・非認知能力推定の説明変数として使用される「文書領域特徴量」を生成する。具体的には上述したように、文書領域毎に又は１つ若しくは複数の文書領域について「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」、及び／又は「文字変動特徴量」が生成された場合に、生成されたこのような特徴量に合わせ、当該特徴量に係る文書領域を指定する量（例えば予め設定された文書領域ＩＤ）を「文書領域特徴量」としてもよい。ちなみに、この「文書領域特徴量」の具体的な取扱いについては後に、図３を用いて詳細に説明する。

＜文字種別特徴量＞
また、文字種別特徴量生成部１１１ｆは、この後、認知・非認知能力推定の説明変数として使用される「文字種別特徴量」を生成する。具体的には上述したように、文字種別毎に又は１つ若しくは複数の文字種別について「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」、及び／又は「文字変動特徴量」が生成された場合に、生成されたこのような特徴量に合わせ、当該特徴量に係る文字種別を指定する量（例えば予め設定された文字種別ＩＤ）を「文字種別特徴量」としてもよい。

＜作成主体属性特徴量＞
さらに、作成主体属性特徴量生成部１１１ｇは、この後、認知・非認知能力推定の説明変数として使用される「作成主体属性特徴量」を生成する。具体的には、生成された「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」、及び／又は「文字変動特徴量」に係る文書データの作成主体（例えば児童）の属性情報（例えば、性別、体格情報、年齢、学習進捗情報等）を、属性情報保存部１０３から取得し、当該属性情報を「作成主体属性特徴量」とすることができる。

また、この生成された「作成主体属性特徴量」は、対応する作成主体（例えば児童）の文書データについて生成された「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」、及び／又は「文字変動特徴量」と合せて、この後、認知・非認知能力推定の説明変数として使用されるのである。

なお、このような「作成主体属性特徴量」を取り扱うことによって、認知・非認知能力推定の際、作成主体（例えば児童）の属性がノイズとなってしまう事態を回避することも可能となる。例えば通常、文字の形状、サイズ及び位置に係る特徴には、作成主体（例えば児童）の属性（性、体格、年齢、学習進捗状況等）も強く反映されると考えられるが、このような属性も考慮した能力推定モデルを構築することによって、認知能力や非認知能力をより精度良く推定することも可能となるのである。

同じく図１の機能ブロック図において、モデル構築部１１４は、文書の作成主体（例えば児童）の認知能力及び／又は非認知能力を推定するための能力推定モデルを構築する。ここで、学習データとして、
（ａ）以上に説明した「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」及び「文字変動特徴量」のうちの少なくとも１つと、
（ｂ）上記（ａ）の「少なくとも１つ」に係る文書データの作成主体（例えば児童）についての認知能力及び／又は非認知能力の正解データと
の組（データセット）を多数準備し、当該学習データを用いて学習処理を行うことにより、上記の能力推定モデルを構築してもよい。

また、他の実施形態の学習データとして、上記（ａ）及び（ｂ）と、さらに、
（ｃ）上記（ａ）の「少なくとも１つ」に係る「文書領域特徴量」、「文字種別特徴量」及び「作成主体属性特徴量」のうちの少なくとも１つと
の組（データセット）を多数準備し、当該学習データを用いて学習処理を行うことにより、上記の能力推定モデルを構築することも好ましい。

ちなみに、上記（ｂ）の正解データについては、例えば、当該作成主体（例えば児童）に対し、知能指数（ＩＱ）測定用の質問紙調査、ＧＲＩＴ測定用の質問紙調査、及び／又はＥＱ測定用の質問紙調査を実施し、この調査結果であるＩＱ値、ＧＲＩＴ値、及び／又はＥＱ値を、当該作成主体（例えば児童）についての正解データとすることができる。

また、能力推定モデルを構築するのに使用される統計・機械学習アルゴリズムは特に限定されず、例えばロジットモデル、ロジスティック回帰、ランダムフォレスト（Random Forest）、XGboost、LightGBM、ニューラルネットワーク（Neural Network）等の公知のアルゴリズムが採用可能である。

同じく図１の機能ブロック図において、能力決定部１１５は、能力推定対象である作成主体（例えば児童）の文書データについて生成された、
（ａ）「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」及び「文字変動特徴量」のうちの少なくとも１つと、
（ｂ）（これらが能力推定モデルの説明変数として採用されている場合ではあるが、）上記（ａ）の「少なくとも１つ」に係る「文書領域特徴量」、「文字種別特徴量」及び「作成主体属性特徴量」のうちの少なくとも１つと
を、構築済みの能力推定モデルへ入力し、当該能力推定モデルの出力を取得して、当該出力を、認知能力及び／又は非認知能力についての能力推定結果とする。

ここで、この能力推定結果は具体的に例えば、ＩＱ値そのものや、当該ＩＱ値に対応するスコア若しくはＩＱレベル値（例えば高，中，低レベルを示す値）、ＧＲＩＴ値（「一貫性」値や「根気」値）そのものや、当該ＧＲＩＴ値に対応するスコア若しくはＧＲＩＴレベル値、及び／又は、ＥＱ値そのものや、当該ＥＱ値に対応するスコア若しくはＥＱレベル値とすることができる。また、このようなスコアが（１つ又は複数の）所定閾値以上であるか否かの判定結果であってもよい。

また、好適な他の実施形態として、モデル構築部１１４は、作成主体（例えば児童）の所定の属性毎に（例えば男子児童及び女子児童についてそれぞれ個別に）、当該属性を有する作成主体の文書データ専用の能力推定モデルを構築し、能力決定部１１５は、能力推定対象の作成主体（例えば児童）の属性に応じ、これらの構築された能力推定モデルの中から、当該属性専用のものを選択して能力推定処理に使用してもよい。例えば、男子児童向けに構築された能力推定モデルと、女子児童向けに構築された能力推定モデルとを、能力推定対象の児童の性別に応じて使い分ける、といったことも好ましいのである。

なお、これはすでに述べたことではあるが、文字の形状、サイズ及び位置に係る特徴には、作成主体（例えば児童）の属性（例えば性別）が強く反映されることも考えられる。そこで、このような属性別に（例えば男子児童と女子児童とを分けて）能力推定モデルを構築し、能力推定対象の属性に応じ適宜使い分けることによって、認知能力や非認知能力をより精度良く推定することも可能となるのである。

図３は、能力決定部１１５における文書領域特徴量を用いた能力推定処理における２つの実施形態を説明するための模式図である。

最初に、図３（Ａ）に示す実施形態においては、能力推定対象である文書データについて、文書領域（Ａ，Ｂ，Ｃ，・・・）毎に、文字特徴量（fc_A，fc_B，fc_C，・・・）が算出されており、さらに、当該文書領域の文書領域特徴量（fr_A，fr_B，fr_C，・・・）が決定されている。

ここで、能力決定部１１５は、能力推定処理の際、各文書領域（Ａ，Ｂ，Ｃ，・・・）において、
（ａ）当該文書領域で算出された文字特徴量（fc_A，fc_B，fc_C，・・・）と、
（ｂ）当該文書領域の文書領域特徴量（fr_A，fr_B，fr_C，・・・）と
の組を生成し、これらの組の全てを能力推定モデルへ入力し、能力推定結果（図３（Ａ）ではＩＱ値に対応する認知能力スコアや、ＧＲＩＴ値に対応する非認知能力スコア）を取得するのである。ちなみに、ここで使用する能力推定モデルも勿論、これらの組の全てを説明変数とするように構築されている。

能力決定部１１５は、このようなモデル入力処理を実施することによって、文字特徴量の算出された文書領域の情報も適切に織り込まれた能力推定結果を取得することができるのである。

次に、図３（Ｂ）に示す実施形態においては、能力推定対象である文書データについて、
（ａ）文書領域Ｂで算出された文字特徴量と文書領域Ｃで算出された文字特徴量とから算出される文字変動特徴量fd_BC、文書領域Ｂの文書領域特徴量fr_B、及び文書領域Ｃの文書領域特徴量fr_C
が決定されており、さらに、
（ｂ）文書領域Ｂで算出された文字特徴量と文書領域Ｚで算出された文字特徴量とから算出される文字変動特徴量fd_BZ、文書領域Ｂの文書領域特徴量fr_B、及び文書領域Ｚの文書領域特徴量fr_Z
が決定されている。

ここで、能力決定部１１５は、能力推定処理の際、
（ア）上記（ａ）における文字変動特徴量fd_BCと、文書領域特徴量fr_Bと、文書領域特徴量fr_Cとの組、及び
（イ）上記（ｂ）における文字変動特徴量fd_BZと、文書領域特徴量fr_Bと、文書領域特徴量fr_Zとの組
を生成し、これらの組を能力推定モデルへ入力し、能力推定結果（図３（Ｂ）でもＩＱ値に対応する認知能力スコアや、ＧＲＩＴ値に対応する非認知能力スコア）を取得するのである。ちなみに、ここで使用する能力推定モデルも勿論、これらの組を説明変数とするように構築されている。

能力決定部１１５は、このようなモデル入力処理を実施することによって、文字変動特徴量の算出された文書領域の情報も適切に織り込まれた能力推定結果を取得することができるのである。

図１の機能ブロック図に戻って、能力決定部１１５で決定された能力推定結果（例えば各児童について推定されたＩＱ値、ＧＲＩＴ値や、ＥＱ値）は、例えば能力情報保存部１０４で保存・管理された上、適宜又はキーボード１０５を介したユーザの指示に従い、入出力制御部１２２を介してディスプレイ１０６に表示されてもよい。さらには、通信制御部１２１及び通信インタフェース部１０１を介し、外部の情報処理装置、例えば小学校の所有する児童情報管理サーバへ送信され、そこで様々な用途、例えば学習指導方針の決定に利用されることも好ましい。

以上、詳細に説明したように、本発明によれば、文書における文字に係る特徴を示す文字特徴量から、その作成主体の認知能力及び／又は非認知能力を推定することができる。また、従来手法である質問紙調査等と比較して、準備や本処理の手間を大幅に削減し、より短時間で認知能力及び／又は非認知能力を推定することも可能となる。さらに、従来の質問紙調査等の手法では、主に被験者側の事情により、測定結果に対する高い信頼性を確保するのが困難であったところ、本発明によれば、その能力推定結果について、より高い信頼性を見込むことが可能となる。

また本発明は、特に教育現場において、児童や生徒に対し学習指導を行うにあたり、指導内容を決定する際の重要な判断材料となる児童や生徒の認知・非認知能力を、より短時間で且つより確実に把握することを可能にする。またひいては、児童や生徒に対し、持続的な且つ好ましい方向への行動変容を促すことにも貢献し得るのである。

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。

１能力推定装置
１０１通信インタフェース部
１０２文書保存部
１０３属性情報保存部
１０４能力情報保存部
１０５キーボード（ＫＢ）
１０６ディスプレイ（ＤＰ）
１１１特徴量生成部
１１１ａ文字形状特徴量生成部
１１１ｂ文字サイズ特徴量生成部
１１１ｃ文字位置特徴量生成部
１１１ｄ文字変動特徴量生成部
１１１ｅ文書領域特徴量生成部
１１１ｆ文字種別特徴量生成部
１１１ｇ作成主体属性特徴量生成部
１１１ｚ文字検出部
１１２文字種別特定部
１１３コンテキスト特定部
１１４モデル構築部
１１５能力決定部
１２１通信制御部
１２２入出力制御部
２文書データベース（ＤＢ）
３属性情報ＤＢ

Claims

作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定可能なコンピュータを機能させる能力推定プログラムであって、
当該文書の文字における形状、サイズ及び位置のうちの少なくとも１つに係る量、及び／又は当該量の変動分に係る量である文字特徴量を、認知能力及び／又は非認知能力に係る値を出力可能な構築済みのモデルに入力し、当該モデルからの出力に基づいて、当該文書の作成主体の認知能力及び／又は非認知能力に係る情報を決定する能力決定手段
としてコンピュータを機能させることを特徴とする能力推定プログラム。
前記能力推定プログラムは、当該文書内の複数の文書領域における文書領域毎に又は１つ若しくは複数の文書領域について、当該文書領域内の文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
前記能力決定手段は、当該文書領域について生成された当該文字特徴量と、該文字特徴量に係る文書領域に係る情報とを、構築済みの当該モデルに入力する
ことを特徴とする請求項１に記載の能力推定プログラム。
前記能力推定プログラムは、当該文書内の複数の文書領域における文書領域毎に又は２つ以上の文書領域につき、当該文書領域内の文字における形状、サイズ及び位置のうちの少なくとも１つに係る量を生成して、互いに異なる文書領域について生成した当該量の間の変動分に係る量である当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
前記能力決定手段は、少なくとも当該変動分に係る量である文字特徴量と、該文字特徴量に係る文書領域に係る情報とを、構築済みの当該モデルに入力する
ことを特徴とする請求項１又は２に記載の能力推定プログラム。
当該文書領域は、当該文書を複数の区域に分割した場合の当該区域、当該文書において所定の窓枠をスライドさせつつ規定した枠内区域、又は当該文書において予め目的別に設定された区域であることを特徴とする請求項２又は３に記載の能力推定プログラム。
予め設定された複数の文字種別における文字種別毎に又は１つ若しくは複数の文字種別について、当該文字種別に属する文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
前記能力決定手段は、当該文字種別について生成された当該文字特徴量と、該文字特徴量に係る文字種別に係る情報とを、構築済みの当該モデルに入力する
ことを特徴とする請求項１から４のいずれか１項に記載の能力推定プログラム。
当該文字種別は、文字を取り囲んで包含する領域である文字領域における高さと幅との比に基づき予め分類されたものであることを特徴とする請求項５に記載の能力推定プログラム。
当該文書の文字のうち、出現頻度が所定以上である文字、又は出現頻度が高いものとして設定された文字種別に属する文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させることを特徴とする請求項１から６のいずれか１項に記載の能力推定プログラム。
当該文字特徴量は、当該文書の文字における、当該文書全体の中での位置に係る量、当該文書内の所定の範囲若しくは基準に対する位置に係る量、及び他の文字に対する位置に係る量のうちの少なくとも１つ、及び／又はこれらの量の変動分に係る量のうちの少なくとも１つを含むことを特徴とする請求項１から７のいずれか１項に記載の能力推定プログラム。
前記能力決定手段は、当該文書の作成主体について取得された属性情報も、構築済みの当該モデルに入力することを特徴とする請求項１から８のいずれか１項に記載の能力推定プログラム。
作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定する能力推定装置であって、
当該文書の文字における形状、サイズ及び位置のうちの少なくとも１つに係る量、及び／又は当該量の変動分に係る量である文字特徴量を、認知能力及び／又は非認知能力に係る値を出力可能な構築済みのモデルに入力し、当該モデルからの出力に基づいて、当該文書の作成主体の認知能力及び／又は非認知能力に係る情報を決定する能力決定手段
を有することを特徴とする能力推定装置。
作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定可能なコンピュータにおける能力推定方法であって、
当該文書の文字における形状、サイズ及び位置のうちの少なくとも１つに係る量、及び／又は当該量の変動分に係る量である文字特徴量を入力とし、認知能力及び／又は非認知能力に係る値を出力可能なモデルを構築するステップと、
能力推定対象である作成主体が作成した文書における当該文字特徴量を、構築済みの当該モデルに入力し、当該モデルからの出力に基づいて、当該作成主体の認知能力及び／又は非認知能力に係る情報を決定するステップと
を有することを特徴とする能力推定方法。