JP7177105B2 - 文書から認知・非認知能力を推定する能力推定プログラム、装置及び方法 - Google Patents

文書から認知・非認知能力を推定する能力推定プログラム、装置及び方法 Download PDF

Info

Publication number
JP7177105B2
JP7177105B2 JP2020013360A JP2020013360A JP7177105B2 JP 7177105 B2 JP7177105 B2 JP 7177105B2 JP 2020013360 A JP2020013360 A JP 2020013360A JP 2020013360 A JP2020013360 A JP 2020013360A JP 7177105 B2 JP7177105 B2 JP 7177105B2
Authority
JP
Japan
Prior art keywords
character
document
ability
feature amount
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020013360A
Other languages
English (en)
Other versions
JP2021119374A (ja
Inventor
雄一 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2020013360A priority Critical patent/JP7177105B2/ja
Publication of JP2021119374A publication Critical patent/JP2021119374A/ja
Application granted granted Critical
Publication of JP7177105B2 publication Critical patent/JP7177105B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、文書から文書作成者に係る情報を推定する技術に関する。
教育現場においては、児童や生徒に対し、その能力に応じたきめ細かな指導を可能にするべく、児童や生徒の能力を定常的且つ定量的に把握することが重要となっている。
ここで近年、特に児童の能力を、認知能力と非認知能力の2つに分けて捉えることが一般的になりつつある。このうち認知能力は、「文字が読める」「うまくブロックを積み上げられる」「三角形と四角形と五角形を区別できる」といったような認知に関する能力を指し、例えば知能指数(IQ)がその指標としての代表例である。
一方、非認知能力は、勉強等の物事への取り組みがうまくいかないときに諦めることなく、「どうしてかな」「こうやってみよう」「これがだめなら、ああやってみよう」等、目標が達成するまで努力したり、我慢したりする能力、さらに感情をコントロールする能力を指す。この非認知能力の尺度としては、「根気」と「一貫性」で構成される「やりぬく力」の指標であるGRITが代表的である。
このように学習指導を行うにあたり重要な情報となり得る認知能力と非認知能力であるが、そのいずれを求めるにしても従来、質問紙や専用のアプリケーション等を利用した、定量的な能力測定が一般的に行われてきた。例えば、認知能力としての知能指数を測定するべく、種々の検査用紙が用意されており、さらに、非認知能力としてのGRITを測定するための例えば12問で構成される標準的な質問紙も、広く利用可能となっている。
しかしながら、このような従来の能力測定手法は、測定自体や、さらには測定の準備(例えば教師による測定内容の説明や回答方法の指導等)のために相当の時間を要するので、頻繁な測定が困難となっている。また、児童によっては質問紙の質問内容が十分に理解できなかったり、(特に非認知能力測定では)大人からの評価を気にして本来の自分とは異なるあるべき姿を思い描いて回答したりすることも想定され、能力測定結果の信頼性を確保することが難しいという課題を抱えている。
このような従来手法の課題を解決するべく、例えば非特許文献1には、個人が作成した文章から当該個人の性格を推定する技術が開示されている。この技術では特に、ソーシャルメディアへの書き込み内容には、人が無意識に認知してそこから取捨選択した情報が多く含まれているとして、そのテキストから筆者の性格を推定している。
また、特許文献1には、デジタルペンで入力された手書き文字から性格を推定する技術が開示されている。この技術では、手書きの文字や絵の時空間情報を定量化して特徴量を抽出することによって、書き手の精神・心理・生理状態を判定している。さらに、特許文献2には、電子ペンと情報端末とサーバを備えており、短時間で詳細な性格分析を行うことのできる性格分析システムが開示されている。
このように、これらの先行文献では、質問紙等を用いることなく、デジタルペン等で入力されたものを含めた手書き文字や文章から、性格を分析・推定する手法が提案されているのである。この点教育現場でも、児童の手書きによるテスト答案や作文等は、日常的に且つ頻繁に作成されるのであり、また、このような児童による作成文書は、作成者である児童の能力を反映した情報を含むと考えられる。したがって、このような作成文書から児童の能力を推定することができれば、上述したような従来の課題が十分に解決可能となるのである。
特開2010-131280号公報 特開2007-79891号公報
上條浩一, 那須川哲哉, 「人の気づきに迫る -認知科学,心理学からのアプローチ-:6.パーソナリティという見地からの認知 -テキストの筆者の性格推定の取組みを通じて-」, 情報処理, vol.58, No.4, pp.305-309, 2017年
しかしながら、非特許文献1や特許文献1及び2に記載されたような従来技術は、上述したように今後益々重要視される認知能力や非認知能力を推定対象としておらず、また認知能力や非認知能力そのものを推定するようには設計されていない。
特に、非特許文献1に記載された技術では、単語の意味情報のみが推定に用いられており、例えば文字の大きさや位置、色や濃淡といった文字属性情報は、推定に使用されていない。ここで、このような単語の意味情報は、推定対象者における言語の学習状況等にも依存し、単なる学習量とは別の指標である認知能力や非認知能力の推定に対し、好適であるとは言えないと考えられる。
さらに、特許文献1及び2に記載された技術においても、文字の大きさについて言及してはいるが、文字の位置、色や濃淡といった文字属性情報はやはり、推定に使用されていない。また特に、これらの技術ではあくまで手書き文字を対象としており、近年、教育現場でも増加しているワープロソフトウェアやプレゼンテーション資料作成ソフトウェア等によって作成された文書には対応することができない。例えば太字や斜体、下線付き、網掛け等の文字効果に関する情報や、明朝体、ゴシック体等のフォントタイプといったような文字形状に関する情報は考慮の対象外となっている。
そこで、本発明は、文書における文字に係る特徴から、その作成主体の認知能力及び/又は非認知能力を推定可能な能力推定プログラム、装置及び方法を提供することを目的とする。
本発明によれば、作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定可能なコンピュータを機能させる能力推定プログラムであって、
当該文書の文字における形状、サイズ及び位置のうちの少なくとも1つに係る量、及び/又は当該量の変動分に係る量である文字特徴量を、認知能力及び/又は非認知能力に係る値を出力可能な構築済みのモデルに入力し、当該モデルからの出力に基づいて、当該文書の作成主体の認知能力及び/又は非認知能力に係る情報を決定する能力決定手段
としてコンピュータを機能させる能力推定プログラムが提供される。
この本発明による能力推定プログラムの一実施形態として、本能力推定プログラムは、当該文書内の複数の文書領域における文書領域毎に又は1つ若しくは複数の文書領域について、当該文書領域内の文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
能力決定手段は、当該文書領域について生成された当該文字特徴量と、この文字特徴量に係る文書領域に係る情報とを、構築済みの当該モデルに入力することも好ましい。
また、本発明による能力推定プログラムの他の実施形態として、本能力推定プログラムは、当該文書内の複数の文書領域における文書領域毎に又は2つ以上の文書領域につき、当該文書領域内の文字における形状、サイズ及び位置のうちの少なくとも1つに係る量を生成して、互いに異なる文書領域について生成した当該量の間の変動分に係る量である当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
能力決定手段は、少なくとも当該変動分に係る量である文字特徴量と、この文字特徴量に係る文書領域に係る情報とを、構築済みの当該モデルに入力することも好ましい。
また、上述したいずれの実施形態についても、当該文書領域は、(a)当該文書を複数の区域に分割した場合の当該区域、(b)当該文書において所定の窓枠をスライドさせつつ規定した枠内区域、又は(c)当該文書において予め目的別に設定された区域であることも好ましい。
さらに、本発明による能力推定プログラムの更なる他の実施形態として、本能力推定プログラムは、予め設定された複数の文字種別における文字種別毎に又は1つ若しくは複数の文字種別について、当該文字種別に属する文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
能力決定手段は、当該文字種別について生成された当該文字特徴量と、この文字特徴量に係る文字種別に係る情報とを、構築済みの当該モデルに入力することも好ましい。
また、上記の文字種別に係る実施形態において、当該文字種別は、文字を取り囲んで包含する領域である文字領域における高さと幅との比に基づき予め分類されたものであることも好ましい。
さらに、本発明による能力推定プログラムの更なる他の実施形態として、本能力推定プログラムは、当該文書の文字のうち、出現頻度が所定以上である文字、又は出現頻度が高いものとして設定された文字種別に属する文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させることも好ましい。
また、本発明による能力推定プログラムにおいて取り扱われる当該文字特徴量は、当該文書の文字における、(a)当該文書全体の中での位置に係る量、(b)当該文書内の所定の範囲若しくは基準に対する位置に係る量、及び(c)他の文字に対する位置に係る量のうちの少なくとも1つ、及び/又は(d)これらの量の変動分に係る量のうちの少なくとも1つを含むことも好ましい。
さらに、本発明による能力推定プログラムの更なる他の実施形態として、能力決定手段は、当該文書の作成主体について取得された属性情報も、構築済みの当該モデルに入力することも好ましい。
本発明によれば、また、作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定する能力推定装置であって、
当該文書の文字における形状、サイズ及び位置のうちの少なくとも1つに係る量、及び/又は当該量の変動分に係る量である文字特徴量を、認知能力及び/又は非認知能力に係る値を出力可能な構築済みのモデルに入力し、当該モデルからの出力に基づいて、当該文書の作成主体の認知能力及び/又は非認知能力に係る情報を決定する能力決定手段
を有する能力推定装置が提供される。
本発明によれば、さらに、作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定可能なコンピュータにおける能力推定方法であって、
当該文書の文字における形状、サイズ及び位置のうちの少なくとも1つに係る量、及び/又は当該量の変動分に係る量である文字特徴量を入力とし、認知能力及び/又は非認知能力に係る値を出力可能なモデルを構築するステップと、
能力推定対象である作成主体が作成した文書における当該文字特徴量を、構築済みの当該モデルに入力し、当該モデルからの出力に基づいて、当該作成主体の認知能力及び/又は非認知能力に係る情報を決定するステップと
を有する能力推定方法が提供される。
本発明の能力推定プログラム、装置及び方法によれば、文書における文字に係る特徴から、その作成主体の認知能力及び/又は非認知能力を推定することができる。
本発明による能力推定装置の一実施形態における機能構成を示す機能ブロック図である。 本発明の一実施形態に係る文字位置特徴量を説明するための模式図である。 本発明に係る能力決定部における文書領域特徴量を用いた能力推定処理における2つの実施形態を説明するための模式図である。
以下、本発明の実施形態について、図面を用いて詳細に説明する。
[能力推定装置]
図1は、本発明による能力推定装置の一実施形態における機能構成を示す機能ブロック図である。
図1に示した本実施形態の能力推定装置1は、(例えば小学校において児童によって作成された提出物であるテスト答案や作文等の)文書に係る文書データを保存・管理している文書データベース(DB)2から、例えば通信によって取得された文書データを用い、当該文書の作成主体(例えば児童)における認知能力及び/又は非認知能力を推定する装置である。
ここで、認知能力は、「文字が読める」「うまくブロックを積み上げられる」「三角形と四角形と五角形を区別できる」といったような認知に関する能力を指し、例えば知能指数(IQ)がその指標の代表例として挙げられる。
一方、非認知能力は、勉強等の物事への取り組みがうまくいかないときに諦めることなく、「どうしてかな」「こうやってみよう」「これがだめなら、ああやってみよう」等、目標が達成するまで努力したり、我慢したりする能力、さらに感情をコントロールする能力を指す。この非認知能力の尺度としては、「根気」と「一貫性」で構成される「やりぬく力」の指標であるGRITが代表的である。また、「心の知能指数」であるEQ(Emotional Intelligence Quotient)も、非認知能力の尺度として周知となっている。
このような認知能力や非認知能力は、例えば教育現場、特に小学校において、児童に対する教育・指導に役立つ重要な情報として認識されている。
また、能力推定装置1は、
(ア)作成主体(例えば児童)が手書きで作成した文書(に係る文書データ)から、又は
(イ)作成主体(例えば児童)が、ワープロソフトウェアやプレゼンテーション資料作成ソフトウェア等を搭載した又は利用可能な機器を介し、文字を選択、調整又は決定して作成した文書(の文書データ)から、
当該作成主体(例えば児童)の認知能力及び/又は非認知能力を推定可能となっており、具体的にその特徴として、
(A)上記の文書の文字における(a)形状、サイズ及び位置のうちの少なくとも1つに係る量、及び/又は、(b)当該量の変動分に係る量である「文字特徴量」を、認知能力及び/又は非認知能力に係る値を出力可能な構築済みの「モデル」に入力し、この「モデル」からの出力に基づいて、当該文書の作成主体(例えば児童)の認知能力及び/又は非認知能力に係る情報を決定する能力決定部115
を有している。
ここで、上記(A)の「文字特徴量」は本実施形態において、能力推定装置1の特徴量生成部111によって生成される量であり、後に詳細に説明するが、本発明における種々の実施形態における特徴量として様々な態様をとることができる量となっている。
このように、能力推定装置1によれば、文書における文字に係る特徴を示す「文字特徴量」から、その作成主体(例えば児童)の認知能力及び/又は非認知能力を推定することができる。さらに、従来手法である質問紙調査等と比較して、準備や本処理の手間を大幅に削減し、より短時間で認知能力及び/又は非認知能力を推定することも可能となるのである。
またさらに、従来の質問紙調査等の手法では、被験者(例えば児童)が質問内容を十分に理解できなかったり、本来の自分とは異なるあるべき姿を思い描いて回答したりすることも想定され、測定結果に対する高い信頼性を確保するのが困難であった。これに対し能力推定装置1においては、「文字特徴量」は通常、作成主体(例えば児童)によって意識的に制御・調整されることのない量となっているので、その能力推定結果について、より高い信頼性が見込まれるのである。
なお、本発明に係る作成主体によって作成された文書は当然、児童による提出物に限定されるものではない。例えば、生徒、学生、受験者、被験者や、社員、グループ構成員、さらには所定調査の対象者や希望者等、上記(ア)や上記(イ)の文書を作成した者であって、認知能力や非認知能力の推定対象となり得る者であれば、種々様々な者が本発明に係る作成主体に該当し得るのである。
また、能力推定装置1は、図1に示したように本実施形態において、文書データ及び属性情報を外部から通信によって取得する装置となっているが、勿論、これらのデータ・情報を通信以外の方法で取得する、例えばスタンドアローンの装置であってもよい。
さらに、能力推定装置1は、図1に示したように本実施形態において、上記(A)の能力決定部115以外の機能構成部である特徴量生成部111、文字種別特定部112、コンテキスト特定部113及びモデル構築部114をも備えた装置となっているが、これらの少なくとも1つが外部の装置に含まれるような装置形態をとることも可能である。例えば、複数のサーバの全体によって、図1に示したような能力推定装置1の機能を実現することもできるのである。
[装置機能構成、能力推定プログラム及び方法]
同じく図1の機能ブロック図によれば、能力推定装置1は、通信インタフェース部101と、文書保存部102と、属性情報保存部103と、能力情報保存部104と、キーボード(KB)105と、ディスプレイ(DP)106と、プロセッサ・メモリとを有する。
ここで、このプロセッサ・メモリは、本発明による能力推定プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この能力推定プログラムを実行することによって、能力推定処理を実施する。このことから、能力推定装置1は、当該能力推定処理専用の装置であってもよいが、本発明による能力推定プログラムを搭載した、クラウドサーバ、非クラウドサーバ、パーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等とすることもできる。
さらに、プロセッサ・メモリは、文字形状特徴量生成部111a、文字サイズ特徴量生成部111b、文字位置特徴量生成部111c、文字変動特徴量生成部111d、文書領域特徴量生成部111e、文字種別特徴量生成部111f、作成主体属性特徴量生成部111g、及び文字検出部111zを有する特徴量生成部111と、文字種別特定部112と、コンテキスト特定部113と、モデル構築部114と、能力決定部115と、通信制御部121と、入出力制御部122とを有する。
なおここで、特徴量生成部111は、文字形状特徴量生成部111a、文字サイズ特徴量生成部111b及び文字位置特徴量生成部111cのうちの少なくとも1つを備えたものであってもよい。ただし、上述したような種々の特徴量生成部を有することによって、より高い推定精度の実現に貢献するような特徴量を構成可能になるのである。
また、以上に述べた機能構成部は、プロセッサ・メモリに保存された能力推定プログラムの機能と捉えることができる。また、図1における能力推定装置1の機能構成部間を矢印で接続して示した処理の流れは、本発明による能力推定方法の一実施形態としても理解される。
同じく図1の機能ブロック図において、文書保存部102は、文書DB2から通信インタフェース部101及び通信制御部121を介して、
(ア)「手書き文書データ」:作成主体(例えば児童)が手書きで作成した文書の文書データ(例えば当該文書をスキャン若しくは撮影して生成した文書電子データや、手書き用デバイスを用いて入力パネルを介し入力された文書データ)、又は/及び
(イ)「非手書き文書データ」:作成主体(児童)が、ワープロソフトウェアやプレゼンテーション資料作成ソフトウェア等を搭載した又は利用可能な機器を介し、文字を選択、調整又は決定して作成した文書の文書データ(文書電子データ)
を取得し、当該「(手書き及び/又は非手書き」文書データ」を作成主体(児童)の対象IDに紐づけて保存・管理する。
ここで、上記(イ)における文字の「選択、調整又は決定」は本実施形態において、文字形状(例えばフォントタイプ等)、文字サイズ(例えばフォントサイズ等)、及び文字位置(例えばページ(用紙)内の文字座標)のうちの少なくとも1つについての作成主体自身による選択、調整又は決定を意味するものとすることができる。
また、属性情報保存部103は、属性情報DB3から通信インタフェース部101及び通信制御部121を介して、作成主体(児童)の属性情報、例えば、性別、体格情報(身長、体重、座高等)、年齢、学習進捗情報(例えば、所属学年や、習熟度別のクラス分けを実施している場合の所属クラス等)等のうちの少なくとも1つを取得し、当該属性情報を作成主体(児童)の対象IDに紐づけて保存・管理する。
ここで、上記の属性情報は、後に詳細に説明するが1つの好適な実施形態として、作成主体属性特徴量生成部111gが作成主体属性特徴量を生成するのに使用される。また、当該属性情報としては、認知能力及び/又は非認知能力の推定の際、文字特徴量とともに説明変数となり得るようなものならば、上記以外にも様々なものが採用可能となっている。
なお、文書DB2及び属性情報DB3は、例えば小学校が管理する同一のサーバに格納又は接続され、共通の対象ID(例えば児童のID)で管理されているものであることも好ましい。
同じく図1の機能ブロック図において、特徴量生成部111の文字検出部111zは、文書保存部102から取り出した、その作成主体の能力を推定すべき文書データから、当該文書データに含まれる各文字の文字データ(以後、文字と略称する場合もあり)を検出し、当該文字の文字情報を決定する。
ここで、上記(ア)の「手書き文書データ」(又はそれに係る文書)の場合、文字検出部111zは、公知の文字認識技術、例えばOCR(Optical Character Recognition)やディープラーニング文字認識等を用いて文字を検出し、さらに、検出した文字における形状、サイズ及び位置のうちの少なくとも1つに係る文字情報、すなわち、文字形状情報、文字サイズ情報、及び/又は文字位置情報を決定してもよい。
例えば文字検出部111zは、各文字に外接する文字矩形領域を検出し、各文字矩形領域における
(a)縦横比(縦長(高さ)と横幅との比の値)、
(b)面積、縦長(高さ)、横幅、及び対角線長等のうちの少なくとも1つ、及び
(c)ページ(用紙)内の位置座標
をそれぞれ、各文字についての文字形状情報、文字サイズ情報、及び文字位置情報とすることができる。ここで、文字サイズ情報は、ピクセルやセンチメートル等の単位で示された絶対的なサイズに係る情報としてもよく、または、用紙のサイズや、用紙から余白領域を除いた文字記入可能範囲のサイズとの比で示される相対的なサイズに係る情報であってもよい。
また、上記(c)のページ(用紙)内の位置座標としては、例えば後に参照する図2にも示したように、ページ(用紙)上の基準点を原点とした(水平方向軸及び垂直方向軸を有する)2次元位置座標系を設定した場合における、文字矩形領域の代表位置(例えば当該領域の中心や四隅のいずれか)の位置座標値を採用することができる。ここで、上記の基準点は、ページ(用紙)や文字記入可能範囲における中心や四隅のいずれかとしてもよい。
一方、上記(イ)の「非手書き文書データ」の場合、文字検出部111zは、当該文書データ内に含まれる各文字の「文字属性情報」を取り出し又は抽出し、当該文字属性情報を、文字形状情報、文字サイズ情報、及び文字位置情報のうちの少なくとも1つとすることができる。または、当該文字属性情報に基づいて、上述した「手書き文書データ」の場合と同様の文字形状情報、文字サイズ情報、及び文字位置情報のうちの少なくとも1つを生成してもよい。またさらに、文字検出部111zは、これらの生成した情報から、各文字の文字矩形領域を決定してもよい。
ここで、上記の「文字属性情報」は、当該文字において指定されている、
(a)文字形状(例えば明朝体、ゴシック体等のフォントタイプや、(太字、下線付き、斜体、影付き等の)文字飾り情報等。さらに本実施形態では文字色等もここに含む)
(b)文字サイズ(例えばフォントサイズ等)、及び
(c)文字位置(例えばページ内の位置座標)
のうちの少なくとも1つに係る情報となっている。
<文字形状特徴量>
同じく図1の機能ブロック図において、特徴量生成部111の文字形状特徴量生成部111aは、文字検出部111zから、モデル構築用の又は能力推定対象としての文書データを構成する文字についての文字形状情報を受け取り、当該文字形状情報に基づき、当該文書データの「文字形状特徴量」を生成する。
ここで、この「文字形状特徴量」として、受け取った文字形状情報が手書き文書データに係るものである場合、例えば、当該文字形状情報に含まれる個々の文字の文字矩形領域における縦横比についての(全文字での)統計値、例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも1つ、を採用することができる。
一方、受け取った文字形状情報が非手書き文書データに係るものである場合、「文字形状特徴量」として、例えば、
(a)フォントタイプ統計値:当該文字形状情報(に係る文字属性情報)に含まれる個々の文字において採用されているフォントタイプの(文書データ全体での)種類数、及び、所定の若しくは個々のフォントタイプを採用している文字の数における全文字数に対する割合(比の値)、のうちの少なくとも1つ、
(b)文字飾り情報:当該文字形状情報(に係る文字属性情報)に含まれる個々の文字で使用されている文字飾りの(文書データ全体での)種類数、及び、所定の若しくは個々の文字飾りを使用している文字の数における全文字数に対する割合(比の値)、のうちの少なくとも1つ、
(c)文字色統計値:当該文字形状情報(に係る文字属性情報)に含まれる個々の文字で使用されている文字色の(文書データ全体での)種類数、所定の若しくは個々の文字色を使用している文字の数における全文字数に対する割合(比の値)、及び、複数色が使用されている場合における文字色の統一性を示す値(例えば基準色からの色空間距離の統計値(例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも1つ)、のうちの少なくとも1つ
のうちの少なくとも1つを採用することができる。
なお、上記(b)の文字飾り情報において、文字飾りの種類数をカウントする際、複数種類の文字飾りが同一の文字に使用されている場合、これらの文字飾りの組合せを、1つの別種の文字飾りとして扱ってもよく、または、当該文字において、これら複数種類の文字飾りをそれぞれ個別にカウントしてもよい。
また、上記の文字属性に係る値である(a)フォントタイプ統計値、(b)文字飾り情報、及び(c)文字色統計値はいずれも、他の文字属性種別となる文字属性毎に算出された値の組(セット)としてもよい。例えば、フォントタイプ統計値を、フォントサイズの設定可能値毎に、文字色の種別毎に、及び/又は文字飾りの種別毎に算出し、これら算出された値のセットを、「文字形状特徴量」に採用することができる。
さらに、受け取った文字形状情報が非手書き文書データに係るものである場合、「文字形状特徴量」として、以上に説明した値に加えて又は以上に説明した値に代えて、手書き文書データの場合と同様の「文字矩形領域における縦横比についての統計値」を採用してもよい。
また特に、手書き文書データの場合に好適な態様となるが、「文字形状特徴量」は、予め設定された文字種別毎に算出されてもよい。例えば(この後用いる図2(E)に示したような)文字形状の縦横比が所定以上に高い高縦横比文字(例えば数字の「1」)や、文字形状の縦横比が所定以上に低い低縦横比文字(例えば漢字の「一」や長音「ー」等)は、作成主体(例えば児童)の認知能力や非認知能力にかかわらず必然的に、その形状が他の文字と比べてより偏る傾向にあると考えられる。
そこで、高縦横比文字や低縦横比文字を含めた複数の文字種別を予め設定しておき、これらの文字種別毎に「文字形状特徴量」を算出・決定することによって、作成主体(例えば児童)の認知能力や非認知能力にかかわらず必然的に発生する文字形状の差異が、能力推定結果に与えてしまう影響を抑制することも可能となるのである。
また、個々の文字毎に「文字形状特徴量」を算出することも可能ではあるが、例えば漢字を含む場合は文字の種類が膨大となり、実際には特徴量としてまとめることが困難となってしまう。そこで上述したように、予め設定した文字種別毎に「文字形状特徴量」を算出することも好ましいのである。
さらに、「文字形状特徴量」は、
(a)文書データ全体において所定回数以上若しくは所定頻度以上で出現する文字種別である「頻出文字」を特定した上で、又は
(b)出現頻度が高い文字種別として予め「頻出文字」を設定した上で、
当該「頻出文字」を含む文字種別毎に、又は当該「頻出文字」についてだけ算出されてもよい。これにより、出現頻度の低い文字についてはその特徴をとらない又は別に分けることによって、文字形状特徴量の統計量としての信頼性を担保することも可能となる。
なお、以上に述べたような、文書データに含まれる各文字の「文字種別」は、文字種別特定部112において、公知の例えば機械学習を用いた画像認識技術を用いて決定される。例えば各文字を当該画像認識技術によって、予め設定した文字種別に分類してもよい。
<文字サイズ特徴量>
同じく図1の機能ブロック図において、特徴量生成部111の文字サイズ特徴量生成部111bは、文字検出部111zから、モデル構築用の又は能力推定対象としての文書データを構成する文字についての文字サイズ情報を受け取り、当該文字サイズ情報に基づき、「文字サイズ特徴量」を生成する。
ここで、この「文字サイズ特徴量」として、受け取った文字サイズ情報が非手書き文書データに係るものである場合、例えば、
・フォントサイズ統計値:当該文字形状情報(に係る文字属性情報)に含まれる個々の文字におけるフォントサイズについての(全文字での)統計値(例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも1つ)、
を採用することができる。
この文字属性に係る値であるフォントサイズ統計値は、他の文字属性種別となる文字属性毎に算出された値の組(セット)としてもよい。例えば、フォントサイズ統計値を、フォントタイプの種別毎に、文字色の種別毎に、及び/又は文字飾りの種別毎に算出し、これら算出された値のセットを、文字サイズ特徴量に採用することもできる。
また、「文字サイズ特徴量」として、手書き文書データ及び非手書き文書データの別によらず、例えば文字の記入・入力されるページ(用紙)上に文字枠が設定されている場合に、この文字枠に対する文字の相対的なサイズを算出し、当該相対サイズを文字サイズ特徴量に採用してもよい。ここで、文字枠に対する文字の相対的なサイズは、例えば、当該文字に係る文字矩形領域の面積と当該文字枠の面積との比の値としてもよく、または、当該文字に係る文字矩形領域の縦長(若しくは横幅)と当該文字枠の縦長(若しくは横幅)との比の値とすることもできる。
また、上記の文字枠とは、例えば、
(a)原稿用紙や(漢字練習帳等の)学習ノートに設けられた、一枠に1つの文字を記入・入力させるためのマス目の枠や、
(b)テストの答案用紙等に設けられた氏名や回答の記載枠、さらには、
(c)プレゼンテーション用の資料に含まれる特定の文字入力領域を囲む文字領域枠
といったようなものを指す。なお文書データにおいては、この文字枠は勿論、当該文書データの中に含まれる、上記(a)、(b)、(c)等に相当する枠の設定位置情報となる。
ちなみに、文字枠は、必ずしも矩形であるとは限らず、楕円形や、矩形以外の多角形であってもよい。さらに、ページ(用紙)上の所定の領域を指定する基準となるもの、例えば自身の上方に文字を記入・入力することを促す線分(文字基準下線)も、ここでは広い意味で当該文字枠に該当するものとする。
また、このような文字枠の検出は、特徴量生成対象の文書データがスキャンデータのような画像データの場合、公知の例えば機械学習を用いた画像認識技術によって実施することができる。またこの際、文字枠とともに、この文字枠内に記入・入力された文字も合せて検出することも好ましい。
さらに、ワープロソフトウェアやプレゼンテーション資料作成ソフトウェア等によって作成された文書データの場合には、当該文書データに含まれる属性情報(を含む文字サイズ情報)から、文字枠と当該文字枠内に記入・入力された文字とを特定することが可能となる。
また、「文字サイズ特徴量」として、受け取った文字サイズ情報が手書き文書データに係るものである場合、例えば、
・手書き文字サイズ統計値:当該文字サイズ情報(に係る文字属性情報)に含まれる個々の文字におけるサイズ(例えば面積、縦長(高さ)、横幅及び対角線長等のうちの少なくとも1つ)についての(全文字での)統計値(例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも1つ)
を採用することができる。
なお、上記の手書き文字サイズ統計値は、個々の作成主体(例えば児童)についての絶対値として算出されるものであるが、変更態様として、複数の作成主体(例えば児童)の手書き文字サイズ統計値群の中における相対値として算出されてもよい。例えば、複数の作成主体(例えば1つのクラスの全児童)を母集団として、個々の作成主体(例えば児童)における絶対値としての手書き文字サイズ統計値における(a)偏差値や、(b)当該母集団の平均値や分散から算出されるZ得点を、相対値としての手書き文字サイズ統計値としてもよい。
また特に、手書き文書データの場合に好適な態様となるが、「文字サイズ特徴量」は、予め設定された文字種別毎に算出されてもよい。例えば、
(a)促音文字(「っ」,「ッ」)、
(b)拗音文字(「ぁ」,「ぃ」,「ぅ」,・・・)、
(c)高縦横比文字(例えば数字の「1」)、
(d)低縦横比文字(例えば漢字の「一」や長音「ー」等)や、
(e)句読点文字(「。」,「、」)
といったような種別の文字は、作成主体(例えば児童)が文書データ全体において文字サイズをできるだけ均等にするように意識していたとしても、他の種別の文字と比べて必然的に、文字矩形領域における面積、縦長、横幅及び対角線長のうちの少なくとも1つが大幅に小さくなる。
そこで、上記(a)~(e)を含めた複数の文字種別を予め設定しておき、これらの文字種別毎に「文字サイズ特徴量」を算出・決定することによって、作成主体(例えば児童)の認知能力や非認知能力にかかわらず必然的に発生する文字サイズの差異が、能力推定結果に与えてしまう影響を抑制することもできるのである。
また、個々の文字毎に「文字サイズ特徴量」を算出することも可能ではあるが、漢字を含む場合は文字の種類が膨大となり、実際には特徴量としてまとめることが困難となってしまう。そこで上述したように、予め設定した文字種別毎に「文字サイズ特徴量」を算出することも好ましいのである。
さらに、「文字サイズ特徴量」は、
(a)文書データ全体において所定回数以上若しくは所定頻度以上で出現する文字種別である「頻出文字」を特定した上で、又は
(b)出現頻度が高い文字種別として予め「頻出文字」を設定した上で、
当該「頻出文字」を含む文字種別毎に、又は当該「頻出文字」についてだけ算出されてもよい。これにより、出現頻度の低い文字についてはその特徴をとらない又は別に分けることによって、文字サイズ特徴量の統計量としての信頼性を担保することも可能となる。
<文字位置特徴量>
同じく図1の機能ブロック図において、特徴量生成部111の文字位置特徴量生成部111cは、文字検出部111zから、モデル構築用の又は能力推定対象としての文書データを構成する文字についての文字位置情報を受け取り、当該文字位置情報に基づき、「文字位置特徴量」を生成する。
ここで以下、図2も適宜用いて、「文字位置特徴量」の具体的な内容について詳細に説明を行う。
なお以下、特徴量決定対象が手書き文書データであるとして、様々な文字位置特徴量の態様を説明するが、これらの態様の文字位置特徴量は、文書生成の際に使用するソフトウェアにもよるが、非手書き文書データを取り扱う場合にも適用され得るものとなっている。
文字位置特徴量生成部111cは、より具体的に、文字位置情報である各文字についてのページ(用紙)内での位置座標を取得し、これらの位置座標に基づき、「文字位置特徴量」を生成することも好ましい。
例えば、図2(A)に示したように、ページ(用紙)に設定されたXY位置座標系における、各文字に係る文字矩形領域の代表位置(例えば当該領域の中心や四隅のいずれか)の位置座標値((X, Y)又はX若しくはY)を、各文字の文字位置特徴量としてもよい。また、マス目枠等の文字枠に設定されたxy位置座標系における文字矩形領域の代表位置の位置座標値((x, y)又はx若しくはy)を、各文字の文字位置特徴量とすることもできる。
さらに、図2(B)に示したように、氏名記載部や本文記載部といったような文字記入・入力領域に設定された位置座標系における、各文字の文字矩形領域の代表位置の位置座標値を、各文字の文字位置特徴量とすることも可能である。
また、図2(C)に示したように、各文字の文字矩形領域と、その近傍となる文字の文字矩形領域との「間隔」(例えばdxc,dyc,sxc及びsycのうちの少なくとも1つ)を、各文字の文字位置特徴量としてもよい。なお、このような文字間の「間隔」は、上下左右のいずれかに隣接する文字との間隔としてもよく、または、上下左右のいずれかの方向において所定文字数分だけ離隔した文字との間隔(例えば文字矩形領域の中心間の距離)とすることもできる。
さらに、図2(D)に示したように、各文字の文字矩形領域の代表位置(例えば当該領域の中心や四隅のいずれか)と、文字基準下線との位置関係を示す値(例えばdL,sxL及びsyLのうちの少なくとも1つ)を、各文字の文字位置特徴量としてもよい。
次いで、以上に述べたような各文字の文字位置特徴量に対し、文書データ全体や該当する文字記入・入力領域全体での統計値(例えば平均値、中央値、四分位値、最大値、最小値、分散、及び標準偏差等のうちの少なくとも1つ)を算出し、当該統計値を「文字位置特徴量」とすることも好ましいのである。
さらにまた、文字位置特徴量生成部111cは、「文字位置特徴量」として、
(a)(例えば横書き文書における)同一行の文字群の文字矩形領域列における上端位置若しくは下端位置の斉一性を示す値(例えば、上端位置若しくは下端位置のy(Y)座標値の標準偏差の逆数)、又は
(b)(例えば縦書き文書における)同一列の文字群の文字矩形領域列における左端位置若しくは右端位置の斉一性を示す値(例えば、左端位置若しくは右端位置のx(X)座標値の標準偏差の逆数)
を採用することも可能である。
また、「文字位置特徴量」は、予め設定された文字種別毎に算出されてもよい。例えば、図2(E)に示すような高縦横比文字(例えば数字の「1」)や、低縦横比文字(例えば漢字の「一」や長音「ー」等)は、文字位置の斉一性が高く見える、すなわち互いの位置が揃って見える文字群(文章)の中においても、所定方向で隣接している文字との間で、文字矩形領域における上下左右端のいずれかのx(X)若しくはy(Y)座標値の差が際立って大きくなってしまう。そこで、高縦横比文字や低縦横比文字を含む複数の文字種別を予め設定しておき、これらの文字種別毎に「文字位置特徴量」を算出・決定することも好ましい。
これにより、作成主体(例えば児童)の認知能力や非認知能力にかかわらず必然的に発生する文字位置の相対的なばらつきが、能力推定結果に与えてしまう影響を抑制することもできる。また、文書データの有する文字位置の斉一性をより正確に反映した文字位置特徴量を生成することも可能となるのである。
また、個々の文字毎に「文字位置特徴量」を算出することも可能ではあるが、漢字を含む場合は文字の種類が膨大となり、実際には特徴量としてまとめることが困難となってしまう。そこで上述したように、予め設定した文字種別毎に「文字位置特徴量」を算出することも好ましいのである。
さらに、「文字位置特徴量」は、
(a)文書データ全体において所定回数以上若しくは所定頻度以上で出現する文字種別である「頻出文字」を特定した上で、又は
(b)出現頻度が高い文字種別として予め「頻出文字」を設定した上で、
当該「頻出文字」を含む文字種別毎に、又は当該「頻出文字」についてだけ算出されてもよい。これにより、出現頻度の低い文字についてはその特徴をとらない又は別に分けることによって、文字位置特徴量の統計量としての信頼性を担保することも可能となる。
<文字変動特徴量>
図1の機能ブロック図に戻って、文字変動特徴量生成部111dは、文書データ内に複数の文書領域が予め設定されている状況において、
(ア)文書領域毎に生成された、又は2つ以上の所定の文書領域について生成された「文字形状特徴量」における、互いに異なる文書領域に係る当該「文字形状特徴量」の間の変動分に係る量、
(イ)文書領域毎に生成された、又は2つ以上の所定の文書領域について生成された「文字サイズ特徴量」における、互いに異なる文書領域に係る当該「文字サイズ特徴量」の間の変動分に係る量、及び
(ウ)文書領域毎に生成された、又は2つ以上の所定の文書領域について生成された「文字位置特徴量」における、互いに異なる文書領域に係る当該「文字位置特徴量」の間の変動分に係る量
のうちの少なくとも1つを含む量を、「文字変動特徴量」として生成する。
例えば、第1の文書領域について生成された「第1の文字形状特徴量」、「第1の文字サイズ特徴量」及び「第1の文字位置特徴量」と、第2の文書領域について生成された「第2の文字形状特徴量」、「第2の文字サイズ特徴量」及び「第2の文字位置特徴量」とから、
(ア’)「形状変動特徴量」=「第2の文字形状特徴量」-「第1の文字形状特徴量」、
(イ’)「サイズ変動特徴量」=「第2の文字サイズ特徴量」-「第1の文字サイズ特徴量」、及び
(ウ’)「位置変動特徴量」=「第2の文字位置特徴量」-「第1の文字位置特徴量」
のうちの少なくとも1つを算出し、算出した当該「少なくとも1つ」を「文字変動特徴量」とすることができる。なお、この例では変動量として差をとっているが、勿論それに限定されず、例えば比(例えば「第2の文字形状特徴量」/「第1の文字形状特徴量」)をとることも可能である。
ここで、予め設定される「文書領域」としては、
(a)文書データを複数の区域(例えば3等分した結果である3つの区域)に分割した場合の当該区域、
(b)文書データにおいて所定の窓枠(ウィンドウ)をスライドさせつつ規定した、連続しており互いに重畳部分を有する枠内区域、又は
(c)文書データにおいて予め目的別に設定された区域(例えば序章区域、本章区域、及び終章区域)
を採用することができる。
このように、「文字変動特徴量」を文字特徴量に採用することによって、作成主体(例えば児童)の認知能力や非認知能力が、文書中における文字形状、文字サイズや文字位置の変動に対して与える影響も確実に取り込んだ特徴量を生成することも可能となるのである。
<コンテキストに係る文字変動特徴量>
また、文字変動特徴量生成部111dは、以上に説明したような文書領域に係る「文字変動特徴量」の一態様として特に、文書の(前後関係、文脈や、背景等としての)コンテキストによる文字形状、文字サイズや文字位置の変動を反映した「文字変動特徴量」を算出することも好ましい。
ここでこの場合、コンテキスト特定部113は、このようなコンテキストに係る「文字変動特徴量」を算出する際に用いる文書領域(以後、コンテキスト領域とも称する)を決定する。このコンテキスト特定部113で決定されるコンテキスト領域は、例えば、
(a)自身に含まれる文字量における文書データ全体に対する割合が33%となる序盤領域、この序盤領域に続いて当該割合が34%となる中盤領域、及び当該割合が残りの33%となる終盤領域、といったように、自身の有する文字量の全文字量に対する割合をもって規定される複数の文書領域、又は
(b)文書データ中のタイトル記載部、氏名記載部、及び本文記載部、といったように、目的別に予め設定される複数の文書領域
とすることができる。
次いで、文字変動特徴量生成部111dは、
(a)コンテキスト特定部113で決定されたコンテキスト領域毎に生成された、又は2つ以上の所定のコンテキスト領域について生成された「文字形状特徴量」における、互いに異なるコンテキスト領域に係る当該「文字形状特徴量」の間の変動分に係る量、
(b)コンテキスト特定部113で決定されたコンテキスト領域毎に生成された、又は2つ以上の所定のコンテキスト領域について生成された「文字サイズ特徴量」における、互いに異なるコンテキスト領域に係る当該「文字サイズ特徴量」の間の変動分に係る量、及び
(c)コンテキスト特定部113で決定されたコンテキスト領域毎に生成された、又は2つ以上の所定のコンテキスト領域について生成された「文字位置特徴量」における、互いに異なるコンテキスト領域に係る当該「文字位置特徴量」の間の変動分に係る量、
のうちの少なくとも1つを含む量を、「文字変動特徴量」として生成する。
このように、コンテキスト領域を考慮した「文字変動特徴量」を生成することにより、作成主体(例えば児童)の作成した文書における文字が、当該作成主体の有する認知能力や非認知能力に応じ、当該文書のコンテキストによって変化する現象を確実に捉え、認知・非認知能力推定に活かすことが可能となる。
例えば、一人の児童が作成した文書において、その前半では文字サイズや文字位置の斉一性が保持たれているものの、後半になるにしたがい、そのような斉一性が失われていくといったことは少なからず発生し得る。こうした文書のコンテキストによる文字の態様の変化にも、作成主体の認知・非認知能力が反映されている可能性があり、その変化を「文字変動特徴量」として確実に捉えることが、認知・非認知能力推定の精度向上に貢献するのである。
<文書領域特徴量>
同じく図1の機能ブロック図において、文書領域特徴量生成部111eは、この後、認知・非認知能力推定の説明変数として使用される「文書領域特徴量」を生成する。具体的には上述したように、文書領域毎に又は1つ若しくは複数の文書領域について「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」、及び/又は「文字変動特徴量」が生成された場合に、生成されたこのような特徴量に合わせ、当該特徴量に係る文書領域を指定する量(例えば予め設定された文書領域ID)を「文書領域特徴量」としてもよい。ちなみに、この「文書領域特徴量」の具体的な取扱いについては後に、図3を用いて詳細に説明する。
<文字種別特徴量>
また、文字種別特徴量生成部111fは、この後、認知・非認知能力推定の説明変数として使用される「文字種別特徴量」を生成する。具体的には上述したように、文字種別毎に又は1つ若しくは複数の文字種別について「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」、及び/又は「文字変動特徴量」が生成された場合に、生成されたこのような特徴量に合わせ、当該特徴量に係る文字種別を指定する量(例えば予め設定された文字種別ID)を「文字種別特徴量」としてもよい。
<作成主体属性特徴量>
さらに、作成主体属性特徴量生成部111gは、この後、認知・非認知能力推定の説明変数として使用される「作成主体属性特徴量」を生成する。具体的には、生成された「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」、及び/又は「文字変動特徴量」に係る文書データの作成主体(例えば児童)の属性情報(例えば、性別、体格情報、年齢、学習進捗情報等)を、属性情報保存部103から取得し、当該属性情報を「作成主体属性特徴量」とすることができる。
また、この生成された「作成主体属性特徴量」は、対応する作成主体(例えば児童)の文書データについて生成された「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」、及び/又は「文字変動特徴量」と合せて、この後、認知・非認知能力推定の説明変数として使用されるのである。
なお、このような「作成主体属性特徴量」を取り扱うことによって、認知・非認知能力推定の際、作成主体(例えば児童)の属性がノイズとなってしまう事態を回避することも可能となる。例えば通常、文字の形状、サイズ及び位置に係る特徴には、作成主体(例えば児童)の属性(性、体格、年齢、学習進捗状況等)も強く反映されると考えられるが、このような属性も考慮した能力推定モデルを構築することによって、認知能力や非認知能力をより精度良く推定することも可能となるのである。
同じく図1の機能ブロック図において、モデル構築部114は、文書の作成主体(例えば児童)の認知能力及び/又は非認知能力を推定するための能力推定モデルを構築する。ここで、学習データとして、
(a)以上に説明した「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」及び「文字変動特徴量」のうちの少なくとも1つと、
(b)上記(a)の「少なくとも1つ」に係る文書データの作成主体(例えば児童)についての認知能力及び/又は非認知能力の正解データと
の組(データセット)を多数準備し、当該学習データを用いて学習処理を行うことにより、上記の能力推定モデルを構築してもよい。
また、他の実施形態の学習データとして、上記(a)及び(b)と、さらに、
(c)上記(a)の「少なくとも1つ」に係る「文書領域特徴量」、「文字種別特徴量」及び「作成主体属性特徴量」のうちの少なくとも1つと
の組(データセット)を多数準備し、当該学習データを用いて学習処理を行うことにより、上記の能力推定モデルを構築することも好ましい。
ちなみに、上記(b)の正解データについては、例えば、当該作成主体(例えば児童)に対し、知能指数(IQ)測定用の質問紙調査、GRIT測定用の質問紙調査、及び/又はEQ測定用の質問紙調査を実施し、この調査結果であるIQ値、GRIT値、及び/又はEQ値を、当該作成主体(例えば児童)についての正解データとすることができる。
また、能力推定モデルを構築するのに使用される統計・機械学習アルゴリズムは特に限定されず、例えばロジットモデル、ロジスティック回帰、ランダムフォレスト(Random Forest)、XGboost、LightGBM、ニューラルネットワーク(Neural Network)等の公知のアルゴリズムが採用可能である。
同じく図1の機能ブロック図において、能力決定部115は、能力推定対象である作成主体(例えば児童)の文書データについて生成された、
(a)「文字形状特徴量」、「文字サイズ特徴量」、「文字位置特徴量」及び「文字変動特徴量」のうちの少なくとも1つと、
(b)(これらが能力推定モデルの説明変数として採用されている場合ではあるが、)上記(a)の「少なくとも1つ」に係る「文書領域特徴量」、「文字種別特徴量」及び「作成主体属性特徴量」のうちの少なくとも1つと
を、構築済みの能力推定モデルへ入力し、当該能力推定モデルの出力を取得して、当該出力を、認知能力及び/又は非認知能力についての能力推定結果とする。
ここで、この能力推定結果は具体的に例えば、IQ値そのものや、当該IQ値に対応するスコア若しくはIQレベル値(例えば高,中,低レベルを示す値)、GRIT値(「一貫性」値や「根気」値)そのものや、当該GRIT値に対応するスコア若しくはGRITレベル値、及び/又は、EQ値そのものや、当該EQ値に対応するスコア若しくはEQレベル値とすることができる。また、このようなスコアが(1つ又は複数の)所定閾値以上であるか否かの判定結果であってもよい。
また、好適な他の実施形態として、モデル構築部114は、作成主体(例えば児童)の所定の属性毎に(例えば男子児童及び女子児童についてそれぞれ個別に)、当該属性を有する作成主体の文書データ専用の能力推定モデルを構築し、能力決定部115は、能力推定対象の作成主体(例えば児童)の属性に応じ、これらの構築された能力推定モデルの中から、当該属性専用のものを選択して能力推定処理に使用してもよい。例えば、男子児童向けに構築された能力推定モデルと、女子児童向けに構築された能力推定モデルとを、能力推定対象の児童の性別に応じて使い分ける、といったことも好ましいのである。
なお、これはすでに述べたことではあるが、文字の形状、サイズ及び位置に係る特徴には、作成主体(例えば児童)の属性(例えば性別)が強く反映されることも考えられる。そこで、このような属性別に(例えば男子児童と女子児童とを分けて)能力推定モデルを構築し、能力推定対象の属性に応じ適宜使い分けることによって、認知能力や非認知能力をより精度良く推定することも可能となるのである。
図3は、能力決定部115における文書領域特徴量を用いた能力推定処理における2つの実施形態を説明するための模式図である。
最初に、図3(A)に示す実施形態においては、能力推定対象である文書データについて、文書領域(A,B,C,・・・)毎に、文字特徴量(fc_A,fc_B,fc_C,・・・)が算出されており、さらに、当該文書領域の文書領域特徴量(fr_A,fr_B,fr_C,・・・)が決定されている。
ここで、能力決定部115は、能力推定処理の際、各文書領域(A,B,C,・・・)において、
(a)当該文書領域で算出された文字特徴量(fc_A,fc_B,fc_C,・・・)と、
(b)当該文書領域の文書領域特徴量(fr_A,fr_B,fr_C,・・・)と
の組を生成し、これらの組の全てを能力推定モデルへ入力し、能力推定結果(図3(A)ではIQ値に対応する認知能力スコアや、GRIT値に対応する非認知能力スコア)を取得するのである。ちなみに、ここで使用する能力推定モデルも勿論、これらの組の全てを説明変数とするように構築されている。
能力決定部115は、このようなモデル入力処理を実施することによって、文字特徴量の算出された文書領域の情報も適切に織り込まれた能力推定結果を取得することができるのである。
次に、図3(B)に示す実施形態においては、能力推定対象である文書データについて、
(a)文書領域Bで算出された文字特徴量と文書領域Cで算出された文字特徴量とから算出される文字変動特徴量fd_BC、文書領域Bの文書領域特徴量fr_B、及び文書領域Cの文書領域特徴量fr_C
が決定されており、さらに、
(b)文書領域Bで算出された文字特徴量と文書領域Zで算出された文字特徴量とから算出される文字変動特徴量fd_BZ、文書領域Bの文書領域特徴量fr_B、及び文書領域Zの文書領域特徴量fr_Z
が決定されている。
ここで、能力決定部115は、能力推定処理の際、
(ア)上記(a)における文字変動特徴量fd_BCと、文書領域特徴量fr_Bと、文書領域特徴量fr_Cとの組、及び
(イ)上記(b)における文字変動特徴量fd_BZと、文書領域特徴量fr_Bと、文書領域特徴量fr_Zとの組
を生成し、これらの組を能力推定モデルへ入力し、能力推定結果(図3(B)でもIQ値に対応する認知能力スコアや、GRIT値に対応する非認知能力スコア)を取得するのである。ちなみに、ここで使用する能力推定モデルも勿論、これらの組を説明変数とするように構築されている。
能力決定部115は、このようなモデル入力処理を実施することによって、文字変動特徴量の算出された文書領域の情報も適切に織り込まれた能力推定結果を取得することができるのである。
図1の機能ブロック図に戻って、能力決定部115で決定された能力推定結果(例えば各児童について推定されたIQ値、GRIT値や、EQ値)は、例えば能力情報保存部104で保存・管理された上、適宜又はキーボード105を介したユーザの指示に従い、入出力制御部122を介してディスプレイ106に表示されてもよい。さらには、通信制御部121及び通信インタフェース部101を介し、外部の情報処理装置、例えば小学校の所有する児童情報管理サーバへ送信され、そこで様々な用途、例えば学習指導方針の決定に利用されることも好ましい。
以上、詳細に説明したように、本発明によれば、文書における文字に係る特徴を示す文字特徴量から、その作成主体の認知能力及び/又は非認知能力を推定することができる。また、従来手法である質問紙調査等と比較して、準備や本処理の手間を大幅に削減し、より短時間で認知能力及び/又は非認知能力を推定することも可能となる。さらに、従来の質問紙調査等の手法では、主に被験者側の事情により、測定結果に対する高い信頼性を確保するのが困難であったところ、本発明によれば、その能力推定結果について、より高い信頼性を見込むことが可能となる。
また本発明は、特に教育現場において、児童や生徒に対し学習指導を行うにあたり、指導内容を決定する際の重要な判断材料となる児童や生徒の認知・非認知能力を、より短時間で且つより確実に把握することを可能にする。またひいては、児童や生徒に対し、持続的な且つ好ましい方向への行動変容を促すことにも貢献し得るのである。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 能力推定装置
101 通信インタフェース部
102 文書保存部
103 属性情報保存部
104 能力情報保存部
105 キーボード(KB)
106 ディスプレイ(DP)
111 特徴量生成部
111a 文字形状特徴量生成部
111b 文字サイズ特徴量生成部
111c 文字位置特徴量生成部
111d 文字変動特徴量生成部
111e 文書領域特徴量生成部
111f 文字種別特徴量生成部
111g 作成主体属性特徴量生成部
111z 文字検出部
112 文字種別特定部
113 コンテキスト特定部
114 モデル構築部
115 能力決定部
121 通信制御部
122 入出力制御部
2 文書データベース(DB)
3 属性情報DB

Claims (11)

  1. 作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定可能なコンピュータを機能させる能力推定プログラムであって、
    当該文書の文字における形状、サイズ及び位置のうちの少なくとも1つに係る量、及び/又は当該量の変動分に係る量である文字特徴量を、認知能力及び/又は非認知能力に係る値を出力可能な構築済みのモデルに入力し、当該モデルからの出力に基づいて、当該文書の作成主体の認知能力及び/又は非認知能力に係る情報を決定する能力決定手段
    としてコンピュータを機能させることを特徴とする能力推定プログラム。
  2. 前記能力推定プログラムは、当該文書内の複数の文書領域における文書領域毎に又は1つ若しくは複数の文書領域について、当該文書領域内の文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
    前記能力決定手段は、当該文書領域について生成された当該文字特徴量と、該文字特徴量に係る文書領域に係る情報とを、構築済みの当該モデルに入力する
    ことを特徴とする請求項1に記載の能力推定プログラム。
  3. 前記能力推定プログラムは、当該文書内の複数の文書領域における文書領域毎に又は2つ以上の文書領域につき、当該文書領域内の文字における形状、サイズ及び位置のうちの少なくとも1つに係る量を生成して、互いに異なる文書領域について生成した当該量の間の変動分に係る量である当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
    前記能力決定手段は、少なくとも当該変動分に係る量である文字特徴量と、該文字特徴量に係る文書領域に係る情報とを、構築済みの当該モデルに入力する
    ことを特徴とする請求項1又は2に記載の能力推定プログラム。
  4. 当該文書領域は、当該文書を複数の区域に分割した場合の当該区域、当該文書において所定の窓枠をスライドさせつつ規定した枠内区域、又は当該文書において予め目的別に設定された区域であることを特徴とする請求項2又は3に記載の能力推定プログラム。
  5. 予め設定された複数の文字種別における文字種別毎に又は1つ若しくは複数の文字種別について、当該文字種別に属する文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させ、
    前記能力決定手段は、当該文字種別について生成された当該文字特徴量と、該文字特徴量に係る文字種別に係る情報とを、構築済みの当該モデルに入力する
    ことを特徴とする請求項1から4のいずれか1項に記載の能力推定プログラム。
  6. 当該文字種別は、文字を取り囲んで包含する領域である文字領域における高さと幅との比に基づき予め分類されたものであることを特徴とする請求項5に記載の能力推定プログラム。
  7. 当該文書の文字のうち、出現頻度が所定以上である文字、又は出現頻度が高いものとして設定された文字種別に属する文字についての当該文字特徴量を生成する特徴量生成手段としてコンピュータを更に機能させることを特徴とする請求項1から6のいずれか1項に記載の能力推定プログラム。
  8. 当該文字特徴量は、当該文書の文字における、当該文書全体の中での位置に係る量、当該文書内の所定の範囲若しくは基準に対する位置に係る量、及び他の文字に対する位置に係る量のうちの少なくとも1つ、及び/又はこれらの量の変動分に係る量のうちの少なくとも1つを含むことを特徴とする請求項1から7のいずれか1項に記載の能力推定プログラム。
  9. 前記能力決定手段は、当該文書の作成主体について取得された属性情報も、構築済みの当該モデルに入力することを特徴とする請求項1から8のいずれか1項に記載の能力推定プログラム。
  10. 作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定する能力推定装置であって、
    当該文書の文字における形状、サイズ及び位置のうちの少なくとも1つに係る量、及び/又は当該量の変動分に係る量である文字特徴量を、認知能力及び/又は非認知能力に係る値を出力可能な構築済みのモデルに入力し、当該モデルからの出力に基づいて、当該文書の作成主体の認知能力及び/又は非認知能力に係る情報を決定する能力決定手段
    を有することを特徴とする能力推定装置。
  11. 作成主体が手書きで、又は機器を介し文字を選択、調整又は決定して作成した文書から、当該作成主体の能力を推定可能なコンピュータにおける能力推定方法であって、
    当該文書の文字における形状、サイズ及び位置のうちの少なくとも1つに係る量、及び/又は当該量の変動分に係る量である文字特徴量を入力とし、認知能力及び/又は非認知能力に係る値を出力可能なモデルを構築するステップと、
    能力推定対象である作成主体が作成した文書における当該文字特徴量を、構築済みの当該モデルに入力し、当該モデルからの出力に基づいて、当該作成主体の認知能力及び/又は非認知能力に係る情報を決定するステップと
    を有することを特徴とする能力推定方法。
JP2020013360A 2020-01-30 2020-01-30 文書から認知・非認知能力を推定する能力推定プログラム、装置及び方法 Active JP7177105B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020013360A JP7177105B2 (ja) 2020-01-30 2020-01-30 文書から認知・非認知能力を推定する能力推定プログラム、装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020013360A JP7177105B2 (ja) 2020-01-30 2020-01-30 文書から認知・非認知能力を推定する能力推定プログラム、装置及び方法

Publications (2)

Publication Number Publication Date
JP2021119374A JP2021119374A (ja) 2021-08-12
JP7177105B2 true JP7177105B2 (ja) 2022-11-22

Family

ID=77195341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020013360A Active JP7177105B2 (ja) 2020-01-30 2020-01-30 文書から認知・非認知能力を推定する能力推定プログラム、装置及び方法

Country Status (1)

Country Link
JP (1) JP7177105B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118401982A (zh) * 2022-01-20 2024-07-26 株式会社和冠 计算机、程序及笔划数据显示控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004046723A (ja) 2002-07-15 2004-02-12 Ricoh Co Ltd 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP2007079891A (ja) 2005-09-14 2007-03-29 Hitachi Maxell Ltd 性格分析システム
JP2010131280A (ja) 2008-12-08 2010-06-17 Hitachi Ltd 精神状態判定支援方法および装置
JP2019153303A (ja) 2018-03-01 2019-09-12 学校法人玉川学園 情報処理装置、情報処理方法、及びプログラム
JP2019197209A (ja) 2018-05-11 2019-11-14 アノト コリア コーポレーション 診断検査方法および装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004046723A (ja) 2002-07-15 2004-02-12 Ricoh Co Ltd 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP2007079891A (ja) 2005-09-14 2007-03-29 Hitachi Maxell Ltd 性格分析システム
JP2010131280A (ja) 2008-12-08 2010-06-17 Hitachi Ltd 精神状態判定支援方法および装置
JP2019153303A (ja) 2018-03-01 2019-09-12 学校法人玉川学園 情報処理装置、情報処理方法、及びプログラム
JP2019197209A (ja) 2018-05-11 2019-11-14 アノト コリア コーポレーション 診断検査方法および装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CNNを用いた手書き文字画像から人の性格を推測するシステム,電子情報通信学会2019年総合大会 予稿集,2019年,一般社団法人電子情報通信学会,2019年03月05日,222
人の気づきに迫る-認知科学、心理学からのアプローチ-,情報処理,第58巻 第4号,一般社団法人情報処理学会,2017年03月15日,305-309
子どもたちからの声から学習プロセスを見える化 協働学習支援サービス,C&Cユーザフォーラム&iEXPO2019,NEC,2019年11月07日

Also Published As

Publication number Publication date
JP2021119374A (ja) 2021-08-12

Similar Documents

Publication Publication Date Title
Bruce et al. The use of pigmentation and shading information in recognising the sex and identities of faces
Sutherland et al. Facial image manipulation: A tool for investigating social perception
Kleinsmith et al. Cross-cultural differences in recognizing affect from body posture
Ariely Seeing sets: Representation by statistical properties
CN109145871B (zh) 心理行为识别方法、装置与存储介质
CN109902912B (zh) 一种基于性格特征的个性化图像美学评价方法
Longmore et al. The importance of internal facial features in learning new faces
US20210012097A1 (en) System and method for first impression analysis and face morphing by adjusting facial landmarks using faces scored for plural perceptive traits
Johnson et al. Understanding aesthetics and fitness measures in evolutionary art systems
Redfern et al. Expressive faces confuse identity
Camões Data at work: Best practices for creating effective charts and information graphics in Microsoft Excel
Ramsamy-Iranah et al. A comparison of three materials used for tactile symbols to communicate colour to children and young people with visual impairments
Mileva et al. Social evaluation of faces across gender and familiarity
Park et al. Consensus analysis and modeling of visual aesthetic perception
Lu et al. An investigation into three visual characteristics of complex scenes that evoke human emotion
Romero et al. Computing aesthetics with image judgement systems
Zhou et al. Deep learning-based emotion recognition from real-time videos
JP7177105B2 (ja) 文書から認知・非認知能力を推定する能力推定プログラム、装置及び方法
Michel et al. The contribution of shape and surface information in the other-race face effect
Kapitanov et al. Slovo: Russian Sign Language Dataset
Farzanfar et al. Changing what you like: Modifying contour properties shifts aesthetic valuations of scenes
Day et al. Physical and perceptual accuracy of upright and inverted face drawings
Cristino et al. Stereo disparity facilitates view generalization during shape recognition for solid multipart objects
Wu et al. Constituent elements affecting the recognition of tactile graphics
Kim et al. # ShoutYourAbortion on Instagram: exploring the visual representation of hashtag movement and the public’s responses

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221110

R150 Certificate of patent or registration of utility model

Ref document number: 7177105

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150