JP7254606B2 - 積算業務支援システム及び積算業務支援プログラム - Google Patents

積算業務支援システム及び積算業務支援プログラム Download PDF

Info

Publication number
JP7254606B2
JP7254606B2 JP2019084487A JP2019084487A JP7254606B2 JP 7254606 B2 JP7254606 B2 JP 7254606B2 JP 2019084487 A JP2019084487 A JP 2019084487A JP 2019084487 A JP2019084487 A JP 2019084487A JP 7254606 B2 JP7254606 B2 JP 7254606B2
Authority
JP
Japan
Prior art keywords
text
correct
symbol
correlation coefficient
symbols
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019084487A
Other languages
English (en)
Other versions
JP2020181405A (ja
Inventor
和秀 高桑
直大 今村
安正 内山
和志 中堀
Original Assignee
日本電設工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電設工業株式会社 filed Critical 日本電設工業株式会社
Priority to JP2019084487A priority Critical patent/JP7254606B2/ja
Publication of JP2020181405A publication Critical patent/JP2020181405A/ja
Application granted granted Critical
Publication of JP7254606B2 publication Critical patent/JP7254606B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、イメージデータの設計図面から、電気器具等の品名や個数などを自動的に拾い出すことで、積算業務の支援を行う積算業務支援システム及び積算業務支援プログラムに関する。
従来、積算業務の支援を行うシステムが種々提案されてきた(例えば、特許文献1(特開2006-113940号公報)参照。)
特開2006-113940号公報
発明者らは、顧客から提供される建物の設計図面から、電気器具の品名や個数などを抽出し(拾い出し)、これらを積算することで、電気工事費用を算出する業務を行っている。ところで、顧客から提供される前記設計図面は、CADデータ等によるものではなく、イメージデータであることが特徴となっている。これは、CADデータ等を顧客側から受領してしまうと、万が一誤って改変してしまう可能性も生じてしまうからであり、このようなことを防止するためにイメージデータの設計図面を顧客から受領するようにしている。そこで、従来は、電気工事費用の算出業務においては、イメージデータに基づいて、電気器具の記号や、テキストの拾い出しを行わなければならず、このような拾い出し作業は実質的に人手により行わなければならず、非常に業務効率が悪い、という問題があった。
図17、図18を参照して具体的に説明する。図17、図18それぞれの(A)は建物の設計図面の一例を示す図である。図17(A)に関連して図17(B)における凡例表には電気器具のシンボルマークとしての記号と、当該記号に対応して名称などが定義されている。設計図面からの積算作業においては、設計図面の本図の中から、記号を抽出することが必要となる。しかしながら、これまで、凡例表中に定義されている複数の記号を、イメージデータの設計図面本図の中で、コンピューターマッチングを行い、効率的に抽出する技術については知られていなかった。(課題1)
さらに、設計図面においては、例えば、図18(A)に関連して図18(B)における姿図が記述されている。このような姿図においては、「品名」などが記述されている。このような「品名」は、姿図や設計図面においてOCRなどの文字認識技術により、テキストデータに変換されるが、この際しばしば変換ミスが発生してしまう。しかしながら、従来このような変換ミスを修正するためには人に頼るしかなく、自動でこれを効率的に修正する技術が求められていた。(課題2)
このような課題を解決するために、本発明に係る積算業務支援システムは、イメージデータよりなる設計図面から、設計図面における電気器具に係る複数の記号パターンの抽出を行うと共に、設計図面における品名を認識する積算業務支援システムであって、所定の矩形状領域で、複数の記号の矩形状ドットパターンを記憶する工程と、複数の記号のそれぞれの矩形状ドットパターンを1ドットずつずらしながら設計図面との比較を行い、相関係数を算出し、それぞれの記号に対する相関係数関数を求める工程と、求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出する工程と、指定範囲において、全ての記号に対する相関係数関数の最大値を与える最大値関数を算出する工程と、最大値関数における極大値を与える記号を正解として抽出する工程と、設計図面における品名を文字認識技術に基づいてテキストに変換する工程と、変換されたテキストと、品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正する工程と、変換されたテキストと、品名の正解テキストとが一致しない場合で、編集距離が最も近い正解テキストが複数存在するとき、変換されたテキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、正解テキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、置換処理済みの変換されたテキストと、置換処理済みの正解テキストとの間の編集距離を算出する工程と、編集距離がより短い変換されたテキストを、正解テキストに修正する工程と、が実行されることを特徴とする。
また、本発明に係る積算業務支援プログラムは、イメージデータよりなる設計図面から、設計図面における電気器具に係る複数の記号パターンの抽出を行う処理と共に、設計図面における品名を認識する処理をコンピューターに実行させる積算業務支援プログラムであって、所定の矩形状領域で、複数の記号の矩形状ドットパターンを記憶する工程と、複数の記号のそれぞれの矩形状ドットパターンを1ドットずつずらしながら設計図面との比較を行い、相関係数を算出し、それぞれの記号に対する相関係数関数を求める工程と、求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出する工程と、指定範囲において、全ての記号に対する相関係数関数の最大値を与える最大値関数を算出する工程と、最大値関数における極大値を与える記号を正解として抽出する工程と、設計図面における品名を文字認識技術に基づいてテキストに変換する工程と、変換されたテキストと、品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正する工程と、変換されたテキストと、品名の正解テキストとが一致しない場合で、編集距離が最も近い正解テキストが複数存在するとき、変換されたテキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、正解テキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、置換処理済みの変換されたテキストと、置換処理済みの正解テキストとの間の編集距離を算出する工程と、編集距離がより短い変換されたテキストを、正解テキストに修正する工程と、をコンピューターに実行させることを特徴とする。
本発明に係る積算業務支援システム及び積算業務支援プログラムは、求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出するので、このような本発明に係る積算業務支援システム及び積算業務支援プログラムによれば、凡例表中に定義されている複数の記号と同様の記号を、イメージデータの設計図面本図の中から、コンピューターマッチングを行い、効率的に抽出することが可能となる。
また、本発明に係る積算業務支援システム及び積算業務支援プログラムは、変換されたテキストと、姿図に記載された品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正するので、このような本発明に係る積算業務支援システム及び積算業務支援プログラムによれば、文字認識技術により誤変換されたテキストデータを効率的に修正することが可能となる。
本発明の実施形態に係る積算業務支援システム1を実行するコンピューターのシステム構成例を示す図である。 設計図面における(A)凡例表、(B)姿図の一部を例示する図である。 説明のための簡略化した3種の記号を示す図である。 本発明の実施形態に係る積算業務支援システム1における記号抽出処理のフローチャートを示す図である。 本発明の実施形態に係る積算業務支援システム1における相関係数関数算出・記憶処理サブルーチンのフローチャートを示す図である。 基準ドットを有するw×hドットの記号ドットパターンと、スキャン対象範囲であるW×Hドットの設計図面本図(平面図)を示す図である。 相関係数の算出の処理を模式的に説明する図である。 種々の記号に対する相関係数の算出の処理を模式的に説明する図である。 本発明の実施形態に係る積算業務支援システム1における第1抽出処理サブルーチンのフローチャートを示す図である。 図3に示した3種の記号に対する相関係数の値の推移を示す図である。 本発明の実施形態に係る積算業務支援システム1における第2抽出処理サブルーチンのフローチャートを示す図である。 最大値関数c(x,y)と、最大値関数c(x,y)の極大値を与える記号とを説明する図である。 マッチング元パターンとして、向きの異なる記号の自動生成について説明する図である。 本発明の実施形態に係る積算業務支援システム1における品名認識処理のフローチャートを示す図である。 編集距離が近い正解テキストが複数ある場合を示す図である。 代表文字による置換処理と、編集距離算出とによる判定を説明する図である。 建物の設計図面の一例を示す図であり、(A)は平面図を、(B)は凡例表を示している。 建物の設計図面の一例を示す図であり、(A)は平面図を、(B)は姿図を示している。
以下、本発明の実施の形態を図面を参照しつつ説明する。図1は本発明の実施形態に係る積算業務支援システムのプラグラムを実行させるコンピューターのシステム構成例を示す図である。
図1において、10はシステムバス、11はCPU(Central Processing Unit)、12はRAM(Random Access Memory)、13はROM(Read Only Memory)、14は外部情報機器との通信を司る通信制御部、15はキーボードコントローラなどの入力制御部、16は出力制御部、17は外部記憶装置制御部、18はキーボード、ポインティングデバイス、マウスなどの入力機器からなる入力部、19は印刷装置などの出力部、20はHDD(Hard Disk Drive)等の外部記憶装置、21はグラフィック制御部、22はディスプレイ装置をそれぞれ示している。
図1において、CPU11は、ROM13内のプログラム用ROM、或いは、大容量の外部記憶装置20に記憶されたプログラム等に応じて、外部機器と通信することでデータを検索・取得したり、また、図形、イメージ、文字、表等が混在した出力データの処理を実行したり、更に、外部記憶装置20に格納されているデータベースの管理を実行したり、などといった演算処理を行うものである。
また、CPU11は、システムバス10に接続される各デバイスを統括的に制御する。ROM13内のプログラム用ROMあるいは外部記憶装置20には、CPU11の制御用の基本プログラムであるオペレーティングシステムプログラム(以下OS)等が記憶されている。また、ROM13あるいは外部記憶装置20には出力データ処理等を行う際に使用される各種データが記憶されている。メインメモリーであるRAM12は、CPU11の主メモリ、ワークエリア等として機能する。
入力制御部15は、キーボードや不図示のポインティングデバイスからの入力部18を制御する。また、出力制御部16は、プリンタなどの出力部19の出力制御を行う。
外部記憶装置制御部17は、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザーファイル、編集ファイル、プリンタドライバ等を記憶するHDD(Hard Disk Drive)や、或いはソリッドステートドライブ(SSD)等の外部記憶装置20へのアクセスを制御する。本発明の積算業務支援システムを実現するシステムプログラムは、上記のような外部記憶装置20に記憶されている。また、グラフィック制御部21は、ディスプレイ装置22に表示する情報を描画処理するための構成である。
また、通信制御部14は、ネットワークを介して、外部機器と通信を制御するものであり、これによりシステムが必要とするデータを、インターネットやイントラネット上の外部機器が保有するデータベースから取得したり、外部機器に情報を送信したりすることができるように構成される。
また、外部記憶装置20には、CPU11の制御プログラムであるオペレーティングシステムプログラム(以下OS)以外に、本発明の積算業務支援システム1をCPU11上で動作させるシステムプログラム、及びこのシステムプログラムで用いるデータなどがインストールされ保存・記憶されている。また、本発明の外部記憶装置20には、表計算処理を実行するExcel(商標)などのスプレッドシートソフトウエアがインストールされ、本発明の積算業務支援システム1と連動可能に動作するようにプログラムされている。
本発明の積算業務支援システム1を実現するシステムプログラムで利用されるデータとしては、基本的には外部記憶装置20に保存されていることが想定されているが、場合によっては、これらのデータを、通信制御部14を介してインターネットやイントラネット上の外部機器から取得するように構成することも可能である。また、本発明の積算業務支援システム1を実現するシステムプログラムで利用されるデータを、USBメモリやCD、DVDなどの各種メディアから取得するように構成することもできる。本発明に係る積算業務支援システムは、以上のように構成されるコンピューターでプログラムが実行されることで実現される。
以下、本実施形態では、電気器具の記号、品名や個数などを設計図面から拾い上げて抽出する例に基づいて説明を行う。また、設計図面のイメージデータは、凡例表や、平面図(本図)や姿図とからなり、これら図面や表から電気器具のシンボルマークとしての記号やテキストデータを抽出する例で、以下の説明を行うが、本発明で用い得るデータが、凡例表や、平面図(本図)や姿図とからなる組み合わせに限定されるものでもない。
発明者らは、顧客から提供される建物の設計図面から、電気器具の品名や個数などを抽出し(拾い出し)、これらを積算することで、電気工事費用を算出する業務を行っている。ここで、顧客から提供される前記設計図面は、CADデータ等によるものではなく、イメージデータであり、従来の電気工事費用の算出業務においては、イメージデータに基づいた照明器具の拾い出しを行っており、実質的に人手による作業となっていた。
そこで、本発明に係る積算業務支援システム1においては、顧客から提供される設計図面のイメージデータから、電気工事費用の積算に必要な電気器具の記号や、テキストトデータを抽出しようとするものである。
図2は設計図面における(A)凡例表、(B)姿図の一部を例示する図である。図2(A)の凡例表においては、電気器具のシンボルマークとしての「記号」と、当該記号に対応して「名称」が定義されている。設計図面からの積算作業においては、設計図面の本図の中から、このような記号を抽出することが必要となる。しかしながら、これまで、凡例表中に定義されている複数の記号を、イメージデータの設計図面本図の中で、コンピューターマッチングを行い、効率的に抽出する技術については知られていなかった。(課題1)
また、図2(B)の姿図においては、「品名」などが記述されている。このような姿図や設計図面中からは、OCRなどの文字認識技術により、テキストデータに変換されるが、この際しばしば変換ミスが発生してしまう。しかしながら、従来このような変換ミスを修正するためには人に頼るしかなく、自動でこれを効率的に修正する技術が求められていた。(課題2)
なお、姿図においては、斜視図が含まれることに図面としての特徴を有するものであるが、本発明においては姿図における品名のテキストデータに着目しているところ、図2(B)では斜視図等を省略している。
以下、これらの課題1及び課題2を、本発明に係る積算業務支援システム1及び積算業務支援プログラムによって解決する具体的な方法について説明する。
まず、「記号」を、設計図面の本図からマッチング処理によって抽出する技術について説明する。図3は説明のための簡略化した3種の記号を示す図である。このような記号は、コンピューターにおけるドット単位の座標でみて水平方向にwドット、垂直方向にhドットのマトリクスを有するものとする。なお、設計図面の本図においてマッチング対象となる記号も、同様に水平方向にwドット、垂直方向にhドットのマトリクスを有している。また、図3に示す記号、設計図面の本図中の記号は2値で構成されている。
水平方向のwドット、垂直方向のhドットの左上隅にのドットを基準ドットとして定義する。図3に示すような記号のドットパターンを、設計図面の本図でマッチング処理を行い抽出する際には、この基準ドットと共に記号のドットパターンを1ドットずつ移動させつつ、本図中のドットパターンとの相関係数をとっていく。そして、相関係数が所定の閾値より高い箇所には、記号が存在するものとして扱うようにする。これにより、本図中から記号を抽出することが可能となる。
ただし、設計図面の本図においては、電気器具の記号のパターンに、建築図の線などが重なっていたり、或いは、そもそも電気器具の記号同士に類似しているものが存在していたりして、判定が困難となる状況があるので、これに対応するために、本発明においては最大値関数という概念を導入して、このような最大値関数に極大値を与えるような記号を抽出するところに本発明の大きな特徴点がある。
さて、以上を踏まえて、次に設計図面の本図から記号を抽出する際のアルゴリズムの一例を説明する。図4は本発明の実施形態に係る積算業務支援システム1における記号抽出処理のフローチャートを示す図である。
図4において、ステップS100で記号抽出処理が開始されると、続いて、ステップS101に進み、相関係数関数算出・記憶処理のサブルーチンが実行される。このようなサブルーチンについて図5を参照して説明する。なお、このようなサブルーチンは、抽出しようとする全ての記号(本例では図3の(A)乃至(C)の3種類の記号)について実行される。
図5で、ステップS200で、相関係数関数算出・記憶処理サブルーチンが開始されると、ステップS201に進み、対象とする記号の基準ドットパターンの座標を初期座標に設定する。このような初期座標としては、設計図面の本図の、例えば左上隅のドット座標が選択される。初期座標から、最終座標まで1ドットずつ隙間なくスキャンすることができればどのような座標をとっても構わない。
図6は左上隅に基準ドットを有するw×hドットの記号ドットパターンと、スキャン対象範囲であるW×Hドットの設計図面本図(平面図)を示す図である。図6において、水平右方向にx座標を、垂直下方向にy座標を定義する。基本的に、w×hドットの記号ドットパターンは、初期座標(1,1)から順次x座標方向に、設計図面本図(平面図)をスキャンしつつ相関係数を算出していく。右端部(W―w,1)にまで到達すると、次にy座標を+1とし(1,2)から順次x座標方向に、設計図面本図(平面図)をスキャンしつつ相関係数を算出していく。以下同様に、このような工程を繰り返して、記号ドットパターンにより設計図面本図(平面図)をスキャンしつつ相関係数を求めていく。
ステップS202では、記号のドットパターンと、このドットパターンと重なっている本図のドットパターンとの間の相関係数を算出して記憶する。
ステップS203では、設計図面の全ての領域(スキャン対象範囲)について相関係数が算出・記憶された否かが判定される。(すなわち、(W-w,H-h)まで基準ドットが到達したか否かが判定される。)当該判定がNOであれば、ステップS204に進み、基準ドットパターンの座標を1ドット分ずらして、再びステップS202を実行する。一方、当該判定がYESであると、ステップS205に進み、元のルーチンにリターンする。
図7は相関係数の算出の処理を模式的に説明する図である。図7において、斜線の記号は設計図面の本図中の記号を示している。また、x座標を水平方向に右側に進むに連れて座標値が増大する座標として定義し、y座標を垂直方向に下側に進むに連れて座標値が増大する座標として定義している。
また、R1を図3(A)に示す記号のドットパターンと本図のドットパターンとの間の相関係数と定義し、R2を図3(B)に示す記号のドットパターンと本図のドットパターンとの間の相関係数と定義し、R3を図3(C)に示す記号のドットパターンと本図のドットパターンとの間の相関係数と定義する。
図7においては、(A)→(B)→(C)→(D)の順で、相関係数算出・記憶処理サブルーチンにおけるステップが進んでいる様子を示している。図7から分かるように、記号のドットパターンと本図のドットパターンと重なり具合によって、それらの間の相関係数の値が変化する。なお、相関係数の最大値は1である。例えば、図7(A)→(B)→(C)→(D)の順で、相関係数R1は0、0.16、0.98、0.30のように推移する。
また、図8は、図3の(A)乃至(C)の3種類の記号に対する相関係数の算出の処理を模式的に説明する図である。本実施形態においては、相関係数算出・記憶処理のサブルーチンで、図3の(A)乃至(C)の3種類の記号の全てについて、図8に示すような形でそれぞれ相関係数が求められていく。
ステップS205においては、上記のように算出した相関係数に基づいて記号ごとの相関係数関数Rn(x,y)を求め(本例では、n=1,2,3)ておき、これを記憶部に記憶する。ステップS206で元のルーチンにリターンする。
さて、以上のように相関係数関数算出・記憶処理のサブルーチンが実行され、図4に示す元のルーチンに戻りステップS102に進むと、続いて、図9に示す第1抽出処理サブルーチンが実行される。
ステップS300で第1抽出処理のサブルーチンが開始されると、続いて、ステップS301に進み、図5のサブルーチンで算出された相関係数関数を取得する。
続く、ステップS302では、算出された相関係数関数が所定の閾値を超える記号であり(条件1とする)、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない(条件2とする)かが判定される。
図10は、図3に示した3種の記号のドットパターンと、図8の本図ドットパターンとの相関係数の値の推移を示す図である。図10において、横軸はx座標を示しており、縦軸はそれぞれの相関係数Rの値を示している。ここで、Rthが先の所定の閾値であるものとする。上記の条件1に該当する記号は、図10に示す図において、閾値Rthを超えた記号であり、本例では図3(A)に示す「△」が該当する。
次に条件2について検討する。2つの記号同士の矩形状のドットパターンが重なっていなければ、それぞれの記号を独立的に相関係数の値を比較することができる。一方、2つの記号同士の矩形状のドットパターン(w×hのパターン)が重なってしまう場合(この場合を2つの記号同士が「近傍」にあると称する)には、両方が閾値Rthを超えてしまうようなことがあり得る。この場合には、精度の高いマッチングができなくなってしまうので、本発明においては、条件2を条件1とのアンド条件とすることで、誤判定を避けるようにしている。
さて、上記の条件1、かつ、条件2を満たしステップS302における判定がYESであると、ステップS303に進み、着目している当該記号についてはマッチングした正解として抽出を行う。
一方、先のステップS302における判定がNOであると、ステップS303に進み、着目している当該記号については、とりあえず未確定の記号として処理を行う。
ステップS305に進むと元のルーチンにリターンして、図4のフローチャートに戻る。図4のフローチャートにおいて、ステップS103では、対象となっている本図のドットパターンにおいて、未確定の記号が存在するか否かが判定される。
ここで、未確定の記号が存在せず、ステップS103の判定がNOであれば、ステップS105に進み、記号抽出処理は終了となる。
一方、未確定の記号が存在し、ステップS103の判定がYESとなると、続いてステップS104に進み、第2抽出処理サブルーチンが実行される。この第2抽出処理サブルーチンを、図11を参照して説明する。
図11において第2抽出処理サブルーチンが開始されると、ステップS401に進み、最大値関数の算出が実行される。ここで、図12を参照して最大値関数c(x,y)についての説明を行う。図12は最大値関数c(x,y)と、最大値関数c(x,y)の極大値を与える記号とを説明する図である。なお、図12においては(x,y)を1次元的に簡略的に図示している。
最大値関数c(x,y)は、指定範囲において、全ての記号に対する相関係数関数の最大値を与えるもとして定義する。ここで、指定範囲は(x,y)を基準として、―εの範囲から+εの範囲とする。また、εは、0<ε/w<1、かつ0<ε/h<1の値を満たす正の整数である。
このような最大値関数c(x,y)は、記憶されている各記号の相関係数関数より求めることができる。
さて、上記のようにステップS401で最大値関数c(x,y)を算出した後には、続いて、ステップS402に進み、未確定記号のうち、最大値関数c(x,y)に対して極大値を与えるものがあるか否かを判定する。
ステップS402における判定がYESであるとき、ステップS404に進み、極大値を与える当該記号を正解として抽出する。
一方、ステップS402における判定がNOであるとき、ステップS404に進み、正解の抽出に失敗したエラーとして処理する。
ステップS405では、リターンして元のフローチャートに戻る。また、元のフローチャートにおいても、ステップS105に進み処理を終了する。
以上のように、本発明に係る積算業務支援システム1及び積算業務支援プログラムは、算出された相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出するので、このような本発明に係る積算業務支援システム1及び積算業務支援プログラムによれば、凡例表中に定義されている複数の記号と同様の記号を、イメージデータの設計図面本図の中から、コンピューターマッチングを行い、効率的に抽出することが可能となる。
また、本発明に係る積算業務支援システム1及び積算業務支援プログラムでは、相関係数関数のみでは、的確な抽出を行い得ないときには、最大値関数c(x,y)に基づいて記号の抽出処理を行うので、より確度の高い抽出処理を行うことができる。
なお、図3(A)(図13(A)に同じ)の記号「△」は、当該記号に加え、90°右に回転させた図13(B)に示す記号、及び、それをさらに90°右に回転させた図13(C)に示す記号、及び、それをさらに90°右に回転させた図13(D)に示す記号の全てのパターンを、マッチングさせる元の記号としておくことが好ましい。設計図面の本図のイメージデータでは、先の記号「△」が、どのような向きで配置されているか分からないからである。図13(A)のパターンから、図13(B)乃至(D)までのマッチングパターンを自動で生成するようにしておくと利便性が高い。
次に、課題2を本発明に係る積算業務支援システム1及び積算業務支援プログラムによって解決する具体的な方法について説明する。なお、課題2は、従来の文字認識技術による変換ミスを、自動的・効率的に修正する技術が確立されていない、というものであった。
以下、図2(B)に類する姿図における「品名」を読み取る例に基づいて説明を行う。また、図2(B)における品名「AdOI(エー ディー オー アイ)」、「AcOx(エー シー オー エックス)」、「AeOy(エー イー オー ワイ)」については正解のテキストデータであるものとして説明すると共に、このような正解テキストデータについてはシステムやプログラム側に予め記憶させてあることを前提に説明する。
図14は本発明の実施形態に係る積算業務支援システム1における品名認識処理のフローチャートを示す図である。なお、本例ではアルゴリズムを「品名認識処理」と称しているが、本発明では認識処理を行い得る対象は姿図の品名に限定されるものではない。
図14において、ステップS500で、品名認識処理のフローチャートが開始されると、続いて、ステップS501に進み、対象となる姿図の品名の欄を文字認識技術に基づいてテキストに変換する。なお、読み取る姿図の具体例についてはここでは特に示さない。また、読み取ったデータをテキストデータに変換する文字認識技術は従来周知のものを適宜利用することができる。
続く、ステップS502では、ステップS501で変換されたテキストと、正解テキスト(図2(B)の一覧)とを比較する。
ステップS503では、正解テキストの一覧の中に一致するものが存在するか否かが判定される。ステップS503における判定がYESである場合には、ステップS507に進み、変換されたテキストを、修正することなくそのまま正解として、ステップS513に進み、品名認識処理を終了する。
一方、ステップS503における判定がNOである場合には、ステップS504に進み、変換されたテキストと、正解テキストとの間の編集距離を算出する。
ここで、ある文字列を別の文字列に変換する際、1文字の挿入・削除・置換のいずれかの処理を1回としてカウントするとき、編集距離は、ある文字列を別の文字列に変換するまでに何回の当該処理で変換を行えるかの(最小の)回数として定義することができる。このような編集距離が短い方が、二つの文字列がより近いことを示す。
続く、ステップS505では、編集距離が最も近い正解テキストが1つのみあるか否かが判定される。ステップS505における判定がYESであるときには、ステップS506に進み、文字認識により変換されたテキストは、正解テキストに修正する。すなわち、本ステップで自動修正を行ってしまう。
一方、ステップS505における判定がNOであるとき、すなわち、編集距離が近い正解テキストが複数ある場合については、続いてステップS508に進む。
図15は編集距離が近い正解テキストが複数ある場合を示す図である。ステップS505では、「AdOI(エー ディー オー アイ)」、「AcOx(エー シー オー エックス)」、「AeOy(エー イー オー ワイ)」の正解テキストに対する、読み取りにより得られた変換されたテキストである「ABOl(エー ビィー オー エル)」の編集距離が検討される。変換されたテキストの文字列「ABOl」から、正解テキストの文字列(「AdOI」、「AcOx」、「AeOy」)までの編集距離はいずれも2である。
図15に示すような場合には、ステップS508では、類似文字を代表文字に置換する。ここでは、仮に0(ゼロ)がO(オー)の代表文字であり、1(イチ)がI(アイ)、l(エル)の代表文字であるものと予め定義されていると仮定する。図15の例では、変換されたテキストの文字列「ABOl」は図16に示すようにステップS508の処理で、「AB01(エー ビィー ゼロ イチ)」へと置換処理される。
ステップS508では、正解テキストについても、類似文字を代表文字に置換する処理が実行される。正解テキスト「AdOI」、「AcOx」、「AeOy」は、本ステップの置換処理によってそれぞれ「Ad01(エー ディー ゼロ イチ)」、「Ac0x(エー シー ゼロ エックス)」、「Ae0y(エー イー ゼロ ワイ)」とされる。
続いて、ステップS509に進み、置換処理された変換テキスト(「AB01」)と、置換処理された正解テキスト(「Ad01」、「Ac0x」、「Ae0y」)との間の編集距離を算出する。図16に示すように、置換された変換テキスト「AB01」から置換された正解テキスト「Ac0x」、「Ae0y」までの編集距離は2である。一方、置換された変換テキスト「AB01」から置換された正解テキスト「Ad01」までの編集距離は1である。(後者が、ステップS510における1つのみの組み合わせとなる)
続く、ステップS510においては、編集距離がより短い組み合わせが1つのみあるか否かが判定される。当該判定結果がNOであれば、いずれが正解であるかを決定することができないものとして、ステップS512に進み、エラーの処理がなされる。
一方、ステップS510の判定結果がYESであるときには、ステップS511に進み、変換されたテキストを、正解テキストに修正する、所謂自動修正を行う。図16は、ステップS510に進む例を示している。本ステップによれば、変換されたテキストの文字列「ABOl」は、自動修正により正解テキスト「AdOI」に修正される。
ステップS513では、品名認識処理を終了する。これまで説明したように、編集距離による処理と、さらに必要に応じて、代表文字への置換処理の双方を利用することで、文字認識によって誤変換されたテキストを、自動修正できる確率を高めることが可能となる。
以上のように、本発明に係る積算業務支援システム1及び積算業務支援プログラムは、変換されたテキストと、姿図に記載された品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正するので、このような本発明に係る積算業務支援システム1及び積算業務支援プログラムによれば、文字認識技術により誤変換されたテキストデータを効率的に修正することが可能となる。
1・・・積算業務支援システム
10・・・システムバス
11・・・CPU(Central Processing Unit)
12・・・RAM(Random Access Memory)
13・・・ROM(Read Only Memory)
14・・・通信制御部
15・・・入力制御部
16・・・出力制御部
17・・・外部記憶装置制御部
18・・・入力部
19・・・出力部
20・・・外部記憶装置
21・・・グラフィック制御部
22・・・ディスプレイ装置

Claims (2)

  1. イメージデータよりなる設計図面から、設計図面における電気器具に係る複数の記号パターンの抽出を行うと共に、設計図面における品名を認識する積算業務支援システムであって、
    所定の矩形状領域で、複数の記号の矩形状ドットパターンを記憶する工程と、
    複数の記号のそれぞれの矩形状ドットパターンを1ドットずつずらしながら設計図面との比較を行い、相関係数を算出し、それぞれの記号に対する相関係数関数を求める工程と、
    求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出する工程と、
    指定範囲において、全ての記号に対する相関係数関数の最大値を与える最大値関数を算出する工程と、
    最大値関数における極大値を与える記号を正解として抽出する工程と、
    設計図面における品名を文字認識技術に基づいてテキストに変換する工程と、
    変換されたテキストと、品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正する工程と、
    変換されたテキストと、品名の正解テキストとが一致しない場合で、編集距離が最も近い正解テキストが複数存在するとき、
    変換されたテキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、
    正解テキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、
    置換処理済みの変換されたテキストと、置換処理済みの正解テキストとの間の編集距離を算出する工程と、
    編集距離がより短い変換されたテキストを、正解テキストに修正する工程と、
    が実行されることを特徴とする積算業務支援システム。
  2. イメージデータよりなる設計図面から、設計図面における電気器具に係る複数の記号パターンの抽出を行う処理と共に、設計図面における品名を認識する処理をコンピューターに実行させる積算業務支援プログラムであって、
    所定の矩形状領域で、複数の記号の矩形状ドットパターンを記憶する工程と、
    複数の記号のそれぞれの矩形状ドットパターンを1ドットずつずらしながら設計図面との比較を行い、相関係数を算出し、それぞれの記号に対する相関係数関数を求める工程と、
    求められた相関係数関数が所定の閾値を超える記号であり、かつ、近傍に相関係数関数が所定の閾値を超える記号は存在しない記号を正解として抽出する工程と、
    指定範囲において、全ての記号に対する相関係数関数の最大値を与える最大値関数を算出する工程と、
    最大値関数における極大値を与える記号を正解として抽出する工程と、
    設計図面における品名を文字認識技術に基づいてテキストに変換する工程と、
    変換されたテキストと、品名の正解テキストとが一致しない場合、変換されたテキストを、編集距離が最も近い正解テキストに修正する工程と、
    変換されたテキストと、品名の正解テキストとが一致しない場合で、編集距離が最も近い正解テキストが複数存在するとき、
    変換されたテキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、
    正解テキストのうち、類似文字を有するものについては類似文字を代表文字に置換処理する工程と、
    置換処理済みの変換されたテキストと、置換処理済みの正解テキストとの間の編集距離を算出する工程と、
    編集距離がより短い変換されたテキストを、正解テキストに修正する工程と、
    をコンピューターに実行させることを特徴とする積算業務支援プログラム。
JP2019084487A 2019-04-25 2019-04-25 積算業務支援システム及び積算業務支援プログラム Active JP7254606B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019084487A JP7254606B2 (ja) 2019-04-25 2019-04-25 積算業務支援システム及び積算業務支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019084487A JP7254606B2 (ja) 2019-04-25 2019-04-25 積算業務支援システム及び積算業務支援プログラム

Publications (2)

Publication Number Publication Date
JP2020181405A JP2020181405A (ja) 2020-11-05
JP7254606B2 true JP7254606B2 (ja) 2023-04-10

Family

ID=73024135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019084487A Active JP7254606B2 (ja) 2019-04-25 2019-04-25 積算業務支援システム及び積算業務支援プログラム

Country Status (1)

Country Link
JP (1) JP7254606B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102638388B1 (ko) * 2021-06-03 2024-02-19 고려대학교 산학협력단 객체 인식 시스템, 객체 인식 방법 및 객체 인식 방법을 실행시키도록 기록매체에 저장된 컴퓨터 프로그램

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001307021A (ja) 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> パターン列抽出方法およびナンバープレート認識方法
JP2004234424A (ja) 2003-01-31 2004-08-19 Hitachi Ltd 図面認識方法及びその装置
JP2015191620A (ja) 2014-03-28 2015-11-02 富士重工業株式会社 車外環境認識装置
JP2018523188A (ja) 2015-08-16 2018-08-16 グーグル エルエルシー 抽出されたユーザ名と記憶されたユーザデータとの比較

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001307021A (ja) 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> パターン列抽出方法およびナンバープレート認識方法
JP2004234424A (ja) 2003-01-31 2004-08-19 Hitachi Ltd 図面認識方法及びその装置
JP2015191620A (ja) 2014-03-28 2015-11-02 富士重工業株式会社 車外環境認識装置
JP2018523188A (ja) 2015-08-16 2018-08-16 グーグル エルエルシー 抽出されたユーザ名と記憶されたユーザデータとの比較

Also Published As

Publication number Publication date
JP2020181405A (ja) 2020-11-05

Similar Documents

Publication Publication Date Title
CN114641753A (zh) 使用机器学***面图图纸进行合成数据生成和建筑信息模型(bim)要素提取
US10346681B2 (en) Method and computing device for optically recognizing mathematical expressions
JP6831951B2 (ja) 画像認識システム
JP7254606B2 (ja) 積算業務支援システム及び積算業務支援プログラム
JP2017515222A (ja) ライン・セグメント化方法
CN113420848A (zh) 神经网络模型的训练方法及装置、手势识别的方法及装置
JP5094682B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN111368915A (zh) 一种图纸校对方法、装置、设备及存储介质
JP2013229011A (ja) 帳票識別装置および帳票識別方法
JP7272037B2 (ja) 情報処理装置及びプログラム
JP5147640B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP7096033B2 (ja) 建築物抽出システム
JP2007316950A (ja) 画像処理方法及び装置及びプログラム
JP6790886B2 (ja) 情報処理プログラム、情報処理方法および情報処理装置
WO2022180705A1 (ja) 情報取得装置、情報取得方法及び情報取得プログラム
JP2015184815A (ja) 帳票定義作成装置、帳票定義作成方法、および、プログラム
Vassiliou et al. On a test for trends in piecewise monotonic data approximation method
KR101761140B1 (ko) 이미지 도면화 방법
JP2020107272A (ja) 情報処理装置、情報処理方法、及びプログラム
JP4648084B2 (ja) 記号認識方法及び装置
US7623714B2 (en) Form recognition system, method, program, and storage medium
JP2022191790A (ja) 異常検出装置、異常検出方法、および異常検出プログラム
TWI571753B (zh) 用於產生一影像之一互動索引碼圖之電子計算裝置、其方法及其電腦程式產品
US20180211366A1 (en) Flattening and Rectifying A Curved Image
JP7413445B2 (ja) 一組の部品を表す複数の図面データを管理するための装置、方法及びそのためのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211101

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230329

R150 Certificate of patent or registration of utility model

Ref document number: 7254606

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150