JP2013218424A - 翻訳装置および翻訳方法 - Google Patents

翻訳装置および翻訳方法 Download PDF

Info

Publication number
JP2013218424A
JP2013218424A JP2012086653A JP2012086653A JP2013218424A JP 2013218424 A JP2013218424 A JP 2013218424A JP 2012086653 A JP2012086653 A JP 2012086653A JP 2012086653 A JP2012086653 A JP 2012086653A JP 2013218424 A JP2013218424 A JP 2013218424A
Authority
JP
Japan
Prior art keywords
information
translation
manufacturing information
manufacturing
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012086653A
Other languages
English (en)
Inventor
Kotaro Ishida
浩太郎 石田
Masanobu Ishii
政信 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZERO FOUR CO Ltd
Original Assignee
ZERO FOUR CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZERO FOUR CO Ltd filed Critical ZERO FOUR CO Ltd
Priority to JP2012086653A priority Critical patent/JP2013218424A/ja
Priority to PCT/JP2013/060045 priority patent/WO2013151031A1/ja
Publication of JP2013218424A publication Critical patent/JP2013218424A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】製造情報が付与された設計図を翻訳するための翻訳装置、および翻訳方法を提供すること。
【解決手段】製造情報が記載された設計図を翻訳するための翻訳装置100は、設計図を取得する入力部102と、取得された設計図内のセルを認識するセル認識部104と、セル認識部104が認識したセルの情報に基づいて、製造情報の属性を識別する製造情報識別部105と、製造情報の属性に基づいて、製造情報を翻訳する翻訳部106と、翻訳部が翻訳した翻訳設計図を出力する出力手段107とを備える。
【選択図】図1

Description

本発明は、文字情報が付与された設計図を翻訳するための翻訳装置、および翻訳方法に関する。
近年の経済のグローバル化に伴い、製造業においても、複数の国の工場、人材を用いて製品を製造することが通常に行われるようになった。例えば、日本において部品の設計図を作成し、該設計図に基づき、中国等の外国で部品の製造を行うといったことである。
このような部品の設計図に記載される情報は、部品の図面だけでは不十分である。例えば、部品の設計図には、部品の名称、部品の材質、板厚等の素材情報、部品中のタップ指示、バリ取り、接着等の加工情報、注文先や発注先の名称、部署、注文の日付、納期等の注文情報、さらに、部品や材料、塗装やメッキなどの表面処理、熱処理等の規格情報(例えば、日本工業規格のJIS規格番号、アメリカ規格協会のANSI、中国国家標準のGB規格等)等の製造情報が含まれている必要がある。
しかしながら、これらの情報は、通常、各国の言語、規格で設計図中に記載されるものである。よって、例えば、日本の設計者が作成した設計図には、日本語で上記情報が記載されている。その結果、中国等の他国の製造者は、日本語で記載されたこれらの情報を、その国の言語、規格に翻訳しなければ部品を製造できない。
このような事情から、複数の国の工場、人材を用いて製品を製造する場合、複数の言語を理解している翻訳者が、設計図毎に、翻訳作業を行う必要があった。そのため、製品製造における工程が増え、結果として製造リードタイムおよび製造コストが増大するという問題があった。また、設計図の翻訳作業は、翻訳者の翻訳レベルに依存するので、翻訳者によって、翻訳された図面の可読性が異なることや、翻訳ミスが発生するという問題があった。
例えば、特許文献1は、FAX等で受信される画像ファイルの画像情報をOCR(Optical Character Recognition)で読み込み、画像情報に含まれる文字情報をテキスト化すると同時に、該テキストを別の言語に翻訳する機能を有する受信文書翻訳システムを開示している。
しかしながら、このような受信文書翻訳システムでは、受信した画像情報に含まれる文字情報を、単純に別の言語の文字に置き換えることができても、その文字情報が部品の材料名を表しているのか、規格を表しているのかを識別することができなかった。そのため、例えば、日本語で記載されたこれらの情報を、別の国の言語、規格に正確に翻訳することができない場合があった。
また、設計図中に用いられる上記情報は、独特の表現で記載されていることが多く、通常の翻訳機能では、正確に翻訳することができない場合が多い。そのため、情報の正確さが重要な設計図の翻訳には、特許文献1が開示しているような翻訳システムを用いることができないという問題があった。
特開2009−246807号公報
本発明の目的は、製造情報が付与された設計図を翻訳するための翻訳装置、および翻訳方法を提供することにある。
このような目的は、下記の本発明により達成される。
本発明の翻訳装置は、製造情報が記載された設計図を翻訳するための翻訳装置であって、
前記設計図を取得する入力部と、
取得された前記設計図内のセルを認識するセル認識部と、
前記セル認識部が認識した前記セルの情報に基づいて、前記製造情報の属性を識別する製造情報識別部と、
前記製造情報の前記属性に基づいて、前記製造情報を翻訳する翻訳部と、
前記翻訳部が翻訳した翻訳設計図を出力する出力手段とを備えることを特徴とする。
これにより、設計図内のセルの情報に基づいて、設計図に記載された製造情報の属性(製品名、材料名、規格番号等)を識別することができる。そのため、設計図に記載された製造情報の属性に基づいて、製造情報を正確に翻訳することができ、可読性の高い翻訳設計図を出力する翻訳装置を得ることができる。
本発明の翻訳装置においては、
前記セル認識部は、前記設計図中に記載された水平線と垂直線とを抽出することにより、前記セルを認識することが好ましい。
これにより、設計図ごとにセルの位置、数、サイズ等が異なっている場合であっても、正確にセルを認識し、セルの位置、数、サイズ等の情報を取得することができる。
本発明の翻訳装置においては、
前記製造情報識別部は、
前記設計図内に属性項目が存在するかを検索し、
前記属性項目が記載されている第1のセルを特定し、
前記第1のセル内に前記属性項目以外の前記製造情報が記載されている場合には、前記属性項目に基づいて、前記製造情報の前記属性を識別することが好ましい。
これにより、第1のセルに記載されている属性項目に基づいて、製造情報の属性を、正確に識別することができる。
本発明の翻訳装置においては、
前記製造情報識別部は、
前記設計図内に属性項目が存在するかを検索し、
前記属性項目が記載されている第1のセルを特定し、
前記第1のセルと所定の関係にある第2のセル内に、前記製造情報が記載されているかを判定し、
前記第2のセル内に前記製造情報が記載されている場合には、前記属性項目に基づいて、前記製造情報の前記属性を識別することが好ましい。
これにより、属性項目と製造情報が第1のセルに記載されていない場合であっても、製造情報の属性を、正確に識別することができる。
本発明の翻訳装置においては、
前記製造情報識別部は、前記設計図内に前記属性項目および前記属性項目の同義語が存在するかを検索し、
前記属性項目または前記同義語が記載されているセルを前記第1のセルとして特定し、
前記同義語に基づいて、前記製造情報の前記属性を識別することが好ましい。
これにより、属性項目が同義語で記載されている場合であっても、製造情報の属性を正確に識別することができる。
本発明の翻訳装置においては、
前記製造情報には、寸法線と該寸法線に関連付けられた寸法情報が含まれ、
前記製造情報識別部は、前記寸法線と前記寸法情報を識別し、
前記翻訳部は、前記製造情報識別部が識別した前記寸法情報を翻訳することが好ましい。
これにより、設計図に記載された寸法線と寸法情報を識別することができる。そのため、寸法値、加工指定等の寸法情報を翻訳することができる。
本発明の翻訳装置においては、
前記製造情報識別部は、第1の線分の端点に任意の角度で接続する線分が2本以上存在する場合には、前記第1の線分を前記寸法線として識別することが好ましい。
これにより、設計図に記載された線分が、部品を描画するための線分なのか、寸法線なのかを判別することが可能となる。
本発明の翻訳装置においては、
前記製造情報識別部は、前記寸法線に対して平行、かつ前記寸法線から所定の距離以内に文字列が存在する場合には、前記文字列を前記寸法情報として識別することが好ましい。
これにより、設計図に記載された文字列が寸法情報か否かを判別することができる。そのため、寸法情報に適した翻訳を行うことができ、翻訳設計図の可読性を向上させることができる。
本発明の翻訳装置においては、
前記製造情報には、製造用記号が含まれ、
前記製造情報識別部は、前記製造用記号を識別し、
前記翻訳部は、前記製造情報識別部が識別した前記製造用記号を翻訳することが好ましい。
これにより、設計図中の製造用記号を識別することができ、製造用記号が表す意味を、他の言語または他の国の記号に翻訳することができる。
本発明の翻訳方法は、製造情報が記載された設計図を翻訳するための翻訳装置を用いた翻訳方法であって、
前記翻訳装置の入力部を用いて、前記設計図を取得する工程と、
前記翻訳装置のセル認識部を用いて、取得された前記設計図内のセルを認識する工程と、
前記翻訳装置の製造情報識別部を用いて、前記セル認識部が認識した前記セルの情報に基づいて、前記製造情報の属性を識別する工程と、
前記翻訳装置の翻訳部を用いて、前記製造情報の前記属性に基づいて、前記製造情報を翻訳する工程と、
前記翻訳装置の出力部を用いて、前記翻訳部が翻訳した翻訳設計図を出力する工程とを備えることを特徴とする。
これにより、可読性の高い翻訳設計図を取得することができる。
本発明の実施形態に係る翻訳装置を示したブロック図である。 図1に示す本発明の実施形態に係る翻訳装置が翻訳する設計図の1例を示す図である。 図1に示す本発明の実施形態に係る翻訳装置が行う処理を示すフローチャートである。 セル認識部が実行するセル認識工程を示すフローチャートである。 製造情報識別部が実行する製造情報識別工程を示すフローチャートである。 製造情報識別部が実行する寸法線抽出工程を示すフローチャートである。 製造情報識別部が実行する寸法情報取得工程を示すフローチャートである。 製造情報識別部が実行する記号識別工程の1例を示すフローチャートである。 製造情報DBの属性情報を示す図である。 製造情報DBの製造情報値と、寸法情報と、製造用記号情報を示す図である。 図1に示す本発明の実施形態に係る翻訳装置を用いて、図2に示す設計図を英語に翻訳した1例を示す図である。 図1に示す本発明の実施形態に係る翻訳装置を用いて、図2に示す設計図を中国語に翻訳した1例を示す図である。
以下、本発明の翻訳装置および翻訳方法の好適な実施形態について、添付図面を参照しつつ説明する。
図1は、本発明の実施形態に係る翻訳装置を示したブロック図である。図2は、図1に示す本発明の実施形態に係る翻訳装置が翻訳する設計図の1例を示す図である。図3は、図1に示す本発明の実施形態に係る翻訳装置が行う処理を示すフローチャートである。図4は、セル認識部が実行するセル認識工程を示すフローチャートである。図5は、製造情報識別部が実行する製造情報識別工程を示すフローチャートである。図6は、製造情報識別部が実行する寸法線抽出工程を示すフローチャートである。図7は、製造情報識別部が実行する寸法情報取得工程を示すフローチャートである。図8は、製造情報識別部が実行する記号識別工程の1例を示すフローチャートである。図9は、製造情報DBの属性情報を示す図である。図10は、製造情報DBの製造情報値と、寸法情報と、製造用記号情報を示す図である。図11は、図1に示す本発明の実施形態に係る翻訳装置を用いて、図2に示す設計図を英語に翻訳した1例を示す図である。図12は、図1に示す本発明の実施形態に係る翻訳装置を用いて、図2に示す設計図を中国語に翻訳した1例を示す図である。
図1に示す翻訳装置100は、部品の設計図を翻訳する機能を有する。翻訳装置100は、翻訳装置100の制御を行う制御部101と、設計図10a(図2参照)を取得する入力部102と、設計図10aから文字列情報201(図3参照)および線分情報202(図3参照)を抽出する情報抽出部103と、設計図10a内のセルを認識するセル認識部104と、設計図10aの製造情報の属性を識別する製造情報識別部105と、製造情報を翻訳する翻訳部106と、翻訳設計図10b、c(図11および12参照)を出力する出力部107と、図面情報が記憶されている図面情報DB(Data Base)108と、製造情報DB110とを備えている。これらはデータバス109に接続されており、このデータバス109を介して、各種データや各種指示の授受を行う。
翻訳装置100が翻訳する部品の設計図の1例を、図2に示す。この設計図10aは、板金部品の設計図であるが、本発明は、これに限らない。例えば、切削部品、樹脂部品、プレス部品、溶接部品等の設計図を翻訳する翻訳装置も本発明の範囲内である。
設計図10aのような設計図は、一般的に、部品の正面図、上面図等の6面図、断面図、展開図等の図面を記載する図面用領域11aと、所定の製造情報が記載されるセル領域12aから構成されている。セル領域12aは、複数のセル(水平線と垂直線により定義される略四角形の領域)から構成されており、各セルのサイズや位置は、任意である。
なお、ここでいう製造情報とは、例えば、部品の名称、部品の材質、板厚等の素材情報、部品中のタップ指示、バリ取り、接着等の加工情報、注文先や発注先の名称、部署、注文の日付、納期等の注文情報、図面の縮尺、さらに、部品や材料、塗装やメッキなどの表面処理、熱処理等の規格情報(例えば、日本工業規格のJIS規格番号、アメリカ規格協会のANSI、中国国家標準のGB規格等)等の情報である。製造情報は、必ずしも文字情報には限られず、加工情報を表す製造用記号、図形、寸法を表す寸法線、寸法値等も製造情報に含まれる。ここで、上述のような部品の名称、部品の材質等を製造情報の属性と言う。
上述の素材情報、注文情報、図面の縮尺、企画情報等を属性として有する製造情報は、セル領域12aに記載されることが多い。一方、加工情報を表す製造用記号、図形、寸法線、寸法値等を属性として有する製造情報は、図面用領域11aに記載されることが多い。
セル領域12aに記載される製造情報が、セル領域12aを構成する複数のセルのいずれに記載されるかは、任意である。しかしながら、設計者、設計会社等のユーザーは、それぞれ独自の設計図フォーマットを設定していることが多い。設定された設計図フォーマットに従う限り、所定の属性を有する製造情報は、どのような部品の設計図であっても、所定のルールに従い、定められたセルに記載されることとなる。
例えば、設計図10aのセル領域12aでは、“材質“という文字列が記載されたセルには、”材質”という属性を有する製造情報“SPCC”が記載されている。すなわち、設計図10aの設計図フォーマットに従う限り、“材質“という文字列が記載されたセル内には、常に”材質”という属性を有する製造情報が記載されることとなる。なお、属性を表す文字列を、以下では属性項目1112a、b(図9参照)という。
図1に戻って、翻訳装置100を説明する。制御部101は、翻訳装置100の制御を行う機能を有する。制御部101は、翻訳装置100の各部を制御するための制御プログラムを記憶しているROM(Read Only Memory)と、翻訳装置100で演算されたデータを一時記憶するためのRAM(Randam Access Memory)と、制御プログラムを実行するCPU(Central Processing Unit)とから構成される。CPUによって、制御プログラムが実行されると、制御プログラムに従って、翻訳装置100が制御され、以下に詳述する各種処理が実行される。
入力部102は、設計図10aのような製造情報が付与された設計図を取得する機能を有する。入力部102は、例えば、OCR(Optical Character Reader)のように紙媒体に印刷された設計図10aをスキャンすることによって設計図10aを取得してもよいし、PDFデータ等のデジタルデータを読み込むことによって設計図10aを取得してもよいし、USB(Universal Serial BUS)ポート等を備え、外部のメモリデバイスとインターフェースを取ることにより設計図10aを取得してもよい。
情報抽出部103は、入力部102が取得した設計図10aから、文字列情報201および線分情報202を抽出する機能を有する。文字列情報201と線分情報202の抽出は、例えば、一般的なOCRソフトに設けられているような文字認識機能と、線分認識機能を用いて実行される。文字認識機能および線分認識機能については、当業者であれば、どのようなものか理解できるであろうから、ここでは詳述しない。
セル認識部104は、情報抽出部103が抽出した線分情報202に基づき、設計図10a内のセルを認識する機能を有する。図4を用いて後述するように、セル認識部104は、水平線分と垂直線分の交点を抽出することにより、設計図10aのセルを認識する。
製造情報識別部105は、設計図10aに記載された製造情報の属性を識別する機能を有する。製造情報識別部105は、図5を用いて後述するように、設計図10a内に属性項目1112a、bが記載されている第1のセルを検索する。さらに、製造情報識別部105は、セル情報203に基づいて、製造情報の属性を識別する。これにより、製造情報識別部105は、単に文字の組み合わせから製造情報の属性を識別するよりも、より高い精度で識別することができる。
また、製造情報識別部105は、設計図10aに、属性項目1112a、bが記載されているセルを検索した結果、発見できない場合には、同義語1113a、b(図9参照)が記載されている第1のセルを検索する。これにより、属性項目1112a、bが同義語1113a、bで記載されている場合であっても、製造情報の属性を正確に識別することができる。ここでいう同義語とは、ある用語と、語形が異なるものの、意味は互いによく似ている用語をいう。例えば、日本語である“材質”の同意語は、“材料名”、“材料”、“材質名”等であり、英語である“Material”の同意語は、“Ingredient”、“Source”、“Stuff”等である。
また、製造情報識別部105は、図6を用いて後述するように、製造情報の1つである寸法線および寸法引出線を抽出する機能を有する。さらに、図7を用いて後述するように、寸法線に関連付けられた寸法情報を取得する機能を有する。これにより、設計図10a中に記載された製造情報の属性が、寸法情報であると識別することができる。
また、製造情報識別部105は、図8を用いて後述するように、製造情報の1つである製造用記号を識別する機能を有する。これにより、設計図10a中に記載された製造情報(記号)の属性が、製造用記号と識別することができる。
翻訳部106は、製造情報識別部105が識別した製造情報の属性に基づいて、製造情報を翻訳する機能を有する。後述する製造情報DB110は、製造情報の属性に関連付けられた各国言語の単語、文章等により構成されるライブラリ115を有しており、翻訳部106は、製造情報の属性に基づいて、ライブラリ115から翻訳に適した単語、文章等を検索し、翻訳文を生成する。また、翻訳部106は、生成した製造情報の翻訳文を、設計図10aの製造情報と置き換えることによって、翻訳設計図10bを生成する。これにより、単に文字列を翻訳するよりも、より高い精度で翻訳を実行することができる。そのため、可読性の高い翻訳設計図10bを生成することができる。
また、翻訳部106は、生成した翻訳文のフォントサイズ、文字間隔、改行位置、文字の向き、文字送り方法等を調整することにより、翻訳前の製造情報が記載されていたセル内に翻訳文を収容することができる(翻訳文がセルからはみ出すことを防止することができる)。また、翻訳部106は、翻訳文の文字数、フォントサイズ等を参照して、セルのサイズを変更することにより、セル内に翻訳文を収納してもよい。これらは、同時に実行してもよいし、いずれか一方を実行してもよい。これにより、翻訳文がセルからはみ出すことを防止することができ、可読性の高い翻訳設計図10bを生成することができる。
また、翻訳部106は、複数の言語の翻訳文を用いて翻訳設計図10bを生成してもよい。例えば、英語の翻訳文と中国語の翻訳文とを併記して、翻訳設計図10bを生成してもよいし、一部の製造情報は英語の翻訳文で置き換え、別の製造情報は中国語の翻訳文で置き換えてもよい。これにより、複数の言語で製造情報が記載されている翻訳設計図10bを生成することができる。
出力部107は、翻訳部106が生成した翻訳設計図10bを出力する機能を有する。出力部107は、翻訳設計図10bを紙媒体に印刷して出力してもよいし、PDFデータ等のデジタルデータとして出力してもよいし、USBポート等を備え、外部のメモリデバイスとインターフェースを取ることにより翻訳設計図10bを出力してもよい。
図面設定情報DB108には、設計図10aの設計図フォーマットの情報が記憶されている。この設計図フォーマットの情報は、例えば、属性項目1112a、bが記載された第1のセルから、その属性を有する製造情報が記載された第2のセルは、どこに存在するかというような所定のルールのことである(第1のセルの上、下、左または右に第2のセルが存在する等のルール)。このような情報が図面設定情報DB108に記憶されていることにより、設計図フォーマットの異なる設計図10aが入力されても、設計図フォーマットに合わせて第2のセルを特定することができる。なお、上述の所定のルールは、ユーザーによって定義可能となっており、様々な設計図フォーマットに対応したルールを図面設定情報DB108に記憶することができる。
製造情報DB110には、属性情報111と、製造情報値112と、寸法情報113と、製造用記号情報114と、ライブラリ115が記憶されている。図9に示すように、属性情報111は、属性タグ1111と、属性項目1112a、bと、同義語1113a、bとから構成されている。なお、図9の例では、日本語と英語に対応した属性項目1112a、bおよび同義語1113a、bのみ記載されているが、本発明はこれに限られない。例えば、中国語、韓国語、ドイツ語等の複数の言語に、それぞれ対応した属性項目1112および同義語1113を有していてもよい。
属性タグ1111は、属性が表す意味である。属性項目1112は、属性タグ1111を各国語言語に翻訳した単語である。同義語1113は、属性項目1112を構成する単語の同義語である。
図10(a)に示すように、製造情報値112は、設計図10a中に記載された製造情報である。製造情報値112として記憶された製造情報は、製造情報識別部105が識別した製造情報の属性に対応する属性タグ1111と関連付けられる。上述のように翻訳部106は、製造情報値112と関連付けられた属性タグ1111とを参照することにより、ライブラリ115から翻訳に適した単語、文章等を検索し、翻訳文を生成する。
図10(b)に示すように、寸法情報113は、寸法線情報1131と、寸法線情報1131に関連付けられた寸法引出線情報1132から構成されている。寸法線情報1131および寸法引出線情報1132は、上述の製造情報識別部105により抽出され、製造情報DB110に記憶される。この寸法線情報1131は、寸法線の始点、終点の座標情報および製造情報値112から構成される。また、寸法引出線情報1132は、寸法引出線の始点および終点の座標情報から構成される。
図10(c)に示すように、製造用記号情報114は、上述の製造情報値112により抽出された製造用記号の情報である。製造用記号情報114は、製造用記号の座標値と、製造用記号の属性と、製造用記号が表す値とから構成されている。
ライブラリ115は、上述のように、製造情報の属性に関連付けられた各国言語の単語、文章等により構成されている。翻訳部106は、製造情報の属性に基づいて、ライブラリ115から翻訳に適した単語、文章等を検索することによって、翻訳文を生成する。
翻訳装置100の各部および各DBは、データバス109に接続されており、このデータバス109を介して、各種データや各種指示の授受を行う。
次に、図3を参照して、翻訳装置100が実行する処理(以下、単に「処理」という)について説明する。
[1]入力工程s110
まず、処理は、入力工程s110に移行する。入力工程s110では、上述した入力部102を用いて、製造情報が記載された設計図10aを取得する。図2に示した設計図10aは、日本語で製造情報が記載されているが、本発明はこれに限られない。例えば、英語、中国語、韓国語、ドイツ語等で記載されていてもよいし、それぞれ異なる言語で記載された製造情報が、複数同時に設計図10a中に記載されていてもよい。
[2]情報抽出工程s120
次に、処理は、情報抽出工程s120に移行する。情報抽出工程s120では、上述した情報抽出部103を用いて、入力部102が取得した設計図10aから、文字列情報201および線分情報202を抽出する。抽出された文字列情報201および線分情報202は、一時的に制御部101のRAMに一時記憶され、後の工程で必要となるたびに読み出される。
[3]セル認識工程s130
次に、処理は、セル認識工程s130に移行する。セル認識工程s130では、上述したセル認識部104を用いて、情報抽出部103が抽出した線分情報202に基づき、設計図10a内のセルを認識する。
図4は、セル認識部104を用いて実行されるセル認識工程s130を示すフローチャートである。まず、s131において、セル認識工程s130が開始される。次に、s132において、線分情報202から水平線分を抽出する。次に、s133において、線分情報202から垂直線分を抽出する。次に、s134において、抽出した水平線分と垂直線分の交点を抽出する。次に、s135において、抽出した交点の情報からセルの位置、数、サイズ等の情報を認識する。認識されたセル情報203は、一時的に制御部101のRAMに一時記憶され、後の工程で必要となるたびに読み出される。最後に、s136において、セル認識工程s130は、終了する。
[4]製造情報識別工程s140
次に、処理は、製造情報識別工程s140に移行する。製造情報識別工程s140では、上述した製造情報識別部105を用いて、設計図10aに記載された製造情報の属性を識別する。
図5は、製造情報識別部105を用いて実行される製造情報識別工程s140を示すフローチャートである。まず、s1401において、製造情報識別工程s140が開始される。次に、s1402において、製造情報DB110から属性項目1112を1つ取得する。次に、s1403において、設計図10a内に取得した属性項目1112と一致する文字列が存在か否かを検索する。もし、設計図10a内に取得した属性項目1112と一致する文字列が存在しない場合には(s1403の判定が偽の場合)、処理は、s1402に移行する。
一方、設計図10a内に取得した属性項目1112と一致する文字列が存在する場合には(s1403の判定が真の場合)、処理は、s1404に移行する。s1404において、属性項目1112が記載された第1のセルが存在するか否かを検索する。属性項目1112が記載された第1のセルが存在しない場合には(s1404の判定が偽の場合)、処理は、s1408に移行する。s1408では、設計図10aのセル領域12a以外の領域、すなわち図面用領域11aに、属性項目1112に関連のある文字列を検索する。その後、処理は、s1409に移行する。
一方、属性項目1112が記載された第1のセルが存在する場合には(s1404の判定が真の場合)、処理は、s1405に移行する。s1405において、第1のセル内に属性項目1112以外の文字列が存在するかを検索する。もし、第1のセル内に属性項目1112以外の文字列が存在しない場合には(s1405の判定が偽の場合)、処理は、s1407に移行する。s1407では、製造情報DB110に記憶された設計図フォーマット、すなわち上述の所定のルールに基づき、第2のセル内に属性項目1112以外の文字列が存在するかを検索する。その後、処理は、s1409に移行する。
一方、第1のセル内に属性項目1112以外の文字列が存在する場合には(s1405の判定が真の場合)、処理は、s1409に移行する。s1409において、第1のセル内の属性項目1112以外の文字列が検索される。その後、処理は、s1409に移行する。
s1409では、s1406、s1407、s1408のいずれかの処理において、属性項目1112以外の文字列を発見できたか否かが判断される。もし、属性項目1112以外の文字列を発見できなかった場合には(s1409の判定が偽の場合)、処理は、s1402に移行する。
一方、属性項目1112以外の文字列を発見できた場合には(s1409の判定が真の場合)、処理は、s1410に移行する。s1410において、発見された文字列は、製造情報値112として、属性項目1112に基づき、属性タグ1111と関連付けられ、さらに、製造情報DB110に保存される。その後、処理は、s1411に移行する。
s1411では、製造情報DB110内の全ての属性項目を検索済みか否かが判断される。もし、製造情報DB110内の全ての属性項目を検索済みでなければ(s1411の判定が偽の場合)、処理は、s1402に移行する。
一方、製造情報DB110内の全ての属性項目を検索済みならば(s1411の判定が真の場合)、処理は、s1412に移行する。s1412において、製造情報識別工程s140は、終了する。
[5]寸法識別工程s150
次に、処理は、寸法識別工程s150に移行する。寸法識別工程s150では、上述した製造情報識別部105を用いて、寸法線、寸法引出線および寸法情報を抽出する。寸法識別工程s150は、図6に示す寸法線抽出処理s150aと、図7に示す寸法情報識別処理s150bにより構成される。設計図10aのような設計図中の寸法線は、通常、シャフトである第1の線分と、矢尻(アローヘッド)となる第2および第3の線分とによって構成される矢印によって表される。製造情報識別部105は、設計図10a中の線分が、矢印を構成するか否かを判別することによって、寸法線を識別する。
図6は、寸法線抽出処理s150aを示すフローチャートである。まず、s151aにおいて、寸法線抽出処理s150aが開始される。次に、s152aにおいて、線分情報202から、任意の線分情報を1つ抽出する。次に、s153aにおいて、抽出した線分(すなわち、第1の線分)の端点に同じ角度で接続する線分(すなわち、第2および第3の線分)が2本以上存在するか否かが判断される。この角度は、任意の値であり、例えば5〜45度であることが好ましく、10〜15度であることがより好ましい。角度が上述の範囲を外れると、線分が寸法線に用いられる矢印である可能性が著しく下がり、寸法線ではない線分を寸法線であると誤認識する可能性が高まるからである。
もし、抽出した線分の端点に同じ角度で接続する線分が2本以上存在する場合には(s153aの判定が真の場合)、処理は、s156aに移行する。s156aでは、抽出した線分は、寸法線であると判断され、その始点および終点の座標値と共に、製造情報DB110の寸法情報113に、寸法線情報1131として記憶される。その後、処理は、s157aに移行する。
一方、抽出した線分の端点に同じ角度で接続する線分が2本以上存在しない場合には(s153aの判定が偽の場合)、処理は、s154aに移行する。s154aでは、抽出した線分上に既に認識された寸法線の頂点があり、寸法線の矢印方向が垂直になるか否かが判断される。もし、抽出した線分上に既に認識された寸法線の頂点があり、寸法線の矢印方向が垂直にならない場合(s154aの判定が偽の場合)、処理は、s157aに移行する。
一方、出した線分上に既に認識された寸法線の頂点があり、寸法線の矢印方向が垂直になる場合(s154aの判定が真の場合)、処理は、s155aに移行する。s155aでは、抽出した線分は、寸法引出線であると判断され、その始点および終点の座標値と共に、製造情報DB110の寸法情報113に、寸法引出線情報1132として記憶される。さらに、保存された寸法引出線情報1132は、関連する寸法線情報1131と関連付けられる。その後、処理は、s157aに移行する。
s157aでは、線分情報202の全ての線分をチェック済みか否かが判断される。もし、線分情報202の全ての線分をチェックしていない場合には(s157aの判定が偽の場合)、処理は、s152aに移行する。一方、線分情報202の全ての線分をチェック済みの場合には(s157aの判定が真の場合)、処理は、s158aに移行する。s158aにおいて、寸法線抽出処理s150aは、終了する。
図7は、寸法情報抽出処理s150bを示すフローチャートである。まず、s151において、寸法情報抽出処理s150bが開始される。次に、s152において、製造情報DB110から、寸法線抽出処理s150aにおいて記憶された寸法線情報1131が取得される。次に、s153bにおいて、抽出した寸法線に対して平行、かつ寸法線を構成する第1の線分の長手方向に直交する方向であって、所定の距離以内に文字列が存在するか否かが判断される。ここでいう所定の距離とは、例えば、寸法線の矢尻(アローヘッド)を構成する第2および第3の線分の長さであることが好ましい。矢尻を構成する第2および第3の線分の長さよりも、文字列が離れている場合、その文字列は寸法情報でない可能性が著しく高まるからである。
もし、抽出した寸法線に対して、平行かつ寸法線から所定の距離以内に文字列が存在しない場合(s153bの判定が偽の場合)、処理は、s152bに移行する。一方、抽出した寸法線に対して平行、かつ寸法線から所定の距離以内に文字列が存在する場合(s153bの判定が真の場合)、処理は、s154bに移行する。
s154bにおいて、抽出した寸法線に対して、平行かつ寸法線から所定の距離以内に存在する文字列は、寸法情報であると判断され、製造情報DB110の寸法線情報1131に、製造情報値112として記憶される。その後、処理は、s155bに移行する。
s155bにおいて、製造情報DB110に記憶された全ての寸法線情報1131がチェック済みであるか否かが判断される。もし、製造情報DB110に記憶された全ての寸法線情報1131がチェック済みでない場合(s155bの判定が偽の場合)、処理は、s152bに移行する。
一方、製造情報DB110に記憶された全ての寸法線情報1131がチェック済みの場合(s155bの判定が真の場合)、処理は、s156bに移行する。s156bにおいて、寸法情報識別処理s150bは、終了する。
[6]記号識別工程s160
次に、処理は、記号識別工程s160に移行する。記号識別工程s160では、上述した製造情報識別部105を用いて、製造用記号を抽出する。製造用記号とは、例えば、図8に示すような逆二等辺三角形である。この逆二等辺三角形は、切削加工における部品表面の算術平均粗さRaを指定するものである。また、逆二等辺三角形の並列数によって部品表面の算術平均粗さRaを、どの範囲にしなければいけないかを表現している。なお、製造情報識別部105が抽出し、識別する製造用記号は、この逆二等辺三角形に限られない。製造情報識別部105は、部品加工を行う当業者であれば理解できるであろう一般的な製造用記号を抽出し、識別することができる。
図8は、記号識別工程s160の1例を示すフローチャートである。図8の記号識別工程s160は、逆二等辺三角形を認識することができる。まず、s1601において、記号識別工程s160が開始される。次に、s1602において、線分情報202から、任意の線分情報を1つ抽出する。次に、s1603において、抽出した線分の両端点に連続する線分があり、ある大きさ以下の二等辺三角形を作るか否かが判断される。もし、抽出した線分の両端点に連続する線分がない、または、ある大きさ以下の二等辺三角形を作らない場合には(s1603の判定が偽の場合)、処理は、s1602に移行する。
一方、抽出した線分の両端点に連続する線分があり、かつ、ある大きさ以下の二等辺三角形を作る場合には(s1603の判定が真の場合)、処理は、s1604に移行する。s1604において、抽出された線分は、製造用記号を形成する線分であると判断され、製造用記号情報114として、その座標値および製造用記号の種類(すなわち、逆二等辺三角形)と共に、製造情報DB110に記憶される。その後、処理は、s1605に移行する。
s1605において、線分情報202の全ての線分情報をチェック済みか否かが判断される。もし、線分情報202の全ての線分情報をチェック済みではない場合(s1605の判定が偽の場合)、処理は、s1602に移行する。
一方、線分情報202の全ての線分情報をチェック済みの場合(s1605の判定が真の場合)、処理は、s1606に移行する。s1606において、製造情報DB110から、逆二等辺三角形の製造用記号に関する製造用記号情報114を抽出する。次に、s1607aにおいて、抽出した製造用記号情報114の座標値から、その端点を複数共有する同じ大きさの逆二等辺三角形が存在するか(並んでいるか)否かが判断される。もし、そのような逆二等辺三角形が存在しない場合(s1607の判定が偽の場合)、処理は、s1606に移行する。
一方、そのような逆二等辺三角形が存在する場合(s1607の判定が真の場合)、処理は、s1608に移行する。s1608において、逆二等辺三角形の並列数から、部品表面の算術平均粗さRaの指定範囲が認識され、その指定範囲が精度情報として、製造用記号情報114に記憶される。その後、処理は、s1609に移行する。
s1609において、製造情報DB110に記憶された全ての逆二等辺三角形に関する製造用記号情報114をチェック済みか否かが判断される。もし、全ての逆二等辺三角形に関する製造用記号情報114をチェック済みではない場合(s1609の判定が偽の場合)、処理は、s1606に移行する。一方、全ての逆二等辺三角形に関する製造用記号情報114をチェック済みの場合(s1609の判定が真の場合)、処理は、s1610に移行する。s1610において、記号識別工程s160は、終了する。
ここまで、図8を用いて、記号識別工程s160の1例を示したが、本発明はこれに限られない。同様に、線分情報202を抽出、場合分けすることにより、製造情報識別部105は、部品加工を行う当業者であれば理解できるであろう一般的な製造用記号を抽出し、識別することができる。
[7]翻訳工程s170
次に、処理は、翻訳工程s170に移行する。翻訳工程s170では、上述した翻訳部106を用いて、製造情報識別工程s140、寸法識別工程s150、および記号識別工程s160で識別した製造情報の属性に基づいて、製造情報を翻訳し、翻訳設計図10bを生成する。
[8]出力工程s180
次に、処理は、出力工程s180に移行する。出力工程s180では、上述した出力部107を用いて、翻訳工程s170で生成した翻訳設計図10bを出力する。
図11は、上述の工程、または翻訳装置100により英語に翻訳され、出力された翻訳設計図10bである。図2の設計図10aの日本語の製造情報が、英語に翻訳され置き換えられていることがわかる。図12は、上述の工程、または翻訳装置100により、中国語に翻訳され、出力された翻訳設計図10cである。翻訳設計図10bと同様に、日本語の製造情報が、中国語に翻訳され、置き換えられていることがわかる。これらは、翻訳装置100の出力の1例であって、本発明はこれに限られない。例えば、翻訳装置100は、英語と中国語が混在した翻訳設計図を出力することも可能であるし、韓国語、ドイツ語等の他の言語に翻訳された翻訳設計図を出力することも可能である。
このような発明によれば、設計図に記載された製造情報の属性に基づいて、製造情報を正確に翻訳することができ、可読性の高い翻訳設計図を出力する翻訳装置を得ることができる。
以上、本発明の翻訳装置および翻訳方法を、図示の実施形態に基づいて説明したが、本発明はこれに限定されるものではなく、各部の構成は、同様の機能を有する任意の構成のものに置換することができる。また、本発明に、他の任意の構成物が付加されていてもよい。また、本発明は、前記実施形態のうちの、任意の2以上の構成(特徴)を組み合わせたものであってもよい。
10a…設計図 10b、c…翻訳設計図 11a、b、c…図面用領域 12a、b、c…セル領域 100…翻訳装置 101…制御部 102…入力部 103…情報抽出部 104…セル認識部 105…製造情報識別部 106…翻訳部 107…出力部 108…図面設定情報DB 109…データバス 110…製造情報DB 111…属性情報 112…製造情報値 113…寸法情報 114…記号情報 115…ライブラリ 201…文字列情報 202…線分情報 203…セル情報 1111…属性タグ 1112、1112a、b…属性項目 1113、1113a、b…同義語 1131…寸法線情報 1132…寸法引出線情報 s110…入力工程 s120…情報抽出工程 s130…セル認識工程 s140…製造情報識別工程 s150…寸法識別工程 s150a…寸法線抽出処理 s151a〜s158a…寸法線抽出処理の処理ブロック s150b…寸法情報識別処理 s151b〜s156b…寸法情報識別処理の処理ブロック s160…記号識別工程 s170…翻訳工程 s180…出力工程 s1401〜s1412…製造情報識別工程の処理ブロック s1601〜s1610…記号識別工程の処理ブロック

Claims (10)

  1. 製造情報が記載された設計図を翻訳するための翻訳装置であって、
    前記設計図を取得する入力部と、
    取得された前記設計図内のセルを認識するセル認識部と、
    前記セル認識部が認識した前記セルの情報に基づいて、前記製造情報の属性を識別する製造情報識別部と、
    前記製造情報の前記属性に基づいて、前記製造情報を翻訳する翻訳部と、
    前記翻訳部が翻訳した翻訳設計図を出力する出力手段とを備えることを特徴とする翻訳装置。
  2. 前記セル認識部は、前記設計図中に記載された水平線と垂直線とを抽出することにより、前記セルを認識する請求項1に記載の翻訳装置。
  3. 前記製造情報識別部は、
    前記設計図内に属性項目が存在するかを検索し、
    前記属性項目が記載されている第1のセルを特定し、
    前記第1のセル内に前記属性項目以外の前記製造情報が記載されている場合には、前記属性項目に基づいて、前記製造情報の前記属性を識別する請求項1または2に記載の翻訳装置。
  4. 前記製造情報識別部は、
    前記設計図内に属性項目が存在するかを検索し、
    前記属性項目が記載されている第1のセルを特定し、
    前記第1のセルと所定の関係にある第2のセル内に、前記製造情報が記載されているかを判定し、
    前記第2のセル内に前記製造情報が記載されている場合には、前記属性項目に基づいて、前記製造情報の前記属性を識別する請求項1または2に記載の翻訳装置。
  5. 前記製造情報識別部は、前記設計図内に前記属性項目および前記属性項目の同義語が存在するかを検索し、
    前記属性項目または前記同義語が記載されているセルを前記第1のセルとして特定し、
    前記同義語に基づいて、前記製造情報の前記属性を識別する請求項3または4に記載の翻訳装置。
  6. 前記製造情報には、寸法線と該寸法線に関連付けられた寸法情報が含まれ、
    前記製造情報識別部は、前記寸法線と前記寸法情報を識別し、
    前記翻訳部は、前記製造情報識別部が識別した前記寸法情報を翻訳する請求項1ないし5のいずれかに記載の翻訳装置。
  7. 前記製造情報識別部は、第1の線分の端点に任意の角度で接続する線分が2本以上存在する場合には、前記第1の線分を前記寸法線として識別する請求項6に記載の翻訳装置。
  8. 前記製造情報識別部は、前記寸法線に対して平行、かつ前記寸法線から所定の距離以内に文字列が存在する場合には、前記文字列を前記寸法情報として識別する請求項6または7に記載の翻訳装置。
  9. 前記製造情報には、製造用記号が含まれ、
    前記製造情報識別部は、前記製造用記号を識別し、
    前記翻訳部は、前記製造情報識別部が識別した前記製造用記号を翻訳する請求項1ないし8のいずれかに記載の翻訳装置。
  10. 製造情報が記載された設計図を翻訳するための翻訳装置を用いた翻訳方法であって、
    前記翻訳装置の入力部を用いて、前記設計図を取得する工程と、
    前記翻訳装置のセル認識部を用いて、取得された前記設計図内のセルを認識する工程と、
    前記翻訳装置の製造情報識別部を用いて、前記セル認識部が認識した前記セルの情報に基づいて、前記製造情報の属性を識別する工程と、
    前記翻訳装置の翻訳部を用いて、前記製造情報の前記属性に基づいて、前記製造情報を翻訳する工程と、
    前記翻訳装置の出力部を用いて、前記翻訳部が翻訳した翻訳設計図を出力する工程とを備えることを特徴とする翻訳方法。
JP2012086653A 2012-04-05 2012-04-05 翻訳装置および翻訳方法 Pending JP2013218424A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012086653A JP2013218424A (ja) 2012-04-05 2012-04-05 翻訳装置および翻訳方法
PCT/JP2013/060045 WO2013151031A1 (ja) 2012-04-05 2013-04-02 翻訳装置および翻訳方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012086653A JP2013218424A (ja) 2012-04-05 2012-04-05 翻訳装置および翻訳方法

Publications (1)

Publication Number Publication Date
JP2013218424A true JP2013218424A (ja) 2013-10-24

Family

ID=49300512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012086653A Pending JP2013218424A (ja) 2012-04-05 2012-04-05 翻訳装置および翻訳方法

Country Status (2)

Country Link
JP (1) JP2013218424A (ja)
WO (1) WO2013151031A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020027603A (ja) * 2018-08-09 2020-02-20 日本無線株式会社 設計品見積システムおよび設計品見積プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259487A (ja) * 1993-03-08 1994-09-16 Ricoh Co Ltd 他国向け図面作成システム
JP3525997B2 (ja) * 1997-12-01 2004-05-10 富士通株式会社 文字認識方法
JP4473702B2 (ja) * 2004-11-02 2010-06-02 株式会社東芝 機械翻訳システム、機械翻訳方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020027603A (ja) * 2018-08-09 2020-02-20 日本無線株式会社 設計品見積システムおよび設計品見積プログラム

Also Published As

Publication number Publication date
WO2013151031A1 (ja) 2013-10-10

Similar Documents

Publication Publication Date Title
US9384389B1 (en) Detecting errors in recognized text
Nurminen Algorithmic extraction of data in tables in PDF documents
EP3403811B1 (en) Shaping processing apparatus, shaping processing system, and program
EP3522038A1 (en) Method for translating characters and apparatus therefor
US20210073535A1 (en) Information processing apparatus and information processing method for extracting information from document image
US10769360B1 (en) Apparatus and method for processing an electronic document to derive a first electronic document with electronic-sign items and a second electronic document with wet-sign items
CN110770735A (zh) 具有嵌入式数学表达式的文档的编码转换
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
CN110263792B (zh) 图像识读及数据处理方法、智能笔、***及存储介质
US20140006917A1 (en) System and method for forms recognition by synthesizing corrected localization of data fields
CN105302626B (zh) Xps结构化数据的解析方法
RU2605078C2 (ru) Сегментация изображения для верификации данных
CN112100979A (zh) 基于电子书的排版处理方法、电子设备及存储介质
CN112149680B (zh) 错字检测识别方法、装置、电子设备及存储介质
JP2008059527A (ja) 画像処理装置およびプログラム
KR102282025B1 (ko) 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
CN110991303A (zh) 一种图像中文本定位方法、装置及电子设备
WO2013151031A1 (ja) 翻訳装置および翻訳方法
CN110688842B (zh) 一种文档标题层级的分析方法、装置及服务器
CN111046627A (zh) 一种中文文字显示方法及***
KR20220058259A (ko) 논문의 메타데이터 추출 방법 및 장치
CN111652157A (zh) 一种低资源语种与通用语种的字典词条提取及识别方法
CN109739981B (zh) 一种pdf文件类别判定方法及文字提取方法
CN111444751B (zh) 信息处理装置、储存介质及信息处理方法
US20210209354A1 (en) Information processing device, information processing method, and information processing program