JP2015069365A - 情報処理装置、および制御プログラム - Google Patents

情報処理装置、および制御プログラム Download PDF

Info

Publication number
JP2015069365A
JP2015069365A JP2013202482A JP2013202482A JP2015069365A JP 2015069365 A JP2015069365 A JP 2015069365A JP 2013202482 A JP2013202482 A JP 2013202482A JP 2013202482 A JP2013202482 A JP 2013202482A JP 2015069365 A JP2015069365 A JP 2015069365A
Authority
JP
Japan
Prior art keywords
image
translation
character string
display control
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013202482A
Other languages
English (en)
Inventor
健文 大塚
Takefumi Otsuka
健文 大塚
忠郎 長沢
Tadao Nagasawa
忠郎 長沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2013202482A priority Critical patent/JP2015069365A/ja
Priority to PCT/JP2014/071647 priority patent/WO2015045676A1/ja
Priority to US14/890,930 priority patent/US10068359B2/en
Priority to CN201810438693.0A priority patent/CN108829644A/zh
Priority to CN201480029905.XA priority patent/CN105393244B/zh
Priority to CN201810842033.9A priority patent/CN109101467A/zh
Publication of JP2015069365A publication Critical patent/JP2015069365A/ja
Priority to US15/996,590 priority patent/US10573046B2/en
Priority to US16/037,280 priority patent/US20180322677A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】撮像された画像に含まれる文字列の翻訳を表示させた後であっても、翻訳された文字列を確認できるようにする。
【解決手段】文字列装飾表示制御部(12)は、撮像された画像の文字列を示す部分を装飾して表示させ、翻訳画像生成部(13)は、上記文字列を他の言語に翻訳した結果を表す翻訳画像を生成し、翻訳表示制御部(16)は、ユーザの入力に応じて、上記翻訳画像の表示、および非表示を切り替える。
【選択図】図1

Description

本発明は情報処理装置、および制御プログラムに関する。
旧来より撮像された画像からOCR(Optical Character Recognition)により文字列を抽出し、翻訳した結果を表示する技術について様々な提案がなされている。例えば、特許文献1には、画像から文字が存在する文字領域を文字認識し、文字コードを生成する文字認識手段と、前記画像の特徴変化が少ない領域を検出する検出手段と、前記検出された領域に前記文字コードから得られるデータを配置する配置手段とを備えた画像処理装置が提案されている。
特開2013−122747号公報(2013年6月20日公開) 特開2011−134144号公報(2011年7月7日公開) 特開2001−319240号公報(2001年11月16日公開) 特開平11−53365号公報(1999年2月26日公開) 特開平9−179867号公報(1997年7月11日公開)
しかしながら、上述のような従来技術は翻訳後の文字列を撮像された画像の翻訳前の文字列が存在していた領域に重ねて表示しているため、撮像された画像に含まれる文字列の翻訳を表示させた後に、どのような文字列が翻訳されたのか容易には確認できない、という問題がある。
本発明は、上記問題を鑑みてなされたものであり、その目的は、撮像された画像に含まれる文字列の翻訳を表示させた後であっても、容易にどのような文字列が翻訳されたのかを確認することができる情報処理装置を提供することにある。
本発明の一態様に係る情報処理装置は、撮像された画像に含まれる文字列を示す部分を装飾した画像を表示させる文字列装飾表示制御手段と、上記文字列を他の言語に翻訳した結果を表す画像である翻訳画像を生成する翻訳画像生成手段と、撮像された画像または上記文字列装飾表示制御手段によって装飾された画像における上記文字列を示す部分に当該文字列と対応する上記翻訳画像を重畳して表示させる翻訳表示制御手段と、を備え、上記翻訳表示制御手段はユーザの入力に応じて、上記翻訳画像の表示および非表示を切り替え、上記文字列装飾表示制御手段は、上記翻訳表示制御手段が上記翻訳画像を非表示とした場合に上記装飾された画像を表示する。
本発明の一態様によれば、撮像された画像に含まれる文字列の翻訳を表示させた後であっても、容易にどのような文字列が翻訳されたのかを確認することができるという効果を奏する。
本発明の実施形態1に係る機能ブロック図である。 本発明の実施形態1に係る情報処理装置の表示画像の切り替えを示す図である。 本発明の実施形態1に係る情報処理装置における翻訳画像の表示に関する処理の流れを示すフローチャートである。 本発明の実施形態2に係る機能ブロック図である。 本発明の実施形態2に係る情報処理装置の表示画像の切り替えを示す図である。 本発明の実施形態2に係る情報処理装置における翻訳画像の表示に関する処理の流れを示すフローチャートである。
〔実施形態1〕
以下、本発明の実施の形態について、図1〜図3に基づいて説明すれば、以下のとおりである。
〔1.情報処理装置1の構成〕
まず、図1に基づいて情報処理装置1の概略構成を説明しながら、図2に基づいて、適宜、情報処理装置1の具体的な表示画像の例について説明する。図1は、本実施形態に係る情報処理装置1の概略構成を示している。また、図2は情報処理装置1の表示画像の切り替えを示す図である。
図1に示す通り、情報処理装置1は、制御部10、撮像部20、表示部30、および入力部40により構成されている。情報処理装置1は、例えば、携帯電話、スマートフォン、PDA(Personal Data Assistant)、PC(Personal Computer)などである。
撮像部20は、被写体を撮影して画像を取得するためのカメラ機能を提供するものである。撮像部20は、例えば、光学系および撮像素子(CCD(Charge Coupled Devices)、CMOS(Complementary Metal-Oxide-Semiconductor)等)により実現することができる。
表示部30は、制御部10から表示画像の情報を受信し、表示画面に表示する。表示部30は、LCD(Liquid Crystal Display)、EL(Electroluminescence)ディスプレイなどの表示素子と、受信した画像データに基づいて表示素子を駆動するドライバ回路とを備える構成である。
入力部40は、ユーザからの入力を受け付け、入力された情報を制御部10へ出力する。入力部40は、静電誘導式、抵抗膜式、光学式などの変換方式を用いたタッチパネルにより構成される。また、入力部40は、表示部30に表示された表示画像の座標または表示されている項目を選択可能なインターフェースであればよく、ボタン、キーボード、マウスなどで構成されていてもよい。
制御部10は、図1に示す通り、OCR部11、文字列装飾表示制御部12、翻訳画像生成部13、翻訳部14、画像保持部15、および翻訳表示制御部16を含んでいる。OCR部11は、入力された画像に含まれる文字列を光学文字認識によって特定(抽出)する。さらに、OCR部11は、抽出した文字列を示す部分の座標および当該文字列を含む文字認識情報を特定し、当該文字認識情報を文字列装飾表示制御部12へ出力する。また、OCR部11は、文字認識情報を特定できなかった場合、すなわち、入力された画像について文字列および文字列の座標を抽出できなかった場合は、文字列を示す部分が特定できなかったこと、すなわち文字列の抽出に失敗したことを文字列装飾表示制御部12へ通知する。また、OCR部11は、通信ネットワーク上のサービスを用いるものであってもよい。
文字列装飾表示制御部12は、撮像部20により撮像され、入力された画像(以下、入力画像と表す)をOCR部11へ出力し、入力画像についての文字認識情報を取得する。文字認識情報を取得し、かつ翻訳画像が非表示となった場合、文字列装飾表示制御部12は、当該文字認識情報に基づき入力画像に含まれる文字列を示す部分に下線を引くことで装飾し、文字列を示す部分を装飾した画像を表示部30へ表示させる。また、文字列装飾表示制御部12は、翻訳画像生成部13へ文字認識情報を出力する。一方、入力画像に文字列を示す部分が含まれていないことの通知をOCR部11から受けた場合、文字列装飾表示制御部12は、入力画像を表示部30へ表示させる。例えば、図2の(A)に示すように、入力画像について、OCR部11が文字列を示す部分が特定できなかった場合に、入力画像がそのまま画像D1として表示部30へ表示される。
また、図2の(C)は、入力画像について、OCR部11が文字列を示す部分が特定できた場合における表示部30への表示画像を示している。この場合、入力画像に含まれる文字列“You have two pens.”を示す部分に下線が引かれている。これにより、入力画像のいずれの部分が文字列を示すかを判別することが容易になる。また、装飾として下線を用いる場合、入力画像が文字列を示す部分の装飾によって隠される部分が少ないため、入力画像を装飾することに起因する視認可能な情報の減少が少なくてすむ。
翻訳画像生成部13は、文字認識情報を入力された場合、当該文字認識情報が示す文字列を翻訳部14へ出力し、他の言語に翻訳した結果を取得する。翻訳画像生成部13は、文字認識情報が示す文字列を他の言語に翻訳した結果を取得した場合、当該翻訳した結果を示す画像である翻訳画像を生成し、当該翻訳画像を画像保持部15へ保持させる。また、翻訳画像生成部13は、翻訳表示制御部16へ翻訳画像を生成したことを通知すると共に文字認識情報に含まれる文字列の座標を入力する。なお、翻訳画像は、文字認識情報に基づくものであるため、文字列を示す入力画像の一部の領域と対応する。
翻訳部14は、入力された文字列が翻訳可能な文字列であった場合、予め指定された他の言語へ翻訳し、翻訳の結果を翻訳画像生成部13へ出力する。翻訳部14は、翻訳エンジンにより構成される。また、翻訳部14は通信ネットワーク上のサービスを用いてもよい。
画像保持部15は、翻訳画像生成部13が生成した翻訳画像を保持する。画像保持部15は、制御部10の一部を構成するRAM(Random Access Memory)に設定された領域であってもよい。
翻訳表示制御部16は、翻訳画像生成部13から翻訳画像が生成されたことの通知を受けて、画像保持部15に保持された翻訳画像を装飾された画像の文字列を示す部分に重畳表示させると共に、切り替えボタンUI1を表示させる。また、入力部40から、切り替えボタンUI1と対応する座標にユーザの指100が接触するなどして、切り替えボタンUI1が押下(選択)されたことの通知を受けた場合、翻訳表示制御部16は、翻訳画像の表示および非表示を切り替える。
例えば、図2の(B)は、表示部30に表示される画像D2の文字列を示す部分に画像保持部15に保持された翻訳画像T1を重畳表示させると共に、切り替えボタンUI1を表示させている情報処理装置1を表している。この状態において切り替えボタンUI1をユーザの指100が接触した場合、図3の(C)に示すように、翻訳画像T1は非表示となり、文字列を表す部分に下線が引かれた画像D2が表示される。また、この状態において、切り替えボタンUI1にユーザの指100が接触した場合、図3の(B)に示すように翻訳画像T1が再び表示される。
〔2.情報処理装置1における翻訳画像の表示に関する処理の流れ〕
次に情報処理装置1における翻訳画像の表示に関する処理の流れについて、図3に基づき説明する。図3は情報処理装置1における翻訳画像の表示に関する処理の流れを示すフローチャートである。
まず、文字列装飾表示制御部12は、撮像部20によって撮像された画像を取得する(S1)。続いて、文字列装飾表示制御部12は取得した画像(入力画像)をOCR部11へ出力する。画像を入力されたOCR部11は、入力画像に含まれる文字列および文字列の座標を抽出する(S2)。
OCR部11は文字列および文字列の座標の抽出が成功したか否かを判定する(S3)。文字列および文字列の座標の抽出が失敗した場合(S3でNO)、OCR部11は、文字列の抽出に失敗したことを文字列装飾表示制御部12へ通知する。当該通知を受けた文字列装飾表示制御部12は、表示部30へ入力画像を表示させる(S13)。
一方、文字列および文字列の座標の抽出が成功した場合(S3でYES)、その旨を翻訳画像生成部13へ通知する。当該通知を受けた文字列装飾表示制御部12は、入力画像を表示部30へ表示させ(S4)、また、翻訳画像生成部13へ文字認識情報を出力する。
文字認識情報が入力された翻訳画像生成部13は、翻訳部14へ当該文字認識情報が示す文字列を翻訳部14へ出力する。文字列を入力された翻訳部14は当該文字列を予め指定された他の言語へ翻訳し(S5)、翻訳の結果を翻訳画像生成部13へ出力する。
翻訳の結果を入力された翻訳画像生成部13は、当該翻訳した結果を示す画像である翻訳画像を生成し、当該翻訳画像を画像保持部15へ保持させる。(S6)。さらに、翻訳画像生成部13は、翻訳表示制御部16へ翻訳画像を生成したことを通知すると共に文字認識情報に含まれる文字列の座標を入力する。
翻訳画像生成部13から翻訳画像が生成されたことの通知を受けた翻訳表示制御部16は、切り替えボタンUI1を表示させる(S7)。さらに、翻訳表示制御部16は、翻訳画像生成部13に入力された文字列の座標に基づき、表示部30に表示された入力画像の文字列を示す部分に画像保持部15に保持された翻訳画像を重畳して表示させる(S8)。この時点で、文字列を表す部分に重畳して翻訳画像が表示された入力画像が表示される。
続いて、翻訳表示制御部16は、入力部40からの通知を確認し、切り替えボタンUI1が押下されたか否かを判定する(S9)。切り替えボタンUI1が押下されなかった場合(S9でNO)、再度、切り替えボタンUI1が押下されたか否かを判定する(S9)。
一方、切り替えボタンが押下された場合(S9でYES)、翻訳表示制御部16は、翻訳画像を非表示とし(S10)、文字列装飾表示制御部12へ切り替えボタンが押下されたことを通知する。切り替えボタンが押下されたことの通知を受けた文字列装飾表示制御部12は、表示された入力画像の文字列を示す部分に対して文字認識情報に基づき下線を引いて装飾する(S11)。この時点で、文字列を表す部分に下線が引かれた装飾された入力画像が表示される。
この状態において、翻訳表示制御部16は、入力部40からの通知を確認し、切り替えボタンUI1が押下されたか否かを判定する(S12)。切り替えボタンUI1が押下されなかった場合(S12でNO)、再度、切り替えボタンUI1が押下されたか否かを判定する(S12)。
一方、切り替えボタンが押下された場合(S12でYES)、翻訳表示制御部16は、文字列を表す部分に重畳して翻訳画像を表示させる(S8)。この時点において、文字列装飾表示制御部12は、文字列を示す部分に対する装飾を解除してもよい。
上記の処理により、撮像された画像(入力画像)に対して当該撮像された画像に含まれる文字列を示す部分へ上記文字列と対応する翻訳画像を重畳表示させた状態において、当該翻訳画像を非表示とし、上記撮像された画像に含まれる文字列を示す部分を装飾した画像と当該翻訳画像とを切り替えて表示させることができる。よって、ユーザは撮像された画像に含まれる文字列の翻訳を表示させた後であっても、容易にどのような文字列が翻訳されたのかを確認することができる。
〔変形例〕
上記実施形態において、翻訳画像の表示および非表示を切り替えるための操作として、切り替えボタンを押下することに替えて、いわゆるフリック操作を行うこと、情報処理装置1を振ること、情報処理装置1を回転させることなどを用いるように情報処理装置1を構成してもよい。また、上記実施形態において、入力画像に含まれる文字列を示す部分を装飾する方法として、マーカー表示を付すこと、枠線で囲むことなどを用いるように情報処理装置1を構成してもよい。
また、上記実施形態において、撮像部20において撮像された画像に対して加工をし、文字列装飾表示制御部12へ加工された画像を入力するように情報処理装置1を構成してもよい。
〔実施形態2〕
本発明の他の実施形態について、図4〜図6に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
〔1.情報処理装置2の構成〕
情報処理装置2の概略構成について図4に基づいて情報処理装置1の概略構成を説明しながら、図5に基づいて、適宜、情報処理装置2の具体的な動作例について説明する。図4は、本実施形態に係る情報処理装置2の概略構成を示している。また、図6は情報処理装置2の表示画像の切り替えを示す図である。
本実施形態に係る情報処理装置2と情報処理装置1との差異は、情報処理装置2が制御部10に替えて制御部110を備えている点である。また、制御部110と制御部10との差異は、情報処理装置2が画像保持部15を備えず、また、文字列装飾表示制御部12、翻訳画像生成部13、翻訳表示制御部16に替えて、文字列装飾表示制御部112、翻訳画像生成部113、翻訳表示制御部116を備え、さらに選択単語判定部17を備える点である。
文字列装飾表示制御部112は、文字列装飾表示制御部12と、OCR部11から取得した文字認識情報について単語ごとに処理を行い、文字認識情報を選択単語判定部17へ出力する点で異なる。具体的には、文字列装飾表示制御部112は、図5の(A)の画像D3を撮像部から取得した場合、図5の(B)に示すように、単語の表示W1〜W5それぞれに下線を引くことによって装飾した画像D4を表示部30へ表示させる。また、文字列装飾表示制御部112は、単語ごとの文字認識情報を選択単語判定部17へ出力する。
翻訳画像生成部113は、翻訳表示制御部116から文字認識情報の入力を受け付ける。文字認識情報の入力を受け付けた翻訳画像生成部113は、当該文字認識情報に含まれる単語を翻訳部14へ出力して翻訳の結果を取得し、翻訳画像を生成する。翻訳画像を生成した翻訳画像生成部113は、当該翻訳画像を翻訳表示制御部116へ出力する。
翻訳表示制御部116は、選択単語判定部17から文字認識情報の入力を受け付ける。文字認識情報の入力を受け付けた翻訳画像生成部113へ当該文字認識情報を入力し、翻訳画像生成部113から翻訳画像を取得する。翻訳画像を取得した翻訳表示制御部116は、文字認識情報に基づき、翻訳画像と対応する単語の座標に重畳して当該翻訳画像を表示させる。具体的には、図5の(B)に示す状態において単語の表示W2と対応する文字認識情報の入力を翻訳表示制御部116が受け付けた場合、翻訳表示制御部116は図5の(D)に示すように翻訳画像T2を単語の表示W2に重畳して表示させる。また、表示させた翻訳画像が選択された場合、翻訳表示制御部116は当該翻訳画像を非表示にする。
選択単語判定部17は、文字列装飾表示制御部112からの文字認識情報の入力を受け付ける。文字認識情報の入力を受け付けた選択単語判定部17は、入力部40へのユーザの入力が翻訳画像と対応する単語の座標を押下するなどの、単語の表示または翻訳画像の表示を選択する操作であった場合に、選択された単語の表示と対応する文字認識情報を翻訳表示制御部116へ出力する。
〔2.情報処理装置2における翻訳画像の表示に関する処理の流れ〕
次に情報処理装置2における翻訳画像の表示に関する処理の流れについて、図3に基づき説明する。図3は情報処理装置1における翻訳画像の表示に関する処理の流れを示すフローチャートである。なお、S1〜S3、およびS13の処理は情報処理装置1と同様であるため説明を割愛する。
OCR部11が文字列の抽出に成功した場合(S3でYES)、その旨の通知を受けた翻訳画像生成部13は、取得した文字認識情報について単語ごとに下線を引くことで装飾した入力画像を表示部30へ表示させる(S101)。さらに、文字列装飾表示制御部112は、単語ごとの文字認識情報を選択単語判定部17へ入力する。
単語ごとの文字認識情報の入力を受け付けた選択単語判定部17は、入力部40へのユーザの入力が単語の表示を押下する操作であるか否かを判定する(S102)。入力部40へのユーザの入力が単語の表示を押下する操作でなかった場合(S102でNO)、選択単語判定部17は、再度、入力部40へのユーザの入力が単語の表示を押下する操作であるか否かを判定する(S102)。
一方、入力部40へのユーザの入力が単語の表示を押下する操作であった場合(S102でYES)、選択された単語の表示と対応する文字認識情報を翻訳表示制御部116へ入力する。文字認識情報の入力を受け付けた翻訳画像生成部113へ当該文字認識情報を入力する。翻訳画像生成部113は、翻訳部14へ当該文字認識情報に含まれる単語を入力し、翻訳部14に当該単語を翻訳させる(S103)。
翻訳の結果を取得した翻訳画像生成部113は、当該翻訳の結果を翻訳画像に変換し(S104)、当該翻訳画像を翻訳表示制御部116へ出力する。翻訳画像を取得した翻訳表示制御部116は、文字認識情報に基づき、翻訳画像と対応する単語の座標に重畳して当該翻訳画像を表示させる(S105)。
続いて、選択単語判定部17は、入力部40へのユーザの入力が翻訳画像と対応する単語の座標を押下する操作、すなわち、翻訳画像の表示を押下する操作であるか否かを判定する(S106)。入力部40へのユーザの入力が翻訳画像の表示を押下する操作でなかった場合(S106でNO)、再度、翻訳表示制御部116は、入力部40へのユーザの入力が翻訳画像の表示を押下する操作であるか否かを判定する(S106)。
一方、入力部40へのユーザの入力が翻訳画像の表示を押下する操作であった場合(S106でYES)、当該翻訳画像と対応する文字認識情報を翻訳表示制御部116へ通知する。文字認識情報の通知を受けた翻訳表示制御部116は、当該文字認識情報と対応する翻訳表示を非表示とする(S107)。続いて、S102からの処理が再度実行される。
上記の処理により、ユーザが選択した単語の表示に、当該単語と対応する翻訳画像が重畳表示される。これにより、ユーザは翻訳を希望する単語について、翻訳画像を表示させることができる。
〔3.情報処理装置2における翻訳画像の表示に関する操作の一例〕
図5に基づき、情報処理装置2における翻訳画像の表示に関する操作の一例を説明する。図5の(A)は、OCR部11が入力画像に含まれる文字列を認識しなかった場合の情報処理装置2を表す図である。この場合、入力画像が画像D3としてそのまま表示されている。
図5の(B)は、OCR部11が入力画像に含まれる文字列を認識した場合の情報処理装置2を表す図である。この場合、入力画像に含まれる文字列”Could you please rent them”を構成する単語の表示W1〜W5ごとに下線で装飾された画像D4が表示されている。
図5の(C)は、図5の(B)に示す状態において、ユーザの指100が単語”you”を表す単語の表示W2を押下した時点の情報処理装置2を表す図である。この時点で、情報処理装置2は上述のS103〜S105に示す処理を実行する。
図5の(D)は、図5の(C)に示すように単語の表示W2が押下され、上述のS103〜S105が実行された場合の情報処理装置2を表す図である。この場合、単語“you”を他の言語に翻訳した結果である“あなた”を示す翻訳画像T2が対応する単語の表示W2に重畳して表示されている。また、この状態において、ユーザの指100が翻訳画像T2を押下した場合、翻訳画像T2が非表示となり、図5の(B)に示すように単語の表示W2が確認できる状態となる。上記のようにユーザは本実施形態における情報処理装置2を用いて、撮像された画像に含まれる文字列を構成する単語について、翻訳の結果を確認し、また、翻訳された単語を確認することができる。
〔変形例〕
上記実施形態2において、S103〜S107の処理は単語ごとに独立して実行するように情報処理装置2を構成してもよい。すなわち、図5の(B)に示す状態において、ユーザの入力に応じて、単語の表示W1〜W5それぞれについて独立して翻訳画像を表示し、また、翻訳画像を非表示とするように情報処理装置2を構成してもよい。
また、上記実施形態2において、押下された単語について実行する処理を選択するメニューを表示する処理を、図6のαで示す箇所において行うように情報処理装置2を構成してもよい。メニューにより選択可能とする処理は、例えば、翻訳表示させる処理、指定の辞書ソフトウェアを検索させる処理、インターネットで検索させる処理、などが挙げられる。上記の構成により、撮像された画像に含まれる文字列について実行する処理をユーザが選択することができる。
また、上記実施形態2において、S103の処理に替えて、単語を含む文を翻訳する処理を行うように情報処理装置2を構成してもよい。
また、上記各実施形態において翻訳画像は半透明であってもよく、上記翻訳画像の表示および非表示は翻訳画像の透明度を変更することで行ってもよい。
〔実施形態3〕
情報処理装置1の制御ブロック(特に制御部10)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、情報処理装置1は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る情報処理装置(1)は、撮像された画像に含まれる文字列を示す部分を装飾した画像を表示させる文字列装飾表示制御手段(文字列装飾表示制御部12)と、上記文字列を他の言語に翻訳した結果を表す画像である翻訳画像を生成する翻訳画像生成手段(翻訳画像生成部13)と、撮像された画像または上記文字列装飾表示制御手段によって装飾された画像における上記文字列を示す部分に当該文字列と対応する上記翻訳画像を重畳して表示させる翻訳表示制御手段(翻訳表示制御部16)と、を備え、上記翻訳表示制御手段はユーザの入力に応じて、上記翻訳画像の表示および非表示を切り替え、上記文字列装飾表示制御手段は、上記翻訳表示制御手段が上記翻訳画像を非表示とした場合に上記装飾された画像を表示する。
上記の構成によれば、撮像された画像に対して当該撮像された画像に含まれる文字列を示す部分へ上記文字列と対応する翻訳画像を重畳表示させた状態において、当該翻訳画像を非表示とし、上記撮像された画像に含まれる文字列を示す部分を装飾した画像と当該翻訳画像とを切り替えて表示させることができる。よって、ユーザは撮像された画像に含まれる文字列の翻訳を表示させた後であっても、容易にどのような文字列が翻訳されたのかを確認することができる。
本発明の本発明の態様2に係る情報処理装置は、上記態様1において、上記文字列装飾表示制御手段は、上記文字列に含まれる単語ごとに上記撮像された画像に含まれる文字列を示す部分を装飾してもよい。
上記の構成によれば、撮像された画像に含まれる文字列を示す部分は、単語ごとに装飾される。これにより、ユーザは単語ごとに選択できることをユーザに理解させることができる。
本発明の態様3に係る情報処理装置は、上記態様2において、上記翻訳画像生成手段は、上記単語ごとに他の言語に翻訳した結果を表す画像である翻訳画像を生成し、いずれの上記単語がユーザの入力によって選択されたかを判定する選択単語判定手段(選択単語判定部17)をさらに備え、上記翻訳表示制御手段は、上記選択単語判定手段が選択されたと判定した装飾された上記単語と対応する画像に、当該単語に対応する上記翻訳画像を重畳表示させてもよい。
上記の構成によれば、ユーザが選択した装飾された上記単語と対応する画像に、当該単語と対応する翻訳画像が重畳表示される。これにより、ユーザは翻訳を希望する単語について、翻訳画像を表示させることができる。
本発明の態様4に係る情報処理装置は、上記態様1から3において、上記文字列装飾表示制御手段は、上記撮像された画像に含まれる文字列を示す部分へ下線を引いた画像を表示させることを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。
上記の構成によれば、撮像された画像に含まれる文字列を示す部分へ下線が引かれる。これにより、撮像された画像のいずれの部分が文字列を示すかを判別することが容易になる。また、撮像された画像が文字列を示す部分の装飾によって隠される部分が少ないため、撮像された画像を装飾することに起因する、視認可能な情報の減少が少なくてすむ。
本発明の各態様に係る情報処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記情報処理装置が備える各手段として動作させることにより上記情報処理装置をコンピュータにて実現させる情報処理装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
本発明は、カメラなどの撮像装置と接続された携帯電話、スマートフォン、PDA、PCに利用することができる。
1 情報処理装置
12、112 文字列装飾表示制御部(文字列装飾表示制御手段)
13、113 翻訳画像生成部(翻訳画像生成手段)
16、116 翻訳表示制御部(翻訳表示制御手段)
17 選択単語判定部(選択単語判定手段)

Claims (5)

  1. 撮像された画像に含まれる文字列を示す部分を装飾した画像を表示させる文字列装飾表示制御手段と、
    上記文字列を他の言語に翻訳した結果を表す画像である翻訳画像を生成する翻訳画像生成手段と、
    撮像された画像または上記文字列装飾表示制御手段によって装飾された画像における上記文字列を示す部分に当該文字列と対応する上記翻訳画像を重畳して表示させる翻訳表示制御手段と、を備え、
    上記翻訳表示制御手段は、ユーザの入力に応じて、上記翻訳画像の表示および非表示を切り替え、
    上記文字列装飾表示制御手段は、上記翻訳表示制御手段が上記翻訳画像を非表示とした場合に上記装飾された画像を表示することを特徴とする情報処理装置。
  2. 上記文字列装飾表示制御手段は、上記文字列に含まれる単語ごとに装飾することを特徴とする請求項1に記載の情報処理装置。
  3. いずれの上記単語がユーザの入力によって選択されたかを判定する選択単語判定手段をさらに備え、
    上記翻訳画像生成手段は、上記単語ごとに、他の言語に翻訳した結果を表す画像である翻訳画像を生成し、
    上記翻訳表示制御手段は、上記選択単語判定手段が選択されたと判定した装飾された上記単語と対応する画像に、当該単語に対応する上記翻訳画像を重畳して表示させることを特徴とする請求項2に記載の情報処理装置。
  4. 上記文字列装飾表示制御手段は、上記画像に含まれる文字列を示す部分へ下線を引いた画像を表示させることを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。
  5. 請求項1から4のいずれか1項に記載の情報処理装置としてコンピュータを機能させるための制御プログラムであって、コンピュータを上記各手段として機能させるための制御プログラム。
JP2013202482A 2013-09-27 2013-09-27 情報処理装置、および制御プログラム Pending JP2015069365A (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2013202482A JP2015069365A (ja) 2013-09-27 2013-09-27 情報処理装置、および制御プログラム
PCT/JP2014/071647 WO2015045676A1 (ja) 2013-09-27 2014-08-19 情報処理装置、および制御プログラム
US14/890,930 US10068359B2 (en) 2013-09-27 2014-08-19 Information processing device
CN201810438693.0A CN108829644A (zh) 2013-09-27 2014-08-19 信息处理装置、记录介质以及显示翻译结果的方法
CN201480029905.XA CN105393244B (zh) 2013-09-27 2014-08-19 信息处理装置
CN201810842033.9A CN109101467A (zh) 2013-09-27 2014-08-19 信息处理装置、记录介质以及信息处理装置的动作方法
US15/996,590 US10573046B2 (en) 2013-09-27 2018-06-04 Information processing device, storage medium, and method of displaying result of translation in information processing device
US16/037,280 US20180322677A1 (en) 2013-09-27 2018-07-17 Information processing device, storage medium, and method of operating information processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013202482A JP2015069365A (ja) 2013-09-27 2013-09-27 情報処理装置、および制御プログラム

Publications (1)

Publication Number Publication Date
JP2015069365A true JP2015069365A (ja) 2015-04-13

Family

ID=52742830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013202482A Pending JP2015069365A (ja) 2013-09-27 2013-09-27 情報処理装置、および制御プログラム

Country Status (4)

Country Link
US (3) US10068359B2 (ja)
JP (1) JP2015069365A (ja)
CN (3) CN105393244B (ja)
WO (1) WO2015045676A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017224140A (ja) * 2016-06-15 2017-12-21 株式会社Nttドコモ 情報表示装置
JP2020509436A (ja) * 2017-12-26 2020-03-26 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co.,Ltd. システム言語切替方法およびシステム言語切替端末機器
KR20210037637A (ko) * 2020-09-07 2021-04-06 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 번역 방법, 장치 및 전자 기기
JP2021528788A (ja) * 2018-06-29 2021-10-21 ネイバー コーポレーションNAVER Corporation 入力アプリケーションを用いた翻訳サービス提供方法及びこれを用いる端末装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7016612B2 (ja) * 2017-02-10 2022-02-07 株式会社東芝 画像処理装置及びプログラム
CN108509117A (zh) 2017-02-27 2018-09-07 腾讯科技(深圳)有限公司 数据显示方法及装置
US10327098B1 (en) * 2018-04-30 2019-06-18 Paypal, Inc. Locations platform for managing and providing of user experiences
CN111045578A (zh) * 2018-10-12 2020-04-21 阿里巴巴集团控股有限公司 显示控制方法、显示控制装置、终端设备和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03271976A (ja) * 1990-03-22 1991-12-03 Toshiba Corp 電子辞書及び情報検索方法
JP2008054236A (ja) * 2006-08-28 2008-03-06 Nikon Corp 撮像装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH039472A (ja) * 1989-06-06 1991-01-17 Nec Corp 原文イメージ保存装置
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
JPH09179867A (ja) 1995-12-25 1997-07-11 Sharp Corp 文書情報処理装置
JPH1153365A (ja) 1997-08-07 1999-02-26 Matsushita Electric Ind Co Ltd 情報付加機能付機械翻訳装置
JP4150842B2 (ja) 2000-05-09 2008-09-17 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US6993473B2 (en) * 2001-08-31 2006-01-31 Equality Translation Services Productivity tool for language translators
US20030125927A1 (en) * 2001-12-28 2003-07-03 Microsoft Corporation Method and system for translating instant messages
US20030200078A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for language translation of character strings occurring in captured image data
JP4038771B2 (ja) * 2003-10-28 2008-01-30 ソニー株式会社 携帯型情報端末装置および情報処理方法、記録媒体、並びにプログラム
KR20060031769A (ko) * 2004-10-09 2006-04-13 엘지전자 주식회사 촬영문자를 음성 변환하는 기능을 갖는 이동통신 단말기및 그 방법
WO2006072882A2 (en) 2005-01-10 2006-07-13 Melingo, Ltd. Embedded translation-enhanced search
JP4428266B2 (ja) * 2005-03-22 2010-03-10 富士ゼロックス株式会社 翻訳装置およびプログラム
US20070216712A1 (en) * 2006-03-20 2007-09-20 John Louch Image transformation based on underlying data
US7801721B2 (en) * 2006-10-02 2010-09-21 Google Inc. Displaying original text in a user interface with translated text
US7983897B2 (en) * 2007-02-14 2011-07-19 Google Inc. Machine translation feedback
US8144990B2 (en) * 2007-03-22 2012-03-27 Sony Ericsson Mobile Communications Ab Translation and display of text in picture
CN101339617A (zh) * 2007-07-06 2009-01-07 上海思必得通讯技术有限公司 手机拍照翻译装置
US20100204979A1 (en) * 2009-02-06 2010-08-12 Inventec Corporation System and method for magnifiedly displaying real-time translated word
JP4759638B2 (ja) 2009-12-25 2011-08-31 株式会社スクウェア・エニックス リアルタイムなカメラ辞書
US9053098B2 (en) * 2010-01-14 2015-06-09 Abbyy Development Llc Insertion of translation in displayed text consisting of grammatical variations pertaining to gender, number and tense
KR101388394B1 (ko) * 2010-06-25 2014-04-22 라쿠텐 인코포레이티드 기계 번역 시스템, 기계 번역 방법 및 기록 매체
US8626236B2 (en) * 2010-10-08 2014-01-07 Blackberry Limited System and method for displaying text in augmented reality
US8635059B2 (en) * 2010-11-15 2014-01-21 Google Inc. Providing alternative translations
JP5631362B2 (ja) 2011-08-08 2014-11-26 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP5972578B2 (ja) * 2012-01-16 2016-08-17 シャープ株式会社 画像処理装置、画像形成装置、プログラム、記録媒体
KR20140030361A (ko) * 2012-08-27 2014-03-12 삼성전자주식회사 휴대단말기의 문자 인식장치 및 방법
US9087046B2 (en) * 2012-09-18 2015-07-21 Abbyy Development Llc Swiping action for displaying a translation of a textual image
US9519641B2 (en) * 2012-09-18 2016-12-13 Abbyy Development Llc Photography recognition translation
US9025877B2 (en) * 2013-01-04 2015-05-05 Ricoh Company, Ltd. Local scale, rotation and position invariant word detection for optical character recognition
JP6317772B2 (ja) * 2013-03-15 2018-04-25 トランスレート アブロード,インコーポレイテッド 外国語の文字セットおよびそれらの翻訳を資源に制約のあるモバイル機器上にリアルタイムで表示するためのシステムおよび方法
US9547644B2 (en) * 2013-11-08 2017-01-17 Google Inc. Presenting translations of text depicted in images
US9239833B2 (en) * 2013-11-08 2016-01-19 Google Inc. Presenting translations of text depicted in images
JP6328409B2 (ja) * 2013-11-28 2018-05-23 シャープ株式会社 翻訳装置
US10534528B2 (en) * 2013-12-31 2020-01-14 Barnes & Noble College Booksellers, Llc Digital flash card techniques
WO2015164823A1 (en) * 2014-04-25 2015-10-29 Fisher Timothy Isaac Messaging with drawn graphic input

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03271976A (ja) * 1990-03-22 1991-12-03 Toshiba Corp 電子辞書及び情報検索方法
JP2008054236A (ja) * 2006-08-28 2008-03-06 Nikon Corp 撮像装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017224140A (ja) * 2016-06-15 2017-12-21 株式会社Nttドコモ 情報表示装置
JP2020509436A (ja) * 2017-12-26 2020-03-26 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co.,Ltd. システム言語切替方法およびシステム言語切替端末機器
JP2021528788A (ja) * 2018-06-29 2021-10-21 ネイバー コーポレーションNAVER Corporation 入力アプリケーションを用いた翻訳サービス提供方法及びこれを用いる端末装置
JP7145988B2 (ja) 2018-06-29 2022-10-03 ネイバー コーポレーション 入力アプリケーションを用いた翻訳サービス提供方法及びこれを用いる端末装置
KR20210037637A (ko) * 2020-09-07 2021-04-06 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 번역 방법, 장치 및 전자 기기
JP2021106008A (ja) * 2020-09-07 2021-07-26 百度在綫網絡技術(北京)有限公司 翻訳方法、装置、電子機器及びコンピュータプログラム製品
JP7164651B2 (ja) 2020-09-07 2022-11-01 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 翻訳方法、装置、電子機器及びコンピュータプログラム製品
KR102569517B1 (ko) * 2020-09-07 2023-08-21 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 번역 방법, 장치 및 전자 기기

Also Published As

Publication number Publication date
US20180322677A1 (en) 2018-11-08
CN105393244A (zh) 2016-03-09
CN108829644A (zh) 2018-11-16
US20160117854A1 (en) 2016-04-28
CN109101467A (zh) 2018-12-28
US10068359B2 (en) 2018-09-04
CN105393244B (zh) 2019-10-15
WO2015045676A1 (ja) 2015-04-02
US10573046B2 (en) 2020-02-25
US20180276868A1 (en) 2018-09-27

Similar Documents

Publication Publication Date Title
WO2015045676A1 (ja) 情報処理装置、および制御プログラム
KR102147935B1 (ko) 데이터 처리 방법 및 그 전자 장치
US9448620B2 (en) Input method and apparatus of portable device for mapping segments of a hand to a plurality of keys
KR102285699B1 (ko) 이미지를 디스플레이하는 사용자 단말기 및 이의 이미지 디스플레이 방법
US9811171B2 (en) Multimodal text input by a keyboard/camera text input module replacing a conventional keyboard text input module on a mobile device
US10990748B2 (en) Electronic device and operation method for providing cover of note in electronic device
US11706476B2 (en) User terminal apparatus, electronic apparatus, system, and control method thereof
JP6991486B2 (ja) 文字列に文字を挿入するための方法およびシステム
US20170285932A1 (en) Ink Input for Browser Navigation
WO2013171919A1 (ja) 表示制御装置、制御プログラム、および表示装置の制御方法
JP2015158900A (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2013222458A (ja) ユーザデータを入力及び管理できる電子装置及び方法
US20170212658A1 (en) Display control device, display control method, and recording medium
JP2014063318A (ja) 文字認識装置、文字認識装置の制御方法、制御プログラム、および制御プログラムを記録したコンピュータ読み取り可能な記録媒体
US10970476B2 (en) Augmenting digital ink strokes
US20160307349A1 (en) Communication support system, information processing apparatus, control method, and storage medium
KR20160053545A (ko) 전자 문서 편집기에서의 객체에 대한 편집 명령 입력 방법
JP2015114955A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2017531889A (ja) 文字列記憶方法及び装置
US20200065604A1 (en) User interface framework for multi-selection and operation of non-consecutive segmented information
JP6225724B2 (ja) 情報共有システムおよび情報共有方法、ならびに、情報処理装置および情報処理方法
US20230095811A1 (en) Information processing apparatus, information processing system, and non-transitory computer readable medium storing program
JPWO2017072913A1 (ja) 制御方法、電子黒板システム、表示装置およびプログラム
JP2017010470A (ja) 電子機器
US20140132567A1 (en) Modifying a digital document responsive to user gestures relative to a physical document

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170509

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171107