JP2005128955A - 情報処理方法および記憶媒体、プログラム - Google Patents

情報処理方法および記憶媒体、プログラム Download PDF

Info

Publication number
JP2005128955A
JP2005128955A JP2003366313A JP2003366313A JP2005128955A JP 2005128955 A JP2005128955 A JP 2005128955A JP 2003366313 A JP2003366313 A JP 2003366313A JP 2003366313 A JP2003366313 A JP 2003366313A JP 2005128955 A JP2005128955 A JP 2005128955A
Authority
JP
Japan
Prior art keywords
information
link information
file
path
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003366313A
Other languages
English (en)
Inventor
Toshiaki Fukada
俊明 深田
Yasuhiro Komori
康弘 小森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003366313A priority Critical patent/JP2005128955A/ja
Priority to US10/971,152 priority patent/US20050089017A1/en
Priority to EP04256592A priority patent/EP1530135A3/en
Priority to CNB2004100879725A priority patent/CN100341273C/zh
Publication of JP2005128955A publication Critical patent/JP2005128955A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 実用的な情報アクセス手段の生成にあたり、利用者の利便性を向上させることを目的とする。
【解決手段】 情報アクセスのためのパスおよび該パスに対するリンク情報を登録する情報処理方法であって、入力される前記情報アクセスのためのパスによりアクセスされたファイルに基づいて、リンク情報の候補を生成するリンク情報候補生成部202における生成工程と、前記生成されたリンク情報候補を表示するリンク情報候補提示部203における表示工程と、前記表示されたリンク情報候補の中から選択されたリンク情報を認識するリンク情報選択部204における認識工程と、前記認識されたリンク情報を、前記アクセスされたファイルのパスと関連付けて登録するリンク情報登録部205における登録工程とを備える。
【選択図】 図2

Description

本発明は、URL、ファイル、ディレクトリに対する情報のアクセスを容易にするためのリンク情報の登録処理に関するものである。
インターネット技術や大容量記憶装置の発達に伴い、個人が扱う情報量も膨大になり、その結果、所望の情報を探し出せない、あるいは情報にたどり着くまでに時間がかかるといった問題が生じており、効率的に情報にアクセスするための情報アクセス手段の要求が高まってきている。
例えば、コンピュータ上でインターネットのコンテンツを閲覧するブラウザでは、「ブックマーク」や「お気に入り」と呼ばれるモジュール内で、URL(パス)とそれに対するタグ名(リンク情報)を登録することによって、利用者はURLを入力しなくとも、タグ名をクリックさえすれば、URLによって指定されるコンテンツに容易にアクセスすることが可能である。
また、コンピュータの記憶装置に深い階層構造で格納されているファイルやディレクトリもしくはネットワーク接続されているコンピュータやプリンタなどの周辺機器に割り当てられたドライブに対しては、「リンク」や「ショートカット」といった方法によって、利用者にとって都合のよいディレクトリにショートカット(リンク情報)を作成することによって、ショートカットをダブルクリックさえすれば、利用者はファイルやディレクトリが格納されている階層構造をたどることなく容易に所望のファイルやディレクトリにアクセスすることが可能である。
一方、情報アクセス手段を効率的に生成する方法についても、これまで種々の提案がなされてきた。例えば、音声認識を用いたウェブアクセス手段を生成するための方法として、特開2002−41081号公報には、ウェブページコンテンツのタグを解析して、自動的に音声認識用の認識文法を様々に組み合わせて作成する方法が開示されている。
また、特開平9−162966号公報には、音声ダイヤル装置において、頻度の高いダイヤル発信に対して、相手の名前を音声入力できるように名前の入力を促すという方法が開示されている。かかる方法を用いることにより、利用者が頻繁にアクセスするパスに対しては、システムから自動的にリンク情報の登録を促すことが可能となり、情報アクセス手段を効率的に生成することが可能となる。
特開2002−41081号公報 特開平9−162966号公報
しかしながら、上記特許文献1によれば、システムによって利用者が発声すると想定した様々な単語の組み合わせがシステムの内部情報として保持されているため、利用者は何と発声すればよいのかが分からない。また、様々な発声が受け付けられるようにするため、1つのパスに対して複数の単語や単語列を用意しておく必要があるため、登録されるパスの数が増加すると認識対象語彙が膨大となり、結果として実用に耐えうる音声認識性能が得られない可能性がある。
また、上記特許文献2によれば、利用者が電話番号に対する名前を文字情報としてキー入力する場合に、電話機などの小型機器で入力することは困難であり、利便性に欠けるという問題がある。
この他にも、情報アクセス手段の生成については、種々の問題がある。例えば、URLに対するタグ名やショートカット名は、通常、システムによって一意に定められ、これらの名前を変更するためには、利用者がキーボードを用いて入力を行わなければならない。また、同じ階層上にはパスが異なっていても同一名のタグやショートカットを複数設定することはできない。更に、必ず文字情報を入力する必要があり、アイコンなどの画像情報のみによる設定を行うことはできない。また、リンク情報を音によって設定することはできない。このように、これまでの情報アクセス手段の生成に利便性及び機能性の面で問題があった。
本発明は、上記課題を鑑みてなされたものであり、実用的な情報アクセス手段の生成にあたり、利用者の利便性を向上させることを第1の目的とする。さらに、機能性の高い情報アクセス手段の生成を図ることを第2の目的とする。
上記の目的を達成するために本発明に係る情報処理方法は以下のような構成を備える。即ち、
情報アクセスのためのパスおよび該パスに対するリンク情報を登録する情報処理方法であって、
入力される前記情報アクセスのためのパスによりアクセスされたオブジェクトに基づいて、リンク情報の候補を生成するリンク情報候補生成工程と、
前記生成されたリンク情報候補を表示する表示工程と
前記表示されたリンク情報候補の中から選択されたリンク情報を認識する認識工程と
前記認識されたリンク情報を、前記アクセスされたオブジェクトのパスと関連付けて登録する登録工程とを備える。
本発明によれば、実用的な情報アクセス手段の生成にあたり、利用者の利便性を向上させることが可能となる。さらに、機能性の高い情報アクセス手段を生成することが可能となる。
以下、添付図面を参照して本発明の好適な実施の形態を詳細に説明する。なお、説明にあたっては、各用語の意味を以下のように定義する。すなわち、「オブジェクト」とは、概念的に一つのまとまりをなす機能をいい、本願においては、URLにより指定されるコンテンツや、アプリケーションソフトにより作成されるファイル、ファイルの保存先を示すディレクトリを含む概念であるとする。また、「パス」とは、UNIX(登録商標)やMS−DOS、Windows(登録商標)などでファイルやフォルダ(ディレクトリ)の位置を示す方法を一般にいうが、本願においては、アクセスする対象がインターネットのコンテンツの場合、URLもパスに含まれるものとする。さらに、「リンク情報」とは、アクセス対象がファイルやディレクトリの場合にはショートカットアイコン等を、アクセス対象がコンテンツの場合にはタグ名等をそれぞれ指し、利用者が画面上で選択することにより、自動的にリンク先にアクセスする機能を有する表示をいうものとする。
[第1の実施形態]
<ハードウェア構成>
図1は、本発明の第1の実施形態に係る情報処理方法(データ登録方法)を実現するための情報処理装置のハードウェア構成を示すブロック図である。101はCPUで、ROM102に記憶された制御プログラム或いは外部記憶装置104からRAM103にロードされた制御プログラムが実行されることにより、本実施形態にかかるデータ登録方法が実現される。
ROM102は各種パラメータやCPU101が実行する制御プログラムなどを格納している。RAM103は、CPU101による各種制御の実行時に作業領域を提供するとともに、CPU101により実行される制御プログラムを記憶する。104はハードディスク、フロッピー(登録商標)ディスク、CD−ROM、DVD−ROM、メモリカード等の外部記憶装置で、この外部記憶装置がハードディスクの場合には、CD−ROMやフロッピー(登録商標)ディスク等からインストールされた各種プログラムが記憶されている。
105はタッチパネル、ボタン、ペン、手書き文字入力のためのパッド、マウス、キーボード、バーコードなどの情報入力部である。106はCRT、液晶、タッチパネルなどの情報表示部であり、文字、画像などによる情報の表示・出力を行う。107はマイクロフォンなどの音声入力部であり、音声認識による情報アクセスや音声による機器操作などを行う。108はスピーカなどの音声出力部であり、利用者への情報通知などを行う。109は上記各部を接続するバスである。
<登録のための処理>
図2は本発明の第1の実施形態にかかるデータ登録方法を実現するための制御プログラムのモジュール構成を示したブロック図である。以下、情報アクセスのためのパスとしてURLによって指定されるHTML文書の場合を例にあげて説明する。いま、パスで指定されたHTML文書をブラウザなどの閲覧プログラムで表示した際の一例を図3に、そのHTML文書のソースファイルを図4にそれぞれ示す。
まず、パス入力部201では、利用者が指定したこのURLを認識する。URLの指定方法は、キーボード、マウス、ボタン、ペン、手書き文字、音声、バーコード、タッチパネルのいずれかもしくは任意の組み合わせによって、情報入力部105および音声入力部107にて行う。
次に、リンク情報候補生成部202では、HTML文書のソースファイルに対して、構造解析およびテキスト解析を行いリンク情報の候補を生成する。構造解析の一例として、HTMLに関するタグ情報を取り除く処理を行うと、「全国の最新ニュース」、「北海道」、「札幌の雪祭り」、「小樽の魚」などのテキストを取り出すことができる。
次に、これらのテキストに対するテキスト解析として、まず形態素解析を適用し、単語への分割を行う。これによって、例えば「全国/の/最新/ニュース」、「北海道」、「札幌/の/雪祭り」、「小樽/の/魚」といった分割がなされる(「/」は単語区切りを示す記号を表す)。
次に、各テキストに加えて、単語もしくは部分単語列を生成する。例えば、「全国/の/最新/ニュース」に対しては、「全国の最新ニュース」に加えて、「全国」、「の」、「最新」、「ニュース」、「全国の」、「の最新」、「最新ニュース」、「全国のニュース」などの単語もしくは部分単語列の候補が生成できる。ここで、単語列の確からしさ、文字数制限、単語頻度などの候補選別処理を適用することによって、これらの候補を絞る。ここで、単語列の確からしさを求める方法としては、例えば、広く知られている単語バイグラムを用いた言語尤度に基づく方法が利用できる。同様に、「札幌の雪祭り」、「小樽の魚」などのテキストに対しても単語列もしくは部分単語列の候補を生成することができる。
ここで、一つのパスに対するリンク情報候補の数は一定数以下になるように制御することが望ましい。このために、例えば、単語列の確からしさの高いものから所定の一定数まで選択することができるようにしておくことが望ましい。また、HTMLのタグ属性に応じて選択基準を変えることもできる。例えば、タイトルタグ(”<title>”および”</title>”)の間に含まれる部分は、XTML文書(コンテンツ)の内容を適切に表現している可能性が高いと考えられる。そのため、XTML文書を構造解析およびテキスト解析して得られるリンク情報候補の数が例えば6個と決められている場合、タイトルタグのテキストから4個、それ以外のテキストから2個の候補を生成するといった制御を行うようにしてもよい。
また、このパスをアクセスしている利用者の機器の使用状況に関する利用者使用状況を用いたリンク情報候補の生成も可能である。利用者使用状況としては、アクセスした年月日、時刻、朝、昼、夜などの時間帯、曜日などの時間情報、アクセスした際の位置情報、利用者IDなどである。例えば、上記XTML文書にアクセスした時間情報として「12月25日の朝」、アクセスした位置情報として「東京駅」周辺が得られた場合、これらの情報をリンク情報候補とすることができる。
次に、リンク情報候補提示部203では、以上の方法によって得られる前記HTMLソースファイルに対するリンク情報候補を利用者へ提示する。この一例を図5に示す。このリンク情報候補の提示は、CRT、液晶パネル、音声読み上げのいずれかもしくは任意の組み合わせによって、情報提示部106および音声出力部108にて行う。
次に、リンク情報選択部204では、利用者がリンク情報候補提示部203で提示されるリンク情報候補の中から選択した一つのリンク情報を認識する。この際の選択方法としては、キーボード、マウス、ボタン、ペン、音声、タッチパネルのいずれかもしくは任意の組み合わせによって、情報入力部105および音声入力部107にて行う。
最後に、リンク情報登録部205では、リンク情報選択部204で利用者が選択したリンク情報とそのパスをデータ登録する。
<アクセス処理>
以上の処理によって登録されるリンク情報とそのパスを用いて情報アクセスを行うための情報処理装置のブロック図を図16に示す。501は登録済リンク情報提示部であり、これまでに登録されたリンク情報とそれに対するパスの情報を保持している503のリンク/パス情報データからリンク情報を取り出して利用者に提示する。
登録済みリンク情報提示部501で利用者に提示されるリンク情報の例を図17に示す。図5において利用者が「全国のニュース」を選択した場合に対応して、図17に「全国のニュース」というリンク情報が提示されている。502はリンク情報選択部であり、図17に示されるリンク情報から所望のものを選択する。そして選択されたリンク情報に対するパス情報をリンク/パス情報503から取り出し、情報アクセス部504において、取り出されたパスに対して情報アクセスを行う。
図17の例におけるリンク/パス情報503として保持されるリンク情報およびそのパスのデータの一例を図19に示す。第一カラムはリンク/パス情報を管理するためのリンクIDである。第二カラムはリンク情報の種別を表すリンク種別であり、「テキスト」とはリンク情報が上記例のようにXHML文書のテキスト部分から生成されたことを表している。
同様に、「画像」、「音」は、リンク情報がXHML文書のそれぞれ画像部分および音部分から生成されたことを表している(詳細は後述)。また、「時間」および「場所」は、利用者の機器の使用状況として、時間に関する情報および位置に関する情報から生成されたことを表している。第三カラムはリンクの内容であり、リンク種別がテキストの場合はそのテキストを、画像や音の場合はそれらのファイル名を、時間や場所の場合はそれらの情報をそれぞれ保持している部分である。第四カラムはリンクに対するパスを表しており、ここではURLのパスの例を示している。例えば、図17において利用者が「全国のニュース」を選択した場合には、これに対応するパスであるhttp://www.weather.xxx/japan.htmを取り出し、情報アクセス部504によりこのURLに対する情報アクセスを行う。
以上の説明から明らかなように、本実施形態によれば、利用者が入力するパスに対するリンク情報を複数種類の候補として利用者に提示し、利用者はその候補の中から一つを選択することによって、パスとそれに対するリンク情報を登録することができる。このため、キーボードを入力することができない利用者やキーボード入力を備えていないもしくは入力困難な機器に対しても簡便な方法で利用者の好みに応じたリンク情報を登録することが可能となり、実用性を備えつつ、利用者の利便性が向上する。
[第2の実施形態]
第1の実施形態において、HTML文書にはテキスト情報しか含まれていなかったが、当該HTML文書内に画像データに対するリンクが含まれていてもよい。この場合には、リンク先の画像を画像解析して得られる画像データをリンク情報候補とする。この際の画像解析としては、様々な方法が考えられるが、例えば、リンク先の画像データが静止画の場合には、リンク情報候補提示部203や登録済リンク情報提示部501において提示可能な画像フォーマットへの変換やサイズ変換を行う。
また、リンク先の画像データが動画の場合には、先頭フレームの画像を静止画に変換するか、全体の中で最も特徴的なシーンを静止画として変換するか、あるいは動画全体もしくは一部を動画データとするなどの方法によって得られる画像データをリンク情報候補とすることができる。図6にテキストデータと画像データで構成されたHTML文書の表示例を、図7にそのHTMLソースファイルを、図8に図7のHTMLソースファイルに対して構造解析、テキスト解析、画像解析を施したリンク情報候補の利用者への提示例をそれぞれ示す。
図7において、<img src=”hokkaido.gif”>、<img src=”tohoku.gif”>、<img src=”kanto.gif”>の部分がそれぞれ北海道、東北、関東に対するGIF形式の画像データである。いま、これら3つの画像データがリンク情報候補の一部として選ばれたとすると、リンク情報候補提示部203では、図8に示すような提示がなされる。ここで、テキスト解析、画像解析、利用者使用情報のそれぞれから得られるリンク情報候補は、例えば、画像解析、テキスト解析、利用者情報の順に優先するなどの何らかの規則を適用すればよい。図19のリンクIDが005の例は、リンク情報として画像データが選択された場合である。この例では、リンクの内容は画像データそのものではなく、画像データが存在する場所(file:”A社.gif”)が保持されている。
以上の説明から明らかなように、HTML文書内に画像データに対するリンクが含まれている場合には、当該画像データがリンク情報候補として利用者に提示され、さらに、リンク情報として当該画像データを利用者が選択した場合には、当該画像データが存在する場所がリンク情報として当該HTML文書のパス情報と関連付けて登録されることとなる。このように、本実施形態によれば、リンク情報を画像データにより設定することが可能となり、機能性の高い情報アクセス手段の生成が可能となる。
[第3の実施形態]
第1の実施形態において、HTML文書にはテキスト情報しか含まれていなかったが、当該HTML文書内に音データに対するリンクが含まれていてもよい。この場合には、リンク先の音を音解析して得られる音データをリンク情報候補とする。この際の音解析としては、様々な方法が考えられるが、例えば、リンク情報候補提示部203や登録済リンク情報提示部501において再生可能なサウンドフォーマットへの変換(例えば、MP3からPCMへの変換やサンプリングレートの変換)を行う。
他にも、先頭から一定時間もしくは一定バイト数の音データを切り出す、あるいは全体の中で最も特徴的な部分を抽出するなどの方法によって得られる音データをリンク情報候補とすることができる。更には、音環境分析などの手法によって音の種類を識別行う、あるいは音声部分に対して音声認識を行うなどの方法を用いることによって、音データをテキストデータに変換し、このテキストデータを第1の実施形態で示した方法もしくは同様な方法によって、文字列としてリンク情報候補を生成することもできる。
図9にテキストデータと音データに対するリンク情報で構成されたHTML文書の表示例を、図10にそのHTMLソースファイルを、図11に図10のHTMLソースファイルに対して構造解析、テキスト解析、音解析を施したリンク情報候補の利用者への提示例をそれぞれ示す。
図10において、<a href=”jazz.au”>の部分がテキストデータ「横浜のジャズコンサート」に対してリンク付けされた音データである。いま、この音データがリンク情報候補の一部として選ばれたとすると、リンク情報候補提示部203では、図11に示すような提示がなされる。ここで、テキスト解析、音解析、利用者使用情報のそれぞれから得られるリンク情報候補は、例えば、音解析、テキスト解析、利用者情報の順に優先するなどの何らかの規則を適用すればよい。図19のリンクIDが006の例は、リンク情報として音データが選択された場合である。この例では、リンクの内容は音データそのものではなく、音データが存在する場所(file:”jazz.au”)が保持されている。
以上の説明から明らかなように、HTML文書内に音データに対するリンクが含まれている場合には、当該音データがリンク情報候補として利用者に提示され、さらに、リンク情報として当該音データを利用者が選択した場合には、当該音データが存在する場所がリンク情報として当該HTML文書のパス情報と関連付けて登録されることとなる。このように、本実施形態によれば、リンク情報を音データによって設定することが可能となり、機能性の高い情報アクセス手段の生成が可能となる。
[第4の実施形態]
上記第1から第3の実施形態では、URLに対するハイパーリンク情報がHTML文書の場合について説明したが、ハイパーリンク情報としてはこれに限らず、XHTML、CHTML、XMLなどのデータに対しても同様に適用可能である。
[第5の実施形態]
上記第1から第4の実施形態では、情報アクセスのパスがURLである場合について説明したが、パスはURLに限らずコンピュータや情報機器に格納されたファイルでもよい。ファイルの場合でもURLと同様の方法でデータ登録を行うことが可能である。
[第6の実施形態]
上記第1から第5の実施形態では、情報アクセスのパスがURLもしくはファイルである場合について説明したが、パスはこれらに限らずコンピュータや情報機器に格納されたディレクトリ(フォルダ)でもよい。この場合には、ディレクトリ名もしくはディレクトリに格納されたファイル名、ファイルの内容、ディレクトリ名のいずれかもしくは任意の組み合わせからリンク情報候補を生成する。ディレクトリとその中に含まれるファイルの例を図12に、これらのディレクトリおよびファイルに対して生成されるリンク情報候補の利用者への提示例を図13にそれぞれ示す。
図12の例は、ディレクトリ名が「/home/ABC/doc/mail」であり、このディレクトリの中に、「001.txt」、「002.txt」、「003.txt」の3つのテキストファイルが存在している。例えば、末尾のディレクトリ名(mail)、拡張子を除いたファイル名をセパレータ(/)を用いて結合したもの、各テキストのキーワード句、アクセス時間、アクセス場所をリンク情報候補として生成すると、図13のようなリンク情報候補の提示がなされる。ディレクトリ内に含まれるファイルがテキストファイル以外の画像ファイル、音ファイル、もしくはこれらが統合された構造化ファイル、マルチメディアドキュメントに対しても第1から第4と同様の方法でデータ登録を行うことが可能である。
[第7の実施形態]
上記実施形態では、テキストとして得られたリンク情報候補は利用者にテキスト表示される文字列であったが、音声合成のための読みやアクセントなどの情報を生成することによって、リンク情報候補提示部203による提示時、リンク情報選択部204による選択指示の認識時、登録済リンク情報提示部501による提示時、登録済リンク情報選択部502による選択指示の認識時に音声出力を行うことが可能となる。図14は、リンク情報候補生成時にテキスト音声合成機能を用いて、リンク情報候補のテキストに対する読み情報を求め、リンク情報候補提示時およびリンク情報選択時に音声合成出力する場合のブロック図である。
301〜304および306は図2と同様の動作を行う。305はテキスト音声合成部で、リンク情報候補生成部302で作成されたテキストのリンク情報候補に対して、読みやアクセントなど音声合成を行うために必要な情報を出力する。これらの情報を用いて、リンク情報候補提示部303による提示時もしくはリンク情報選択部304による選択指示認識時に利用者にテキスト音声合成部305によって合成音声を生成し、スピーカなどから音声出力することが可能となる。
図20は、リンク情報選択時に音声合成を行う際のリンク情報およびそのパスのデータ内容の一例である。リンク種別が「テキスト+合成」となり、リンク内容が「全国の天気+ゼ'ンコクノ/テ'ンキ」とテキストと音声合成のための読みとアクセント情報の対としてリンク情報が保持されている。なお、「+」は結合記号、「/」は文節区切り、「'」はアクセント記号をそれぞれ表す。なお、テキスト音声合成部305が自動的に出力した読みやアクセントなどの情報を利用者が好みに応じて変更してもよい。また、こうした変更が不要もしくは不可能な場合には、必ずしも読み情報を出力する必要はない。
図18は、音声合成機能を用いた情報アクセスを行う際のブロック図である(605の音声認識部については後述)。ここで、601、602、604、606は、図16と同様の動作を行う。604に保持されている音声合成用のリンク情報を用いることによって、登録済リンク情報提示部601による提示時やリンク情報選択部602による選択指示認識時に利用者に対して合成音声でリンク情報を提示することが可能となる。
[第8の実施形態]
前記実施形態では、テキストとして得られたリンク情報候補は利用者にテキスト表示される文字列であったが、音声認識のための文字列や読みなどの情報を生成することによって、リンク情報選択部204による選択指示認識時、登録済リンク情報選択部502による選択指示認識時に音声認識によってパスを入力することが可能となる。
図15は、リンク情報候補生成時にリンク情報候補のテキストに対する文字列や読みなどの音声認識を行うために必要な情報を求める場合のブロック図である。401〜404および406は図2と同様の動作を行う。405は音声認識用発音生成部で、リンク情報候補生成部402で作成されたテキストのリンク情報候補に対して、文字列や読みなど音声認識を行うために必要な情報を出力する。なお、これらの情報はリンク情報候補提示部403で利用者に提示してもよいし、リンク情報選択部404による選択指示認識時に更に音声認識部を設け、実際に音声認識が正常に動作するかの確認を行ったり、必要であれば音声認識用発音生成部405が出力した情報を変更してもよい。
図21は、音声認識によってリンク情報を選択する際のリンク情報およびそのパスのデータ内容の一例である。リンク種別が「テキスト+認識」となり、リンク内容が「全国の天気+z e X k o k u n o t e X k i」とテキストと音声認識を行うために必要な読み情報の対としてリンク情報が保持されている。なお、「+」は結合記号を表す。図18は、音声認識機能を用いて情報アクセスを行う際のブロック図である(603の音声合成部については前述)。ここで、登録済みリンク情報提示部601、リンク情報選択部602、リンク/パス情報604、情報アクセス部606は、図16と同様の動作を行う。リンク/パス情報604に保持されている音声認識用のリンク情報を用いることによって、リンク情報選択部602によるリンク情報選択時に利用者に対して音声認識によって所望のパスを入力することが可能となる。
[第9の実施形態]
前記実施形態で挙げられたリンク種別には、テキスト、画像、音、時間、位置、合成、認識があったが、これらの情報は任意に組み合わせることによって、リンク情報候補を生成することも可能である。図22に、様々なリンク種別が混同したリンク情報およびそのパスのデータ内容の一例を示す。組み合わせの方法はこれに限らず、他にも例えば「テキスト+合成+認識」とすることによって、リンク情報を画面表示と音声出力の両方で確認し、音声によってパス入力を行うことが可能となる。
[第10の実施形態]
前記実施形態では、利用者が選択したリンク情報を登録していたが、この際、選択されたリンク情報と同一もしくは類似のリンク情報が既に存在している場合も考えられる。この場合には、リンク情報候補生成時に候補から除外する、もしくは利用者に通知するための付加情報を生成することが可能である。
図23に、同一および類似データ情報を含んだリンク情報およびそのパスのデータ内容の一例を示す。この例では、第四カラムおよび第五カラムにそれぞれ同一リンク情報、類似リンク情報として、同一・類似リンク情報のリンクIDを保持している。図24は、同一データ情報を含んだリンク情報が選択された場合の利用者への提示方法の一例を示す。図25は、類似データ情報を含んだリンク情報が選択された場合の利用者への提示方法の一例を示す。なお、同一もしくは類似の判定は、テキスト情報の場合は文字列レベルのDPマッチング、画像・音情報の場合は、画像・音の類似度判定を行うことによって実現可能である。
[第11の実施形態]
前記実施形態では、パスが入力されるとリンク情報候補を生成し、利用者に選択させていたが、パスに対するアクセス回数をカウントし、同一パスに対するアクセス回数が所定の回数を超えた場合にリンク情報候補生成以降の処理を行うことも可能である。図26に、あるパスに対するアクセスが所定の回数以上となった場合にデータ登録を行う際のブロック図を示す。
パス入力部701で利用者によってパス入力がなされた際に、パス/アクセス回数情報703を参照し、パス入力部701で入力したパスに対するアクセス回数のカウンタを1つ増加させる。そして、アクセス回数判定部704でこのアクセス回数が所定回数ε以上となった際にリンク情報候補生成部705からリンク情報登録部708の処理を行い、ε未満の場合はリンク情報の登録処理を行うことなく情報アクセス部709へ移る。なお、εは利用者によってパスやパスのカテゴリごとに個別の値を設定してもよいし、カウンタの増分を同一パスに対するアクセスのインターバル(時期差)に応じて変化させてもよいし、インターバル(時期差)に応じてパス/アクセス回数情報703に保持されているアクセス回数情報をリセットもしくは減じてもよい。
[他の実施形態]
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。プログラムコードを供給するための記憶媒体としては、例えば、フロッピ(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される情報機器などの装置が含まれることは言うまでもない。
本発明の第1の実施形態に係る情報処理方法(データ登録方法)を実現するための情報処理装置のハードウェア構成を示すブロック図である。 本発明の第1の実施形態にかかるデータ登録方法を実現するための制御プログラムのモジュール構成を示したブロック図である。 テキストデータのみで構成されたHTMLコンテンツの表示例を示す図である。 図3のHTMLソースファイルを示す図である。 図4のHTMLソースファイルに対して構造解析および言語解析を施したリンク情報候補の利用者への提示例を示す図である。 テキストデータと画像データで構成されたHTML文書の表示例を示す図である。 図6のHTMLソースファイルを示す図である。 図7のHTMLソースファイルに対して構造解析、言語解析、画像解析を施したリンク情報候補の利用者への提示例を示す図である。 テキストデータと音データのリンク情報で構成されたHTML文書の表示例を示す図である。 図9のHTMLソースファイルを示す図である。 図10のHTMLソースファイルに対して構造解析、言語解析、音解析を施したリンク情報候補の利用者への提示例を示す図である。 ディレクトリとその中に含まれるファイルの例を示す図である。 図12に示したディレクトリおよびファイルに対して生成されるリンク情報候補の利用者への提示例を示す図である。 本発明の第7の実施形態にかかるデータ登録方法を実現するための制御プログラムのモジュール構成を示したもので、リンク情報候補生成時にテキスト音声合成機能を用いて、利用者に提示およびリンク情報のための読み情報を求める場合のブロック図である。 本発明の第7の実施形態にかかるデータ登録方法を実現するための制御プログラムのモジュール構成を示したもので、情報アクセス時に音声認識を用いる際に、リンク情報のための音声認識用発音情報を求める場合のブロック図である。 登録されたリンク情報とそのパスを用いて情報アクセスを行う際のブロック図である。 図16の登録済みリンク情報提示部で利用者に提示されるリンク情報の例を示す図である。 音声合成および音声認識機能を用いて情報アクセスを行う際のブロック図である。 リンク情報およびそのパスのデータ内容の例を示す図である。 リンク情報選択時に音声合成を行う際のリンク情報およびそのパスのデータ内容の例を示す図である。 音声認識によってリンク情報を選択する際のリンク情報およびそのパスのデータ内容の例を示す図である。 様々なリンク種別が混同したリンク情報およびそのパスのデータ内容の例を示す図である。 同一および類似データ情報を含んだリンク情報およびそのパスのデータ内容の例を示す図である。 同一データ情報を含んだリンク情報が選択された場合の利用者への提示方法の一例を示す図である。 類似データ情報を含んだリンク情報が選択された場合の利用者への提示方法の一例を示す図である。 あるパスに対するアクセスが所定の回数以上となった場合にデータ登録を行う際のブロック図である。

Claims (16)

  1. 情報アクセスのためのパスおよび該パスに対するリンク情報を登録する情報処理方法であって、
    入力される前記情報アクセスのためのパスによりアクセスされたオブジェクトに基づいて、リンク情報の候補を生成するリンク情報候補生成工程と、
    前記生成されたリンク情報候補を表示する表示工程と
    前記表示されたリンク情報候補の中から選択されたリンク情報を認識する認識工程と
    前記認識されたリンク情報を、前記アクセスされたオブジェクトのパスと関連付けて登録する登録工程と
    を備えることを特徴とする情報処理方法。
  2. 情報アクセスのためのパスおよび該パスに対するリンク情報を登録する情報処理方法であって、
    入力される前記情報アクセスのためのパスにより所定のオブジェクトにアクセスした際の状況を示す情報に基づいて、リンク情報の候補を生成するリンク情報候補生成工程と、
    前記生成されたリンク情報候補を表示する表示工程と
    前記表示されたリンク情報候補の中から選択されたリンク情報を認識する工程と
    前記認識されたリンク情報を、前記アクセスされたオブジェクトのパスと関連付けて登録する登録工程と
    を備えることを特徴とする情報処理方法。
  3. 前記情報アクセスのためのパスは、URL、ファイル、またはディレクトリのいずれかに対するパスであることを特徴とする請求項1または2に記載の情報処理方法。
  4. 前記リンク情報候補は、前記アクセスされたオブジェクトに記載された文字列、または、前記アクセスされたオブジェクトに関連付けられた画像データ、音声データ、音声合成のための読み、音声認識のための発音のいずれか、もしくは、これらの任意の組み合わせにより生成されることを特徴とする請求項1または2に記載の情報処理方法。
  5. 前記情報アクセスのためのパスがURLである場合、前記オブジェクトはコンテンツを示し、
    前記リンク情報候補生成工程は、該URLによりアクセスされるHTMLファイル、XHTMLファイル、CHTMLファイル、またはXMLファイルのいずれかのコンテンツに対して解析を行い、該コンテンツに含まれる文字列を抽出することで、前記リンク情報の候補を生成することを特徴とする請求項3に記載の情報処理方法。
  6. 前記情報アクセスのためのパスがURLである場合、前記オブジェクトはコンテンツを示し、
    前記リンク情報候補生成工程は、該URLによりアクセスされるHTMLファイル、XHTMLファイル、CHTMLファイル、またはXMLファイルのいずれかのコンテンツに対して解析を行い、該コンテンツに含まれる画像データまたは、該コンテンツにリンクされている画像データのファイル名を抽出することで、前記リンク情報の候補を生成することを特徴とする請求項3に記載の情報処理方法。
  7. 前記情報アクセスのためのパスがURLである場合、前記オブジェクトはコンテンツを示し、
    前記リンク情報候補生成工程は、該URLによりアクセスされるHTMLファイル、XHTMLファイル、CHTMLファイル、またはXMLファイルのいずれかのコンテンツに対して解析を行い、該コンテンツに含まれる音データまたは、該コンテンツにリンクされている音データのファイル名を抽出することで、前記リンク情報の候補を生成することを特徴とする請求項3に記載の情報処理方法。
  8. 前記情報アクセスのためのパスが所定のファイルを指定する場合、前記オブジェクトは該ファイルを示し、
    前記リンク情報候補生成工程は、該パスによりアクセスされるファイルに対して解析を行い、該ファイルに含まれる文字列を抽出することで、前記リンク情報の候補を生成することを特徴とする請求項3に記載の情報処理方法。
  9. 前記情報アクセスのためのパスが所定のファイルを指定する場合、前記オブジェクトは該ファイルを示し、
    前記リンク情報候補生成工程は、該パスによりアクセスされるファイルに対して解析を行い、該ファイルに含まれる画像データまたは、該ファイルにリンクされている画像データのファイル名を抽出することで、前記リンク情報の候補を生成することを特徴とする請求項3に記載の情報処理方法。
  10. 前記情報アクセスのためのパスが所定のファイルを指定する場合、前記オブジェクトは該ファイルを示し、
    前記リンク情報候補生成工程は、該パスによりアクセスされるファイルに対して解析を行い、該ファイルに含まれる音データまたは、該ファイルにリンクされている音データのファイル名を抽出することで、前記リンク情報の候補を生成することを特徴とする請求項3に記載の情報処理方法。
  11. 前記情報アクセスのためのパスが所定のディレクトリを指定する場合、前記オブジェクトは該ディレクトリまたは該ディレクトリに含まれるファイルを示し、
    前記リンク情報候補生成工程は、該ディレクトリ名、該ディレクトリに含まれるファイル名、該ディレクトリに含まれるファイルの内容、または該ディレクトリに含まれるディレクトリ名のいずれかもしくはこれらの組み合わせにより、前記リンク情報の候補を生成することを特徴とする請求項3に記載の情報処理方法。
  12. 前記所定のオブジェクトにアクセスした際の状況を示す情報とは、アクセスした年月日、時刻、時間帯、アクセスした場所、アクセスした利用者のIDのいずれか、もしくはこれらの組み合わせであることを特徴とする請求項2に記載の情報処理方法。
  13. 前記登録工程は、
    前記リンク情報候補生成工程において抽出された文字列のうち、前記認識工程において認識された文字列についての音声合成に関する情報を、該文字列と関連付けて登録することを特徴とする請求項5、8のいずれかに記載の情報処理方法。
  14. 前記表示工程は、
    前記リンク情報候補生成工程において生成されたリンク情報の候補が、前記登録工程により既に登録されたリンク情報であった場合には、該リンク情報の候補を表示しないことを特徴とする請求項1に記載の情報処理方法。
  15. 請求項1乃至14のいずれか1つに記載の情報処理方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体。
  16. 請求項1乃至14のいずれか1つに記載の情報処理方法をコンピュータによって実現させるための制御プログラム。
JP2003366313A 2003-10-27 2003-10-27 情報処理方法および記憶媒体、プログラム Pending JP2005128955A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2003366313A JP2005128955A (ja) 2003-10-27 2003-10-27 情報処理方法および記憶媒体、プログラム
US10/971,152 US20050089017A1 (en) 2003-10-27 2004-10-25 Data processing method, data processing apparatus, storage medium and program
EP04256592A EP1530135A3 (en) 2003-10-27 2004-10-26 Data processing method, data processing apparatus, storage medium and program
CNB2004100879725A CN100341273C (zh) 2003-10-27 2004-10-27 信息处理方法和信息处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003366313A JP2005128955A (ja) 2003-10-27 2003-10-27 情報処理方法および記憶媒体、プログラム

Publications (1)

Publication Number Publication Date
JP2005128955A true JP2005128955A (ja) 2005-05-19

Family

ID=34431224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003366313A Pending JP2005128955A (ja) 2003-10-27 2003-10-27 情報処理方法および記憶媒体、プログラム

Country Status (4)

Country Link
US (1) US20050089017A1 (ja)
EP (1) EP1530135A3 (ja)
JP (1) JP2005128955A (ja)
CN (1) CN100341273C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007200194A (ja) * 2006-01-30 2007-08-09 Kyocera Corp ウェブページの表示方法およびブラウザ装置、並びにウェブページ表示プログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8923124B1 (en) * 2006-01-31 2014-12-30 Juniper Networks, Inc. Data unit counter
US9152946B2 (en) 2010-05-21 2015-10-06 Brokersavant Inc. Apparatuses, methods and systems for a lead generating hub
CN103714076B (zh) * 2012-09-29 2017-09-22 联想(北京)有限公司 电子设备及其文件浏览方法
US10796182B2 (en) * 2013-10-22 2020-10-06 Hewlett Packard Enterprise Development Lp Interactive optical codes
US10628411B2 (en) * 2013-11-20 2020-04-21 International Business Machines Corporation Repairing a link based on an issue
JP6362452B2 (ja) * 2014-07-03 2018-07-25 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、及びプログラム
CN107766523A (zh) * 2017-10-25 2018-03-06 努比亚技术有限公司 一种文件管理方法、移动终端和计算机可读存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6405223B1 (en) * 1998-01-15 2002-06-11 International Business Machines Corporation System for personal storage of different web source versions
US6345250B1 (en) * 1998-02-24 2002-02-05 International Business Machines Corp. Developing voice response applications from pre-recorded voice and stored text-to-speech prompts
US6631496B1 (en) * 1999-03-22 2003-10-07 Nec Corporation System for personalizing, organizing and managing web information
US6834372B1 (en) * 2000-02-10 2004-12-21 International Business Machines Corporation Internet web browser with proximity sensitie hyperlink history report
US7114124B2 (en) * 2000-02-28 2006-09-26 Xerox Corporation Method and system for information retrieval from query evaluations of very large full-text databases
US20010049700A1 (en) * 2000-05-26 2001-12-06 Shinobu Ichikura Information processing apparatus, information processing method and storage medium
JP2002163175A (ja) * 2000-11-28 2002-06-07 Ntt Docomo Inc 受信装置及び中継装置
US6981210B2 (en) * 2001-02-16 2005-12-27 International Business Machines Corporation Self-maintaining web browser bookmarks
JP2002304340A (ja) * 2001-04-04 2002-10-18 Toshiba Corp データ処理装置及びデータ処理方法
US20030030666A1 (en) * 2001-08-07 2003-02-13 Amir Najmi Intelligent adaptive navigation optimization
US20030139901A1 (en) * 2002-01-22 2003-07-24 Forman George Henry Navigating organizational structures
CN1410918A (zh) * 2002-05-31 2003-04-16 浙江大学 基于信息抽取技术的搜索引擎
JP4825534B2 (ja) * 2006-02-08 2011-11-30 株式会社リコー 情報処理装置、及び、情報処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007200194A (ja) * 2006-01-30 2007-08-09 Kyocera Corp ウェブページの表示方法およびブラウザ装置、並びにウェブページ表示プログラム

Also Published As

Publication number Publication date
CN1612524A (zh) 2005-05-04
CN100341273C (zh) 2007-10-03
EP1530135A2 (en) 2005-05-11
EP1530135A3 (en) 2006-05-24
US20050089017A1 (en) 2005-04-28

Similar Documents

Publication Publication Date Title
US7992085B2 (en) Lightweight reference user interface
CA2372544C (en) Information access method, information access system and program therefor
US6697838B1 (en) Method and system for annotating information resources in connection with browsing, in both connected and disconnected states
US7788590B2 (en) Lightweight reference user interface
US8031943B2 (en) Automatic natural language translation of embedded text regions in images during information transfer
JP5671557B2 (ja) クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法
JP4428952B2 (ja) ユーザインタフェース制御装置及びその方法
JP2004310748A (ja) ユーザ入力に基づくデータの提示
US20070214149A1 (en) Associating user selected content management directives with user selected ratings
JP2007242013A (ja) コンテンツ管理指示を呼び出すための方法、システム、およびプログラム(コンテンツ管理指示の呼び出し)
JP2003108184A (ja) 入力モードバイアスを適用するための方法およびシステム
CN1279804A (zh) 通过听觉表示sgml数据页的***和方法
US6732078B1 (en) Audio control method and audio controlled device
House Spoken-language access to multimedia(SLAM): a multimodal interface to the World-Wide Web
JP2002197118A (ja) 情報アクセス方法、情報アクセスシステムおよび記録媒体
JP2005128955A (ja) 情報処理方法および記憶媒体、プログラム
JP2002207727A (ja) クライアント装置、そのプログラムを記録した記録媒体、及びそのプログラム
JP4515186B2 (ja) 音声辞書作成装置、音声辞書作成方法、及びプログラム
JP2007164732A (ja) コンピュータ実行可能なプログラム、および情報処理装置
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP7257010B2 (ja) 検索支援サーバ、検索支援方法及びコンピュータプログラム
KR100923942B1 (ko) 웹 페이지로부터 텍스트를 추출하고 이를 음성 데이터파일로 변환하여 제공하기 위한 방법, 시스템 및 컴퓨터판독 가능한 기록 매체
JP2002297667A (ja) 文書閲覧装置
Lin et al. Using chinese spoken-language access to the WWW
JPH11296525A (ja) データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070809

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071108

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20071128

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20071221