JP2001043215A - 文書処理装置、文書処理方法、及び記録媒体 - Google Patents

文書処理装置、文書処理方法、及び記録媒体

Info

Publication number
JP2001043215A
JP2001043215A JP21865299A JP21865299A JP2001043215A JP 2001043215 A JP2001043215 A JP 2001043215A JP 21865299 A JP21865299 A JP 21865299A JP 21865299 A JP21865299 A JP 21865299A JP 2001043215 A JP2001043215 A JP 2001043215A
Authority
JP
Japan
Prior art keywords
video
document
output
data
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP21865299A
Other languages
English (en)
Other versions
JP2001043215A5 (ja
Inventor
Katashi Nagao
確 長尾
Kazuyuki Marukawa
和幸 丸川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP21865299A priority Critical patent/JP2001043215A/ja
Priority to US09/624,580 priority patent/US7610546B1/en
Publication of JP2001043215A publication Critical patent/JP2001043215A/ja
Publication of JP2001043215A5 publication Critical patent/JP2001043215A5/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • G06F16/4387Presentation of query results by the use of playlists
    • G06F16/4393Multimedia presentations, e.g. slide shows, multimedia albums
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43074Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of additional data with content streams on the same device, e.g. of EPG data or interactive icon with a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4886Data services, e.g. news ticker for displaying a ticker, e.g. scrolling banner for news, stock exchange, weather data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8543Content authoring using a description language, e.g. Multimedia and Hypermedia information coding Expert Group [MHEG], eXtensible Markup Language [XML]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Marketing (AREA)
  • Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • User Interface Of Digital Computer (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文書データに関連したビデオデータ出力によ
る情報提示の実現。 【解決手段】 各電子文書データにおいてビデオデータ
指定情報(ビデオタグ)が付されていることに応じて、
その電子文書データに関連するビデオデータを判別し、
電子文書データに対応して、電子文書データの出力と同
時又は個別に、その関連するビデオデータを出力する。
これにより文書の提示だけでなく、その文書内容と関連
する映像をユーザーに提示できるようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は電子文書処理に関
し、特に電子文書データと関連するビデオデータを出力
することのできる文書処理装置に関するものである。
【0002】
【従来の技術】従来、インターネットにおいて、ウィン
ドウ形式でハイパーテキスト型情報を提供するアプリケ
ーションサービスとしてWWW(World Wide Web)が提
供されている。
【0003】WWWは、文書の作成、公開または共有化
の文書処理を実行し、新しいスタイルの文書の在り方を
示したシステムである。しかし、文書の実際上の利用の
観点からは、文書の内容に基づいた文書の分類や要約と
いった、WWWを越える高度な文書処理が求められてい
る。このような高度な文書処理には、文書の内容の機械
的な処理が不可欠である。
【0004】しかしながら、文書の内容の機械的な処理
は、以下のような理由から依然として困難である。第1
に、ハイパーテキストを記述する言語であるHTML
(Hyper Text Markup Language)は、文書の表現につい
ては規定するが、文書の内容についてはほとんど規定し
ない。第2に、文書間に構成されたハイパーテキストの
ネットワークは、文書の読者にとって文書の内容を理解
するために必ずしも利用しやすいものではない。第3
に、一般に文章の著作者は読者の便宜を念頭に置かずに
著作するが、文書の読者の便宜が著作者の便宜と調整さ
れることはない。
【0005】このように、WWWは新しい文書の在り方
を示したシステムであるが、文書を機械的に処理しない
ので、高度な文書処理をおこなうことができなかった。
換言すると、高度な文書処理を実行するためには、文書
を機械的に処理することが必要となる。
【0006】そこで、文書の機械的な処理を目標とし
て、文書の機械的な処理を支援するシステムが自然言語
研究の成果に基づいて開発されている。自然言語研究に
よる文書処理として、文書の著作者等による文書の内部
構造についての属性情報、いわゆるタグの付与を前提と
した、文書に付与されたタグを利用する機械的な文書処
理が提案されている。
【0007】
【発明が解決しようとする課題】ところで、近年のコン
ピュータの普及や、ネットワーク化の進展に伴い、文章
処理や、文書の内容に依存した索引などで、テキスト文
書の作成、ラベル付け、変更などをおこなう文書処理の
高機能化が求められている。たとえば、ユーザの要望に
応じた文書の要約や、文書の分類等が望まれる。また、
文書やその要約を表示する文書ビューワや表示部の形態
に適した表示スタイルや、表示とともに行われる読み上
げ機能、さらには文書や画像の表示と読み上げの連動な
ど、よりユーザーにとって好適な処理が求められてい
る。そしてさらに、文書データに関連して動画や静止画
などのビデオデータを出力することができるようにすれ
ば、ユーザーにとって、より多様かつ高度であり、さら
に的確な情報を提供できることが期待されるが、従っ
て、各種の文書処理に加えてビデオデータとの連携化が
望まれている。
【0008】
【課題を解決するための手段】本発明は、このような事
情に鑑みて提案されたものであって、文書処理装置にお
いて提示する文書データに対応してビデオデータを出力
することができるようにし、ユーザーに対する的確、多
様、高度な情報を提示できるようにすることを目的とす
る。
【0009】このため本発明の文書処理装置は、電子文
書データに付加された1又は複数のビデオデータ指定情
報を検出し、1又は複数の特定のビデオデータを選択す
るビデオ選択手段と、1又は複数の電子文書データのう
ちの或る電子文書データを提示するために出力制御する
文書出力制御手段と、文書出力制御手段で出力制御され
た電子文書データに対応して、ビデオ選択手段で選択さ
れたビデオデータを出力制御するビデオ出力制御手段と
を備えるようにする。つまり、各電子文書データにおい
てビデオデータ指定情報(タグ)が付されていることに
応じて、その電子文書データに関連するビデオデータを
判別し、電子文書データに対応して、電子文書データの
出力と同時又は個別に、その関連するビデオデータを出
力できるようにする。また、電子文書データ及びビデオ
データを、同時もしくは個別に表示する表示手段を当該
文書処理装置内に備えるようにしてもよい。
【0010】また上記構成に加えて、文書本文としての
電子文書データから、その要約文としての電子文書デー
タを作成することのできる要約作成手段を備えるように
し、ビデオ出力制御手段は、文書出力制御手段が要約作
成手段により作成された要約文を出力制御する際に、ビ
デオ選択手段で選択されたビデオデータを出力制御する
ようにする。つまり要約文の提示とともに、関連するビ
デオデータを提示する。
【0011】また文書出力制御手段は、電子文書データ
が部分毎の切換表示もしくは移動表示(テロップ表示)
されるように、電子文書データを出力制御するととも
に、ビデオ出力制御手段は、文書出力制御手段の制御に
よる電子文書データ出力の進行に対応したタイミング
で、出力するビデオデータを切り換えるように制御す
る。つまり本文又は要約文としての電子文書データのテ
ロップ表示の進行に対応して、ビデオデータが切り換え
られていくようにする。
【0012】また上記構成に加えて、電子文書データが
読み上げ音声として出力されるように制御する音声出力
制御手段を備え、ビデオ出力制御手段は、音声出力制御
手段により電子文書データが読み上げ音声として出力制
御される際に、ビデオ選択手段で選択されたビデオデー
タを出力制御するようにする。つまり本文又は要約文と
しての電子文書データの読み上げとともに、関連するビ
デオデータを提示する。
【0013】またビデオ出力制御手段は、音声出力制御
手段の制御による読み上げ音声出力の進行に対応したタ
イミングで、出力するビデオデータを切り換えるように
制御する。つまり本文又は要約文としての電子文書デー
タの読み上げの進行に対応して、ビデオデータが切り換
えられていくようにする。
【0014】本発明の文書処理方法は、電子文書データ
に付加された1又は複数のビデオデータ指定情報を検出
し、1又は複数の特定のビデオデータを選択するビデオ
選択手順と、1又は複数の電子文書データのうちの或る
電子文書データを提示するために出力制御する文書出力
制御手順と、文書出力制御手順で出力制御された電子文
書データに対応して、ビデオ選択手順で選択されたビデ
オデータを出力制御するビデオ出力制御手順とが行われ
るようにする。また、文書本文としての電子文書データ
から、その要約文としての電子文書データを作成するこ
とのできる要約作成手順を有するようにし、ビデオ出力
制御手順では、要約作成手順で作成された要約文が文書
出力制御手順において出力制御される際に、ビデオ選択
手順で選択されたビデオデータを出力するようにする。
また、文書出力制御手順では、電子文書データが部分毎
の切換表示もしくは移動表示(テロップ表示)されるよ
うに、電子文書データを出力制御するとともに、ビデオ
出力制御手順では、文書出力制御手順での制御による電
子文書データ出力の進行に対応したタイミングで、出力
するビデオデータを切り換えるように制御する。また電
子文書データが読み上げ音声として出力されるように制
御する音声出力制御手順を有するようにし、ビデオ出力
制御手順では、音声出力制御手順での制御により電子文
書データが読み上げ音声として出力される際に、ビデオ
選択手順で選択されたビデオデータが出力されるように
制御する。またビデオ出力制御手順では、音声出力制御
手順の制御による読み上げ音声出力の進行に対応したタ
イミングで、出力するビデオデータを切り換えるように
制御する。
【0015】また本発明の記録媒体は、以上のような各
手順を有する動作制御プログラムが記録されているもの
とする。
【0016】
【発明の実施の形態】以下、本発明の実施の形態につい
て次の順序で説明する。 1.文書処理装置の構成 2.文書データ構造 3.文書データに対する手動分類処理 3−1 処理手順 3−2 インデックス作成 3−3 文書閲覧/分類作成/分類操作 3−4 分類モデル作成/登録 4.文書データに対する自動分類処理 4−1 処理手順 4−2 自動分類 5.読み上げ処理 6.要約作成/表示処理 7.ビデオファイルの出力処理 7−1 ビデオファイル及びタグ 7−2 ビデオ出力処理 7−3 要約出力時のビデオ出力処理 7−4 読み上げ時のビデオ出力処理 7−5 各種のビデオ出力形態 8.文書処理装置の機能ブロック構成
【0017】1.文書処理装置の構成 本発明の実施の形態としての文書処理装置1は、図1に
示すように、制御部11およびインターフェース12を
備える本体10と、ユーザからの入力を受けて本体10
に送る入力部20と、外部との信号の送受信を行う通信
部21と、本体10からの出力を表示する表示部30
と、記録媒体32に対して情報を記録/再生する記録/
再生部31と、音声出力部33と、HDD(ハードディ
スクドライブ)34を有している。
【0018】本体10は、制御部11およびインターフ
ェース12を有し、この文書処理装置1の主要な部分を
構成している。制御部11は、この文書処理装置1にお
ける処理を実行するCPU13と、揮発性のメモリであ
るRAM14と、不揮発性のメモリであるROM15と
を有している。CPU13は、たとえばROM15に記
録された手順にしたがって、必要な場合にはデータを一
時的にRAM14に格納して、プログラムを実行するた
めの制御をおこなう。この制御部11の動作としては、
詳しくはそれぞれ後述していくが、供給された文書デー
タに関する分類処理、要約作成処理、読み上げ動作のた
めの音声読み上げ用ファイルの生成処理、及びこれらの
処理に必要な文書解析などがある。さらに、文書データ
に関連するビデオデータの出力制御処理も行う。そして
これらの動作のために必要なプログラムやアプリケーシ
ョンソフトが、ROM15や、HDD34、あるいは記
録媒体32に記憶されている。なお、制御部11が用い
る文書処理プログラムは上記のようにあらかじめROM
15に格納されたり、あるいは、記録媒体32やHDD
34から取り込むことが考えられるが、例えば通信部2
1を介してインターネット等のネットワークから、外部
サーバ等が提供する文書処理プログラムをダウンロード
することも考えられる。
【0019】インターフェース12は、制御部11、入
力部20、通信部21、表示部30、記録/再生部3
1、音声出力部33、HDD34に接続される。そして
インターフェース12は、制御部11の制御の下に、入
力部20からのデータの入力、通信部21との間のデー
タの入出力、表示部30へのデータの出力、記録/再生
部31に対するデータの入出力、音声出力部33へのデ
ータの出力、HDD34に対するデータの入出力の各動
作を行う。具体的には制御部11と上記各部の間でのデ
ータの入出力のタイミングを調整したり、データの形式
を変換することなどを行う。
【0020】入力部20は、この文書処理装置1に対す
るユーザの入力を受ける部分である。この入力部20
は、たとえばキーボードやマウスにより構成される。ユ
ーザは、この入力部20を用い、キーボードによリキー
ワード等の文字を入力したり、マウスにより表示部30
に表示されている電子文書のエレメントを選択すること
などができる。なお、以下では文書処理装置1で扱う電
子文書を、「文書データ」又は単に「文書」と称するこ
とにする。また「エレメント」とは文書を構成する要素
であって、たとえば文書、文および語が含まれる。
【0021】通信部21は、この文書処理装置1に外部
からたとえば通信回線を介して送信される信号を受信し
たり、通信回線に信号を送信する部位である。この通信
部21は、外部から送信された1又は複数の文書等のデ
ータを受信し、受信したデータを本体10に送る。もち
ろん通信回線を介して外部装置にデータを送信すること
も行われる。また、文書データに付随して、もしくは独
立して、1又は複数のビデオデータ(ビデオファイル)
が通信部21により取り込まれることもある。
【0022】表示部30は、この文書処理装置1の出力
としての文字や画像情報を表示する部位である。この表
示部30は、たとえば陰極線管(cathode ray tube;CR
T)や液晶表示装置(Liquid crystal display;LCD)な
どにより構成され、たとえば単数または複数のウィンド
ウを表示し、このウィンドウ上に文字、図形等を表示す
る。
【0023】記録/再生部31は、たとえばいわゆるフ
ロッピーディスクのような記録媒体32に対してデータ
の記録/再生をおこなう。なお、ここでは記録媒体32
の例としてフロッピーディスク(磁気ディスク)を例を
あげているが、もちろん光ディスク、光磁気ディスク、
メモリカードなど、可搬性メディアであれば記録媒体3
2の例として適用できる。そして記録/再生部31は、
メディアに応じた記録再生装置(ディスクドライブ、カ
ードドライブなど)であればよい。
【0024】記録媒体32が、文書を処理するための文
書処理プログラムが記録されているものである場合は、
記録/再生部31は、その記録媒体32から文書処理プ
ログラムを読み出して制御部11に供給することができ
る。また記録媒体32に文書データやビデオデータが記
録されていれば、記録/再生部31でそれを読み出して
制御部11に供給することができる。即ち文書処理装置
1にとって、通信部21による文書データ及びビデオデ
ータの受信とは別の、文書データ及びビデオデータの入
力態様となる。さらに、制御部11は当該文書処理装置
1で処理した文書データを記録/再生部31において記
録媒体32に記録させることもできる。
【0025】音声出力部33は、文書処理装置1の出力
としての文書を、読み上げ音声として出力する部位であ
る。即ち音声出力部33は、制御部11が文書情報(後
述する読み上げ用ファイル)に基づいた音声合成処理に
より生成した音声信号が供給された際に、その音声信号
の出力処理を行うことで、表示部30とともに文書処理
装置1の出力手段として機能する。
【0026】HDD34は、文書処理装置1における大
容量の記録領域を提供する。HDD34は、制御部11
の制御に基づいて情報の記録/再生を行う。このHDD
34は、制御部11で実行される各種処理のためのアプ
リケーションプログラム、例えば音声合成のためのプロ
グラムなどの格納するために用いられたり、例えば当該
文書処理装置1に取り込まれた文書データやビデオデー
タ等を格納しておく部位として用いることなどが可能と
なる。
【0027】2.文書データ構造 続いて、本例における文書データの構造について説明す
る。本例においては、文書処理は、文書に付与された属
性情報であるタグを参照しておこなわれる。本例で用い
られるタグには、文書の構造を示す統語論的(syntacti
c)タグと、多言語間で文書の機械的な内容理解を可能
にするような意味的(semantic)・語用論的タグとがあ
る。
【0028】統語論的なタグとしては、文書の内部構造
を記述するものがある。タグ付けによる内部構造は、図
2に示すように、文書、文、語彙エレメント等の各エレ
メントが互いに、通常リンク、参照・被参照リンクによ
りリンクされて構成されている。図中において、白丸
“○”はエレメントを示し、最下位の白丸は文書におけ
る最小レベルの語に対応する語彙エレメントである。ま
た、実線は文書、文、語彙エレメント等のエレメント間
のつながり示す通常リンク(normal link)であり、破
線は参照・被参照による係り受け関係を示す参照リンク
(reference link)である。文書の内部構造は、上位か
ら下位への順序で、文書(documemt)、サブディビジョ
ン(subdivision)、段落(paragraph)、文(sentenc
e)、サブセンテンシャルセグメント(subsentential s
egment)、・・・、語彙エレメントから構成される。こ
のうち、サブディビジョンと段落はオプションである。
【0029】一方、意味論・語用論的なタグ付けとして
は、多義語の意味のように意味等の情報を記述するもの
がある。本例におけるタグ付けは、HTML(Hyper Te
xt Markup Language)と同様なXML(Extensible Mar
kup Language)の形式によるものである。
【0030】タグ付けの一例を次に示すが、文書へのタ
グ付けはこの方法に限られない。また、以下では英語と
日本語の文書の例を示すが、タグ付けによる内部構造の
記述は他の言語にも同様に適用することができる。
【0031】たとえば、“Time flies like an arro
w.”という文については、下記のようなタグ付けをする
ことができる。< >が、文書に対して付与されたタグ
である。
【0032】<文><名詞句 語義=“time0”>time
</名詞句> <動詞句><動詞 語義=“fly1”>flies</動詞> <副詞句><副詞 語義=like0>like</副詞> <
名詞句>an <名詞 語義=“arrow0”>arrow</名詞></名詞
句> </副詞句></動詞句>.</文>
【0033】ここで<文>、<名詞>、<名詞句>、<
動詞>、<動詞句>、<副詞>、<副詞句>は、それぞ
れ文、名詞、名詞句、動詞、動詞句、形容詞/副詞(前
置詞句または後置詞句を含む)、形容詞句/副詞句、を
示している。つまり文の統語構造(syntactic structur
e)を表している。
【0034】これらのタグは、エレメントの先端の直前
および終端の直後に対応して配置される。エレメントの
終端の直後に配置されるタグは、記号“ /”によりエ
レメントの終端であることを示している。エレメントと
は統語的構成素、すなわち句、節、および文のことであ
る。なお、語義(word sense)=“time0”は、語“ti
me”の有する複数の意味、すなわち複数の語義のうちの
第0番目の意味を指している。具体的には、語“time”
には少なくとも名詞、形容詞、動詞の意味があるが、こ
こでは語“time”が名詞(=第0番目の意味)であるこ
とを示している。同様に、語“オレンジ”は少なくとも
植物の名前、色、果物の意味があるが、これらも語義に
よって区別することができる。
【0035】本例では、文書データについては、図3に
示すように、表示部30上のウィンドウ101におい
て、その統語構造を表示することができる。このウィン
ドウ101においては、右半面103に語彙エレメント
が、左半面102に文の内部構造がそれぞれ表示されて
いる。
【0036】例えば図示するようにこのウィンドウ10
1には、タグ付けにより内部構造が記述された文章「A
氏のB会が終わったC市で、一部の大衆紙と一般紙がそ
の写真報道を自主規制する方針を紙面で明らかにし
た。」の一部が表示されている。この文書のタグ付けの
例は次のようになる。
【0037】<文書><文><副詞句 関係=“場所”
><名詞句><副詞句 場所=“C市”> <副詞句 関係=“主語”><名詞句 識別子=“B
会”><副詞句 関係=“所属”><人名 識別子=
“A氏”>A氏</人名>の</副詞句><組織名識別
子=“B会”>B会</組織名></名詞句>が</副
詞句> 終わった</副詞句><地名 識別子=“C市”>C市
</地名></名詞句>で、</副詞句><副詞句 関
係=“主語”><名詞句 識別子=“press” 統語=“並列”><名詞句><副詞句>一部の</副詞
句>大衆紙</名詞句>と<名詞>一般紙</名詞><
/名詞句>が</副詞句> <副詞句 関係=“目的語”><副詞句 関係=“内
容” 主語=“press”> <副詞句 関係=“目的語”><名詞句><副詞句><
名詞 共参照=“B会”>そ</名詞>の</副詞句>
写真報道</名詞句>を</副詞句> 自主規制する</副詞句>方針を</副詞句> <副詞句 間係=“位置”>紙面で</副詞句>明らか
にした。</文></文書>
【0038】このようにタグ付されることで、各一対の
タグ< >〜</ >によって文書の構造が表現され
る。例えば<文書>〜</文書>で1つの文書の範囲が
示され、同様に<文>〜</文>で1つの文の範囲が示
される。また例えば、<名詞句 識別子=“B会”>〜
</名詞句>により、「A氏のB会」という部分が「B
会」を識別子とする名詞句として表現される。即ち上記
タグ付により、図3の左半面102に示した文の内部構
造が表現される。
【0039】さらに、この文書においては、「一部の大
衆紙と一般紙」は、統語=“並列”というタグにより並
列であることが表されている。並列の定義は、係り受け
関係を共有するということである。特に何も指定がない
場合、たとえば、<名詞句関係=x><名詞>A</名
詞><名詞>B</名詞></名詞句>は、AがBに依
存関係があることを表す。関係=xは関係属性を表す。
【0040】関係属性は、統語、意味、修辞についての
相互関俵を記述する。主語、目的語、間接目的語のよう
な文法機能、動作主、被動作者、受益者などのような主
題役割、および理由、結果などのような修辞関係はこの
関係属性により記述される。本例では、主語、目的語、
間接目的語のような比較的容易な文法機能について関係
属性を記述する。
【0041】また、この文書においては、“A氏”、
“B会”、“C市”のような固有名詞について、地名、
人名、組織名等のタグにより属性が記述されている。こ
れら地名、人名、組織名等のタグが付与されることで、
その語が固有名詞であることが表現される。
【0042】3.文書データに対する手動分類処理 3−1 処理手順 本例の文書処理装置1では、例えば通信部21(又は記
録/再生部31)により外部から文書データが取り込ま
れると、その文書データを内容に応じて分類する処理を
行う。なお、以下の説明では、外部からの文書データは
通信部21を介して取り込まれるとして述べていくが、
その説明は、外部からフロッピーディスク等の可搬性メ
ディアの形態で供給され、記録/再生部31から文書デ
ータが取り込まれる場合も同様となるものである。
【0043】分類処理としては、文書データ内容に応じ
てユーザーが手動で分類する手動分類処理と、文書処理
装置1が自動的に分類する自動分類処理がある。これら
の分類処理は、後述する分類モデルに基づいて行われる
わけであるが、文書処理装置1においては、初期状態で
は分類モデルは存在しない。そのため初期状態にある時
点では、手動分類処理として、分類モデルの作成を含む
分類処理が必要になる。そして、分類モデルが生成され
た後においては、入力された文書データに対して自動分
類処理が可能となるものである。まずここでは、最初に
実行することが必要とされる手動分類処理について説明
する。即ちこの手動分類処理とは、初期状態にある文書
処理装置1が外部から送られた文書データを受信した際
に、ユーザーの操作に基づいて、制御部11が分類モデ
ルの作成及び文書データの分類を行う動作となる。
【0044】まず手動分類処理としての全体の処理手順
を図4に示す。なお、各処理ステップの詳細な処理につ
いては後述する。
【0045】図4のステップF11は、文書処理装置1
の受信部21による文書受信処理を示している。このス
テップF11では、受信部21は、たとえば通信回線を
介して送信された1又は複数の文書を受信する。受信部
21は、受信した文書を文書処理装置の本体10に送
る。制御部11は供給された1又は複数の文書データを
RAM14又はHDD34に格納する。
【0046】なお、文書受信時には、その文書に関連す
るビデオデータ(動画又は静止画データ)を含むビデオ
ファイルが受信される場合があり(もちろんビデオデー
タのみの受信もあり得る)、1又は複数のビデオファイ
ルが受信された場合は、制御部11はそのビデオファイ
ルを取り込んでRAM14又はHDD34に格納する。
ビデオファイルに関する処理については後に詳述する。
【0047】ステップF12では、文書処理装置1の制
御部11は、受信部21から送られた複数の文書の特徴
を抽出し、それぞれの文書の特徴情報すなわちインデッ
クスを作成する。制御部11は、作成したインデックス
を、たとえばRAM14又はHDD34に記憶させる。
後述するがインデックスは、その文書に特徴的な、固有
名詞、固有名詞以外の語義などを含むものであり、文書
の分類や検索に利用できるものである。
【0048】ステップF13の文書閲覧は、ユーザーの
必要に応じて実行される処理である。つまりユーザーの
操作に応じて行われる。なお、このステップF13や次
のステップF14は、ユーザ操作に基づく処理である。
入力された文書データに対しては、ユーザーは所要の操
作を行うことにより、表示部30の画面上で、その文書
内容を閲覧することができる。そして文書閲覧中は、ユ
ーザーは画面上のアイコン等に対する操作により、例え
ば後述する要約作成などの各種処理を指示できるが、こ
の手動分類処理に関しては、ステップF14として示す
ように、分類項目の作成及び分類操作としての処理に進
むことになる。ステップF14では、ユーザーが分類項
目(なお本明細書では、分類項目のことをカテゴリとも
いう)を設定する操作を行うことに応じて、制御部11
は分類項目を生成/表示していく。またユーザーが文書
データを、設定された分類項目に振り分けていく操作も
行うことになり、それに応じて制御部11は文書データ
の振り分け/表示を行うことになる。
【0049】ステップF15では、制御部11は、ステ
ップF14でユーザーが行った分類項目作成及び分類操
作に応じて、分類モデルを作成する。分類モデルは、文
書を分類する複数の分類項目(カテゴリ)から構成され
るとともに、各カテゴリに対して各文書のインデックス
(ステップF12で作成した各文書のインデックス)を
対応づけることで、分類状態を規定するデータである。
このような分類モデルを生成したら、ステップF16
で、その分類モデルを登録する。即ち制御部11は、分
類モデルをたとえばRAM14に記憶させることで登録
を行う。以上の図4の処理により、文書処理状態1が初
期状態にある時に入力された1又は複数の各文書データ
について、手動分類及び分類モデルの作成が行われたこ
とになる。この図4のステップF12以下の処理につい
て詳しく述べていく。
【0050】3−2 インデックス作成 ステップF14では、制御部11は入力された文書デー
タについてインデックスの作成を行う。まず、或る1つ
の文書データに対して作成されたインデックスの具体例
を示す。
【0051】<インデックス 日付=“AAAA/BB/CC”
時刻=“DD:EE:FF” 文書アドレス=“1234”> <ユーザの操作履歴 最大要約サイズ=“100”> <選択 エレメントの数=“10”>ピクチャーテル</
選択> ・・・ </ユーザの操作履歴> <要約>減税規模、触れず−X首相の会見</要約> <語 語義=“0003” 中心活性値=“140.6”>触れ
ず</語> <語 語義=“0105” 識別子=“X” 中心活性値=
“67.2”>首相</語> <人名 識別子=“X” 語 語義=“6103” 中心活
性値=“150.2”>X首相</語 /人名> <語 語義=“5301” 中心活性値=“120.6”>求め
た</語> <語 語義=“2350” 識別子=“X” 中心活性値=
“31.4”>首相</語> <語 語義=“9582” 中心活性値=“182.3”>強調
した</語> <語 語義=“2595” 中心活性値=“93.6”>触れる
</語> <語 帝義=“9472” 中心活性値=“12.0”>予告し
た</語> <語 語義=“4934” 中心活性値=“46.7”>触れな
かった</語> <語 語義=“0178” 中心活性値=“175.7”>釈明
した</語> <語 語義=“7248” 識別子=“X” 中心活性値=
“130.6”>私</語> <語 語義=“3684” 識別子=“X” 中心活性値=
“121.9”>首相</語> <語 語義=“1824” 中心活性値=“144.4.”>訴え
た</語> <語 語義=“7289” 中心活性値=“176.8”>見せ
た</語> </インデックス>
【0052】このインデックスにおいては、<インデッ
クス>および</インデックス>は、インデックスの始
端および終端を、<日付>および<時刻>はこのインデ
ックスが作成された日付および時刻を、<要約>および
</要約>はこのインデックスの内容の要約の始端およ
び終端を、それぞれ示している。また、<語>および<
/語>は語の始端および終端を示している。さらに例え
ば、語義=“0003”は、第3番目の語義であることを示
している。他についても同様である。上述したように、
同じ語でも複数の意味を持つ場合があるので、それを区
別するために語義ごとに番号が予め決められており、そ
の該当する語義が番号で表されているものである。
【0053】また、<ユーザの操作履歴>および</ユ
ーザの操作履歴>は、ユーザの操作履歴の始端および終
端を、<選択>および</選択>は、適訳されたエレメ
ントの始端および終端を、それぞれ示している。最大要
約サイズ=“100”は、要約の最大のサイズが100文
字であることを、エレメントの数=“10”は、選択され
たエレメントの数が10であることを示している。
【0054】この例のように、インデックスは、その文
書に特徴的な、固有名詞、固有名詞以外の語義などを含
むものである。例えばこのようなインデックスを作成す
るステップF12の処理を、図5〜図8で説明する。な
お、図5は1つの文書データに対するインデックス作成
処理を示しており、従って複数の文書データについて処
理を行う場合は、各文書データについてこの図5の処理
が行われることになる。また図5のステップF31の詳
細な処理を図7に示し、さらに図7のステップF43の
詳細な処理を図8に示している。
【0055】上述した図4のステップF12のインデッ
クス作成処理としては、まず図5のステップF31の活
性拡散が行われる。この活性拡散とは、文書データにつ
いて、エレメントの中心活性値を文書の内部構造に基づ
いて拡散することで、中心活性値の高いエレメントと関
わりのあるエレメントにも高い中心活性値を与えるよう
な処理である。即ち、文書を構成する各エレメントに対
して初期値としての中心活性値を与えた後、その中心活
性値を、文書の内部構造、具体的にはリンク構造に基づ
いて拡散する。この中心活性値は、タグ付けによる内部
構造に応じて決定されるので、文書の特徴の抽出等に利
用されるものである。制御部11は、このステップF3
1として、活性拡散を行い、活性拡散の結果として得ら
れた各エレメントの中心活性値を、たとえばRAM14
に記憶させることになる。
【0056】ステップF31の活性拡散について、図6
〜図8で詳しく説明していく。まずエレメントとエレメ
ントのリンク構造の例を図6に示す。図6においては、
文書を構成するエレメントとリンクの構造の一部とし
て、エレメントE1、E2の周辺を示している。E1〜
E8はエレメントの例であり、この中でエレメントE
1、E2に注目して説明する。
【0057】エレメントE1の中心活性値はe1である
とし、またエレメントE2の中心活性値はe2であると
する。このエレメントE1,E2は、リンクL12(上
述した通常リンクもしくは参照リンク)にて接続されて
いる。リンクL12のエレメントE1に接続する端点を
T12、エレメントE2に接続する端点をT21とす
る。エレメントE1は、さらにエレメントE3,E4,
E5と、それぞれリンクL13,L14,L15で接続
されている。各リンクL13,L14,L15における
エレメントE1側の端点をそれぞれT13,T14,T
15とする。またエレメントE2は、エレメントE6,
E7,E8とも、それぞれリンクL26,L27,L2
8で接続されている。各リンクL26,L27,L28
におけるエレメントE2側の端点をそれぞれT26,T
27,T28とする。このようなリンク構造の例を用い
ながら、図7、図8の活性拡散処理を説明していく。
【0058】図7のステップF41で制御部11は、イ
ンデックス作成対象としての文書データについて活性拡
散を開始するにあたり、まず文書データの全エレメント
について中心活性値の初期設定を行う。中心活性値の初
期値としては、例えば固有名詞や、ユーザーが選択(ク
リック)したエレメント等に高い値を与えるようにす
る。また制御部11は、参照リンクと通常リンクに関し
て、エレメントを連結するリンクの端点T(xx)の端点活
性値を0に設定する。制御部11は、このように付与し
た端点活性値の初期値を、たとえばRAM14に記憶さ
せる。
【0059】ステップF42においては、制御部11
は、文書を構成するエレメントEiを計数するカウンタ
の初期化をおこなう。すなわち、エレメントを計数する
カウンタのカウント値iを1に設定する。i=1の場
合、このカウンタは、第1番目のエレメント(例えば図
6のエレメントE1)を参照することになる。
【0060】ステップF43においては、制御部11
は、カウンタが参照するエレメントについて、新たな中
心活性値を計算する中心活性値更新処理を実行する。こ
の中心活性値更新処理について、エレメントE1につい
ての処理を例に挙げながら、図8で詳しく説明する。こ
の中心活性値更新処理は、エレメントについての端点活
性値を更新し、さらに更新された端点活性値と現在の中
心活性値を用いて、新たな中心活性値を算出する処理と
なる。
【0061】図8のステップF51では、制御部11
は、文書を構成するエレメントEi(例えばこの場合E
1)に一端が接続されたリンクの数を計数するカウンタ
の初期化をおこなう。すなわち、リンクを計数するカウ
ンタのカウント値jを1に設定する。j=1の場合、こ
のカウンタは、エレメントEiと接続された第1番目の
リンクL(yy)を参照することになる。図6の例では、
エレメントE1についての第1のリンクとして例えばリ
ンクL12を参照する。
【0062】ステップF52で制御部11は、参照中の
リンク、つまりエレメントE1とE2を接続するリンク
L12について、関係属性のタグを参照することにより
通常リンクであるか否かを判断する。制御部11は、リ
ンクL12が通常リンクであればステップF53に、一
方リンクL12が参照リンクであればステップF54に
処理を進める。
【0063】リンクL12が通常リンクと判断されてス
テップF53に進んだ場合は、制御部11は、エレメン
トE1の通常リンクL12に接続された端点T12の新
たな端点活性値を計算する処理をおこなう。端点T12
の端点活性値t12は、リンク先のエレメントE2の端
点活性値のうち、リンクL12以外のリンクに接続する
すべての端点の各端点活性値(この場合T26、T2
7、T28の各端点活性値t26、t27,t28)
と、エレメントE2の中心活性値e2を加算し、この加
算で得た値を、文書に含まれるエレメントの総数で除す
ることにより求められる。制御部11は、この様な演算
を、RAM14から読み出した各端点活性値および各中
心活性値を用いて行うことで、通常リンクと接続された
端点についての新たな端点活性値を算出し、算出した端
点活性値を、RAM14に記憶させる。つまり端点T1
2の端点活性値t12を更新する。
【0064】一方、ステップF52でリンクL12が参
照リンクであると判断され、ステップF54に進んだ場
合は、同じく制御部11は、通常リンクL12に接続さ
れたエレメントE1の端点T12の新たな端点活性値を
計算する処理をおこなうことになるが、端点活性値の算
出のための演算は次のようになる。即ちこの場合は、端
点T12の端点活性値t12は、リンク先のエレメント
E2の端点活性値のうち、リンクL12以外のリンクに
接続するすべての端点の各端点活性値(この場合T2
6、T27、T28の各端点活性値t26、t27,t
28)と、エレメントE2の中心活性値e2を加算した
値とする。(つまり除算がない点が上記通常リンクの場
合と異なるものとなる)そして制御部11は、この様な
演算を、RAM14から読み出した各端点活性値および
各中心活性値を用いて行うことで、参照リンクと接続さ
れた端点についての新たな端点活性値を算出し、算出し
た端点活性値を、RAM14に記憶させる。つまり端点
T12の端点活性値t12を更新する。
【0065】このようなステップF53又はF54の処
理を行なったら、制御部11はステップF55での判別
処理を介して(判別結果がNOであれば)ステップF5
7に進み、カウント値jをインクリメントしてステップ
F52に戻る。即ち続いて、カウント値j=2とされる
ことにより、エレメントE1についての第2のリンク
(例えばリンクL13)が参照されることになるため、
上記同様にステップF52以降の処理でリンクL13に
接続される端点T13の端点活性値t13が算出/更新
されることになる。
【0066】ステップF55では、制御部11は、現在
カウント値iで参照中のエレメントEi(E1)につい
て、全てのリンクについての新たな端点活性値が計算さ
れたか否かを判別して処理を分岐するものであるため、
端点活性値の更新処理は、参照中のエレメントEiの全
ての端点活性値が更新されるまで行われる。つまりステ
ップF57でカウント値jがインクリメントされながら
処理が繰り返されることで、例えばエレメントE1につ
いては、端点T12,T13,T14,T15について
それぞれ端点活性値t12,t13,t14,t15が
更新されていき、その全てが更新された時点で、処理は
ステップF55からF56に進むことになる。
【0067】エレメントEiについての全ての端点活性
値が求められたことに応じて、ステップF56では、更
新された端点活性値を用いて、エレメントEiの新たな
中心活性値eiを算出する。エレメントEiの新たな中
心活性値eiは、エレメントEiの現在の中心活性値e
iとエレメントEiのすべての端点の新たな端点活性値
の和で求められる。例えば図6のエレメントE1の場合
は、新たな中心活性値e1(new)は、 e1(new)=e1+t12+t13+t14+t15 となる。
【0068】制御部11は、このようにして現在カウン
ト値iで参照中のエレメントEiの中心活性値eiを算
出する。そして、制御部11は、計算した新たな中心活
性値eiをRAM14に記憶させる。つまりエレメント
Eiの中心活性値eiを更新する。(但しこの時点で
は、後述するステップF45の処理で用いるため、旧中
心活性値も保持しておく)
【0069】図7のステップF43の中心活性値更新処
理として、以上図8に示したような処理が行われるた
ら、制御部11の処理は図7のステップF44に進み、
制御部11は、文書中のすべてのエレメントについて中
心活性値更新処理が完了したか否かを判断する。具体的
には、制御部11は、カウント値iが、文書に含まれる
エレメントの総数に達したか否かを判断する。制御部1
1は、すべてのエレメントについて中心活性値更新処理
が完了していないときは、ステップF47に処理を進
め、カウント値iをインクリメントしてステップF43
に戻る。例えば上記のようにエレメントE1についての
処理が終わった後であれば、カウント値i=2とされ
て、今度はエレメントE2が参照されることになる。そ
してエレメントE2について、ステップF43の中心活
性値更新処理(即ち図8の処理)が上記同様に行われ
る。重複説明となるため詳細は述べないが、図6のリン
ク例でいえば、エレメントE2の場合は、図8の処理に
おいて端点T21,T26,T27,T28の各端点活
性値t21,t26,t27,t28が更新された後、
新たな中心活性値e2(new)が、 e2(new)=e2+t21+t26+t27+t28 として算出され、更新されることになる。
【0070】図7の処理においては、このようにステッ
プF47でカウント値iがインクリメントされて参照エ
レメントが変更されながらステップF43の中心活性値
更新処理が繰り返されることで、文書に含まれる全ての
エレメントの中心活性値が更新されていくことになる。
【0071】文書中のすべてのエレメントについて中心
活性値の更新が完了したときは、処理はステップF44
からF45に進むことになる。ステップF45において
は、制御部11は、文書に含まれるすべてのエレメント
の中心活性値の変化分、すなわち新たに計算された中心
活性値の元の中心活性値に対する変化分について平均値
を計算する。例えば制御部11は、RAM14に記憶さ
れた旧中心活性値と、更新した新たな中心活性値を、文
書に含まれるすべてのエレメントについて読み出す。そ
して各エレメントについて新中心活性値と旧中心活性値
の差分を求め、その差分の総和をエレメントの総数で除
することにより、すべてのエレメントの中心活性値の変
化分の平均値を計算する。制御部11は、このように計
算したすべてのエレメントの中心活性値の変化分の平均
値を、たとえばRAM14に記憶させる。
【0072】続いてステップF46において制御部11
は、ステップF45で計算した平均値が、あらかじめ設
定された閾値以内であるか否かを判断する。そして、制
御部11は、上記平均値が閾値以内である場合は、活性
拡散処理としての一連の行程を終了するが、上記平均値
が閾値以内でないときには、ステップF42にもどっ
て、上述した一連の行程を再び実行する。
【0073】この一連の活性拡散処理は、中心活性値が
高いエレメントに関連のある(リンクする)エレメント
について、その中心活性値を引き上げていく処理といえ
るものである。ところが、この活性拡散を1回行うのみ
では、インデックス作成処理の目的を考えたときに、本
来中心活性値を引き上げられるべきエレメントの中で、
中心活性値が十分に引き上げられないものが発生する場
合もありうる。例えば、1回の活性拡散では、中心活性
値の初期値が高く設定されたエレメントに直接リンクす
るエレメントについては、或る程度中心活性値が引き上
げられるが、直接リンクしていないエレメントは、それ
がインデックスとして重要なエレメントであっても十分
に中心活性値が引き上げられないことが生ずる。そこ
で、ステップF46の判断を介して、必要に応じて活性
拡散処理を複数回行うようにすることで、全体的に中心
活性値が収束されるようにし、中心活性値が引き上げら
れない重要なエレメントがなるべく生じないようにする
ものである。なお、複数回の活性拡散で、全体的に中心
活性値が収束されていくのは、活性拡散処理で更新され
た各エレメントの中心活性値に基づいて、さらに次の活
性拡散処理で各エレメントの中心活性値が更新されてい
くためである。但し、このような活性拡散処理が多数回
行われすぎると、全エレメントの中心活性値が収束しき
ってほぼ同値となるような事態となり、不適切である。
このため、ステップF45,F46の処理として、中心
活性値の変化分の平均値を求めるように、その変化分に
基づいて活性拡散処理の終了タイミングを判断すること
で、インデックス作成に好適な活性拡散が実現されるこ
とになる。
【0074】以上の図7、図8のような活性拡散処理
(即ち図5のステップF31)が完了したら、制御部1
1の処理は図5のステップF32に進むことになる。ス
テップF32においては、制御部11は、ステップF3
1で得られた各エレメントの中心活性値に基づいて、中
心活性値があらかじめ設定された閾値を超えるエレメン
トを抽出する。制御部11は、このように抽出したエレ
メントをRAM14に記憶させる。
【0075】続いてステップF33においては、制御部
11は、ステップF32にて抽出したエレメントをたと
えばRAM14から読み出す。そして制御部11は、こ
の抽出したエレメントの中からすべての固有名詞を取り
出してインデックスに加える。固有名詞は語義を持た
ず、辞書に載っていないなどの特殊の性質を有するので
固有名詞以外の語とは別に扱うものである。なお語義と
は、前述したように、語の有する複数の意味のうちの各
意味に対応したものである。各エレメントが固有名詞で
あるか否かは、文書に付されたタグに基づいて判断する
ことができる。たとえば、図3に示したタグ付けによる
内部構造においては、“A氏”、“B会”および“C
市”は、タグによる関係属性がそれぞれ“人名”、“組
織名”および“地名”であるので固有名詞であることが
分かる。そして、制御部11は、取り出した固有名詞を
インデックスに加え、その結果をRAM14に記憶させ
る。
【0076】次のステップF34においては、制御部1
1は、ステップF32にて抽出したエレメントの中か
ら、固有名詞以外の語義を取り出してインデックスに加
え、その結果をRAM14に記憶させる。
【0077】以上の処理により、例えば上記した具体例
のようなインデックスが生成される。即ちインデックス
は、タグ付けされた文書の特徴を発見して、その特徴を
配列したものとなり、その文書の特徴は、文書の内部構
造に応じて拡散処理された中心活性値に基づいて判断さ
れるものとなる。そしてこのようなインデックスは、文
書を代表するような特徴を表す語義および固有名詞を含
むので、所望の文書を参照する際に用いることができ
る。なお、インデックスには、文書の特徴を表す語義お
よび固有名詞とともに、その文書がRAM14(又はH
DD34)において記憶された位置を示す文書アドレス
を含めておく。
【0078】3−3 文書閲覧/分類作成/分類操作 以上の図5〜図8で説明したインデックス作成処理は図
4のステップF12で行われるものとなる。従って図4
の手動分類処理としては、続いてステップF13,F1
4の処理、即ち上述したようにユーザーによる閲覧及び
手動分類の処理に移る。
【0079】上述のように、図4のステップF13にお
いては、ユーザーは表示部30に表示される文書を閲覧
することができる。またステップF14においては、ユ
ーザーが分類項目を設定する操作や、文書データを、設
定された分類項目に振り分けていく操作を行うことがで
きる。このステップF13,F14で行われる操作や、
それに対応する制御部11の処理及び表示部30の表示
例は以下のようになる。
【0080】図9、図10は表示部30における表示の
具体例を示している。まず図9は、詳しくは後述する分
類モデルに対応した文書分類ウインドウ201の表示例
である。即ち、文書分類の表示に用いられるグラフィッ
クユーザインターフェース(graphic user interface;
GUI)の具体例となる。この文書分類ウィンドウ201
には、操作用のボタン表示202として、画面のウィン
ドウの状態を初期の位置にもどすポジションリセット
(position reset)ボタン202aと、文書の内容を閲
読するブラウザ(browser)を呼び出すブラウザボタン
202bと、このウィンドウからの脱出(exit)ボタン
202cとが表示される。
【0081】また、この文書分類ウィンドウ301は、
分類モデルに対応する分類項目に応じた小ウインドウと
して、文書分類エリア203,204,205・・・が
形成される。文書分類エリア203は、“他のトピック
ス”を表示するエリアとされる。この”他のトピック
ス”の文書分類エリア203は、まだ分類されていない
文書が提示される領域となる。例えば図4のステップF
11で受信された各文書(つまりこれから分類しようと
する文書)は、この”他のトピックス”の文書分類エリ
ア203に提示される。文書分類エリア204は、例え
ば”ビジネスニュース”に分類された文書が提示される
領域となる。文書分類エリア205は、例えば”政治ニ
ュース”に分類された文書が提示される領域となる。こ
れら以外にも、図中で符号を付していない文書分類エリ
アは、それぞれ特定の分類項目に応じた文書が提示され
る領域となる。
【0082】これらの各文書分類エリア203,204
・・・では、その各文書分類エリアに設定された分類項
目(カテゴリ)に分類された文書が、その文書のアイコ
ンと文書のタイトルにより提示される。タイトルがない
場合には、一文の要約が表示される。また各文書分類エ
リア203,204・・・の大きさは固定的ではなく、
ユーザーがドラッグ操作などにより各文書分類エリアを
区切る区切枠211,212,213・・・を移動させ
ることにより、各文書分類エリア203,204・・・
の面積を任意に変更させることができる。文書分類エリ
アの数もユーザーが任意に増減できる。
【0083】また各文書分類エリア203,204・・
・のタイトル(例えば「政治ニュース」など)は、ユー
ザーが任意に設定、変更できるものである。なお、この
文書分類エリアの数及び各タイトルは、後述する分類モ
デルの分類項目に応じたものとなる。言い換えれば、ユ
ーザーがこの分類ウインドウ201においてマウスやキ
ーボード等による入力部20からの操作で、文書分類エ
リアの設定や削除、或いはタイトル設定を行うことで、
分類モデルの分類項目の数やタイトルが設定されること
になる。
【0084】図10は、ユーザーが文書データの内容を
閲覧する閲覧ウインドウ301の例を示している。例え
ばユーザーが、図9の分類ウインドウ201において或
る文書をクリックして選択した状態としたうえで、ブラ
ウザボタン202bをクリックすることで、制御部11
は図10のように選択された文書を表示する閲覧ウイン
ドウ301を開くようにする。
【0085】この閲覧ウインドウ301には、文書デー
タファイルのファイル名を表示するファイル名表示部3
02、そのファイル名の文書データを表示する文書表示
部303、文書表示部303に表示された文書の要約文
を表示する要約表示部304、キーワードの入力/表示
を行うキーワード表示部305が設けられる。また操作
用のボタン表示306として、要約文の作成を指示する
ための要約作成ボタン306a、アンドゥ操作(操作取
消)を行うためのアンドゥボタン306b、読み上げ動
作を実行させるための読み上げボタン306c、ビデオ
データの表示を指示するためのビデオボタン306dな
どが表示される。
【0086】この様な閲覧ウインドウ301において、
ユーザーは文書表示部303に表示される文書を閲覧す
ることができる。なお、文書の全体を表示しきれないと
きは、文書の一部が表示される。もちろんスクロール操
作を行うことで、全文を閲覧できる。また、ユーザーは
要約作成ボタン306aをクリックすることで、文書表
示部303に表示される文書についての要約文を作成さ
せ、要約表示部304に表示させることができる。さら
にユーザーは、読み上げボタン306cをクリックする
ことで、文書表示部303に表示されている文書の本文
又は要約文についての読み上げを実行させることができ
る。また、ユーザーはビデオボタン306dをクリック
することで、文書表示部303に表示されている文書の
本文、または要約表示部304に表示されている要約文
に関連するビデオデータの表示を実行させることができ
る。なお、要約文作成のための制御部11の処理、読み
上げ動作についての処理、及びビデオ出力動作について
の処理はそれぞれ後述する。
【0087】以上のような分類ウインドウ201、閲覧
ウインドウ301は、図4の手動分類処理の際に限ら
ず、ユーザーの操作に応じて随時表示部20に表示され
るものであるが、図4の手動分類処理に関していえば、
ユーザーは受信した文書の種類や内容を、分類ウインド
ウ201、閲覧ウインドウ301で確認することができ
るものである。具体的には、図4のステップF11で受
信された1又は複数の文書は、ステップF12でのイン
デックス作成処理の後、図9のような分類ウインドウ2
01における”他のトピックス”の文書分類エリア20
3に表示される。この分類ウインドウ201において、
ユーザーは、文書分類エリア203に表示された各文書
を手動で分類していくことになるが、例えば文書のタイ
トルだけ等では内容がわからない場合は、図10の閲覧
ウインドウ301により文書内容を確認する。そのよう
にユーザの必要に応じて行われる閲覧が図4のステップ
F13の処理となる。
【0088】ステップF14としては、ユーザーは分類
ウインドウ201上において分類項目の追加、更新、削
除等を任意に行うことができ、その操作に応じて、制御
部11は表示される文書分類エリア203、204・・
・の表示態様(数、面積、タイトル等)を変更させてい
く。なお、ユーザーによる分類項目(文書分類エリアの
タイトル)の設定/変更は、それが後述する分類モデル
に反映されることになる。
【0089】ユーザーは必要に応じて分類項目の設定を
行った後、文書分類エリア203に表示されている各文
書を、各文書分類エリアに振り分けていく。つまりユー
ザーの手動により、文書を分類する。具体的には、”他
のトピックス”の文書分類エリア203に表示されてい
る文書のアイコンを、例えば入力部20のマウスを用
い、所望の分類項目(カテゴリ)に対応する文書分類エ
リアにドラッグすることによりおこなう。例えばユーザ
ーは、「スポーツ」というタイトルの文書分類エリアを
設定したうえで、”他のトピックス”の文書分類エリア
203に表示されているスポーツ関連の文書のアイコン
を、“スポーツ”の文書分類エリアにドラッグするよう
な操作を行う。このようにして手動で分類された各文書
のアイコンやタイトルは、以降、そのドラッグされた先
の文書分類エリア内で表示される。
【0090】3−4 分類モデル作成/登録 以上のようにユーザーによる手動分類操作が行われた
ら、制御部11は図4のステップF15において、ユー
ザの分類操作に基づいた複数のカテゴリからなる分類モ
デルを作成する。すなわち制御部11は、各カテゴリに
分類された上記複数の文書のインデックスを集めて、分
類モデルを生成する。そして、分類モデルの各カテゴリ
に上記複数の文書を分類する。
【0091】分類モデルは、文書を分類する複数の分類
項目(カテゴリ)から構成される。そして各カテゴリに
ついて、分類された文書が示されるデータ形態となる。
各文書については、上記ステップF12などでインデッ
クスが形成されるが、分類モデルは例えば図11(a)
に示すように、各カテゴリについて分類された文書のイ
ンデックスが対応づけられたようなデータ構造となる。
この図11(a)では、カテゴリとして「スポーツ」
「会社」「コンピュータ」・・・等が設定されている
が、これらは上記のように分類ウインドウ201におい
てユーザーが設定した分類項目となる。なお、もちろん
ユーザーが設定しなくとも、予め設定されている(つま
り分類ウインドウで文書分類エリアとして表示される)
カテゴリがあってもよい。そして各分類項目にはインデ
ックスIDX1、IDX2・・・が対応づけられるが、
即ち各分類項目には、ユーザーが上記のように分類した
文書のインデックスが対応づけられるものとなる。
【0092】各分類項目に対応づけられるインデックス
は、分類ウインドウ201においてその分類項目の文書
分類エリアに表示されている文書のインデックスであ
る。例えばインデックスIDX1がカテゴリ「スポー
ツ」に対応づけられているのは、ユーザーが、分類ウイ
ンドウ201において「スポーツ」をタイトルとする文
書分類エリアを作成し、さらにインデックスIDX1の
文書のアイコンを、その「スポーツ」をタイトルとする
文書分類エリアにドラッグするという手動分類を行った
ことに基づくものとなる。
【0093】ところで上述のように各文書のインデック
スは、固有名詞、固有名詞以外の語義や文書アドレス等
を含んでいる。そして、例えば図11(a)のように1
つの分類項目には1又は複数のインデックスが対応づけ
られるが、インデックスとして固有名詞、語義、文書ア
ドレス等が含まれるため、分類モデルは図11(b)の
ようにも表すことができる。
【0094】即ち図11(b)に示すように、分類モデ
ルは、各カテゴリに対応するカテゴリインデックスとし
て、固有名詞、固有名詞以外の語義、文書アドレスの欄
を有する構造となる。そして分類モデルにおいては、各
カテゴリ「スポーツ」「社会」「コンピュータ」「植
物」「美術」「イベント」に対して、固有名詞“A氏、
・・・”、“B氏、・・・”、“C社、G社、・・
・”、“D種、・・・”、“E氏、・・・”および“F
氏”等の固有名詞が割り当てられる。また、“野球(4
546)、グランド(2343)、・・・”、“労働
(3112)、固有(9821)、・・・”、“モバイ
ル(2102)、・・・”、“桜1(11111)、オ
レンジ1(9911)”、“桜2(11112)、オレ
ンジ2(9912)”および“桜3(11113)”等
の語義も各カテゴリに割り当てられる。さらに文書アド
レス“SP1、SP2、SP3、・・・”、“S01、
S02、S03、・・・”、“CO1、CO2、CO
3、・・・”、“PL1、PL2、PL3、・・・”、
“AR1、AR2、AR3、・・・”および“EV1、
EV2、EV3、・・・”も各カテゴリに割り当てられ
る。
【0095】なお、“桜1”“桜2”“桜3”は、
“桜”の第1の語義(11111)、第2の語義(11
112)、第3の語義(11113)を示している。ま
た、“オレンジ1”“オレンジ2”は、“オレンジ”の
第1の語義(9911)、第2の語義(9912)を示
している。たとえば“オレンジ1”は植物のオレンジを
表し、“オレンジ2”はオレンジ色を表す。固有名詞以
外の場合に語そのものではなく語義を用いるのは、この
様に、同じ語でも複数の意味を有することがあるからで
ある。
【0096】図4のステップF15では、ユーザーの手
動分類操作に応じて例えばこの様な分類モデルが生成さ
れる。そしてステップF16として分類モデルが登録、
即ちRAM15(又はHDD34)に記録される。この
ように分類モデルが生成/登録されることにより、文書
の分類が行われたことになる。
【0097】なお、このように図4におけるステップF
15、F16として分類モデルの作成/登録が行われた
後は、後述する自動分類処理や、ユーザーの分類項目の
編集、或いは手動分類操作などに応じて、分類モデルは
逐次更新されていくことになる。分類モデルが更新され
ると、分類モデルに更新日時が記録される。図11に
は、更新日時として“1998年12月10日19時5
6分10秒”が記録されている。
【0098】4.文書データに対する自動分類処理 4−1 処理手順 本例の文書処理装置1では、上記のように一旦分類モデ
ルが作成された後は、例えば通信部21により外部から
取り込まれた文書データを、自動的に分類していく自動
分類処理が可能となる。即ち以下説明する自動分類処理
とは、文書処理装置1が外部から送られた文書データを
受信した際に、その文書データを分類モデルに対して分
類していく処理となる。なお、この例では、一つの文書
を受信する毎に以下説明する自動分類処理をおこなうこ
ととするか、複数の所定数の文書を受信する度におこな
ってもよいし、ユーザが図9の画面を開く操作をしたと
きにそれまでに受信した全文書に対して自動分類処理を
おこなうようにしてもよい。
【0099】自動分類処理としての全体の処理手順を図
12に示す。図12のステップF21は、文書処理装置
1の受信部21による文書受信処理を示している。この
ステップF21では、受信部21は、たとえば通信回線
を介して送信された1又は複数の文書を受信する。受信
部21は、受信した文書を文書処理装置の本体10に送
る。制御部11は供給された1又は複数の文書データを
RAM14又はHDD34に格納する。なお文書データ
とともに(又は文書データとは独立して)、1又は複数
のビデオファイルが受信された場合は、制御部11はそ
のビデオファイルを取り込んでRAM14又はHDD3
4に格納することになる。
【0100】続いてステップF22に進み、制御部11
は、ステップF21で取り込まれた文書についてインデ
ックスを作成する。
【0101】ステップF23では、制御部11は、分類
モデルに基づいて、インデックスを付された各文書を、
分類モデルのいずれかのカテゴリに自動分類する。そし
て、制御部11は、分類の結果をたとえばRAM14に
記憶させる。自動分類の詳細については後述する。
【0102】ステップF24では、制御部11は、ステ
ップF23での新たな文書の自動分類の結果に基づい
て、分類モデルを更新する。そしてステップF25で
は、制御部11は、ステップF24で更新された分類モ
デルを登録する。例えば分類モデルをRAM14に記憶
させる。
【0103】以上の図12の処理により、文書処理状態
1に入力された文書データが、分類モデル上で分類され
るように自動分類処理が行われることになる。すなわち
この自動分類処理においては、受信した文書に対しては
インデックスが作成され、さらに自動分類が行われた
後、そのインデックスを構成している固有名詞、語義、
文書アドレス等が、上記図11のように分類モデル上で
或るカテゴリーに対応づけられることになる(分類モデ
ルが更新される)。
【0104】ステップF21、F22の処理は、上述し
た手動分類処理におけるステップF11,F12と同様
である。即ちステップF22のインデックス作成処理と
しては、図5〜図8で説明した処理が行われるものであ
り、ここでの繰り返しの説明は避ける。また、ステップ
F24の分類モデルの更新は、ステップF23の自動分
類の分類結果に応じてものとなる。以下、上述の手動分
類処理とは異なる処理として、ステップF23の自動分
類について詳細に説明する。
【0105】4−2 自動分類 図12のステップF23での自動分類の詳しい処理を図
13に示す。図13のステップF61では、制御部11
は、分類モデルのカテゴリCiに含まれる固有名詞の集
合と、ステップF21で受信した文書から抽出されイン
デックスに入れられた語のうちの固有名詞の集合とにつ
いて、これらの共通集合の数をP(Ci)とする。そし
て制御部11は、このようにして算出した数P(Ci)
をRAM14に記憶させる。
【0106】ステップF62においては、制御部11
は、その文書のインデックス中に含まれる全語義と、各
カテゴリCiに含まれる全語義との語義間関連度を、後
述する図15に示す語義間関連度の表を参照して、語義
間関連度の総和R(Ci)を演算する。すなわち制御部
11は、分類モデルにおける固有名詞以外の語につい
て、全語義間関連度の総和R(Ci)を演算する。そし
て制御部11は、演算した語義間関連度の総和R(C
i)をRAM14に記憶させる。
【0107】ここで語義間関連度について説明してお
く。語義間関連度は、図14の処理により文書処理装置
1が備える電子辞書に含まれる語義について予め算出
し、その結果を図15のように保持しておけばよい。つ
まり、制御部11が予め一度だけ図14の処理を実行し
ておくようにすることで、図13の自動分類処理の際に
用いることができる。
【0108】制御部11が予め実行しておく図15の処
理は次のようになる。まずステップF71において、制
御部11は、電子辞書内の語の語義の説明を用いて、こ
の辞書を使って語義のネットワークを作成する。すなわ
ち、辞書における各語義の説明とこの説明中に現れる語
義との参照関係から、語義のネットワークを作成する。
ネットワークの内部構造は、上述したようなタグ付けに
より記述される。文書処理装置の制御部11は、たとえ
ばRAM14に記憶された電子辞書について、語義とそ
の説明を順に読み出して、ネットワークを作成する。制
御部14は、このようにして作成した語義のネットワー
クをRAM14に記憶させる。
【0109】なお、上記ネットワークは、文書処理装置
の制御部11が辞書を用いて作成する他に、受信部21
にて外部から受信したリ、記録/再生部31にて記録媒
体32から再生したりすることにより得ることもでき
る。また上記電子辞書は、受信部21にて外部から受信
したり、記録/再生部31にて記録媒体32から再生し
たりすることにより得ることができる。
【0110】ステップF72においては、ステップF7
1で作成された語義のネットワーク上で、各語義のエレ
メントに対応する中心活性値の拡散処理をおこなう。こ
の活性拡散により、各語義に対応する中心活性値は、上
記辞書により与えられたタグ付けによる内部構造に応じ
て与えられる。中心活性値の拡散処理は、図7で説明し
た処理となる。
【0111】ステップF73においては、ステップF7
1で作成された語義のネットワークを構成するある一つ
の語義Siを選択し、続くステップF74においては、
この語義Siに対応する語彙エレメントEiの中心活性
値eiの初期値を変化させ、このときの中心活性値の差
分△eiを計算する。
【0112】さらにステップF75においては、ステッ
プF74におけるエレメントEiの中心活性値eiの差
分△eiに対応する、他の語義Sjに対応するエレメン
トEjの中心活性値ejの差分△ejを求める。ステッ
プF76においては、ステップF75で求めた差分△e
jを、ステップF74で求めた△eiで除した商△ej
/△eiを、語義Siの語義sjに対する語義間関連度
とする。
【0113】ステップF77においては、一の語義Si
と他の語義Sjとのすべての対について語義間関連度の
演算が終了したか否かについて判断する。すべての語義
の対について語義間関連度の演算が終了していないとき
には、ステップF73にもどり、語義間関連度の演算が
終了していない対について語義間関連度の演算を継続す
る。このようなステップF73からステップF77のル
ープにおいて、制御部11は、必要な値をたとえばRA
M14から順に読み出して、上述したように語義間関連
度を計算する。制御部11は、計算した語義間関連度を
たとえばRAM14に順に記憶させる。そして、すべて
の語義の対について語義間関連度の演算が終了したとき
には、ステップF77から、この一連の処理を終了す
る。
【0114】このような語義間関連度の算出は、或る1
つの語義の中心活性値を変化させた時に、それにつられ
て中心活性値が変化する語義を、関連度が高いものとす
る処理といえる。つまりステップF74で或る語義の中
心活性値を変化させると、それに応じて関連する(リン
クされた)語義の中心活性値が変化するものとなるた
め、その変化の度合いを調べれば、或る語義に対する他
の各語義の関連度がわかるものである。(或るエレメン
トEiの中心活性値は、上述した活性拡散の説明におい
て述べたように、リンク先のエレメントの中心活性値と
端点活性値が反映されて、そのエレメントEi端点活性
値が更新されたうえで、そのエレメントEiの端点活性
値と現在の中心活性値の和から求められるため、リンク
先との関連度が大きいほど中心活性値の変化量は大きく
なる)このような処理を各語義から他の全ての語義に対
して行っていくことで、すべての語義の対(組み合わ
せ)について、関連度を算出することができる。
【0115】このように計算された語義間関連度は、図
15に示すように、それぞれの語義と語義の間に定義さ
れる。この図15の表においては、語義間関連度は0か
ら1までの値をとるように正規化されている。そしてこ
の表においては一例として“コンピュータ”、“テレ
ビ”、“VTR”の間の相互の語義間関連度が示されて
いる。“コンピュータ”と“テレビ”の語義間関連度は
0.55、“コンピュータ” と“VTR”の語義間関
連度は0.25、“テレビ”と“VTR”の語義間関連
度は0.60である。
【0116】以上のように予め算出されていた語義間関
連度を用いて図13のステップF62の処理が行われた
ら、続いて制御部11は、ステップF63として、カテ
ゴリCiに対する文書の文書分類間関連度Rel(C
i)を Rel(Ci)=m1P(Ci)+n1R(Ci) として算出する。ここで、係数m1、n1は定数で、そ
れぞれの値の文書分類間関連度への寄与の度合いを表す
ものである。制御部11は、ステップF61で算出した
共通集合の数P(Ci)およびステップF62で算出し
た語義間関連度の総和R(Ci)を用いて、上記式の演
算を行い、文書分類間関連度Rel(Ci)を算出す
る。制御部11は、このように算出した文書分類間関連
度Rel(Ci)をRAM14に記憶させる。
【0117】なお、これらの係数m1、n1の値として
は、たとえばm1=10、n1=1とすることができ
る。また係数m1、n1の値は、統計的手法を使って推
定することもできる。すなわち、制御部11は、複数の
係数mおよびnの対について文書分類間関連度Rel
(Ci)が与えられることで、上記係数を最適化により
求めることができる。
【0118】ステップF64においては、制御部11
は、カテゴリCiに対する文書分類間関連度Rel(C
i)が最大で、その文書分類間関連度Rel(Ci)の
値がある閾値を越えているとき、そのカテゴリCiに文
書を分類する。すなわち制御部11は、複数のカテゴリ
に対してそれぞれ文書分類間関連度を作成し、最大の文
書分類間関連度が閣値を越えているときには、文書を最
大の文書分類間関連度を有する上記カテゴリCiに分類
する。これにより文書が自動的に所要のカテゴリに分類
されることになる。なお最大の文書分類間関連度が閾値
を越えていないときには、文書の分類はおこなわない。
【0119】以上のような図13の処理として、図12
のステップF23の自動分類が行われたら、ステップF
24、F25で、それに応じて分類モデルを更新し、登
録することで、一連の自動分類が完了する。即ち文書処
理装置1に受信された文書データは、自動的に分類され
たことになり、ユーザーは例えば図9の分類ウインドウ
201において、所要の文書分類エリアにおいて、受信
された文書データを確認できることになる。
【0120】5.読み上げ処理 続いて、文書データについての読み上げを行う処理につ
いて述べる。上述したようにユーザーは、文書を選択し
て図10のような閲覧ウインドウ301を開くことによ
り、文書の本文を閲覧することができる。例えば上述し
た手動分類処理におけるステップF13の時点や、その
他任意の時点において、図9で説明した分類ウインドウ
201から、閲覧ウインドウ301を開くことができ
る。
【0121】例えば分類ウインドウ201において或る
文書を選択した状態でブラウザボタン202bをクリッ
クすることで、後述する図26のように、文書表示部3
03に選択された文書の本文が表示された閲覧ウインド
ウ301が開かれる。なお文書表示部303に文書全文
が表示できないときには、その文書の一部が表示され
る。また要約文が作成されていない時点では、図26の
ように要約表示部304は空白とされる。要約文の作成
及び表示動作については後述する。
【0122】このように文書処理装置1は、タグ付けさ
れた文書を受信すると、その本文や詳しくは後述する要
約文を表示してユーザーに提示できるが、さらに受信し
た文書を音声でユーザーに提示することもできる。即ち
CPU13により、ROM15やHDD34に記録され
ている電子文書処理プログラムのうちの音声読み上げプ
ログラムを起動することで、図16に示すような一連の
工程を経ることによって、文書の読み上げを行うことが
できる。まずここでは、簡略化した各工程の説明を行
い、その後、具体的な文書例を用いて、各工程の説明を
詳細に行う。
【0123】制御部11の処理として、図16のステッ
プF101は、図4のステップF11(又は図12のス
テップF21)と同様の文書受信/記憶処理である。上
述ののように、受信した文書(タグ付文書)については
手動又は自動での分類処理が行われるが、それと同様
に、受信した文書について読み上げ処理も実行可能とい
う意味で図16にステップF101を記したものであ
る。ここでは特に処理手順として、分類処理と読み上げ
処理の順序その他を規定するものではない。
【0124】なお、文書読み上げ処理の対象となる文書
(受信文書)には、後述するように、音声合成を行うた
めに必要なタグが付与されていることが必要である。但
し、文書処理装置1は、タグ付けされた文章を受信した
うえで、その文書に音声合成を行うために必要なタグを
新たに付与して文書を作成することもできる。以下で
は、このようにして受信又は作成されて用意されたタグ
付き文書を、タグファイルと記す。
【0125】文書処理装置1の文書読み上げ処理として
は続いてステップF102において、CPU13の制御
のもとに、タグファイルに基づいて読み上げ用ファイル
を生成する。この読み上げ用ファイルは、後述するよう
に、タグファイル中のタグから、読み上げのための属性
情報を導出し、この属性情報を埋め込むことにより生成
される。
【0126】続いてステップF103において文書処理
装置1は、CPU13の制御のもとに、読み上げ用ファ
イルを用いて、音声合成エンジンに適した処理を行う。
なお、この音声合成エンジンは、ハードウェアで構成し
てもよいし、ソフトウェアで実現するようにしてもよ
い。音声合成エンジンをソフトウェアで実現する場合に
は、そのアプリケーションプログラムは、ROM15や
HDD34等に予め記憶されている。本例の文書処理装
置1において、読み上げ処理や、後述する要約作成/表
示処理、ビデオ出力処理などを実行するために形成され
る機能ブロック構成については、図47を用いて最後に
まとめて説明するが、上記音声合成エンジンは、その図
47における音声合成エンジン601に相当する。
【0127】続いて文書処理装置1はステップF104
において、ユーザが後述するユーザインターフェースを
用いて行う操作に応じて処理を行う。文書処理装置1
は、このような処理を行うことによって、与えられた文
書を読み上げることができる。これらの各工程につい
て、以下詳細に説明する。
【0128】まず、ステップF101におけるタグ付け
された文書の受信又は作成について説明する。文書処理
装置1は、例えば通信部21から文書(音声合成を行う
ために必要なタグが既に付与されている文書)を受信す
る。または、文書処理装置1は、タグ付けされた文書を
受信し、その文書に音声合成を行うために必要なタグを
新たに付与して文書を作成する。
【0129】説明上の例として、以下のような、日本
語、及び英語の文書にタグ付けがなされたタグファイル
が、受信又は作成されものとする。
【0130】まずタグファイルの元となる日本語文書
は、次のような文書とする。「[素敵にエイジング]/
8ガン転移、抑えられる!?がんはこの十数年、わが国
の死因第一位を占めている。その死亡率は年齢が進むと
ともに増加傾向にある。高齢者の健康を考えるとき、が
んの問題を避けて通れない。がんを特徴づけるのは、細
胞増殖と転移である。人間の細胞には、自動車でいえば
アクセルに当たり、がんをどんどん増殖する「がん遺伝
子」と、ブレーキ役の「がん抑制遺伝子」がある。双方
のバランスが取れていれば問題はない。正常な調節機能
が失われ、細胞内でブレーキが利かない変異が起こる
と、がんの増殖が始まる。高齢者の場合、長い年月の間
にこの変異が蓄積し、がん化の条件を備えた細胞の割合
が増え、がん多発につながるわけだ。ところで、もう一
つの特徴、転移という性質がなければ、がんはそれほど
恐れる必要はない。切除するだけで、完治が可能になる
からである。転移を抑制することの重要性がここにあ
る。この転移、がん細胞が増えるだけでは発生しない。
がん細胞が細胞と細胞の間にある蛋白(たんぱく)質な
どを溶かし、自分の進む道をつくって、血管やリンパ管
に入り込む。循環しながら新たな“住み家”を探して潜
り込む、といった複雑な動きをすることが、近年解明さ
れつつある。」
【0131】タグファイルの元となる英語の文書の例は
次のようなものとする「During its centennial year,
The Wall Street Journal will report events of the
past century that stand as milestones of American
business history. THREE COMPUTERS THAT CHANGED the
face of personal computing were Iaunched in 1977.
That year the Apple II, Commodore Pet and Tendy T
RS came to market. The computers were crude by tod
ay's standerds. Apple ll owners, for example,had t
o use their television sets as screens and storedd
ata on audiocassettes.」
【0132】文書処理装置1は、このような日本語又は
英語の文書についてタグが付された文書を受信すると、
分類処理や、後述する図26、図27のようにその本文
を表示したり、要約文を作成して表示することができ
る。
【0133】ここで上記の日本語又は英語の文書は、そ
れそれ、図18又は図19に示すようなタグファイルと
して構成されている。日本語文書のタグファイルとして
は、図18(a)に見出しの部分である「〔素敵にエイ
ジング〕/8ガン転移、抑えられる!?」を抜粋したも
のを示し、図18(b)に、文書中の最後の段落である
「この転移、がん細胞が・・・・近年解明されつつあ
る。」を抜粋したものを示している。残りの段落につい
ては省略してある。なお、実際のタグファイルは、見出
し部分から最後の段落までが1つのファイルとして構成
されている。
【0134】図18(a)に示す見出し部分において、
<見出し>というタグは、この部分が見出しであること
を示している。この図18(a)(b)に示すタグファ
イルは基本的には、図2を用いて文書データ構造を説明
した際に用いたタグファイル例と同様にタグが付されて
いるものであり、上述した各タグについての細かい説明
は省略するが、所要各所に、音声合成を行うために必要
なタグが付与されているものである。
【0135】音声合成を行うために必要なタグとして
は、例えばまず、図中「例1」の部分に示すように、
「蛋白(たんぱく)」のように元の文書に読み仮名を示
す情報が与えられているときに付与されるものがある。
すなわち、この場合では、「たんぱくたんぱく」と重複
して読み上げてしまうことを防ぐために、発音=“nul
l”という読み属性情報が記述されており、「(たんぱ
く)」の部分読み上げを禁止するタグが付与されてい
る。また、音声合成を行うために必要なタグとしては、
図中「例2」「例3」に示すように、「リンパ管」のよ
うな専門用語や「住み家」のように、誤った読み上げを
行う可能性のある難訓部分に付与されるものがある。す
なわち、この場合では、「りんぱくだ」や「すみいえ」
と読み上げてしまうことを防ぐために、それぞれ、発音
=“りんぱかん”、発音=“すみか”という読み仮名を
示す読み属性情報が記述されている。
【0136】一方、図19に示すタグファイルにおける
音声合成を行うために必要なタグとしては、図中「例
4」として示す部分のように、「II」というローマ数
字に対して、発音=“two”という読み属性情報が記述
されている。これは、「II」を「トゥ(two)」と読
み上げさせたい場合に、「セカンド(second)」と読み
上げてしまうことを防ぐために記述されているものであ
る。
【0137】また、例えば文書内に引用文が含まれてい
る場合、このようなタグファイルには、図示しないが、
その文が引用文であることを示すタグが付与される。さ
らに、タグファイルには、例えば文書内に疑問文がある
場合、図示しないが、その文が疑問文であることを示す
タグが付与される。
【0138】文書処理装置1は、先に図16に示したス
テップF101において、例えば以上の例のように、音
声合成を行うために必要なタグが付与された文書を受信
又は作成するものとなる。
【0139】つぎに、図16のステップF102におけ
る読み上げ用ファイルの生成について説明する。文書処
理装置1は、タグファイル中のタグから、読み上げめた
めの属性情報を導出し、この属性情報を埋め込むことに
よって読み上げ用ファイルを生成する。具体的には、文
書処理装置1は、文書の段落、文、句の先頭を示すタグ
を見つけ出し、これらのタグに対応して読み上げのため
の属性情報を埋め込む。また文書処理装置は、文書の要
約文を作成した場合には、その要約文に含まれる部分の
先頭を文書から見つけ出し、読み上げの際に音量を増大
させる属性情報を埋め込み、要約文に含まれる部分であ
ることを強調することなどもできる。
【0140】文書処理装置1は、図18又は図19に示
したタグファイルから図20又は図21に示すような読
み上げ用ファイルを生成する。なお、図20(a)
(b)は図18(a)(b)に示した部分に対応するも
のである。実際の読み上げ用ファイルは、上述した見出
し部分から最後の段落までが1つのファイルとして構成
されていることは勿論である。
【0141】図20に示す読み上げ用ファイルには、文
書の先頭に対応してCom=Lang***という属性情報が埋め
込まれている。この属性情報は、文書を記述している言
語を示す。ここでは、Com=Lang=JPNという属性情報であ
り、文書を記述している言語が日本語であることを示し
ている。文書処理装置においては、この属性情報を参照
することで、文書毎に言語に応じた適切な音声合成エン
ジンを選択することができる。
【0142】また、この読み上げ用ファイルには各所
に、Com=begin_p、Com=begin_s、Com=begin_phという属
性情報が埋め込まれている。これらの属性情報は、それ
ぞれ、文書の段落、文及び句の先頭を示す。文書処理装
置1は、上述したタグファイル中のタグに基づいて、こ
れらの段落、文及び句の先頭を識別する。なお、読み上
げ用ファイルにおいて、例えば上述したタグファイル中
の<形容動詞句><名詞句>のように、同じレベルの統
語構造を表すタグが連続して表れる部分に対しては、そ
れぞれに対応する数のCom=begin_phが埋め込まれずに、
まとめられて1つのCom=begin_phが埋め込まれる。
【0143】さらに、読み上げ用ファイルには、Com=be
gin_p、Com=begin_s、及びCom=begin_phに対応して、そ
れぞれ、Pau=500、Pau=100及びPau=50という属性情報が
埋め込まれている。これらの属性情報は、それぞれ、読
み上げの際に500ミリ秒、100ミリ秒及び50ミリ
秒の休止期間を設けることを示す。すなわち文書処理装
置1が、文章の段落、文及び句の先頭こおいて、それぞ
れ、500ミリ秒、100ミリ秒及び50ミリ秒の休止
期間を設けて文書を音声合成エンジンにより読み上げる
ようにするための情報である。なお、これらの属性情報
は、Com=begin_p、Com=begin_s及びCom=begin_phに対応
して埋め込まれる。そのため、例えばタグファイル中の
<副詞句><名詞句>のように、同じレベルの統語構造
を表すタグが連続して表れる部分は、1つの句として捉
えられ、それぞれに対応する数のPau=50が埋め込まれず
に、まとめられて1つのPau=50が埋め込まれる。また、
例えばタグファイル中の<段落><文><名詞句>のよ
うに、異なるレベルの統語構造を表すタグが連続して表
れる部分については、それぞれに対応するPau=***が埋
め込まれる。そのため文書処理装置1は、このような部
分を読み上げる際には、例えば文書の段落、文及び句の
それぞれの休止期間を加算して得られる650ミリ秒の
休止期間を設けて読み上げるようにする。このように、
文書処理装置1は、段落、文及び句に対応した休止期間
を設けることで、段落、文及び句の切れ目を考慮した違
和感のない読み上げを行うことができる。なお、この休
止期間は、文書の段落、文及び句の先頭において、それ
ぞれ、600ミリ秒、100ミリ秒及び50ミリ秒であ
る必要はなく、適宜変更することができる。
【0144】さらにまた、読み上げ用ファイルにおいて
は、タグファイル中で記述されている発音=“null”と
いう読み属性情報に対応して、「(たんぱく)」が除か
れているとともに、発音=“りんぱかん”、発音=“す
みか”という読み属性情報に対応して、「リンパ管」、
「住み家」が、それぞれ、「りんぱかん」、「すみか」
に置換されている。文書処理装置1は、このような読み
属性情報を埋め込むことで、音声合成エンジンが参照す
る辞書の不備による読み誤りをすることがないようにし
ている。
【0145】また、読み上げ用ファイルには、文書内に
含まれた引用文であることを示すタグに基づいて、この
引用文のみを別の音声合成エンジンを用いるように指定
するための属性情報が埋め込まれてもよい。さらに、読
み上げ用ファイルには、疑問文であることを示すタグに
基づいて、その文の語尾のイントネーションを上げるた
めの属性情報が埋め込まれるようにしてもよい。さらに
また、読み上げ用ファイルには、必要に応じて、いわゆ
る「である調」の文体を「ですます調」の文体に変換す
るための属性情報を埋め込むこともできる。なお、この
場合、文書処理装置1は、このような属性情報を読み上
げ用ファイルに埋め込むのではなく、「である調」の文
体を「ですます調」の文体に変換して音声読み上げ用フ
ァイルを生成するようにしてもよい。
【0146】一方、図21に示す読み上げ用ファイルに
は、文書の先頭に対応してCom=Lang=ENGという属性情報
が埋め込まれており、文書を記述している言語が英語で
あることを示している。また、読み上げ用ファイルに
は、Com=Vol=***という属性情報が埋め込まれている。
この属性情報は、読み上げの時の音量を示す。例えば、
Com=Vol=0は、文書処理装置のデフォルトの音量で読み
上げることを示している。また、Com=Vol=80は、デフォ
ルトの音量を80%増量した音量で読み上げることを示
している。任意の、Com=Vol=***は、次のCom=Vol=***ま
で有効である。さらに、読み上げ用ファイルにおいて
は、タグファイル中で記述されている発音=“two”と
いう読み属性情報に対応して、「II」が「two」に置
換されている。
【0147】文書処理装置1は、図17に示す一連の工
程を経ることによって、このような読み上げ用ファイル
を生成する。まず文書処理装置1は、ステップF201
において、CPU13によって、受信又は作成したタグ
ファイルを解析する。ここで文書処理装置1は、文書を
記述している言語を判別するとともに、文書の段落、文
及び句の先頭や、読み属性情報をタグに基づいて探し出
す。続いて文書処理装置1は、ステップF202におい
て、CPU13によって、文書を記述している言語に応
じて文書の先頭にCom=Lang=***という属性情報を埋め込
む。
【0148】次に文書処理装置1は、ステップF203
において、CPU13によって、文書の段落、文及び句
の先頭を読み上げ用ファイルにおける属性情報に置換す
る。すなわち文書処理装置1は、タグファイル中の<段
落>、<文>及び<***句>を、それぞれ、Com=begi
n_p、Com=begin_s及びCom=begin_phに置換する。
【0149】さらに文書処理装置1は、ステップF20
4において、CPU13によって、同じレベルの統語構
造が表れて同じCom=begin_***が重複しているものを、
1つのCom=begin_***にまとめる。続いて文書処理装置
1は、ステップF205において、CPU13によっ
て、Com=begin_***に対応してPau=***を埋め込む。すな
わち文書処理装置1は、Com=begin_pの前にPau=500を埋
め込み、Com=begin_sの前にPau=100を埋め込み、Com=be
gin_phの前にPau=50を埋め込む。そして文書処理装置1
は、ステップF206において、CPU13によって、
読み属性情報に基づいて、正しい読みに置換する。すな
わち文書処理装置1は、発音=“null”という読み属性
情報に基づいて、「(たんぱく)」を除去するととも
に、発音=“りんぱかん”、発音=“すみか”という読
み属性情報に基づいて、「リンパ管」、「住み家」を、
それぞれ、「りんぱかん」、「すみか」に置換する。
【0150】文書処理装置1は、先に図16に示したス
テップF102において、この図17に示す処理を行う
ことによって、読み上げ用ファイルを自動的に生成す
る。文書処理装置1は、生成した読み上げ用ファイルを
RAM14に記憶させる。
【0151】つぎに、図16のステップF103におけ
る読み上げ用ファイルを用いた処理について説明する。
文書処理装置1は、読み上げ用ファイルを用いて、RO
M15やHDD34等に予め記憶されている音声合成エ
ンジンに適した処理をCPU13の制御のもとに行う。
具体的には、文書処理装置1は、読み上げ用ファイルに
埋め込まれているCom=Lang=***という属性情報に基づい
て、使用する音声合成エンジンを選択する。音声合成エ
ンジンは、言語や男声/女声等の種類に応じて識別子が
付されており、その情報が例えば初期設定ファイルとし
てHDD34に記録されている。文書処理装置1は、初
期設定ファイルを参照し、言語に対応した識別子の音声
合成エンジンを選択する。 .
【0152】また文書処理装置1は、読み上げ用ファイ
ルに埋め込まれているCom=begin_***を音声合成エンジ
ンに適した形式に変換する。例えば文書処理装置1は、
Com=begin_phをMark=10000のように10000番台の番
号でマーク付けする。またCom=begin_sをMark=1000のよ
うに1000番台の番号でマーク付けし、Com=begin_p
をMark=100のように100番台の番号でマーク付けす
る。これは、<句>、<文>、<段落>の先頭が、それ
ぞれ10000番台、1000番台、100番台の番号
で示されることを意味し、このマークによって<句>、
<文>、<段落>の先頭が識別できるようになる。さら
に、読み上げ用ファイルにおいては、音量の属性情報が
Voll=***のようにデフォルトの音量の百分率で表されて
いることから、文書処理装置1は、この属性情報に基づ
いて、百分率の情報を絶対値の情報に変換して求める。
【0153】文書処理装置1は、先に図16に示したス
テップF103において、このような読み上げ用ファイ
ルを用いた処理を行うことによって、読み上げ用ファイ
ルを音声合成エンジンが文書を読み上げることが可能な
形式に変換するものとなる。
【0154】つぎに、図16のステップF104におけ
るユーザインターフェースを用いた操作について説明す
る。文書処理装置1は、ユーザが例えば入力部20のマ
ウス等を操作して、先に図10に示した読み上げボタン
306cをクリックすることによって、音声合成エンジ
ンを起動する。そして文書処理装置1は、図22に示す
ようなユーザインターフェース用の読み上げウインドウ
401を表示部30に表示する。
【0155】この読み上げウインドウ401は、図示す
るように、文書を読み上げさせるための再生ボタン42
0と、読み上げを停止させるための停止ボタン421
と、読み上げを一時停止させるための一時停止ボタン4
22とを有する。また、この読み上げウインドウ401
は、文単位で頭出し、早戻し及び早送りさせるための頭
出しボタン411、早戻しボタン412及び早送りボタ
ン413と、段落単位で頭出し、早戻し及び早送りさせ
るための頭出しボタン414、早戻しボタン415及び
早送りボタン416と、句単位で頭出し、早戻し及び早
送りさせるための頭出しボタン417、早戻しボタン4
18及び早送りボタン419とを有する。
【0156】さらに、読み上げウインドウ401は、読
み上げる対象を全文とするか、上述したようにして作成
された要約文とするかを選択するための選択スイッチ4
23,424を有する。また、読み上げ時に画像を表示
する画像表示エリア403が設定され、読み上げている
人のイメージを表示したり、テロップ表示エリア402
が設けられ、読み上げ音声に対応して文字がテロップ表
示できるようにされている。
【0157】なお、ここでは図示しないが、例えば、音
声を増減させるためのボタンや読み上げの速さを増減さ
せるためのボタン、男声/女声等の声を変化させるため
のボタン等を有していてもよい。
【0158】文書処理装置1は、ユーザがこれらの各種
ボタン/スイッチを例えば入力部20のマウス等を操作
してクリック/選択することに応じて、音声合成エンジ
ンによる読み上げ動作を行う。例えば、文書処理装置1
は、ユーザが再生ボタン420をクリックすることによ
って、文書の読み上げを開始する。具体的には制御部1
1は音声合成処理により生成した音声信号を音声出力部
33に供給し、音声として出力する。また文書処理装置
1は、停止ボタン421、一時停止ボタン422のクリ
ックにおいて、読み上げ処理の停止や一時停止を行う。
【0159】また、読み上げの途中でユーザが頭出しボ
タン411を押すことによって、現在読み上げている文
の先頭にジャンプして再び読み上げる。頭出しボタン4
14、417についても同様に、それぞれ現在読み上げ
ている段落や句の先頭にジャンプして再び読み上げを行
う。制御部11は、この頭出しボタン411、414、
417の操作に関しては、上記したマーク付により、ジ
ャンプ先を認識するものとなる。即ち、文に関する頭出
しボタン411が操作された際には、制御部11は、現
在読み上げている文の途中位置から文を遡っていき、1
000番台のマークをサーチする。そして1000番台
のマークが検出されたら、そこから読み上げを再開する
ものとなる。段落や句の場合は、それぞれ100番台、
10000番台のマークを探して読み上げを再開するも
のとなる。この様な処理によって、例えば文書中でユー
ザが所望の部分を繰り返し再生させたいといった要求に
応えることができる。
【0160】文書処理装置1は、図16のステップF1
04において、ユーザがこのような読み上げウインドウ
401でのユーザインターフェースを用いた操作を行う
ことに応じて、音声合成エンジンにより文書を読み上げ
る。このようにして文書処理装置1は、所望の文書を音
声合成エンジンにより違和感なく読み上げることができ
る。
【0161】ところで読み上げる対象の文書としては文
書データの本文でもよいし、後述するように生成される
要約文であってもよい。本文か要約文かは、選択スイッ
チ423,424のクリックにより選択されるが、いず
れにしても、本文又は要約文としてのタグファイルにつ
いて、図16のステップF102,F103の処理が行
われることで、音声合成エンジンによる文書読み上げが
可能となる。
【0162】なお本例では、受信又は作成したタグファ
イルから読み上げ用ファイルを生成するものとしたが、
このような読み上げ用ファイルを生成せずに、タグファ
イルに基づいて直接読み上げを行うようにしてもよい。
この場合、文書処理装置1は、タグファイルを受信又は
作成した後、音声合成エンジンを用い、タグファイルに
付与されている段落、文及び句を示すタグに基づいて、
段落、文及び句の先頭に所定の休止期間を設けて読み上
げる。このようにすることによって、文書処理装置1
は、音声読み上げ用ファイルを生成することなく、タグ
ファイルに基づいて直接読み上げることができる。
【0163】6.要約作成/表示処理 続いて、文書データについての要約文を作成する処理に
ついて述べる。上述したようにユーザーは、文書を選択
して図10のような閲覧ウインドウ301を開くことに
より、文書の本文を閲覧することができる。そして閲覧
ウインドウ301においては、選択された文書の本文及
び要約文が表示される。但し、また要約文が作成されて
いない時点では、図26のように要約表示部304は空
白とされる。
【0164】この閲覧ウインドウ301において要約作
成ボタン306aがクリックされると、文書表示部30
3に表示されている文書についての要約文が作成され、
図27に示すように要約表示部304に表示される。つ
まり制御部11は、ソフトウエアもしくはハードウエア
で構成される要約作成エンジン(図47で後述)を起動
させることにより、ユーザーの要約作成操作に応じて、
以下説明するような要約文作成処理を行い、作成後、そ
れを表示する制御を行うものとなる。文書から要約を作
成する処理は、文書のタグ付けによる内部構造に基づい
て実行される。
【0165】なお要約文は、通常は、要約表示部304
のサイズに応じて生成される。そして本文表示部303
と要約表示部304の面積は、ユーザーが仕切枠312
を移動させることで変化させることができる。つまり要
約文は、要約作成が指示された時点での要約表示部30
4のサイズに応じたサイズ(文書長)で作成されること
になる。例えば図26では要約表示部304は非常に狭
いものとなっているが、ユーザーが仕切枠312を移動
させて要約表示部304を広くした上で、要約作成を指
示することで、例えば図27のように広げられた要約表
示部304に、そのエリアサイズに合った文書長の要約
文が作成され、表示されるものとなる。
【0166】但し、例えば図26のように要約表示部3
04が非常に狭い場合に、そのサイズに応じた要約文を
作成するとすると、その要約文は不十分な内容となって
しまうことが多い。つまり十分な文書長で要約文を作成
できないため、実質的に要約としての機能を果たさない
文章となってしまう。そこで本例では、要約表示部30
4としてのウインドウサイズ(ウインドウ内に表示可能
な文書長)が所定値以下、例えば図26のような画面上
での行数でいうと1〜2行程度未満の場合などには、要
約表示部304のサイズを越える文書長の要約文を作成
するようにし、ソフトウエアもしくはハードウエアで構
成されるテロップ作成エンジン(図47で後述)によ
り、それをテロップ化して表示するようにしている。
【0167】以下、このようなテロップ表示を含む、本
例の要約文の作成及び表示動作について説明していく。
【0168】閲覧ウインドウ301上で要約作成ボタン
306aがクリックされることにより、制御部11(要
約作成エンジン)によって図23の要約作成処理が開始
される。なお図23の要約作成処理が終了すると、続い
て図24の要約文表示処理が実行され、また場合によっ
ては、その要約文表示処理中で図25のテロップ表示処
理が行われるものとなる。
【0169】図23の要約作成処理としては、まずステ
ップF81として制御部11は活性拡散を行う。本例に
おいては、活性拡散により得られた中心活性値を重要度
として採用することにより、文書の要約を行うものであ
る。すなわち、タグ付けによる内部構造を与えられた文
書においては、活性拡散を行うことにより、各エレメン
トにタグ付けによる内部構造に応じた中心活性値を付与
することができる。ステップF81で行う活性拡散処理
は、図6〜図8で説明したものと同様の処理となるが、
上述したように活性拡散は、中心活性値の高いエレメン
トと関わりのあるエレメントにも高い中心活性値を与え
るような処理である。すなわち、活性拡散は、照応(共
参照)表現とその先行詞の間で中心活性値が等しくな
り、それ以外では中心活性値が減衰するような中心活性
値についての演算である。この中心活性値は、タグ付け
による内部構造に応じて決定されるので、タグ付けによ
る内部構造を考慮した文書の分析に利用することができ
る。
【0170】次にステップF82で、その時点の要約表
示部304のサイズwsyを確認し、要約表示部サイズ
wsyが予め設定されている所定サイズwsth以上で
あるか否かを確認する。この所定サイズwsthとは、
通常、要約文としては十分な文書長(文字数)を表示で
きるウインドウサイズとして設定されているものであ
る。所定サイズwsthとしての具体的な値は、システ
ム設計上、適切な値が決められるものとなる。
【0171】まず、要約表示部サイズwsyが予め設定
されている所定サイズwsth以上であった場合につい
て説明していく。これは要約表示部サイズwsyに応じ
た要約文が作成される場合の処理となる。この場合、制
御部11の処理は、ステップF83に進み、制御部11
は、その時点で表示部30に表示されている閲覧ウィン
ドウ301の要約表示部304のサイズwsy(具体的
にはこの要約表示部304に表示可能な最大文字数)を
変数(最大文字数)wsと設定する。また制御部11
は、要約の文字列(要約文を保持する内部レジスタ)s
を初期化して初期値s(0)=””と設定する。制御部
11は、このように設定した、最大文字数wsおよび文
字列sの初期値s(0)を、RAM14に記録する。
【0172】次にステップF85に進み、制御部11
は、文の骨格の抽出処理をカウントするカウンタのカウ
ント値iを「1」に設定する。そしてステップF86で
制御部11は、カウンタのカウント値iに基づいて、文
章からi番目に平均中心活性値の高い文の骨格を抽出す
る。平均中心活性値とは、一つの文を構成する各エレメ
ントの中心活性値を平均したものである。制御部11
は、たとえばRAM14に記録した文字列s(i−1)
を読み出し、この文字列s(i−1)に対して、抽出し
た文の骨格の文字列を加えて、S(i)とする。そして
制御部11は、このようにして得た文字列s(i)をR
AM14に記録する。初回は、文字列s(i−1)は初
期値s(0)であるので、今回抽出した文の骨格が文字
列S(i)としてRAM14に記憶されることになる。
また以降においてステップF84の処理が行われる場合
は、抽出された文の骨格が文字列S(i)に、それまで
の文字列S(i)(つまりその時点では文字列S(i−
1))に追加されていくものとなる。また同時に、制御
部11はこのステップF84において、上記文の骨格に
含まれないエレメントの中心活性値順のリストL(i)
を作成し、このリストL(i)をRAM14に記録す
る。
【0173】すなわち、このステップF86において
は、要約のアルゴリズムは、活性拡散の結果を用いて、
平均中心活性値の大きい順に文を選択し、選択された文
の骨格の抽出する。文の骨格は、文から抽出した必須要
素により構成される。必須要素になりうるのは、エレメ
ントの主辞(head)と、主語(subject)、目的語(obj
ect)、間接目的語(indirect object)、所有者(poss
essor)、原因(cause)、条件(condition)または比
較(comparison)の関係属性を有する要素と、等位構造
が必須要素のときにはそれに直接含まれるエレメントと
が必須要素を構成するものである。そして、文の必須要
素をつなげて文の骨格を生成し、要約に加える。
【0174】ステップF87では制御部11は、文字列
s(i)の長さが、閲覧ウィンドウ301の要約表示部
104の最大文字数wsより大きいか否かを判断する。
このステップF87は、要約表示部304のサイズに応
じた要約文を作成するための判断処理となる。
【0175】制御部11は、文字列s(i)の長さが最
大文字数wsに達していないときは、処理をステップF
88に進める。ステップF88では制御部11は、文書
中で、(i+1)番目に平均中心活性値が高い文のエレ
メントの中心活性値と、上記ステップF86で作成した
リストL(i)の最も中心活性値が高いエレメントの中
心活性値を比較する。つまり、上記ステップF86にお
いて要約として採用された文の次に平均中心活性値が高
い文(即ち次に要約文に付加する候補となる文)と、ス
テップF86において要約として採用された文の中で骨
格ではないとして要約からは排除されたエレメントの中
心活性値を比較する。
【0176】このステップF88の処理は、要約文とし
ての文字列に次に加える部位を、その直前のステップF
86で採用した文において骨格として採用されなかった
ものから選ぶか、或いは他の文から選ぶかを判断する処
理となる。
【0177】(i+1)番目に平均中心活性値が高い文
におけるエレメントの中心活性値よりも、リストL
(i)における最も高い中心活性値の方が、中心活性値
が高い値であった場合は、要約文としての文字列に次に
加える部位を、その直前のステップF86で採用した文
において骨格として採用されなかったものから選ぶよう
にする。このため制御部11の処理はステップF90に
進み、リストL(i)における最も中心活性値が高いエ
レメントを、その時点で記憶されている文字列S(i)
に加え、文字列SS(i)とする。またこのとき、文字
列SS(i)に加えたエレメントをリストL(i)から
削除する。そして、ステップF91において、文字列S
S(i)が、最大文字数wsより大きいか否かを判断
し、大きくなければステップF88に戻る。
【0178】ステップF88において、(i+1)番目
に平均中心活性値が高い文のエレメントとして、リスト
L(i)における最も高い中心活性値よりも中心活性値
が高いエレメントがあった場合は、要約文としての文字
列に次に加える部位を、その直前のステップF86で採
用した文とは別の文から選ぶこととしてステップF89
でカウント値iをインクリメントしてステップF86に
戻ることになる。つまりステップF88で、(i+1)
番目に平均中心活性値が高い文とされた文について、ス
テップF86で骨格を抽出し、それを文字列S(i)に
加えるようにする。
【0179】以上のように、ステップF86又はステッ
プF90で文の骨格となるエレメントやその他のエレメ
ントとして、中心活性値の高いものを基準として文字列
に加えていきながら、ステップF87又はステップF9
1で、文字列S(i)又はSS(i)を最大文字数ws
と比較していくことで、最大文字数wsに近いが最大文
字数wsを越えない文字列を作成していくことになる。
【0180】例えばステップF87で文字列S(i)が
最大文字数wsを越えた場合は、制御部11の処理はス
テップF92に進み、直前のステップF86で骨格を加
える前の文字列S(i−1)を、要約文とする。つま
り、これはステップF86で文の骨格を加えたことによ
り、最大文字数wsを越えてしまったことになるため、
その骨格を加える前の文字列S(i−1)が、最大文字
数wsに近いが最大文字数wsを越えない文字列である
と判断して、それを要約文とするものである。
【0181】なお、このため初めてステップF86で文
字列S(i)を生成した時点(i=1の時点)で、ステ
ップF87で、文字列S(i)が最大文字数wsを越え
た場合は、文字列S(i−1)は、ステップF83で設
定した初期値としての文字列S(0)となるため、実質
的に要約文は作成できなかったことになる。これは、要
約表示部304のサイズが小さすぎたことに起因するた
め、ユーザーは画面上で要約表示部304の面積を広げ
た上で、再度、要約作成ボタン306aをクリックし
て、図23の処理が開始されるようにすればよい。但
し、本例の場合、ステップF82において要約表示部3
04のサイズが小さすぎる場合が判別され、そのような
場合は後述するように、要約表示部304のサイズで表
示可能な文書長より長い文書長の要約文が作成される処
理となるため、実質的に要約文が作成できなくなる事態
は、ほとんど発生しない。
【0182】ステップF87で文字列S(i)が最大文
字数wsを越えていない場合は、上述のように制御部1
1の処理はステップF88に進み、次に文字列に加える
部分を判断することになる。そして上記のようにステッ
プF91に進んだ場合は、文字列SS(i)が最大文字
数wsを越えたか否かを判別する。ここで文字列SS
(i)が最大文字数wsを越えた場合は、制御部11の
処理はステップF93に進み、直前のステップF90で
或るエレメントを加える前の文字列S(i)を、要約文
とすることになる。つまり、これはステップF90でエ
レメントを加えたことにより、最大文字数wsを越えて
しまったことになるため、そのエレメントを加える前の
文字列S(i)が、最大文字数wsに近いが最大文字数
wsを越えない文字列であると判断して、それを要約文
とするものである。
【0183】以上の処理説明は、ステップF82→F8
3→F85と進んだ場合として説明した。従って、図2
3の処理を終えた時点で、要約表示部304のサイズに
適合した文書長の要約文が作成されたことになる。そし
てその要約文の内容は、平均中心活性値の高い1又は複
数の文の骨格、及び骨格以外の中心活性値の高いエレメ
ントが用いられたものとなる。この様に作成された要約
文は、RAM14に記憶されるとともに、図27のよう
に要約表示部304に、その要約文全体が固定的に表示
される。
【0184】つまり、図23の要約作成処理が終了され
ると続いて制御部11の処理は図24の要約文表示処理
に進む。要約文表示処理としては、まずステップF94
で、要約表示部304のサイズwsyがその時点での最
大文字数wsと一致しているか否かを確認する。つまり
直前の要約作成処理で用いられていた最大文字数ws
は、ステップF83で要約表示部304のサイズwsy
が代入されたものであるか否かを判別する。wsy=w
sの場合とは、上記の処理により、その時点の要約表示
部304のサイズに適合した要約文が作成された場合で
ある。そこでその場合は、ステップF96に進み、作成
された要約文を要約表示部304に表示させる。これに
より、図27のように要約文全体が固定表示される。つ
まり、ユーザーが予め要約表示部304のサイズを任意
に設定した上で要約作成を指示することで、要約表示部
304のサイズに応じた文書長の要約が固定的に(つま
りテロップ化として切り換えや移動なしに)表示される
ことになる。
【0185】なお、表示された要約文を見てユーザーが
より詳しい要約文を見たいと思った場合、或いはより短
い要約文を見たいと思った場合は、閲覧ウインドウ30
1の要約表示部304のサイズ(面積)を増減した上
で、再度要約作成ボタン306aをクリックすればよ
い。すると、要約表示部304のサイズwsyが、所定
サイズwsth以上である限りは、図23の上述した処
理により、その時点の要約表示部304のサイズに応じ
た文書長の要約書が作成され、表示されることになる。
【0186】ところで、例えば図26のように要約表示
部304が非常に小さいサイズとされている状態でユー
ザーが要約作成ボタン306aをクリックし、図23の
要約作成処理が開始された場合などで、ステップF82
において要約表示部304のサイズwsyが、所定サイ
ズwsth未満であると判断された場合は、以下のよう
な処理が行われることとなる。
【0187】この場合は制御部11の処理はステップF
84に進み、最大文字数wsとして、予め設定された固
定値wsfixを代入する。この固定値wsfixと
は、要約文として最低限必要であるとして設定された文
字数に相当する値であり、システム設計上、適切な値が
設定される。例えばwsfix=wsthとしてもよ
い。さらに、固定値wsfix=(wsfix−i)×
Vとし、固定値初期値wsfix−iを保持するととも
に、係数Vの値をユーザーが任意に入力できるようにす
ることで、固定値wsfixをユーザーが任意に設定で
きるようにしてもよい。
【0188】また、制御部11は、要約の文字列(要約
文を保持する内部レジスタ)sを初期化して初期値s
(0)=””と設定する。制御部11は、このように設
定した、最大文字数wsおよび文字列sの初期値s
(0)を、RAM14に記録する。
【0189】続いて制御部11はステップF85で変数
i=1とした後、ステップF86以降の処理に進むが、
これは上述したとおりとなるため重複説明は避ける。即
ちこの場合も、最大文字数wsを越えない範囲で、最大
文字数wsに最も近い文字数としての要約文を作成して
いくことになる。但しこの場合は、最大文字数ws=w
sfixとされているため、その時点の要約表示部30
4のサイズに応じた文字数とはならず、実際には要約表
示部304での表示可能な文字数を越える文字数(文書
長)の要約文が生成されることになる。
【0190】ステップF86〜F93の処理により要約
文が作成されたら、制御部11は図24の要約文表示処
理を実行する。そしてこの場合は最大文字数wsは要約
表示部サイズwsyではないため、ステップF94から
F95に進み、テロップ作成エンジンを用いて、生成し
た要約文をテロップ化して表示していく処理を行うこと
になる。
【0191】このステップF95のテロップ表示処理の
例を図25に詳しく示す。まず制御部11(テロップ作
成エンジン)はステップF501で変数n=1とセット
する。そしてステップF502で、生成した要約文から
第nの文を抽出する。従ってまず要約文を構成している
第1の文が抽出される。
【0192】次にステップF503で、抽出した文の文
長Ls(語数)が、要約表示部サイズwsyを越えてい
るか否かを判別する。例えば要約文を構成している1又
は複数の文のうちの第1の文が、その時点の要約表示部
サイズwsyにおいて表示可能な語数以下であったとす
ると、制御部11の処理はステップF504に進む。そ
して、文長Lsに所定の係数kを乗算して、テロップ表
示時間T1を算出する。
【0193】続いてステップF505で制御部11は内
部タイマのカウントをスタートさせるとともに、ステッ
プF506で、その第1の文を要約表示部304に表示
させる。このとき、文長Lsは要約表示部サイズwsy
以下であるため、その第1の文の全体が、テロップとし
て要約表示部304に表示される。この表示動作中に
は、制御部11はステップF507でタイムカウント値
を監視しており、タイマによりT1時間が計数された時
点で、ステップF515に進む。そして、ステップF5
15で要約文の最後の文の表示までが完了したか否かを
判断し、完了していなければステップF516で変数n
をインクリメントしたうえでステップF502に戻る。
従って、次に要約文を構成している文のうちの第2の文
を抽出することになる。
【0194】続いて制御部11は、第2の文についてス
テップF503の判別を行うが、ここで、第2の文の文
長が要約表示部サイズwsyを越えていたとすると(つ
まり一度に文全体を表示できない場合)、制御部11の
処理はステップF508に進み、要約表示部に表示可能
な文長Lwsyに所定の係数kを乗算して、テロップ表
示時間T1を算出する。続いてステップF509で制御
部11は内部タイマのカウントをスタートさせるととも
に、ステップF510で、その第2の文をテロップとし
て要約表示部304に表示させる。但し、このとき、文
長Lsは要約表示部サイズwsyを越えているため、表
示可能な先頭部分のみを表示することになる。つまり第
2の文のうちの、先頭から文長Lwsyに相当する部分
を表示する。この表示動作中には、制御部11はステッ
プF511でタイムカウント値を監視しており、タイマ
によりT1時間が計数された時点で、ステップF512
に進む。
【0195】ステップF512では、表示されている文
を、1文字分スクロールさせる。そしてステップF31
3でT2時間待機する。そして、ステップF514で第
2の分の最後の文字までが表示されたか否かを判断し、
まだ最後の文字まで達していなければ、ステップF51
2に戻って1文字分スクロールさせる。待機時間として
のT2時間は、スクロールタイミングを規定する時間と
なり、これもシステム設計上設定される値となるが、例
えば0.5〜1秒程度とすると、適切な速度で、文がス
クロールされていくことになる。
【0196】このようなステップF508〜F514の
処理により、要約表示部304に表示しきれない文につ
いては、まず先頭部分がT1時間表示された後、T2時
間毎に1文字づつ表示がスクロールされていき、その文
の最後の文字に至るまで表示されることになる。
【0197】スクロールにより文の最後の文字までが表
示されたら、制御部11の処理はステップF514から
F515に進み、要約文の最後の文の表示までが完了し
たか否かを判断し、完了していなければステップF51
6で変数nをインクリメントしたうえでステップF50
2に戻る。従って、次に要約文を構成している文のうち
の第3の文を抽出することになる。そして第3の文につ
いて、ステップF504〜F507、もしくはステップ
F508〜F514の処理によりテロップ表示を実行す
る。
【0198】ステップF515で、要約文を構成する全
ての文について表示を終了したと判断すると、処理はス
テップF517に進み、要約文の先頭部分を表示する。
即ち要約表示部サイズwsyにおいて表示可能な先頭部
分を表示する状態とする。またステップF518で、後
述するスクロールバー307を表示して、テロップ表示
処理を終了する。
【0199】以上のようなテロップ表示処理で実現され
る表示動作は、次のようになる。例えば図26のように
要約表示部304が非常に狭くされた状態の閲覧ウイン
ドウ301において要約作成ボタン306aがクリック
され、要約文が作成されるとする。このとき、上述の図
23の処理で要約表示部304での表示可能な文書長よ
りも長い要約文が作成される。
【0200】例えば図26において本文表示部303に
表示されている本文に対して、次のような要約文が生成
されたとする。「[素敵にエイジング]/8ガン転移、
抑えられる!?がんを特徴づけるのは、細胞増殖と転移
である。人間の細胞には、「がん遺伝子」と、「がん抑
制遺伝子」がある。高齢者の場合、長い年月の間に正常
な調節機能が失われ、細胞内でブレーキが利かない変異
が蓄積し、細胞の割合が増え、がん多発につながるわけ
だ。転移、がん細胞が増えるだけでは発生しない。がん
細胞が蛋白質などを溶かし、道をつくって、血管やリン
パ管に入り込む。がんの診断、治療の面から(nm2
3)の期待が集まっている。」
【0201】このような要約文は、次のように〜の
7つの文から構成されているが、上述した本例のテロッ
プ表示処理では、文単位でテロップ化する。 [素敵にエイジング]/8ガン転移、抑えられる!? がんを特徴づけるのは、細胞増殖と転移である。 人間の細胞には、「がん遺伝子」と、「がん抑制遺伝
子」がある。 高齢者の場合、長い年月の間に正常な調節機能が失わ
れ、細胞内でブレーキが利かない変異が蓄積し、細胞の
割合が増え、がん多発につながるわけだ。 転移、がん細胞が増えるだけでは発生しない。 がん細胞が蛋白質などを溶かし、道をつくって、血管
やリンパ管に入り込む。 がんの診断、治療の面から(nm23)の期待が集ま
っている。
【0202】図25の処理により、まず最初に第1の文
が抽出され、図28のように要約表示部304に表示
される。この図25の状態以降の要約表示部304のテ
ロップ表示状態を図29(a)〜(j)で説明してい
く。
【0203】図28の文は、文長Ls≦wsyである
(文全体を表示可能である)ため、図25のステップF
504〜F507の処理で、図29(a)の表示状態
が、文長に応じて算出されたT1時間継続される。続い
て文、も文長Ls≦wsyとなるため、それぞれス
テップF504〜F507の処理で、文長に応じて算出
されたT1時間づつ、図29(b)(c)の表示が実行
される。
【0204】次の文は、文長Ls>wsyである(文
全体を表示不能である)ため、図25のステップF50
8〜F514の処理が行われる。即ちまず図29(d)
のように文の先頭部分が、算出されたT1時間表示され
た後、T2時間毎に、図29(e)→(f)のように、
表示が1文字づつスクロールされる。その後同様にスク
ロールが進み、図29(g)の状態となることで、文
の表示が完了することになる。
【0205】続いて文、、がそれぞれ順次抽出さ
れ、これらは文長Ls≦wsyであるため、それぞれス
テップF504〜F507の処理で、文長に応じて算出
されたT1時間づつ、図29(h)(i)(j)の表示
が実行される。
【0206】以上のように各文毎にテロップとして順次
表示され、また文長が長くて表示しきれない場合は、そ
の表示しきれなかった部分がスクロールにより表示され
る。そして、要約文を構成する全文のテロップ表示を完
了したら、図25のステップF517、F518とし
て、図30に示すように要約文の先頭部分が表示される
とともに、スクロールバー307が表示される。即ち、
上記テロップ表示により、要約文全体をユーザーに提示
した後は、スクロールバー307を用意することで、そ
の後ユーザーが、要約表示部304上の文字を任意にス
クロールさせて、要約文内容を確認できるようにするも
のである。
【0207】本例の要約文の作成及び表示は以上のよう
に実行されるが、これによりユーザーにとって好適な要
約提示が可能となる。まず、ユーザーは、要約表示部3
04のサイズを任意に設定することで、生成される要約
文の文書長を設定できる。つまり詳しい要約文を見たい
ときには要約表示部304を広くしてから要約作成ボタ
ン306aをクリックし、一方、簡単な内容の要約文を
見たいときには要約表示部304を狭くしてから要約作
成ボタン306aをクリックすればよい。それにより、
ユーザーの望むサイズの要約文が生成され、テロップで
はなく固定表示される。
【0208】また、もしユーザーが要約表示部304を
狭くしすぎてしまった場合は、そのウインドウサイズに
関わらず最低限必要な文書長の要約文が作成され、上述
のようにテロップ化されて表示されることになる。従っ
て、例えばユーザーが本文表示部303を広くとりたい
ためにやむおえず要約表示部304をかなり狭くしたよ
うな場合でも、ユーザーは適切な内容の要約文を見るこ
とができるようになる。これにより内容を正確に認識で
きる。
【0209】また本例のテロップ表示処理では、要約文
を文単位でテロップ化しているが、1つの文の表示時間
(T1)は、その文長に応じて算出しているため、各文
(テロップ)は、ユーザーが読むのに適切な表示時間と
なる。さらに、文が長い場合は、スクロール表示を実行
するため、ユーザーが1つの文を認識することに好適で
ある(後続部分は切換表示でなく移動表示されるため
に、1つの文が続いていることをユーザーが認識しやす
い)。
【0210】なお、テロップ表示処理の例としては図2
5の例に限らず各種の処理例が考えられる。例えば文単
位でなく、文節、句などの単位でテロップ化するように
してもよいし、文や文節の長さに応じて、表示の区切を
変更するようにしてもよい。また、要約文全体を最初か
ら最後までスクロール表示していくことも考えられる。
いずれにしても、切換表示又は移動表示、もしくはその
組み合わせにより、要約文の全体がユーザーに提示され
るようにすればよい。
【0211】また各テロップとしての表示期間や切換タ
イミング、スクロールタイミングの設定は多様に考えら
れる。上述のように本例では本文や要約文についての読
み上げも可能であるが、テロップ作成エンジンにより行
われるテロップ表示のタイミングを、読み上げ音声の出
力タイミングに合わせて設定することも可能である。例
えば上述したように読み上げ処理においては、タグファ
イルから読み上げ用ファイルを生成し、その読み上げ用
ファイルを音声合成エンジンに適した形態に変換した上
で、音声合成エンジンによって、人が話すような自然な
感じでの速度や、段落、文、句の区切によって読み上げ
が実行されるようにしている。従って、そのような段
落、文、句の区切や、読み上げ速度と同様のテロップ区
切や、表示期間の設定を行うことで、ユーザーにとって
読みやすいテロップ表示を実現できる。具体的な手法例
としては、上述したように音声合成エンジンによる読み
上げ処理を実行させ(但し読み上げ音声の出力は実行さ
せない)、CPU13はその読み上げタイミングを参照
して、テロップ表示の区切及び切換タイミングを設定す
ればよい。例えば音声合成エンジンによって或る句の読
み上げが実行されている期間(実際には音声は出力しな
い)に、その句としての文字列をテロップ表示するとと
もに、読み上げ音声が次の句に進んだ時点で、次の句の
テロップ表示に切り換えるような処理となる。このよう
な音声合成エンジンとテロップ作成エンジンの連動を実
現する構成も図47で後述する。
【0212】7.ビデオファイルの出力処理 7−1 ビデオファイル及びタグ 以上の説明は本例の文書処理装置1において主に文書デ
ータのみを対象とした処理についてであるが、本例の文
書処理装置1では、上記のような各種処理、例えば本文
の表示出力、要約文の表示出力、読み上げ音声の出力な
どと連携して、もしくは独立して、文書データに関連す
るビデオデータを出力することができる。以下、ビデオ
データに関する各種処理を説明していく。
【0213】まず、ビデオデータとしてのデータファイ
ル(以下、ビデオファイルという)及び、ビデオファイ
ルを文書データと関連づけるために文書データに付与さ
れているタグ構造について説明する。上述したように、
例えば通信部21や記録媒体32から文書処理装置1に
文書データが取り込まれる際には、同時にビデオファイ
ルが取り込まれることがある。また文書データとは別に
ビデオファイルが入力されることもある。図4、図12
などで説明したように、文書処理装置1に取り込まれた
文書データやビデオファイルは、RAM14やHDD3
4などに格納される。そして制御部11は必要に応じて
格納された文書データを取り出すことで、上述のように
文書の本文の表示や、要約作成及び表示、読み上げなど
を実行できるが、格納されているビデオファイルに関し
ても、処理対象となっている文書データに対応するビデ
オファイルを取り出して表示出力することができる。
【0214】図31に、文書処理装置1内に格納されて
いる文書データ及びビデオファイルのイメージを示す。
文書データ、即ちタグファイルとしては、図示するよう
にタグファイルTG1、TG2、TG3・・・・という
ように、各種文書データが格納されている。一方、ビデ
オファイルとしても、例えばビデオファイルV1、V2
・・・・というように、各種のファイルが格納されてい
る。ビデオファイルの内容は多様であり、それぞれ文書
データやビデオデータを供給するサーバ側が任意に作成
するものであるが、例えばビデオファイルV1では複数
のシーンとしての動画データVM1〜VM4が含まれて
いる。ビデオファイルV3は2つの動画データVM5、
VM6が、ビデオファイルV5は1つの動画データVM
9が含まれている。またビデオファイルV2は、複数の
静止画データVS1〜VS7が含まれている。ビデオフ
ァイルV4では、複数の静止画データVS8,VS9
と、複数の動画データVM7,VM8が含まれている。
もちろんこれ以外にも、多様なビデオファイルが存在す
る。ビデオデータは、例えばMPEGデータなどとされ
る。
【0215】また動画データには、オーディオデータが
含まれているものとしている。但し静止画データには、
基本的にはオーディオデータは含まれないが、静止画映
像に関連するオーディオデータが付加されていてもよ
い。なお、ここでいうオーディオデータとは、動画もし
くは静止画としての画像に対応して記録されたオーディ
オデータであり、関連関係にある文書データの本文や要
約文の内容が読み上げられたようなオーディオデータで
はない(上述のように音声合成処理により発生される読
み上げ音声信号のことではなく、また読み上げ音声と同
内容の音声信号ではない)。つまりオーディオデータ
は、ビデオデータに付随する音声のデータのことをいっ
ており、直接的に文書データと一致するものではない。
例えば記録された映像の収録時の周囲音声、効果音、ア
ナウンス/説明等の音声など、通常のビデオデータに含
まれる音声データのことである。(但し、情報提供者側
の意向により、或る文書データに対応するビデオデータ
に、その文書データをそのまま読み上げたような内容の
オーディオデータを付加することはあり得る。)
【0216】また、各ビデオファイルは、例えば、時/
分/秒/フレームとしてのタイムコードTCがビデオデ
ータを構成するフレーム単位で付されている。例えばビ
デオファイルV1では図示するように、先頭のフレーム
から終端のフレームまでにおいて「00:00:00:
00」〜「00:03:39:05」のタイムコードT
Cが付されている。このタイムコードTCはビデオファ
イルにおける各部のアドレス的に機能し、例えばタイム
コードを指定することで、任意の箇所(任意の区間)を
再生させることができる。例えばビデオファイルV1に
おける動画データVM2を再生させる場合などは、その
動画データVM2としての区間の開始フレームと終了フ
レームのタイムコードが指定されればよい。
【0217】このようにビデオファイルは、それぞれ1
又は複数の動画や静止画のデータで構成されるが、文書
データ(タグファイル)は、その文書内容に関連するビ
デオデータとして、ビデオファイル名や各動画データ、
静止画データを指定するタグが付されている。つまりタ
グファイルとしては、文書全体、段落、文、句などの任
意の単位で、タグにより関連するビデオデータを指定す
ることができ、文書処理装置1は、そのようなタグ(以
下、ビデオデータを指定するタグを、ビデオタグとい
う)に基づいて、文書データに関連するビデオデータを
判別し、出力することができる。
【0218】ビデオタグが付されたタグファイルの例を
図32、図33に示す。図32は、前述した図18と同
一の内容としてのタグファイルに、ビデオタグが付加さ
れた例である。図18の場合は、文書範囲を規定するタ
グとして<文書>〜</文書>が付されていたが、この
場合、(例11)としての部分に示すように、文書範囲
を示すタグにおいてビデオタグが付加され、<文書 ビ
デオファイル=“V3”><シーン=“VM5” in
=“00:00:00:00” out=“00:0
0:03:12”>・・・・・</シーン></文書>
とされている。このようなタグによって、この文書デー
タの全体に関連するビデオデータが、図31に示したビ
デオファイルV3に含まれる動画データVM5であるこ
とが表されている。また、in=“00:00:00:
00”とout=“00:00:03:12”により、
ビデオファイルV3内における動画データVM5として
のシーンの開始時間(開始フレーム)と終了時間(終了
フレーム)、即ちタイムコードが指定されている。この
ようなタグ構造により、制御部11は、当該タグファイ
ルに関連するビデオデータを判別でき、必要に応じて再
生出力させることができる。
【0219】また図33は、前述した図19と同一の内
容としてのタグファイルに、ビデオタグが付加された例
である。この例は、文書データ内の1つの文ごとに、対
応する1つの静止画データが指定されている例である。
まず、<文書 ビデオファイル=“V2”>・・・・<
/文書>というタグにより、この文書に関連するビデオ
データがビデオファイルV2に含まれていることが示さ
れる。そして各文は、<文>〜</文>というタグで、
その範囲が示されるが、(例12)〜(例16)におい
て示すように、それぞれ各文についてのタグが、 <文 シーン=“VS1”>・・・・</文> <文 シーン=“VS2”>・・・・</文> <文 シーン=“VS3”>・・・・</文> <文 シーン=“VS4”>・・・・</文> <文 シーン=“VS5”>・・・・</文> とされており、つまり、各文のそれぞれに、静止画デー
タVS1、VS2、VS3、VS4、VS5が対応して
いることが示されている。
【0220】なお、ビデオファイルV2において各静止
画データVS1〜VS7がそのデータ名称「VS1」・
・・「VS7」として再生指定できる管理構造がとられ
ていることを前提とすれば、このようなシーンをデータ
名称のみで指定するビデオタグでよいが、静止画データ
についても上記の動画データと同様にビデオタグ内でタ
イムコードにより指定されるようにしてもよい。また逆
に、動画データの再生区間をデータ名称のみで指定でき
る場合は、必ずしも上記のようにタイムコードを指定す
る必要はない。
【0221】この図32、図33のようなタグ構造によ
り、制御部11は、当該タグファイルの各文に関連する
ビデオデータを判別でき、必要に応じて再生出力させる
ことができる。
【0222】上記図32の例は、文書全体に1つの動画
データが対応づけられた例で、図33は文書の各文に、
それぞれ静止画データが対応づけられた例であるが、タ
グファイルによるビデオデータの対応付は、多様なバリ
エーションで可能となる。即ち、<段落>〜</段落
>、<**句>〜</**句>などのタグにビデオタグ
を付加すれば、段落単位や句単位など、任意の単位で或
るビデオデータを対応づけることが可能である。また、
1つのタグファイル内で、複数の動画データを対応付け
したり、静止画データと動画データを複合的に対応付け
することも当然可能である。
【0223】7−2 ビデオ出力処理 以上の例のようなタグファイルによれば、文書処理装置
1はタグファイルに関連づけてビデオデータを出力する
ことができる。以下、ビデオデータに関する各種の出力
処理(ビデオ出力処理、要約出力時のビデオ出力処理、
読み上げ時のビデオ出力処理)を説明していく。まずこ
こでは、図34〜図36を用いて、要約表示や読み上げ
に連動しない通常のビデオ出力処理について述べる。
【0224】なお、動画や静止画としてのビデオデータ
の実際の出力形態(タイミング、表示期間など)は、タ
グファイルの構造や動画/静止画の別、さらには要約表
示処理や読み上げ処理の事情などにより、多様に考えら
れるため、それについては各種のビデオ出力形態として
図41以降を用いてまとめて後述する。
【0225】図35は制御部11によるビデオ出力処理
を示す。この処理は、例えば上述した図26のように閲
覧ウインドウ301が表示されている状態で、ビデオボ
タン306dがクリックされることにより開始される。
もちろん図27のように要約文が作成され、表示された
状態にあるときに、ビデオボタン306dがクリックさ
れた場合でもよい。
【0226】ビデオボタン306dがクリックされるこ
とに応じて、制御部11は、まず図35のステップF6
01として、閲覧ウインドウ301上に表示されている
文書データのタグファイルを確認し、そのタグファイル
が上記図32、図33のようにビデオタグを含むもので
あるか、或いは図18、図19のようにビデオタグが存
在しないものであるかを確認する。
【0227】もしビデオタグが存在しないタグファイル
について、閲覧ウインドウ301が開かれていた状態で
あったときは、表示されている文書データに関連するビ
デオデータは存在しないと判断し、ステップF601か
らビデオ出力処理を終える。つまりその場合は、ビデオ
ボタン306dのクリックは無効な操作となる。
【0228】ところが、閲覧ウインドウ301で表示さ
れている文書データのタグファイルにビデオタグが含ま
れていた場合は、その文書データに関連するビデオデー
タが指定されていることになるため、制御部11は処理
をステップF602に進め、ビデオ出力用ファイルを生
成する。ビデオ出力用ファイルとは、例えば図34
(a)(b)に示すように、タグファイルからビデオタ
グを抽出して生成するファイルである。図34(a)は
図32のタグファイルから生成したビデオ出力用ファイ
ルであり、この場合、上述したビデオタグが抽出され、
図示するようにビデオファイルV3における動画データ
VM5を指定するファイル内容となる。また図34
(b)は図33のタグファイルから生成したビデオ出力
用ファイルであり、この場合、図示するようにビデオフ
ァイルV2における静止画データVS1〜VS5を指定
するファイル内容となる。
【0229】このようなビデオ出力用ファイルは、文書
処理装置1内のビデオエンジンによるビデオ再生動作の
実行のためのファイルとなる。ビデオエンジンは、ハー
ドウェアで構成してもよいし、ソフトウェアで実現する
ようにしてもよい。ビデオエンジンをソフトウェアで実
現する場合には、そのアプリケーションプログラムは、
ROM15やHDD34等に予め記憶されている。ビデ
オエンジンを含む機能構成については図47で後述す
る。
【0230】なお、図34はビデオ出力用ファイルの構
造としての一例であり、実際にビデオ出力用ファイルが
このような構造に限定されるものではない。また、この
図35の処理や後述する図37、図39の処理では、ビ
デオ出力用ファイルに基づいてビデオデータが出力され
るものとしているが、ビデオエンジンが直接タグファイ
ルに基づいてビデオデータの再生を行うようにすること
もできる。
【0231】続いて制御部11はステップF603で、
ビデオエンジンを起動する。また制御部11はステップ
F604で、表示部30に例えば図36に示すようなビ
デオウインドウ501を開く。このビデオウインドウ5
01には、文書データファイルのファイル名を表示する
ファイル名表示部502、そのファイル名の文書データ
に関連するビデオデータを表示するビデオ表示部50
3、ビデオ表示部503で表示されている映像の位置
(動画データの再生進行位置)を示すビデオバー50
4、表示されている映像の開始位置としてのタイムコー
ドを表示する開始位置表示部521、表示されている映
像の現在の再生位置(カレントポジション)としてのタ
イムコードを表示する現在位置表示部522、表示され
ている映像の終了位置としてのタイムコードを表示する
終了位置表示部523などが表示される。さらに、画像
再生動作をユーザーが指示するために、再生ボタン50
5、一時停止ボタン506、停止ボタン507、早戻し
ボタン508、早送りボタン509、戻し方向の頭出し
ボタン510、送り方向の頭出しボタン511などが表
示される。
【0232】このようなビデオウインドウ501を開い
たら、制御部11はステップF605としてユーザーイ
ンターフェースの操作に応じた処理を行うことになる。
例えば図34(a)のようなビデオ出力用ファイルによ
れば、図31に示したビデオファイルV3の動画データ
VM5の再生が指定されたことになるが、ビデオウイン
ドウ501で再生ボタン505がクリックされた場合
は、制御部11はビデオエンジンにより、動画データV
M5の再生を開始させる。これによりビデオ表示部50
3に動画データVM5の動作映像が表示される。なおこ
のとき動画データVM5に含まれるオーディオデータは
音声出力部33から音声として出力されることになる。
【0233】また、一時停止ボタン506がクリックさ
れると、制御部11はビデオエンジンによる動画データ
VM5の再生を一時停止させる。停止ボタン507がク
リックされると、制御部11はビデオエンジンによる動
画データVM5の再生を停止させる。早戻しボタン50
8、又は早送りボタン509がクリックされると、制御
部11はビデオエンジンによる動画データVM5の再生
動作の早戻し又は早送りを実行させる。戻し方向の頭出
しボタン510、又は送り方向の頭出しボタン511が
クリックされると、制御部11はビデオエンジンによる
動画データVM5の再生箇所として、例えば前後のシー
ン(又はポイントとなる特定箇所)の先頭箇所に戻し
(又は送り)、その箇所からの再生を実行させる。さら
に、ユーザーがビデオバー504における現在位置の表
示部分をドラッグした場合は、それに応じて、ビデオエ
ンジンによる動画データVM5の再生箇所の戻し方向又
は進み方向に移動させる。
【0234】ところで、例えば図34(b)のようなビ
デオ出力用ファイルに基づく場合など、表示されるビデ
オデータが静止画データである場合は、一時停止ボタン
506、早戻しボタン508、早送りボタン509操作
は実質的に意味がないため表示されないようにしてもよ
い。そしてその場合は、再生ボタン505のクリックに
より、静止画データの表示が開始され、またタグファイ
ルにより複数の静止画データが指定されていた場合は、
戻し方向の頭出しボタン510、又は送り方向の頭出し
ボタン511のクリックに応じて、静止画データが切り
換えられていくようにすればよい。
【0235】このようなユーザーインターフェース操作
に応じた処理により、ユーザーは、ビデオデータを任意
の状態で視聴できることになる。そして、このように閲
覧ウインドウ301で表示されている文書データに関連
したビデオデータがビデオウインドウ501において表
示されることで、ユーザーは文書内容に関連したビデオ
データを見ることができ、文書内容(情報内容)をより
的確かつ詳細に知ることができる。
【0236】7−3 要約出力時のビデオ出力処理 次に、図37、図38を用いて、要約出力時に行われる
ビデオ出力処理について述べる。上述したように、例え
ば図26のような閲覧ウインドウ301において要約作
成ボタン306aをクリックすると、その時点の要約表
示部304のサイズに応じた文書長の要約文が作成さ
れ、その要約文が要約表示部304に固定的に表示され
る。又は、要約表示部304のサイズが小さい場合は、
要約表示部304のサイズより長い文書長の要約文が作
成され、その要約文が要約表示部304にテロップ化さ
れて表示される(切り換え又は移動表示)。
【0237】ここで、要約文の元となる本文タグファイ
ルにビデオタグが付されていた場合はその全部又は一部
のビデオタグが要約文のタグファイルにも付加されるこ
とで、要約文の表示の際に、ビデオデータを表示させる
ことができる。このようなビデオデータ出力を含む、制
御部11による要約作成/表示の際の全体の処理を図3
7に示す。
【0238】閲覧ウインドウ301において要約作成ボ
タン306aがクリックされると、制御部11は、まず
図37のステップF701として、閲覧ウインドウ30
1上に表示されている文書データのタグファイルを確認
し、そのタグファイルがビデオタグを含むものであるか
否かを確認する。
【0239】もしビデオタグが存在しないタグファイル
について、閲覧ウインドウ301が開かれていた状態で
あったときは、表示されている文書データに関連するビ
デオデータは存在しないと判断し、ステップF701か
らF702、F703に進み、図23で説明した要約作
成処理、及び図24(及び図25)で説明した要約文表
示処理を実行する。即ち、図26〜図30で説明したと
おり、要約文が作成されるとともに、その要約文が固定
表示もしくはテロップ表示により表示される。
【0240】ところがステップF701において、閲覧
ウインドウ301で表示されている文書データのタグフ
ァイルにビデオタグが含まれていると判断された場合
は、その文書データに関連するビデオデータは存在する
ことになるため、制御部11は処理をステップF704
以降に進め、要約作成/表示とともにビデオ出力を行う
処理を開始する。
【0241】まずステップF704で、図23で説明し
た要約作成処理を実行する。このとき上述したように本
文から文や句が抽出されて要約文が作成されることにな
るが、そのとき要約文として生成されるタグファイルに
は、抽出した文、句等の部分にかかるビデオタグも含ま
れることになる。従って、要約文のタグファイルには、
本文タグファイルに含まれるビデオタグの全部又は一部
が含まれることになる。なお、ビデオタグの一部のみが
要約文タグファイルに含まれ、要約文タグファイルに含
まれなくなるビデオタグが存在する場合とは、例えば本
文タグファイル上で、要約文として抽出されなかった
文、句等のみにかかるビデオタグがあった場合である。
例えば図33の本文タグファイルから(例14)の部分
の文(第3番目の文)が要約文として抽出されなかった
場合、その第3番目の文のみにかかるビデオタグ「シー
ン=“VS3”」は要約文タグファイルには含まれない
ことになる。
【0242】続いて制御部11はステップF705で、
要約文としてのタグファイルに基づいて、図34で説明
したようなビデオ出力用ファイルを生成する。続いて制
御部11はステップF706で、ビデオエンジンを起動
する。
【0243】そして制御部11はステップF707で、
図24で説明した処理により要約文の表示(固定表示又
はテロップ表示)を実行するとともに、ビデオエンジン
によるビデオ再生を開始させ、その動画映像又は静止画
映像を表示させる。なおこのときビデオデータに含まれ
るオーディオデータは音声出力部33から音声として出
力される。例えば図38に示すように、閲覧ウインドウ
301上で、要約表示部304に作成した要約文を表示
させるとともに、本文表示部303とされていた領域を
利用してビデオ表示部330を設定して、ビデオエンジ
ンにより出力される画像を表示させる。なおこのとき閲
覧ウインドウ301上には、ビデオ表示部330で表示
されている映像の位置を示すビデオバー331、表示さ
れている映像の開始位置としてのタイムコードを表示す
る開始位置表示部332、表示されている映像の現在の
再生位置(カレントポジション)としてのタイムコード
を表示する現在位置表示部333、表示されている映像
の終了位置としてのタイムコードを表示する終了位置表
示部334なども表示させる。
【0244】このように要約文とともにビデオデータの
表示を開始させた後は、ステップF708で、ビデオデ
ータの再生終了もしくは要約文のテロップ表示の場合の
テロップ完了を監視し、ビデオ終了もしくはテロップ完
了に応じて、ステップF709で本文表示を復帰させ、
例えば図27や図30のようなウインドウ状態に戻し
て、処理を終了する。
【0245】以上のように、タグファイル上で文書に関
連するビデオデータが指定されている場合は、要約表示
の際に、関連するビデオデータがユーザーに提示される
ことになり、これによってユーザーにとって要約内容
(文書内容)がより理解しやすいものとなる。
【0246】7−4 読み上げ時のビデオ出力処理 次に、図39、図40を用いて、読み上げ時に行われる
ビデオ出力処理について述べる。上述したように、例え
ば図26のような閲覧ウインドウ301において読み上
げボタン306cをクリックすると、その閲覧ウインド
ウ301において表示されている本文又は要約文の読み
上げが実行される。このとき、本文又は要約文のタグフ
ァイルにビデオタグが付されていた場合、読み上げ音声
の出力とともに、ビデオデータを表示させることができ
る。このようなビデオデータ出力を含む、制御部11に
よる文書読み上げの際の全体の処理を図39に示す。
【0247】閲覧ウインドウ301において読み上げボ
タン306cがクリックされると、制御部11は、まず
図39のステップF801として、閲覧ウインドウ30
1上に表示されている文書データのタグファイル(本文
タグファイル又は要約文タグファイル)を確認し、その
タグファイルがビデオタグを含むものであるか否かを確
認する。
【0248】もしビデオタグが存在しないタグファイル
について閲覧ウインドウ301が開かれていた状態であ
ったときは、表示されている文書データに関連するビデ
オデータは存在しないと判断し、ステップF801から
F802、F803に進み、図16で説明した読み上げ
用ファイルの生成及び読み上げ用ファイルを用いた処
理、即ち図16のステップF102,F103の処理を
行った後、ステップF803に進んで、ユーザーインタ
ーフェースの操作に応じた読み上げ処理を実行する。即
ち図16のステップF104で説明した処理である。こ
れにより、図22に示した読み上げウインドウ401に
おいて、ユーザーが行う操作に応じて、上述したように
読み上げが行われる。
【0249】一方、ステップF801において、閲覧ウ
インドウ301で表示されている文書データのタグファ
イルにビデオタグが含まれていると判断された場合は、
その文書データに関連するビデオデータは存在すること
になるため、制御部11は処理をステップF804以降
に進め、読み上げとともにビデオ出力を行う処理を開始
する。
【0250】まずステップF804で、図16で説明し
た読み上げ用ファイルの生成及び読み上げ用ファイルを
用いた処理(ステップF102,F103)を行った
後、ステップF805で、図34で説明したようなビデ
オ出力用ファイルを生成する。続いて制御部11はステ
ップF806で、ビデオエンジンを起動する。
【0251】そしてステップF807で制御部11は、
ユーザーインターフェースの操作に応じた読み上げ処理
(図16のステップF104)を実行するが、このと
き、読み上げ処理に連動してビデオエンジンによるビデ
オ再生を実行させる。なお、この場合は、ビデオデータ
に含まれるオーディオデータは出力させないようにする
(音声出力部33からは読み上げ音声が出力されるた
め)。但し、オーディオデータが読み上げ音声とともに
出力されるようにしてもよい。
【0252】このステップF807での表示状態として
は、例えば図40に示すように、読み上げウインドウ4
01上で、ビデオ表示部430を設定して、ビデオエン
ジンにより出力される画像を表示させる。つまり再生ボ
タン420のクリックにより読み上げ音声出力が開始さ
れることに応じて、動画データ又は静止画データとして
の表示出力を実行する。なお図示していないが、このと
き読み上げウインドウ401上で、上記図38のような
ビデオバー、開始位置表示部、現在位置表示部、終了位
置表示部などを表示させるようにしてもよい。
【0253】以上のように、タグファイル上で文書に関
連するビデオデータが指定されている場合は、読み上げ
の際に、関連するビデオデータがユーザーに提示される
ことになり、これによってユーザーにとって読み上げ内
容(文書内容)がより理解しやすいものとなる。
【0254】7−5 各種のビデオ出力形態 以上、本例の文書処理装置1においてビデオデータが出
力される際の処理例を説明したが、実際のビデオデータ
出力時の出力形態としては、タグファイルの構造や動画
/静止画の別、さらには要約表示処理や読み上げ処理の
事情などにより、ビデオ再生期間、再生タイミング、再
生箇所などがそれぞれ多様な状態となる。以下、図41
〜図46でビデオデータの出力形態の各種の例を説明し
ていく。
【0255】図41、図43、図45は、それぞれ本文
タグファイル、本文タグファイルから生成される要約文
タグファイル、及び読み上げ時に作成される本文の読み
上げ用ファイル、要約文の読み上げ用ファイルを、模式
的に示している。即ち、文書処理装置1に供給される本
文タグファイルから、上述した文書処理装置1の処理よ
って要約文タグファイルが生成され、またこれらタグフ
ァイルから読み上げファイルが生成される場合の模式図
である。
【0256】まず図41は、本文タグファイルに、上述
したビデオタグにより、本文全体に関連して動画データ
VM5が指定されている場合を示している。これは本文
タグファイルが例えば図32のようなタグファイルであ
った場合に相当する。このとき、このような本文タグフ
ァイルに基づいて生成される要約文タグファイルにも、
ビデオタグが含まれ、同じく要約文全体について動画デ
ータVM5が指定される状態となる。
【0257】このような状態において実行される、各場
合でのビデオ出力動作を図42に示す。なお、この図4
2及び後述する図44、図46は横方向を時間軸とし
て、ビデオ出力動作を模式的に示すものである。また、
これら各図において、実線矢印は、情報内容が時間的に
進行する情報の出力(即ち動画データ出力、テロップ表
示、読み上げ音声出力)を示し、破線は、固定的な出力
(即ち本文又は要約文の固定表示、静止画データ出力)
を示すこととしている。
【0258】図41に示す本文タグファイル、又は要約
文タグファイルが閲覧ウインドウ301に表示されてい
る状態で、ビデオボタン306dがクリックされること
により実行される、上記図35のビデオ出力処理による
ビデオ出力動作は図42(a)のようになる。この場
合、図36のようなビデオウインドウ501上で、ユー
ザーが再生ボタン505をクリックすることで、例えば
t1時点から動画データVM5の再生(及びオーディオ
データの再生)が行われ、動画データVM5の再生終了
により、例えばt2時点で動画データVM5の再生が終
了される。なお、もちろんこの場合は、ビデオウインド
ウ501上でのユーザーインターフェース操作に応じ
て、ビデオデータ再生の一時停止、早送り、早戻し、頭
出し、再生途中での停止などもあり得る。また、t2時
点で再生が終了した後は、ビデオウインドウ501を閉
じるようにしてもよいが、そのままビデオウインドウ5
01上で再びリピート再生したり、或いは特定の場面を
静止画として継続表示するようにしてもよい。
【0259】図41の本文タグファイルについての要約
文の作成が指示(要約作成ボタン306aのクリック)
された際に、上記図37の処理により要約文表示ととも
に行われるビデオ出力動作は図42(b)又は(c)の
ようになる。
【0260】まず、図42(b)は作成された要約文が
固定表示される場合を示している。この場合、図38の
ような閲覧ウインドウ301上で、例えばt11時点か
ら要約文が固定表示され、その固定表示は以降継続され
る。そしてそれとともに、t11時点からビデオ表示部
330で動画データVM5の再生(及びオーディオデー
タの再生)が行われる。例えばt12時点で動画データ
VM5の再生が終了されたとすると、閲覧ウインドウ3
01上でビデオ表示部330が閉じられて本文表示部3
03に戻され、本文の表示が復帰される。例えばt12
時点以降は、図27のような表示状態となる。
【0261】図42(c)は作成された要約文がテロッ
プ表示される場合を示している。この場合、図38のよ
うにビデオ表示部330が設定された閲覧ウインドウ3
01上における要約表示部304において、図28、図
29で説明したようなテロップ表示がt21時点から開
始される。また、そのテロップ表示がt22時点で完了
されたとすると、t22時点以降は図30に示すように
要約文の一部が固定表示されることになる。ここで閲覧
ウインドウ301におけるビデオ表示部330では、t
21時点から動画データVM5の再生(及びオーディオ
データの再生)が開始される。そしてt22時点でテロ
ップ表示が完了すると、動画データVM5の再生がまだ
終了していなくても、テロップ完了とともに中止終了さ
れ、t22時点以降は図30に示すように本文が固定表
示されている状態に復帰することになる。
【0262】図41に示す本文タグファイル又は要約文
タグファイルについての読み上げ指示(読み上げボタン
306cのクリック)があって図39の処理が実行され
た際のビデオ出力、つまり読み上げウインドウ401が
開かれた状態において、読み上げとともに行われるビデ
オ出力動作は図42(d)又は(e)のようになる。
【0263】まず、図42(d)は本文の読み上げが実
行される場合を示している。例えば図40に示す読み上
げウインドウ401で再生ボタン420がクリックされ
ることで、t31時点から本文の読み上げが開始される
が、それと同時に、ビデオ表示部430において動画デ
ータVM5の再生が開始される(この場合はオーディオ
データの再生出力は行われない)。なお、読み上げ音声
に連動して、読み上げウインドウ401上のテロップ表
示部402で本文のテロップ表示も行われる。ここで、
t32時点で本文の読み上げが完了したとすると、動画
データVM5の再生がまだ終了していなくても、読み上
げ完了とともに中止終了されることになる。
【0264】図42(e)は要約文の読み上げが実行さ
れる場合を示している。例えば読み上げウィンドウ40
1で再生ボタン420のクリックにより、t41時点か
ら要約文の読み上げが開始されると、それと同時に、ビ
デオ表示部430において動画データVM5の再生が開
始される(この場合もオーディオデータの再生出力は行
われない)。また読み上げ音声に連動して、テロップ表
示部402で要約文のテロップ表示も行われる。そして
t42時点で要約文の読み上げが完了したとすると、動
画データVM5の再生は、まだ終了していなくても、読
み上げ完了とともに中止終了される。
【0265】なお、図42(c)(d)(e)の場合に
は動画データが中止終了されるとしたが、中止終了とな
るタイミング以前に動画データの再生が完了していた場
合は、その余った期間は、動画データを再度先頭位置な
どから再生させたり、或いは特定の場面を静止画として
表示させるようにしてもよい。
【0266】次に、図43は、本文タグファイルに、上
述したビデオタグにより、例えばそれぞれの段落や文な
どの単位で、それぞれに関連して複数の動画データVM
1〜VM4が指定されている場合を示している。そして
このような本文タグファイルに基づいて生成される要約
文タグファイルには、動画データVM1、VM4を指定
するビデオタグが含まれたとする。
【0267】このような状態において実行される、各場
合でのビデオ出力動作を図44に示す。図43に示す本
文タグファイルが閲覧ウインドウ301に表示されてい
る状態で、ビデオボタン306dがクリックされること
により実行される、上記図35のビデオ出力処理による
ビデオ出力動作は図44(a)のようになる。
【0268】この場合、図36のようなビデオウインド
ウ501上で、ユーザーが再生ボタン505をクリック
することで、例えばt101時点から動画データVM1
の再生(及びオーディオデータの再生:以下同様)が行
われる。動画データVM1の再生がt102時点で終了
すると、続いて動画データVM2が再生される。さらに
t103時点からは動画データVM3が、またt104
時点からは動画データVM4が、それぞれ順次再生され
る。そして動画データVM4の再生終了に伴って、t1
05時点でビデオデータの再生が終了される。
【0269】なお、もちろんこの場合は、ビデオウイン
ドウ501上でのユーザーインターフェース操作に応じ
て、ビデオデータ再生の一時停止、早送り、早戻し、頭
出し、再生途中での停止などもあり得る。また、t10
2時点で再生が終了した後は、ビデオウインドウ501
を閉じるようにしてもよいが、そのままビデオウインド
ウ501上で再びリピート再生したり、或いは特定の場
面を静止画として継続表示するようにしてもよい。
【0270】図43に示す本文タグファイルについての
要約文の作成が指示(要約作成ボタン306aのクリッ
ク)された際に、図37の処理により要約文表示ととも
に行われるビデオ出力動作は図44(b)又は(c)の
ようになる。
【0271】まず、図44(b)は作成された要約文が
固定表示される場合を示している。この場合、図38の
ような閲覧ウインドウ301上で、例えばt111時点
から要約文が固定表示され、その固定表示は以降継続さ
れる。そしてそれとともに、t111時点からビデオ表
示部330で動画データVM1の再生(オーディオデー
タ再生を含む)が行われる。t112時点で動画データ
VM1の再生が終了すると、続いて動画データVM4の
再生(オーディオデータ再生を含む)が行われる。な
お、図43の例の場合、要約文タグファイルには動画デ
ータVM2、VM3を指定するビデオタグが付されてい
ないため、これらは再生されない。t113時点で動画
データVM4の再生が終了されると、閲覧ウインドウ3
01上でビデオ表示部330が閉じられて本文表示部3
03に戻され、本文の表示が復帰される。例えばt11
3時点以降は、図27のような表示状態となる。
【0272】図44(c)は作成された要約文がテロッ
プ表示される場合を示している。この場合、図38のよ
うにビデオ表示部330が設定された閲覧ウインドウ3
01上における要約表示部304において、図28、図
29で説明したようなテロップ表示がt121時点から
開始される。また、そのテロップ表示がt123時点で
完了されたとすると、t123時点以降は図30に示す
ように要約文の一部が固定表示されることになる。ここ
で閲覧ウインドウ301におけるビデオ表示部330で
は、t121時点から動画データVM1の再生(オーデ
ィオデータ再生を含む)が開始される。その後、t12
2時点で、要約文のテロップが、動画データVM4に対
応する部分に到達したとすると、動画データVM1の再
生はまだ終了していなくても中止され、続いて動画デー
タVM4の再生が開始される。そしてt123時点でテ
ロップ表示が完了すると、動画データVM4の再生は、
まだ終了していなくても中止終了され、t123時点以
降は図30に示すように本文が固定表示されている状態
に復帰することになる。
【0273】図43に示す本文タグファイル又は要約文
タグファイルについての読み上げ指示(読み上げボタン
306cのクリック)があって図39の処理が実行され
た際のビデオ出力、つまり読み上げウインドウ401が
開かれた状態において、読み上げとともに行われるビデ
オ出力動作は図44(d)又は(e)のようになる。
【0274】まず、図44(d)は本文の読み上げが実
行される場合を示している。例えば読み上げウインドウ
401で再生ボタン420がクリックされることで、t
131時点から本文の読み上げが開始されるが、それと
同時に、図40に示したビデオ表示部430において動
画データVM1の再生が開始される(なお、この場合は
オーディオデータの再生出力は行われない:以下同
様)。なお、読み上げ音声に連動して、読み上げウイン
ドウ401上のテロップ表示部402で本文のテロップ
表示も行われる。t132時点で、本文の読み上げが動
画データVM2に対応する部分に到達したとすると、動
画データVM1の再生は中止終了され、続いて動画デー
タVM2の再生が開始される。以降同様に読み上げの進
行に応じて、t133時点で動画データVM2の再生は
中止終了されて動画データVM3の再生が開始され、さ
らにt134時点で動画データVM3の再生が中止終了
されて動画データVM4の再生が開始される。そしてt
135時点で本文の読み上げが完了したとすると、動画
データVM4の再生は中止終了される。即ち読み上げ完
了とともにビデオデータ再生が終了されることになる。
【0275】図44(e)は要約文の読み上げが実行さ
れる場合を示している。例えば再生ボタン420のクリ
ックにより、t141時点から要約文の読み上げが開始
されると、それと同時に、図40に示したビデオ表示部
430において動画データVM1の再生が開始される
(オーディオデータの再生出力は行われない)。また読
み上げ音声に連動して、読み上げウインドウ401上の
テロップ表示部402で要約文のテロップ表示も行われ
る。t142時点で、要約文の読み上げが動画データV
M4に対応する部分に到達したとすると、動画データV
M1の再生は中止終了され、続いて動画データVM4の
再生が開始される。そしてt143時点で要約文の読み
上げが完了したとすると、動画データVM4の再生は中
止終了される。即ち読み上げ完了とともにビデオデータ
再生が終了される。
【0276】なお、図44(c)(d)(e)の各場合
には、各動画データが中止終了されるとしたが、中止終
了となるタイミング以前に動画データの再生が完了して
いた場合は、その余った期間は、動画データを再度先頭
位置などから再生させたり、或いは特定の場面を静止画
として表示させるようにしてもよい。
【0277】次に図45は、本文タグファイルに、上述
したビデオタグにより、例えばそれぞれの段落や文など
の単位でそれぞれに関連する、複数の静止画データVS
1〜VSが指定されている場合を示している。そしてこ
のような本文タグファイルに基づいて生成される要約文
タグファイルには、静止画データVS1、VS3、VS
5を指定するビデオタグが含まれたとする。
【0278】このような状態において実行される、各場
合でのビデオ出力動作を図46に示す。図45に示す本
文タグファイルが閲覧ウインドウ301に表示されてい
る状態で、ビデオボタン306dがクリックされること
により実行される、上記図35のビデオ出力処理による
ビデオ出力動作は図46(a)のようになる。この場
合、図36のようなビデオウインドウ501上で、ユー
ザーが再生ボタン505をクリックすることで、例えば
t201時点から静止画データVS1の再生が行われ
る。この静止画データVS1の再生表示は例えば一定時
間TSだけ行われる。一定時間を経過したt202時点
からは、同様に一定時間TSの間、静止画データVS2
の再生表示が行われる。以降同様に一定時間TSづつ、
静止画データVS3、VS4、VS5が順次再生表示さ
れていく。そしてt206時点で、ビデオデータの再生
が終了される。
【0279】なお、もちろんこの場合は、ビデオウイン
ドウ501上でのユーザーインターフェース操作に応じ
て、静止画の送り/戻し(頭出し操作)や、再生途中で
の停止などもあり得る。また、t202時点で一連の静
止画の再生が終了した後は、ビデオウインドウ501を
閉じるようにしてもよいが、そのままビデオウインドウ
501上で再び各静止画データを順次再生したり、或い
は特定の静止画データを継続表示するようにしてもよ
い。なお、上記のようにTS時間毎に静止画データを切
り換えることはせずに、ユーザーの操作(戻し方向又は
送り方向の頭出しボタン510,511のクリック)に
応じて画像を切り換えていくようにしてもよい。
【0280】図45に示す本文タグファイルについての
要約文の作成が指示(要約作成ボタン306aのクリッ
ク)された際に、図37の処理により要約文表示ととも
に行われるビデオ出力動作は図46(b)又は(c)の
ようになる。
【0281】まず、図46(b)は作成された要約文が
固定表示される場合を示している。この場合、図38の
ような閲覧ウインドウ301上で、例えばt211時点
から要約文が固定表示され、その固定表示は以降継続さ
れる。そしてそれとともに、t211時点からビデオ表
示部330で静止画データVS1の再生が一定時間TS
の間、行われる。TS時間後の時点t212からは、続
いて静止画データVM3の再生表示が行われる。さらに
TS時間後の時点t213からは、続いて静止画データ
VS5の再生表示が行われる。なお、図45の例の場
合、要約文タグファイルには動画データVS2、VS4
を指定するビデオタグが付されていないため、これらは
再生されない。t214時点で各静止画データVS1、
VS3、VS5のTS時間づつの再生が終了されると、
閲覧ウインドウ301上でビデオ表示部330が閉じら
れて本文表示部303に戻され、本文の表示が復帰され
る。例えばt214時点以降は、図27のような表示状
態となる。
【0282】ところで静止画データにオーディオデータ
が付随されている場合もあり得るが、オーディオデータ
が存在する場合は、上記図46(a)(b)の各場合に
おいて各静止画データの表示期間を一定時間TSとはせ
ずに、それぞれ付随するオーディオデータの再生が完了
するまでの期間とするようにしてもよい。
【0283】図46(c)は作成された要約文がテロッ
プ表示される場合を示している。この場合、図38のよ
うにビデオ表示部330が設定された閲覧ウインドウ3
01上における要約表示部304において、図28、図
29で説明したようなテロップ表示がt221時点から
開始される。また、そのテロップ表示がt223時点で
完了されたとすると、t223時点以降は図30に示す
ように要約文の一部が固定表示されることになる。ここ
で閲覧ウインドウ301におけるビデオ表示部330で
は、t221時点から静止画データVS1の再生表示が
開始される。その後、t222時点で、要約文のテロッ
プが、静止画データVS3に対応する部分に到達したと
すると、静止画データVS1の再生は終了され、続いて
静止画データVS3が再生表示される。またt223時
点で、要約文のテロップが、静止画データVS5に対応
する部分に到達したとすると、静止画データVS3の再
生は終了され、静止画データVS5が再生表示される。
そしてt224時点でテロップ表示が完了すると、ビデ
オデータ再生も終了され、t224時点以降は図30に
示すように本文が固定表示されている状態に復帰するこ
とになる。
【0284】図45に示す本文タグファイル又は要約文
タグファイルについての読み上げ指示(読み上げボタン
306cのクリック)があって図39の処理が実行され
た際のビデオ出力、つまり読み上げウインドウ401が
開かれた状態において、読み上げとともに行われるビデ
オ出力動作は図46(d)又は(e)のようになる。
【0285】まず、図46(d)は本文の読み上げが実
行される場合を示している。例えば読み上げウインドウ
401で再生ボタン420がクリックされることで、t
231時点から本文の読み上げが開始されるが、それと
同時に、図40に示したビデオ表示部430において静
止画データVS1の再生が開始される。なお、読み上げ
音声に連動して、読み上げウインドウ401上のテロッ
プ表示部402で本文のテロップ表示も行われる。t2
32時点で、本文の読み上げが静止画データVS2に対
応する部分に到達したとすると、静止画データVS1の
再生は終了され、続いて静止画データVS2の再生表示
が行われる。以降同様に読み上げの進行に応じて、対応
する静止画データVS3、VS4、VS5の表示がそれ
ぞれ行われていく。t236時点で本文の読み上げが完
了したとすると、静止画としてのビデオデータ再生が終
了されることになる。
【0286】図44(e)は要約文の読み上げが実行さ
れる場合を示している。例えば再生ボタン420のクリ
ックにより、t241時点から要約文の読み上げが開始
されると、それと同時に、図40に示したビデオ表示部
430において静止画データVS1の再生が開始され
る。この場合も、読み上げ音声に連動して、読み上げウ
インドウ401上のテロップ表示部402で本文のテロ
ップ表示も行われる。t242時点で、要約文の読み上
げが静止画データVS3に対応する部分に到達すると、
静止画データVS1の再生は終了され、静止画データV
S3の再生表示が行われる。また同様に読み上げの進行
に応じて、例えばt243時点で、静止画データVS5
の再生表示に切り換えられる。t244時点で要約文の
読み上げが完了したとすると、静止画としてのビデオデ
ータ再生が終了されることになる。
【0287】以上、各種のビデオ出力形態を例示した
が、このように、指定されるビデオデータが動画である
か、静止画であるかの別や、ビデオ出力時の動作状況、
即ちビデオボタン306dのクリックにより開始され
る、ビデオ再生を主とする動作状況であるか、或いは要
約や読み上げの補助的なビデオ再生を行う動作状況であ
るかなどにより、多様な出力形態が実行されることにな
る。もちろん例示した以外にも各種のビデオ出力形態が
考えられる。また例えば1つのタグファイルで静止画デ
ータと動画データが複合的に指定された場合なども、上
記各例に準じてビデオ再生が行われるものとなる。さら
にビデオ出力の期間、開始/終了タイミング、テロップ
や読み上げとの同期状態など、多様な観点で、ビデオ出
力形態としての変形例も考えられる。
【0288】8.文書処理装置の機能ブロック構成 以上、文書処理装置1において実現される各種の動作を
説明してきた。本例の文書処理装置1では、これらの処
理を実行するために、例えば制御部11内のソフトウエ
ア構成(もしくはハードウエア構成でもよい)及びファ
イル群構成として、図47のような機能ブロックが形成
されている。
【0289】即ち上述した音声合成エンジン601、テ
ロップ作成エンジン602、要約作成エンジン603、
ビデオエンジン604が設けられる。また音声出力部3
3に対する音声信号の出力処理部として音声制御部60
5や、表示部30に対する画像信号の出力処理部として
表示制御部606が設けられる。さらに、ユーザーイン
ターフェース607として、表示される各種ウインドウ
上でのボタンについてのユーザー操作(入力部20とし
てのマウスのクリック等による操作)についての処理を
行う部位が設けられる。そして、これらの機能ブロック
の制御を行うコントローラ600が形成される。
【0290】またファイルとしては、上述してきた読み
上げ用ファイル608、本文タグファイル609、要約
文タグファイル610、ビデオファイル611、ビデオ
出力用ファイル612がある。上述したように、本文タ
グファイル609及びビデオファイル611は、通信部
21もしくは記録/再生部31(記録媒体32)から取
り込まれるものとなる。また、要約文タグファイル61
0は、要約作成エンジン603によって本文タグファイ
ル609から生成される。読み上げ用ファイル608
は、本文タグファイル609もしくは要約文タグファイ
ル610が変換されて生成される。ビデオ出力用ファイ
ル612は、本文タグファイル609もしくは要約文タ
グファイル610から変換されて(具体的にはビデオタ
グが抽出されて)生成される。
【0291】上述してきた各動作を実現するための図4
7の機能ブロックの処理を、以下説明していく。
【0292】・読み上げ処理 図16〜図22で説明した読み上げ処理の際には、まず
本文タグファイル609もしくは要約文タグファイル6
10から読み上げ用ファイル608が生成される。そし
て音声合成エンジン601はコントローラ600の指示
に基づいて読み上げ用ファイル608を参照し、読み上
げ用ファイル608に基づいた音声合成処理を行う。生
成された合成音声信号(読み上げ音声信号)Youtは
音声制御部605において出力レベル調整等が行われ、
音声出力部33に供給されて出力される。またコントロ
ーラは表示制御部606から読み上げウインドウ401
としての画像信号を出力させ、表示部30に表示させ
る。また読み上げウインドウ401に対するユーザー操
作の情報はユーザーインターフェース607で取り込ま
れてコントローラ600に伝えられ、コントローラ60
0は、ユーザー操作に応じて音声合成エンジン601の
動作を制御する。
【0293】・要約作成処理 図23で説明した要約作成処理の際には、コントローラ
600は要約作成エンジン603に指示を出し、本文タ
グファイル609について要約作成を実行させる。これ
により要約文タグファイルが形成される。なおコントロ
ーラ600は、要約作成エンジン603に対して、要約
表示部304のサイズ情報を伝えることで、上述のよう
に要約表示部304のサイズに応じた要約生成処理が行
われる。
【0294】・要約固定表示処理 図23、図24、図27で説明したように、要約表示部
304のサイズが所定値wsth以上であった場合は、
そのサイズに応じた文書長の要約文タグファイル610
が生成され、それが固定表示されることになる。この場
合、生成された要約文タグファイル610は、要約作成
エンジン603によって表示文書出力Soutとして処
理され、表示制御部606に供給される。そして表示制
御部606で、閲覧ウインドウ300の画像に合成さ
れ、表示部30で図27のように表示される。
【0295】・要約文/本文のテロップ表示処理 図23〜図30で説明したように、要約表示部304の
サイズが所定値wsth未満であった場合は、そのサイ
ズを越える文書長の要約文タグファイル610が生成さ
れ、それがテロップ表示されることになる。この場合、
生成された要約文タグファイル610は、テロップ作成
エンジン602によってテロップ化処理が行われる。そ
してテロップ表示文書出力Toutとして逐次出力され
ていく。表示制御部606では、テロップ表示文書出力
Toutを閲覧ウインドウ300の画像に合成し、表示
部30で図28〜図30のような表示が実行されていく
ようにする。
【0296】・読み上げタイミングでのテロップ表示処
理 テロップ表示の変形例として、テロップの進行タイミン
グを読み上げ音声タイミングに合わせることができるこ
とを述べた。その場合、要約文タグファイル610から
変換された読み上げ用ファイル608が、音声合成エン
ジン601とテロップ作成エンジン602の共有ファイ
ルとして用いられる。(図中破線で示す信号系が形成さ
れる。)コントローラ600の制御に基づいて、音声合
成エンジン601は読み上げ用ファイル608を用いた
音声合成/読み上げ出力を行う。但しこの場合、音声制
御部605は生成された合成音声信号Youtについて
出力レベルをゼロとすることで、ユーザーに対して読み
上げ音声が出力されないようにする。テロップ作成エン
ジン602は、読み上げ用ファイル608を用いてテロ
ップ作成を行うが、この際、テロップ作成エンジン60
2と音声合成エンジン601は相互にタイミング信号の
授受を行う。つまり、テロップ作成エンジン602は、
読み上げ用ファイル608からのタイミング信号に基づ
いてテロップ作成/テロップ表示文書出力Toutを実
行していく。これにより読み上げ速度によるテロップ表
示が実行される。なお、読み上げ速度(つまりこの場合
はテロップ速度)については、ユーザーインターフェー
ス607からの情報に基づいてコントローラ600が音
声合成エンジン601での設定を変更することで、変更
可能となる。
【0297】・ビデオ出力処理 図35、図36で説明したビデオ出力処理は、ユーザー
インターフェース607からの情報に基づくコンピュー
タ600の指示によって、ビデオエンジン604の処理
で行われる。ビデオエンジン604は、本文タグファイ
ル609もしくは要約文タグファイル610から生成さ
れたビデオ出力用ファイル612を参照し、再生すべき
ビデオデータを判別して、ビデオファイル611を読み
出す。読み出されたビデオデータは、ビデオエンジン6
04によって出力用の映像信号Voutとして処理さ
れ、表示制御部606に供給される。そして表示制御部
606で、ビデオウインドウ501の画像に合成され、
表示部30で図36のように表示される。時間軸上で見
れば図42(a)、図44(a)、図46(a)のよう
な出力が行われる。またビデオデータに含まれるオーデ
ィオデータについても、ビデオエンジン604によって
出力用の音声信号Aoutとして処理され、音声制御部
605に供給されてレベル調整等の処理が行われる。そ
して音声出力部33から再生音声として出力される。ビ
デオ出力中には、ビデオウインドウ501に対するユー
ザー操作の情報はユーザーインターフェース607で取
り込まれてコントローラ600に伝えられ、コントロー
ラ600は、ユーザー操作に応じてビデオエンジン60
1の動作を制御する。
【0298】・要約作成時のビデオ出力 図37、図38で説明した要約作成時のビデオ出力処理
は、コンピュータ600の指示に基づいて、ビデオエン
ジン604及び要約作成エンジン603の処理により行
われる。また、要約文がテロップ表示される場合は、ビ
デオエンジン604によるビデオ出力は、テロップ作成
エンジン602からのテロップ出力タイミングに連動し
て行われる。まず要約文が固定表示される場合は、上記
の要約固定表示処理とともに、ビデオエンジン604が
要約文タグファイル610から生成されたビデオ出力用
ファイル612を参照し、再生すべきビデオデータを判
別して、ビデオファイル611を読み出す。そしてビデ
オエンジン604は出力用の映像信号Voutを表示制
御部606に供給し、また出力用の音声信号Aoutを
音声制御部605に供給する。表示制御部606では、
閲覧ウインドウ301の画像に出力用の映像信号Vou
tを合成し、表示部30で図38のような表示を実行さ
れる。時間軸上で見れば図42(b)、図44(b)、
図46(b)のような出力が行われる。また音声制御部
605は、音声出力部33からの再生音声出力を実行さ
せる。要約文がテロップ表示される場合は、上記の要約
のテロップ表示処理とともに、ビデオエンジン604が
要約文タグファイル610から生成されたビデオ出力用
ファイル612を参照し、再生すべきビデオデータを判
別して、ビデオファイル611を読み出す。そしてビデ
オエンジン604は出力用の映像信号Voutを表示制
御部606に供給し、また出力用の音声信号Aoutを
音声制御部605に供給することで、同様に表示部30
で図38のような表示を実行させ、また音声出力部33
からの再生音声出力を実行させる。但しこの場合、ビデ
オエンジン604はコントローラ600を介して(又は
直接)テロップ作成エンジン602のタイミング情報を
受け取り、テロップの進行に合わせて出力するビデオデ
ータの切り換えを行っていく。これにより時間軸上で図
42(c)、図44(c)、図46(c)で説明したよ
うな出力が行われる。
【0299】・読み上げ時のビデオ出力 図39、図40で説明した読み上げ時のビデオ出力処理
は、コンピュータ600の指示に基づいて、ビデオエン
ジン604及び音声合成エンジン601の処理により行
われる。この場合ビデオエンジン604によるビデオ出
力は、音声合成エンジン601からの読み上げ音声出力
タイミングに連動して行われる。即ち上記の読み上げ処
理とともに、ビデオエンジン604が本文タグファイル
609又は要約文タグファイル610から生成されたビ
デオ出力用ファイル612を参照し、再生すべきビデオ
データを判別して、ビデオファイル611を読み出す。
そしてビデオエンジン604は出力用の映像信号Vou
tを表示制御部606に供給する。なお、この場合出力
用の音声信号Aoutは音声制御部605には供給しな
い。表示制御部606では、読み上げウインドウ401
の画像に出力用の映像信号Voutを合成し、表示部3
0で図40のような表示を実行される。但しこの場合、
ビデオエンジン604はコントローラ600を介して
(又は直接)音声合成エンジン601のタイミング情報
を受け取り、読み上げの進行に合わせて出力するビデオ
データの切り換えを行っていく。これにより時間軸上で
図42(d)(e)、図44(d)(e)、図46
(d)(e)で説明したような出力が行われる。また音
声制御部605では合成音声信号(読み上げ音声信号)
Youtについて出力レベル調整等を行ない、音声出力
部33から読み上げ音声を出力させる。また読み上げウ
インドウ401に対するユーザー操作の情報はユーザー
インターフェース607で取り込まれてコントローラ6
00に伝えられ、コントローラ600は、ユーザー操作
に応じて音声合成エンジン601の動作を制御する。こ
れに伴ってビデオエンジン604の動作も制御される。
【0300】以上、図47の機能ブロックについて説明
したが、機能ブロック構成や動作形態はこれに限られる
ものではない。また図47は、ここで説明した表示部3
0又は音声出力部33からの出力動作に関連する部位の
みを示したものであり、例えば文書受信処理、分類処理
などを実現する機能ブロックについては省略した。
【0301】以上本発明の実施の形態について説明して
きたが、これはあくまで一例であり、文書処理装置1の
ハードウエアもしくはソフトウエア構成、及び処理例は
多様に考えられる。また文書処理装置1を構成する具体
的なデバイス例は多様であり、例えば文書処理装置1に
おける入力部20を例に挙げれば、キーボードやマウス
だけでなく、タブレット、ライトペン、赤外線等を利用
した無線コマンダ装置等の他のデバイスが考えられる。
【0302】また実施の形態においては、通信部22に
外部から電話回線等を介して文書やビデオファイルが送
信されてくるものとして説明したが、本発明は、これに
限定されるものではない。例えば、衛星等を介して文書
やビデオファイルが送信される場合にも適用できる他、
記録/再生部31において記録媒体32から読み出され
たり、ROM15に予め文書やビデオファイルが書き込
まれていてもよい。
【0303】また実施の形態において、文書へのタグ付
けの方法の一例を示したが、本発明がこのタグ付けの方
法に限定されないことはもちろんである。さらに、上述
の実施の形態においては、日本語および英語の文章を例
示したが、本発明がこれらの言語に限られないことはい
うまでもない。このように、本発明は、その趣旨を逸脱
しない範囲で適宜変更が可能であることはいうまでもな
い。
【0304】さらにまた、本発明においては、記録媒体
32として、上述した電子文書処理プログラムが書き込
まれたディスク状記録媒体やテープ状記録媒体等を提供
することが容易に実現できる。即ち本発明の記録媒体が
実現できる。なお、図1に示したHDD34としても同
様に本発明の記録媒体とすることができる。そしてその
ような記録媒体32によれば、上記してきた文書処理方
法を実現するプログラムを提供できることになり、例え
ば汎用のパーソナルコンピュータ等を用いて、本発明の
文書処理装置を容易に実現できる。もちろん記録媒体3
2としては、フロッピーディスクの他に、光ディスク、
光磁気ディスク、磁気テープ、フラッシュメモリ等によ
るメモリカード、メモリチップ等としてもよい。さらに
本発明の文書処理方法を実現するプログラムは、例えば
インターネット等のネットワーク通信を介しても提供す
ることができるものであり、従って、プログラムサーバ
側もしくは通信過程における記録媒体としても本発明は
適用できるものである。
【0305】また記録媒体としては、上記処理を実現す
る動作制御プログラムとともに、そのプログラムの処理
対象となる文書データやビデオデータをも記録している
ものも有用となる。つまり、文書処理装置1に対して、
記録媒体から電子文書データを提供するときに、同時に
動作制御プログラムやビデオファイルをも提供すること
で、その文書処理装置において、上記のような文書デー
タに対応したビデオ出力処理を実行できるものとなる。
【0306】
【発明の効果】以上の説明からわかるように本発明で
は、次のような効果が得られる。即ち本発明の文書処理
装置及び文書処理方法によれば、各電子文書データにお
いてビデオデータ指定情報(ビデオタグ)が付されてい
ることに応じて、その電子文書データに関連するビデオ
データを判別し、電子文書データに対応して、電子文書
データの出力と同時又は個別に、その関連するビデオデ
ータを出力することができる。従って、文書の提示だけ
でなく、その文書内容と関連する映像をユーザーに提示
でき、ユーザーに対して的確で、かつ多様、高度な情報
を提供できるという効果がある。ビデオデータとして
は、提供できる情報量の多い動画や、イメージを的確に
伝えることのできる静止画を、それぞれ適切に用いるこ
とで、ユーザーに対する適切な情報提示が可能となる。
【0307】また本文としての電子文書データから作成
された要約文を出力する際に、それに関連するビデオデ
ータを出力するようにすれば、要約文と映像の両方によ
り、ユーザーにとって文書内容をわかりやすく提供でき
る。
【0308】さらに、本文又は要約文などの電子文書デ
ータの読み上げとともに、それに関連するビデオデータ
を出力するようにすれば、読み上げ音声と映像の両方に
より、ユーザーにとって文書内容をわかりやすく提供で
きる。
【0309】また、本文又は要約文などの電子文書デー
タを部分毎の切り換えもしくは移動による表示、即ちテ
ロップ表示を行う場合や、或いは本文又は要約文などの
電子文書データの読み上げを行う場合は、そのテロップ
表示や読み上げの進行に時間的に対応してビデオデータ
を切り換えていくようにすることで、テロップ表示や読
み上げ音声と、ビデオデータを適切にリンクさせてユー
ザーに提示でき、ユーザーにとって好適な情報提供を実
現できる。
【0310】さらに本発明の記録媒体によれば、本発明
の文書処理方法を実現するプログラムを提供できること
になり、例えば汎用のパーソナルコンピュータ等を用い
て、本発明の文書処理装置を容易に実現できるようにな
る。これにより、一般ユーザーは容易に上記効果を享受
できるものとなる。
【図面の簡単な説明】
【図1】本発明の実施の形態の文書処理装置のブロック
図である。
【図2】実施の形態で用いる文書構造の説明図である。
【図3】実施の形態の文章構造を表示するウインドウの
説明図である。
【図4】実施の形態の手動分類処理のフローチャートで
ある。
【図5】実施の形態のインデックス作成処理のフローチ
ャートである。
【図6】実施の形態のエレメントの活性値の説明図であ
る。
【図7】実施の形態の活性拡散処理のフローチャートで
ある。
【図8】実施の形態の中心活性値更新処理のフローチャ
ートである。
【図9】実施の形態の分類ウインドウの説明図である。
【図10】実施の形態の閲覧ウインドウの説明図であ
る。
【図11】実施の形態の分類モデルの説明図である。
【図12】実施の形態の自動分類処理のフローチャート
である。
【図13】実施の形態の自動分類のフローチャートであ
る。
【図14】実施の形態の語義間関連度算出処理のフロー
チャートである。
【図15】実施の形態の語義間関連度の説明図である。
【図16】実施の形態の文書読み上げ処理のフローチャ
ートである。
【図17】実施の形態の読み上げ用ファイル生成処理の
フローチャートである。
【図18】実施の形態のタグファイル例の説明図であ
る。
【図19】実施の形態のタグファイル例の説明図であ
る。
【図20】実施の形態の読み上げ用ファイル例の説明図
である。
【図21】実施の形態の読み上げ用ファイル例の説明図
である。
【図22】実施の形態の読み上げウインドウの説明図で
ある。
【図23】実施の形態の要約作成処理のフローチャート
である。
【図24】実施の形態の要約文表示処理のフローチャー
トである。
【図25】実施の形態のテロップ表示処理のフローチャ
ートである。
【図26】実施の形態の閲覧ウインドウの表示例の説明
図である。
【図27】実施の形態の閲覧ウインドウの要約文を含む
表示例の説明図である。
【図28】実施の形態の閲覧ウインドウでのテロップ表
示例の説明図である。
【図29】実施の形態のテロップ表示動作の説明図であ
る。
【図30】実施の形態の閲覧ウインドウでのテロップ表
示後の表示例の説明図である。
【図31】実施の形態のタグファイル及びビデオファイ
ルの説明図である。
【図32】実施の形態のビデオタグ付のタグファイルの
説明図である。
【図33】実施の形態のビデオタグ付のタグファイルの
説明図である。
【図34】実施の形態のビデオ出力用ファイルの説明図
である。
【図35】実施の形態のビデオ出力処理のフローチャー
トである。
【図36】実施の形態のビデオ出力処理によるビデオウ
インドウの説明図である。
【図37】実施の形態の要約出力処理のフローチャート
である。
【図38】実施の形態の要約出力時のビデオ出力の説明
図である。
【図39】実施の形態の文書読み上げ処理のフローチャ
ートである。
【図40】実施の形態の文書読み上げ時のビデオ出力の
説明図である。
【図41】実施の形態のビデオタグ付加例の説明図であ
る。
【図42】実施の形態のビデオ出力形態の説明図であ
る。
【図43】実施の形態のビデオタグ付加例の説明図であ
る。
【図44】実施の形態のビデオ出力形態の説明図であ
る。
【図45】実施の形態のビデオタグ付加例の説明図であ
る。
【図46】実施の形態のビデオ出力形態の説明図であ
る。
【図47】実施の形態の文書処理装置の機能ブロックの
説明図である。
【符号の説明】
1 文書処理装置、10 本体、11 制御部、12
インターフェース、13 CPU、14 RAM、15
ROM、20 入力部、21 通信部、22携帯端末
リーダ、30 表示部、31 記録再生部、32 記録
媒体、33音声出力部、34 HDD、101 ウイン
ドウ、201 分類ウインドウ、301 閲覧ウインド
ウ、303 文書表示部、304 要約表示部、401
読み上げウインドウ、501 ビデオウインドウ、6
00 コントローラ、601音声合成エンジン、602
テロップ作成エンジン、603 要約作成エンジン、
604 ビデオエンジン、605 音声制御部、606
表示制御部、607 ユーザーインターフェース
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 5/765 G06F 15/40 370D 5E501 15/401 320A 9A001 G10L 3/00 E H04N 5/91 L Fターム(参考) 5B009 RD00 SA03 SA14 5B075 ND06 ND12 NS01 PQ02 5B089 GB01 GB03 JA33 JB01 JB03 JB06 JB22 JB24 KA02 KA04 KC23 KC59 KH15 LB13 LB14 LB20 5C053 FA06 FA23 GB10 HA24 JA01 JA16 JA21 JA22 JA30 KA01 KA08 LA06 LA14 5D045 AA01 AA08 5E501 AA13 AB13 AB15 AB18 AC15 BA03 CA08 EB05 FA32 FB32 FB34 9A001 HH15 HH33 JZ25

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 電子文書データに付加された1又は複数
    のビデオデータ指定情報を検出し、1又は複数の特定の
    ビデオデータを選択するビデオ選択手段と、 1又は複数の電子文書データのうちの或る電子文書デー
    タを提示するために出力制御する文書出力制御手段と、 前記文書出力制御手段の制御により出力された電子文書
    データに対応して、前記ビデオ選択手段で選択されたビ
    デオデータを出力制御するビデオ出力制御手段と、 を備えたことを特徴とする文書処理装置。
  2. 【請求項2】 前記文書出力制御手段により出力制御さ
    れる電子文書データ、及び前記ビデオ出力制御手段によ
    り出力制御されるビデオデータを、同時もしくは個別に
    表示する表示手段を備えることを特徴とする請求項1に
    記載の文書処理装置。
  3. 【請求項3】 文書本文としての電子文書データから、
    その要約文としての電子文書データを作成することので
    きる要約作成手段を備え、 前記ビデオ出力制御手段は、前記文書出力制御手段が前
    記要約作成手段により作成された要約文を出力制御する
    際に、前記ビデオ選択手段で選択されたビデオデータが
    出力されるように制御することを特徴とする請求項1に
    記載の文書処理装置。
  4. 【請求項4】 前記ビデオ選択手段は、前記要約作成手
    段により作成された要約文に関連する1又は複数のビデ
    オデータを選択することを特徴とする請求項3に記載の
    文書処理装置。
  5. 【請求項5】 前記文書出力制御手段は、電子文書デー
    タが部分毎の切換表示もしくは移動表示されるように、
    電子文書データを出力制御するとともに、 前記ビデオ出力制御手段は、前記文書出力制御手段の制
    御による電子文書データ出力の進行に対応したタイミン
    グで、出力するビデオデータを切り換えるように制御す
    ることを特徴とする請求項1に記載の文書処理装置。
  6. 【請求項6】 電子文書データが読み上げ音声として出
    力されるように制御する音声出力制御手段を備え、 前記ビデオ出力制御手段は、前記音声出力制御手段の制
    御により電子文書データが読み上げ音声として出力され
    る際に、前記ビデオ選択手段で選択されたビデオデータ
    が出力されるように制御することを特徴とする請求項1
    に記載の文書処理装置。
  7. 【請求項7】 前記ビデオ出力制御手段は、前記音声出
    力制御手段の制御による読み上げ音声出力の進行に対応
    したタイミングで、出力するビデオデータを切り換える
    ように制御することを特徴とする請求項6に記載の文書
    処理装置。
  8. 【請求項8】 前記ビデオデータは動画データであるこ
    とを特徴とする請求項1に記載の文書処理装置。
  9. 【請求項9】 前記ビデオデータは静止画データである
    ことを特徴とする請求項1に記載の文書処理装置。
  10. 【請求項10】 電子文書データに付加された1又は複
    数のビデオデータ指定情報を検出し、1又は複数の特定
    のビデオデータを選択するビデオ選択手順と、 1又は複数の電子文書データのうちの或る電子文書デー
    タを提示するために出力制御する文書出力制御手順と、 前記文書出力制御手順での制御により出力された電子文
    書データに対応して、前記ビデオ選択手順で選択された
    ビデオデータを出力制御するビデオ出力制御手順と、 が行われることを特徴とする文書処理方法。
  11. 【請求項11】 文書本文としての電子文書データか
    ら、その要約文としての電子文書データを作成すること
    のできる要約作成手順を有し、 前記ビデオ出力制御手順では、前記要約作成手順で作成
    された要約文が前記文書出力制御手順での制御により出
    力される際に、前記ビデオ選択手順で選択されたビデオ
    データが出力されるように制御することを特徴とする請
    求項10に記載の文書処理方法。
  12. 【請求項12】 前記ビデオ選択手順では、前記要約作
    成手順により作成された要約文に関連する1又は複数の
    ビデオデータを選択することを特徴とする請求項11に
    記載の文書処理方法。
  13. 【請求項13】 前記文書出力制御手順では、電子文書
    データが部分毎の切換表示もしくは移動表示されるよう
    に、電子文書データを出力制御するとともに、 前記ビデオ出力制御手順では、前記文書出力制御手順で
    の制御による電子文書データ出力の進行に対応したタイ
    ミングで、出力するビデオデータを切り換えるように制
    御することを特徴とする請求項10に記載の文書処理方
    法。
  14. 【請求項14】 電子文書データが読み上げ音声として
    出力されるように制御する音声出力制御手順を有し、 前記ビデオ出力制御手順では、前記音声出力制御手順で
    の制御により電子文書データが読み上げ音声として出力
    される際に、前記ビデオ選択手順で選択されたビデオデ
    ータが出力されるように制御することを特徴とする請求
    項10に記載の文書処理方法。
  15. 【請求項15】 前記ビデオ出力制御手順では、前記音
    声出力制御手順の制御による読み上げ音声出力の進行に
    対応したタイミングで、出力するビデオデータを切り換
    えるように制御することを特徴とする請求項14に記載
    の文書処理方法。
  16. 【請求項16】 電子文書データに付加された1又は複
    数のビデオデータ指定情報を検出し、1又は複数の特定
    のビデオデータを選択するビデオ選択手順と、 1又は複数の電子文書データのうちの或る電子文書デー
    タを提示するために出力制御する文書出力制御手順と、 前記文書出力制御手順での制御により出力された電子文
    書データに対応して、前記ビデオ選択手順で選択された
    ビデオデータを出力制御するビデオ出力制御手順と、 を有する動作制御プログラムが記録されていることを特
    徴とする記録媒体。
  17. 【請求項17】 文書本文としての電子文書データか
    ら、その要約文としての電子文書データを作成すること
    のできる要約作成手順を有し、 前記ビデオ出力制御手順では、前記要約作成手順で作成
    された要約文が前記文書出力制御手順での制御により出
    力される際に、前記ビデオ選択手順で選択されたビデオ
    データが出力されるように制御する動作制御プログラム
    が記録されていることを特徴とする請求項16に記載の
    記録媒体。
  18. 【請求項18】 前記ビデオ選択手順では、前記要約作
    成手順により作成された要約文に関連する1又は複数の
    ビデオデータを選択することを特徴とする請求項17に
    記載の記録媒体。
  19. 【請求項19】 前記文書出力制御手順では、電子文書
    データが部分毎の切換表示もしくは移動表示されるよう
    に、電子文書データを出力制御するとともに、 前記ビデオ出力制御手順では、前記文書出力制御手順で
    の制御による電子文書データ出力の進行に対応したタイ
    ミングで、出力するビデオデータを切り換えるように制
    御する動作制御プログラムが記録されていることを特徴
    とする請求項16に記載の記録媒体。
  20. 【請求項20】 電子文書データが読み上げ音声として
    出力されるように制御する音声出力制御手順を有し、 前記ビデオ出力制御手順では、前記音声出力制御手順で
    の制御により電子文書データが読み上げ音声として出力
    される際に、前記ビデオ選択手順で選択されたビデオデ
    ータが出力されるように制御する動作制御プログラムが
    記録されていることを特徴とする請求項16に記載の記
    録媒体。
  21. 【請求項21】 前記ビデオ出力制御手順では、前記音
    声出力制御手順の制御による読み上げ音声出力の進行に
    対応したタイミングで、出力するビデオデータを切り換
    えるように制御する動作制御プログラムが記録されてい
    ることを特徴とする請求項20に記載の記録媒体。
JP21865299A 1999-08-02 1999-08-02 文書処理装置、文書処理方法、及び記録媒体 Pending JP2001043215A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP21865299A JP2001043215A (ja) 1999-08-02 1999-08-02 文書処理装置、文書処理方法、及び記録媒体
US09/624,580 US7610546B1 (en) 1999-08-02 2000-07-24 Document processing apparatus having capability of controlling video data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21865299A JP2001043215A (ja) 1999-08-02 1999-08-02 文書処理装置、文書処理方法、及び記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008043222A Division JP4798150B2 (ja) 2008-02-25 2008-02-25 文書処理装置、文書処理方法、及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001043215A true JP2001043215A (ja) 2001-02-16
JP2001043215A5 JP2001043215A5 (ja) 2006-06-22

Family

ID=16723312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21865299A Pending JP2001043215A (ja) 1999-08-02 1999-08-02 文書処理装置、文書処理方法、及び記録媒体

Country Status (2)

Country Link
US (1) US7610546B1 (ja)
JP (1) JP2001043215A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002312370A (ja) * 2001-04-11 2002-10-25 J-Fit Co Ltd マルチメディアデータ検索装置、マルチメディアデータ検索方法およびマルチメディアデータ検索プログラム
WO2004003756A1 (ja) * 2002-06-26 2004-01-08 Sony Corporation コンテンツ関連情報提供装置及びコンテンツ関連情報提供方法、電子掲示板システム、並びにコンピュータ・プログラム
US7215510B2 (en) 2002-03-28 2007-05-08 Sony Corporation Magnetic head and magnetic recording/reproducing apparatus for a video tape recorder, and a method of manufacturing the same
CN100417214C (zh) * 2002-05-23 2008-09-03 索尼株式会社 内容记录和再现设备、方法
CN102074235A (zh) * 2010-12-20 2011-05-25 上海华勤通讯技术有限公司 视频语音识别并检索的方法
JP2015125681A (ja) * 2013-12-27 2015-07-06 パイオニア株式会社 情報提供装置
WO2016009834A1 (ja) * 2014-07-14 2016-01-21 ソニー株式会社 送信装置、送信方法、受信装置、及び、受信方法
JP2019050009A (ja) * 2018-11-05 2019-03-28 パイオニア株式会社 情報提供装置
JP2020144890A (ja) * 2020-04-27 2020-09-10 パイオニア株式会社 情報提供装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101364970B (zh) * 2007-08-09 2012-06-20 鸿富锦精密工业(深圳)有限公司 网页资料下载控制***及方法
US20090138296A1 (en) 2007-11-27 2009-05-28 Ebay Inc. Context-based realtime advertising
JP5010492B2 (ja) * 2008-01-31 2012-08-29 株式会社東芝 通信装置、方法及びプログラム
TWI407790B (zh) * 2010-01-08 2013-09-01 Chunghwa Telecom Co Ltd 影音互動系統及其方法
CN102685584A (zh) * 2011-03-16 2012-09-19 鸿富锦精密工业(深圳)有限公司 机顶盒、耳机及影音播放方法
US9098533B2 (en) * 2011-10-03 2015-08-04 Microsoft Technology Licensing, Llc Voice directed context sensitive visual search
USD674403S1 (en) * 2011-10-26 2013-01-15 Mcafee, Inc. Computer having graphical user interface
USD673967S1 (en) 2011-10-26 2013-01-08 Mcafee, Inc. Computer having graphical user interface
USD674404S1 (en) 2011-10-26 2013-01-15 Mcafee, Inc. Computer having graphical user interface
USD677687S1 (en) 2011-10-27 2013-03-12 Mcafee, Inc. Computer display screen with graphical user interface
TWI482494B (zh) * 2012-07-09 2015-04-21 Wistron Corp 頻道資訊提示方法及系統以及電腦可讀取儲存媒體
US20170024097A1 (en) * 2012-09-13 2017-01-26 Bravo Ideas Digital Co., Ltd. Method and Host Server for Creating a Composite Media File
US8837906B2 (en) 2012-12-14 2014-09-16 Motorola Solutions, Inc. Computer assisted dispatch incident report video search and tagging systems and methods
US9229674B2 (en) 2014-01-31 2016-01-05 Ebay Inc. 3D printing: marketplace with federated access to printers
US9595037B2 (en) 2014-12-16 2017-03-14 Ebay Inc. Digital rights and integrity management in three-dimensional (3D) printing
JP6165913B1 (ja) * 2016-03-24 2017-07-19 株式会社東芝 情報処理装置、情報処理方法およびプログラム
US10083369B2 (en) 2016-07-01 2018-09-25 Ricoh Company, Ltd. Active view planning by deep learning
US11423073B2 (en) * 2018-11-16 2022-08-23 Microsoft Technology Licensing, Llc System and management of semantic indicators during document presentations

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59197926A (ja) 1983-04-26 1984-11-09 Toshiba Corp 動的文書表示装置
US4864502A (en) 1987-10-07 1989-09-05 Houghton Mifflin Company Sentence analyzer
JPH022598A (ja) 1988-06-14 1990-01-08 Nec Corp データ編集方法とその装置
JP2783558B2 (ja) 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
US5185698A (en) 1989-02-24 1993-02-09 International Business Machines Corporation Technique for contracting element marks in a structured document
EP0542628B1 (en) * 1991-11-12 2001-10-10 Fujitsu Limited Speech synthesis system
US5598557A (en) * 1992-09-22 1997-01-28 Caere Corporation Apparatus and method for retrieving and grouping images representing text files based on the relevance of key words extracted from a selected file to the text files
CA2159468C (en) * 1993-03-31 2002-09-10 Object Technology Licensing Corporation Time-based script sequences
US5384703A (en) 1993-07-02 1995-01-24 Xerox Corporation Method and apparatus for summarizing documents according to theme
US5689641A (en) * 1993-10-01 1997-11-18 Vicor, Inc. Multimedia collaboration system arrangement for routing compressed AV signal through a participant site without decompressing the AV signal
US5546520A (en) * 1994-09-30 1996-08-13 International Business Machines Corporation Method, system, and memory for reshaping the frame edges of a window around information displayed in the window
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
US5675710A (en) 1995-06-07 1997-10-07 Lucent Technologies, Inc. Method and apparatus for training a text classifier
US5572643A (en) * 1995-10-19 1996-11-05 Judson; David H. Web browser with dynamic display of information objects during linking
JP2982697B2 (ja) 1996-07-05 1999-11-29 日本電気株式会社 テロップ表示装置
US5854624A (en) * 1996-09-12 1998-12-29 Innovative Device Technologies, Inc. Pocket-sized user interface for internet browser terminals and the like
US5953056A (en) * 1996-12-20 1999-09-14 Whack & Track, Inc. System and method for enhancing display of a sporting event
US5963203A (en) * 1997-07-03 1999-10-05 Obvious Technology, Inc. Interactive video icon with designated viewing position
US6021418A (en) * 1997-02-18 2000-02-01 International Business Machines Corporation Apparatus and method for displaying control-objects
JPH10274997A (ja) 1997-03-31 1998-10-13 Sanyo Electric Co Ltd 文書読み上げ装置
US6115035A (en) * 1997-07-21 2000-09-05 Mediaone Group, Inc. System and method for automated audio/video archive and distribution
JPH1145289A (ja) 1997-07-28 1999-02-16 Just Syst Corp 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
US6567980B1 (en) * 1997-08-14 2003-05-20 Virage, Inc. Video cataloger system with hyperlinked output
EP0974110A2 (en) 1997-10-30 2000-01-26 Koninklijke Philips Electronics N.V. Method for coding a presentation
US6278446B1 (en) * 1998-02-23 2001-08-21 Siemens Corporate Research, Inc. System for interactive organization and browsing of video
US6088702A (en) * 1998-02-25 2000-07-11 Plantz; Scott H. Group publishing system
US6199042B1 (en) * 1998-06-19 2001-03-06 L&H Applications Usa, Inc. Reading system
US6430357B1 (en) * 1998-09-22 2002-08-06 Ati International Srl Text data extraction system for interleaved video data streams
US6452612B1 (en) * 1998-12-18 2002-09-17 Parkervision, Inc. Real time video production system and method
US6738075B1 (en) * 1998-12-31 2004-05-18 Flashpoint Technology, Inc. Method and apparatus for creating an interactive slide show in a digital imaging device
US6317708B1 (en) * 1999-01-07 2001-11-13 Justsystem Corporation Method for producing summaries of text document
US6532218B1 (en) * 1999-04-05 2003-03-11 Siemens Information & Communication Networks, Inc. System and method for multimedia collaborative conferencing
US6369835B1 (en) * 1999-05-18 2002-04-09 Microsoft Corporation Method and system for generating a movie file from a slide show presentation
US6636888B1 (en) * 1999-06-15 2003-10-21 Microsoft Corporation Scheduling presentation broadcasts in an integrated network environment
US6636245B1 (en) * 2000-06-14 2003-10-21 Intel Corporation Method and apparatus to display video

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002312370A (ja) * 2001-04-11 2002-10-25 J-Fit Co Ltd マルチメディアデータ検索装置、マルチメディアデータ検索方法およびマルチメディアデータ検索プログラム
US7215510B2 (en) 2002-03-28 2007-05-08 Sony Corporation Magnetic head and magnetic recording/reproducing apparatus for a video tape recorder, and a method of manufacturing the same
CN100417214C (zh) * 2002-05-23 2008-09-03 索尼株式会社 内容记录和再现设备、方法
WO2004003756A1 (ja) * 2002-06-26 2004-01-08 Sony Corporation コンテンツ関連情報提供装置及びコンテンツ関連情報提供方法、電子掲示板システム、並びにコンピュータ・プログラム
US7747696B2 (en) 2002-06-26 2010-06-29 Sony Corporation Content-related information providing apparatus, content related information providing method, electronic bulletin board system, and computer program
CN102074235A (zh) * 2010-12-20 2011-05-25 上海华勤通讯技术有限公司 视频语音识别并检索的方法
JP2015125681A (ja) * 2013-12-27 2015-07-06 パイオニア株式会社 情報提供装置
WO2016009834A1 (ja) * 2014-07-14 2016-01-21 ソニー株式会社 送信装置、送信方法、受信装置、及び、受信方法
JPWO2016009834A1 (ja) * 2014-07-14 2017-05-25 ソニー株式会社 送信装置、送信方法、受信装置、及び、受信方法
US10491934B2 (en) 2014-07-14 2019-11-26 Sony Corporation Transmission device, transmission method, reception device, and reception method
US11197048B2 (en) 2014-07-14 2021-12-07 Saturn Licensing Llc Transmission device, transmission method, reception device, and reception method
JP2019050009A (ja) * 2018-11-05 2019-03-28 パイオニア株式会社 情報提供装置
JP2020144890A (ja) * 2020-04-27 2020-09-10 パイオニア株式会社 情報提供装置
JP2022020751A (ja) * 2020-04-27 2022-02-01 パイオニア株式会社 情報提供装置

Also Published As

Publication number Publication date
US7610546B1 (en) 2009-10-27

Similar Documents

Publication Publication Date Title
JP2001043215A (ja) 文書処理装置、文書処理方法、及び記録媒体
JP4320491B2 (ja) 文書処理システム、端末装置、文書提供装置、文書処理方法、記録媒体
JP2001051997A (ja) 文書データ作成装置、文書データ作成方法、及び記録媒体
US20080300872A1 (en) Scalable summaries of audio or visual content
WO2001001390A1 (fr) Trieuse-liseuse electronique
JP2001184371A (ja) ユーザの使用に便利な多段階の要約ストリームの提供方法
US11893794B2 (en) Hierarchical segmentation of screen captured, screencasted, or streamed video
JP2001075989A (ja) 情報提示装置および方法、ならびに情報提示プログラムを記録したコンピュータで読取可能な記録媒体
US20220076024A1 (en) Interacting with hierarchical clusters of video segments using a metadata panel
JP4433532B2 (ja) 文書処理装置、文書処理方法、記録媒体
JP4798150B2 (ja) 文書処理装置、文書処理方法、及び記録媒体
US11899917B2 (en) Zoom and scroll bar for a video timeline
JP2010073205A (ja) 文書処理装置、文書処理方法、記録媒体
JP4449118B2 (ja) 文書処理装置、文書処理方法、及び記録媒体
JP2001014307A (ja) 文書処理装置、文書処理方法、及び記録媒体
JP2001014313A (ja) 文書処理装置、文書処理方法、及び記録媒体
JP2001034384A (ja) 文書処理装置、文書処理方法、及び記録媒体
JP2001159938A (ja) 文書処理方法、記録媒体、文書処理装置
JP2001014346A (ja) 携帯端末装置、文書処理システム
JP2001147926A (ja) 文書処理システム、端末装置、サービス提供装置、文書処理方法、記録媒体
JP2010044767A (ja) 文書処理装置、文書処理方法、及び記録媒体
JP2001022774A (ja) 文書処理装置、文書処理方法、及び記録媒体
JP2001147915A (ja) 文書処理システム、オーサリング装置、文書処理方法、記録媒体
JP2001167114A (ja) 文書処理装置、文書処理方法、記録媒体
US11631434B2 (en) Selecting and performing operations on hierarchical clusters of video segments

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060316

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060316

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071025

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080225

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080228

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080328