JP7009840B2 - 情報処理装置、情報処理方法及び対話制御システム - Google Patents
情報処理装置、情報処理方法及び対話制御システム Download PDFInfo
- Publication number
- JP7009840B2 JP7009840B2 JP2017165209A JP2017165209A JP7009840B2 JP 7009840 B2 JP7009840 B2 JP 7009840B2 JP 2017165209 A JP2017165209 A JP 2017165209A JP 2017165209 A JP2017165209 A JP 2017165209A JP 7009840 B2 JP7009840 B2 JP 7009840B2
- Authority
- JP
- Japan
- Prior art keywords
- generation unit
- web page
- unit
- information processing
- text display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 37
- 238000003672 processing method Methods 0.000 title claims description 3
- 238000000034 method Methods 0.000 claims description 220
- 239000000470 constituent Substances 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims 2
- 238000012545 processing Methods 0.000 description 48
- 238000010586 diagram Methods 0.000 description 42
- 238000004458 analytical method Methods 0.000 description 18
- 238000002360 preparation method Methods 0.000 description 13
- 238000012937 correction Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000013500 data storage Methods 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000012795 verification Methods 0.000 description 7
- 230000000877 morphologic effect Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Information Transfer Between Computers (AREA)
Description
まず、ユーザ端末においてユーザとの自動対話の制御に用いる対話制御テーブルについて説明する。図1に、対話制御テーブルの構成例を示す。対話制御テーブルは、ユーザ端末が発話する内容(発話コンテンツ)を含む対話制御データの例である。
本実施の形態では、予め用意されている既定テーブルを参照して、領域名に応じて自動的に次候補及び契機文言を設定する例について説明する。
本実施の形態では、他のサイトに関する特性テーブルを参照して、領域名に応じて自動的に次候補の領域名及び契機文言を設定する例について説明する。
本実施の形態では、テキスト表示領域に対するクリック履歴に基づいて次候補を設定する例について説明する。
本実施の形態では、発話内容に基づいて契機文言を設定する例について説明する。
本実施の形態では、構成要素から抽出されたテキストデータを分割して、分割されたテキストデータに前後関係に基づく契機文言を設定する例について説明する。
本実施の形態では、リンク先のURLからウェブページを取得して、対話制御テーブルを生成する例について説明する。
本実施の形態では、ユーザ端末505が指定したページURLからウェブページを取得して、対話制御テーブルを生成する例について説明する。
本実施の形態では、対話制御テーブルの生成が失敗したか否かを判定して、対話制御テーブルの生成が失敗したと判定した場合に、特性テーブルを修正する例について説明する。
第1ウェブページの表示イメージに含まれるテキスト表示領域間について第1前後関係を設定した特性データを生成する第1生成部と、
前記特性データに基づいて、第2ウェブページに含まれるテキスト表示領域の構成要素から抽出されたテキスト間に第2前後関係を設定した対話制御データを生成する第2生成部と
を有する情報処理装置。
前記第1生成部は、前記第1前後関係を適用する契機となる文言を前記特性データに設定し、
前記第2生成部は、自動認識したユーザ発言に当該文言が含まれる場合に、前記第1前後関係に基づく前記第2前後関係を適用して次に読み上げる前記テキストを選択する条件を前記対話制御データに設定する
付記1記載の情報処理装置。
前記第1生成部は、前記テキスト表示領域の名前に応じて前記第1前後関係を設定する
付記1又は2記載の情報処理装置。
前記第1生成部は、前記テキスト表示領域の名前に応じて前記文言を設定する
付記2記載の情報処理装置。
前記第1生成部は、前記テキスト表示領域に対するユーザ指示の履歴に基づいて前記第1前後関係を設定する
付記1又は2記載の情報処理装置。
前記第2生成部は、前記構成要素から抽出された前記テキストに基づいて前記文言を特定する
付記2記載の情報処理装置。
前記第2生成部は、前記構成要素から抽出された前記テキストを分割して、分割されたテキスト間に第3前後関係を設定する
付記1乃至6のいずれか1つ記載の情報処理装置。
更に、
前記構成要素にリンク先が設定されている場合に、当該リンク先から前記第2ウェブページを取得する取得部
を有する付記1乃至7のいずれか1つ記載の情報処理装置。
更に、
格納位置が指定されて前記対話制御データを要求された場合に、当該格納位置から前記第2ウェブページを取得する取得部
を有する付記1乃至7のいずれか1つ記載の情報処理装置。
更に、
前記対話制御データの生成が失敗したか否かを判定する判定部と、
前記対話制御データの生成が失敗したと判定した場合に、前記特性データを修正する修正部と
を有する付記1乃至9のいずれか1つ記載の情報処理装置。
第1ウェブページの表示イメージに含まれるテキスト表示領域間について第1前後関係を設定した特性データを生成し、
前記特性データに基づいて、第2ウェブページに含まれる前記テキスト表示領域の構成要素から抽出されたテキスト間に第2前後関係を設定した対話制御データを生成する
処理を含み、コンピュータにより実行される情報処理方法。
第1情報処理装置と第2情報処理装置とを含む対話制御システムであって、
前記第1情報処理装置は、
第1ウェブページの表示イメージに含まれるテキスト表示領域間について第1前後関係を設定した特性データを生成する第1生成部と、
前記特性データに基づいて、第2ウェブページに含まれる前記テキスト表示領域の構成要素から抽出されたテキスト間に第2前後関係を設定した対話制御データを生成する第2生成部と
を有し、
前記第2情報処理装置は、
前記対話制御データに基づいて自動対話を行う制御部
を有する対話制御システム。
505 ユーザ端末 601 取得部
603 第1生成部 605 第2生成部
607 提供部 611 受信部
613 特定部 615 送信部
621 DOM解析部 623 形態素解析部
625 ブラウザ 631 検証部
633 修正部 641 サイト記憶部
643 ウェブページ記憶部 645 特性データ記憶部
647 制御データ記憶部 649 単語データベース
651 既定テーブル記憶部 653 クリック履歴記憶部
2201 音声入力部 2203 音声認識部
2205 対話制御部 2207 音声合成部
2209 音声出力部 2221 送信部
2223 受信部 2225 適用部
Claims (10)
- 第1ウェブページの表示イメージに含まれるテキスト表示領域間について第1前後関係を設定した特性データを生成する第1生成部と、
前記特性データに基づいて、前記第1ウェブページのサイトと同一サイトに含まれるか又は前記第1ウェブページと同種の第2ウェブページに含まれるテキスト表示領域の構成要素から抽出されたテキスト間に第2前後関係を設定した対話制御データを生成する第2生成部と
を有する情報処理装置。 - 前記第1生成部は、前記第1前後関係に従ってあるテキスト表示領域から他のテキスト表示領域へ遷移させる契機となる文言を、前記特性データに設定し、
前記第2生成部は、
前記特性データの前記第1前後関係における前記あるテキスト表示領域に対応し且つ前記第2ウェブページに含まれるテキスト表示領域の第1テキストから、前記第1前後関係における前記他のテキスト表示領域に対応し且つ前記第2ウェブページに含まれるテキスト表示領域の第2テキストへ遷移させる第2前後関係について、前記第1テキストから前記第2のテキストへ遷移させる契機となる文言として、前記特性データに設定された前記文言を、前記対話制御データに設定する
請求項1記載の情報処理装置。 - 前記第1生成部は、前記テキスト表示領域の名前に応じて前記第1前後関係を設定する
請求項1又は2記載の情報処理装置。 - 前記第1生成部は、前記テキスト表示領域の名前に応じて前記文言を設定する
請求項2記載の情報処理装置。 - 前記第1生成部は、前記テキスト表示領域に対するユーザ指示の履歴に基づいて前記第1前後関係を設定する
請求項1又は2記載の情報処理装置。 - 前記第2生成部は、前記構成要素から抽出された前記テキストに基づいて前記文言を特定する
請求項2記載の情報処理装置。 - 前記第2生成部は、前記構成要素から抽出された前記テキストを分割して、分割されたテキスト間に第3前後関係を設定する
請求項1乃至6のいずれか1つ記載の情報処理装置。 - 更に、
前記構成要素にリンク先が設定されている場合に、当該リンク先から第3ウェブページを取得する取得部
を有し、
前記第2生成部が、前記第3ウェブページについて対話制御データを生成する
請求項1乃至7のいずれか1つ記載の情報処理装置。 - 第1ウェブページの表示イメージに含まれるテキスト表示領域間について第1前後関係を設定した特性データを生成し、
前記特性データに基づいて、前記第1ウェブページのサイトと同一サイトに含まれるか又は前記第1ウェブページと同種の第2ウェブページに含まれる前記テキスト表示領域の構成要素から抽出されたテキスト間に第2前後関係を設定した対話制御データを生成する
処理を含み、コンピュータにより実行される情報処理方法。 - 第1情報処理装置と第2情報処理装置とを含む対話制御システムであって、
前記第1情報処理装置は、
第1ウェブページの表示イメージに含まれるテキスト表示領域間について第1前後関係を設定した特性データを生成する第1生成部と、
前記特性データに基づいて、前記第1ウェブページのサイトと同一サイトに含まれるか又は前記第1ウェブページと同種の第2ウェブページに含まれる前記テキスト表示領域の構成要素から抽出されたテキスト間に第2前後関係を設定した対話制御データを生成する第2生成部と
を有し、
前記第2情報処理装置は、
前記対話制御データに基づいて自動対話を行う制御部
を有する対話制御システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017165209A JP7009840B2 (ja) | 2017-08-30 | 2017-08-30 | 情報処理装置、情報処理方法及び対話制御システム |
US16/114,361 US11170051B2 (en) | 2017-08-30 | 2018-08-28 | Information processing device, information processing method, and dialog control system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017165209A JP7009840B2 (ja) | 2017-08-30 | 2017-08-30 | 情報処理装置、情報処理方法及び対話制御システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019045937A JP2019045937A (ja) | 2019-03-22 |
JP7009840B2 true JP7009840B2 (ja) | 2022-01-26 |
Family
ID=65437470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017165209A Active JP7009840B2 (ja) | 2017-08-30 | 2017-08-30 | 情報処理装置、情報処理方法及び対話制御システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11170051B2 (ja) |
JP (1) | JP7009840B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10789940B2 (en) * | 2018-03-27 | 2020-09-29 | Lenovo (Singapore) Pte. Ltd. | Dynamic wake word identification |
JP7383456B2 (ja) * | 2019-11-12 | 2023-11-20 | ユーソナー株式会社 | 情報管理システム、識別情報付与モジュール及び情報管理方法 |
WO2021106051A1 (ja) * | 2019-11-25 | 2021-06-03 | 株式会社オープンエイト | サーバおよびデータ割り当て方法 |
CN112463282B (zh) * | 2020-12-14 | 2023-02-24 | 网易(杭州)网络有限公司 | 界面显示方法、装置、存储介质和电子装置 |
CN116563869B (zh) * | 2023-07-10 | 2023-09-19 | 平安银行股份有限公司 | 页面图像文字处理方法、装置、终端设备和可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000181474A (ja) | 1998-12-10 | 2000-06-30 | Nec Software Okinawa Ltd | 文書データ音声合成方式 |
JP3163623B2 (ja) | 1990-08-27 | 2001-05-08 | セイコーエプソン株式会社 | 情報機器 |
JP2002091473A (ja) | 2000-06-30 | 2002-03-27 | Fujitsu Ltd | 情報処理装置 |
JP2002342212A (ja) | 2001-04-27 | 2002-11-29 | Internatl Business Mach Corp <Ibm> | 情報アクセス方法、情報アクセスシステムおよびプログラム |
JP2008171356A (ja) | 2007-01-15 | 2008-07-24 | Ricoh Co Ltd | 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよび記録媒体 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6199076B1 (en) * | 1996-10-02 | 2001-03-06 | James Logan | Audio program player including a dynamic program selection controller |
JP3789614B2 (ja) * | 1997-10-02 | 2006-06-28 | 日本電信電話株式会社 | ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体 |
US6751593B2 (en) | 2000-06-30 | 2004-06-15 | Fujitsu Limited | Data processing system with block attribute-based vocalization mechanism |
US6983250B2 (en) * | 2000-10-25 | 2006-01-03 | Nms Communications Corporation | Method and system for enabling a user to obtain information from a text-based web site in audio form |
US7194411B2 (en) * | 2001-02-26 | 2007-03-20 | Benjamin Slotznick | Method of displaying web pages to enable user access to text information that the user has difficulty reading |
US7185276B2 (en) * | 2001-08-09 | 2007-02-27 | Voxera Corporation | System and method for dynamically translating HTML to VoiceXML intelligently |
JP2004303097A (ja) | 2003-03-31 | 2004-10-28 | Fujitsu Ltd | 構造化文書の部分文書抽出プログラムおよび部分文書抽出方法 |
US7577568B2 (en) * | 2003-06-10 | 2009-08-18 | At&T Intellctual Property Ii, L.P. | Methods and system for creating voice files using a VoiceXML application |
JP5520732B2 (ja) | 2010-07-27 | 2014-06-11 | 日本電信電話株式会社 | 本文抽出方法、本文抽出装置、本文抽出プログラム |
US9152730B2 (en) | 2011-11-10 | 2015-10-06 | Evernote Corporation | Extracting principal content from web pages |
JP2013218627A (ja) | 2012-04-12 | 2013-10-24 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書からの情報抽出方法、装置、及びプログラム |
-
2017
- 2017-08-30 JP JP2017165209A patent/JP7009840B2/ja active Active
-
2018
- 2018-08-28 US US16/114,361 patent/US11170051B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3163623B2 (ja) | 1990-08-27 | 2001-05-08 | セイコーエプソン株式会社 | 情報機器 |
JP2000181474A (ja) | 1998-12-10 | 2000-06-30 | Nec Software Okinawa Ltd | 文書データ音声合成方式 |
JP2002091473A (ja) | 2000-06-30 | 2002-03-27 | Fujitsu Ltd | 情報処理装置 |
JP2002342212A (ja) | 2001-04-27 | 2002-11-29 | Internatl Business Mach Corp <Ibm> | 情報アクセス方法、情報アクセスシステムおよびプログラム |
JP2008171356A (ja) | 2007-01-15 | 2008-07-24 | Ricoh Co Ltd | 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよび記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20190065623A1 (en) | 2019-02-28 |
US11170051B2 (en) | 2021-11-09 |
JP2019045937A (ja) | 2019-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7009840B2 (ja) | 情報処理装置、情報処理方法及び対話制御システム | |
EP0954856B1 (en) | Context dependent phoneme networks for encoding speech information | |
JP3519015B2 (ja) | ネットワーク話し言葉語彙システム | |
US8015012B2 (en) | Data-driven global boundary optimization | |
JP4189369B2 (ja) | 構造化文書検索装置及び構造化文書検索方法 | |
CN106384593A (zh) | 一种语音信息转换、信息生成方法及装置 | |
CN109036425A (zh) | 用于操作智能终端的方法和装置 | |
JP4722195B2 (ja) | データベース・メッセージ分析支援プログラム、方法及び装置 | |
JP2021504784A (ja) | 文書構造抽出に基づいた多言語文書の検索 | |
WO2017044415A1 (en) | System and method for eliciting open-ended natural language responses to questions to train natural language processors | |
EP1334435A2 (en) | Adding data to text pages by an intermediary proxy | |
CN110692040A (zh) | 在网络***中激活远程设备 | |
CN109254921A (zh) | 应用版本验证方法、装置、计算机设备以及存储介质 | |
US20120120436A1 (en) | Remote printing | |
KR20170008357A (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
CN101576885B (zh) | 提取动态生成网页内容的技术方案 | |
SE0201898D0 (sv) | A method and an apparatus for styling a web service | |
JP6095487B2 (ja) | 質問応答装置、及び質問応答方法 | |
CN111354344A (zh) | 语音识别模型的训练方法、装置、电子设备及存储介质 | |
CN116863910A (zh) | 一种语音数据的合成方法、装置、电子设备及存储介质 | |
CN113870830A (zh) | 基于人工智能的语音合成方法、装置、设备及存储介质 | |
CN103533009A (zh) | 一种基于Web技术实现音视频推荐的方法和*** | |
JP2010230948A (ja) | コンテンツ配信システムおよびテキスト表示方法 | |
KR101837341B1 (ko) | 비디오 콘텐츠를 분할하는 방법 및 시스템 | |
Król | Comparative analysis of selected online tools for JavaScript code minification. A case study of a map application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7009840 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |