CN1254136A - 查询索引多媒体标题数据的方法与装置 - Google Patents
查询索引多媒体标题数据的方法与装置 Download PDFInfo
- Publication number
- CN1254136A CN1254136A CN 98124160 CN98124160A CN1254136A CN 1254136 A CN1254136 A CN 1254136A CN 98124160 CN98124160 CN 98124160 CN 98124160 A CN98124160 A CN 98124160A CN 1254136 A CN1254136 A CN 1254136A
- Authority
- CN
- China
- Prior art keywords
- word
- key word
- key
- index
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种查询索引多媒体标题数据的方法与装置,主要是采用多级索引的方式,将多媒体数据建立索引库,由使用者下达欲查询的关键字,通过编码操作获得关键字的各项特征,依据这些特征进行多级查询和索引后,通过浏览器输出所查询的多媒体文件数据,使得多媒体数据可以重新使用,达到充分利用现成数据的目的。
Description
本发明涉及一种查询索引多媒体标题(TITLE)数据的方法及装置,特别是涉及一种可对多媒体数据进行查询索引,使多媒体数据可以重新使用及充分利用的方法及装置。
随着多媒体计算机的流行,使得一些书籍、展示文件等均以计算机展示,且多媒体计算机的影音播放功能,更使得影音光盘盛行。然而,这些多媒体TITLE的数据却只能供其本身所使用,别的产品无法读取此多媒体TITLE的数据,或无法识别其文件格式,而不能对其所包括的任何数据进行浏览,因此限制了这些数据的用途,也使得这些数据无法作进一步的利用,形成资源的浪费,增加数据搜寻的困难与时间。
本发明的目的在于提供一种查询索引多媒体TITLE数据的方法及装置,主要是采用多级索引的方式,将多媒体数据建立索引库,由使用者提出要查询的关键字,通过编码作业获得关键字的各项特征,依据这些特征进行多级查询和索引后,通过浏览器输出所查询的多媒体文件数据,使得多媒体数据可以重新使用,达到充分利用现成数据的目的。
依据前述,本发明在多媒体光盘上由专用工具置放数个索引库,用以针对多媒体数据进行索引,其中一索引库为多媒体数据中所有可用的数据标题表,其余的索引文件则作为标题的索引文件,再在前述的索引库上建立索引,使得用户能有效查询到所需的多媒体数据,并增进查寻的速度。
依据前述,本发明针对关键字的特征所进行的编码操作,是采用逆向排除算法,以达到快速寻找的目的。
本发明的另一目的在于为配合前述的索引功能,在开发标题时,可为其多媒体数据编写两个浏览程序,第一个浏览程序称为电子书,可以浏览整个多媒体的数据,第二个浏览程序可以接收参数,使用者可以通过参数将所要查询的内容提交给此浏览程序,便可将相关的多媒体数据返传给使用者,通过上述的过程,即可使得TITLE上的多媒体可以被以后的ITILE所使用,而使数据资源不会浪费。
本发明的目的是这样实现的,即提供一种查询索引多媒体ITILE数据的方法与装置,主要由通过在多媒体上设置标题关键字表、初级标题索引表、次级标题索引表的数个索引库,由使用者提供所需的关键字后传入浏览器中,利用多级索引的方式,依据关键字的特微进行编码,并进行查找以通过对关键字的各项特征比较,而获得多媒体数据中所有包括关键字的数据,回传至浏览器显现出来,能使多媒体数据可以重新利用,达到充分利用现成数据的目的。
以下将对本发明的结构设计与操作原理,作一详细的说明,并参阅附图,将对本发明的特征作更进一步的了解,其中:
图1为本发明的结构及功能原理图;
图2为本发明的逆向排除算法的步骤流程图。
本发明主要是提供一种方法,使光盘中的多媒体数据可以重新利用,达到充分利用现成数据的目的。主要是采用多级索引的方式,如图1所示,首先通过在多媒体光盘上设置数个索引库,包括有:标题关键字表30(CDINDEX.DAT)、初级标题索引表50(CDINDEX.ID1)、次级标题索引表40(CDINDEX.ID2)。由使用者提供所需的关键字10后传入浏览器20中,依据关键字10的特征(如详后述)产生前述的三种表数据30、40、50,经过多级查询和索引后,将所查询的结果回传至浏览器20,并将此结果显现出来。
使用者所提供的关键字10,可能是一些不规则的短语组合,因此抽取关键字的五项特征进行编码,并以逆向排除的方法进行查找,以通过对关键字10的第一单词首字母、第一单词长度、第二单词的首字母、关键字10的字尾符、关键字长度等特征比较,通过总体到细部的思考模式,对细部的一一确认来确认整体,而获得光盘中所有包括有关键字10的数据。
前述关键字10所取出的五项特征码中,关键字10的第一单词首字母、第一单词长度组成关键字10的第一特征;第二单词的首字母则作为关键字10的第二特征。若关键字10为中文,则第一特征取首字内码的低十二位,第二特征取第二字内码的高八位。
标题关键字表30中包括关键字10、关键字的字尾符及关键字长度三项内容;以表一内容举例说明,标题关键字表30第0位置的关键字10为“Li jian”关键字表中即分别记录Li jian、n、7(包括空格)三项内容,以此类推,即记录所有关键字10的三项内容于标题关键字表30中。
表一 本发明实施例的关键字表
关 键 字 | 关键字的字尾节 | 关键字的长度 |
Li jian | n(ASCII 110) | 7 |
Li ming | g(ASCII 103) | 7 |
Wang Dong | g(ASCII 103) | 9 |
Wang Dong sheng | g(ASCII 103) | 15 |
穆 立 源 | (ASCII 183) | 6 |
表二 本发明实施例的次级索引表
关键字的第二特征 | FROM | TO |
0 j | 0 | 0 |
1 m | 1 | 1 |
2 d | 2 | 3 |
3 223(立) | 4 | 4 |
表三 本发明实施例的初级索引表
FROM | TO |
... | ... |
236 0 | 1 |
... | ... |
471 2 | 2 |
... | ... |
4287 3 | 3 |
... | ... |
次级标题索引表40用来记录第一和第二特征的关键字10在标题关键字表30中的位置,包括有关键字10的第二特征、所有包括第一和第二特征的关键字10在标题关键字表30中的起始位置(FROM)、所有包括第一和第二特征的关键字10在标题关键字表30中的结束位置(TO)三项内容,以表二内容举例说明:
关键字“Li jian”的第二特征为j,仅有位置0处拥有此项特征,因此其起始位置与结束位置分别为0、0;而关键字“Wang dong”及“Wangdong sheng”的第二特征均为d,故其启始位置为2,结束位置为3,以此类推,建立出一完整的次级标题索引表40。
初级标题索引表50的大小是固定的,与关键字10的最大长度有关,所有关键字10的第一特征均可通过下列公式计算出其在初级标题索引表50的位置,此位置的内容指向次级标题索引表40该关键字10的第二特征。初级标题索引表50共有两项数据,分别是含有第一特征的所有关键字10在次级标题索引表40中的起始位置(FROM),及含有第二特征的所有关键字10在次级标题索引表40中的结束位置(END)。
位置=(单词的长度-1)×128+单词的首字母ASCII码值
若为中文,则
位置=(中文内码的低十二位)+(128×32)
其中,32为定义关键字的最大长度,128为英文ASCII码值的大小。
当扫描到单词时,首先会根据它的第一特征查询在初级标题索引表50的内容,如果该位置是空,则不存在以此为词头的关键字10,进行下一个词的扫描,否则继续查询次级标题索引表。
前述的索引库30、40、50建立完成后,可采用逆向排除算法以达到快速寻找的目的。如图2所示,为本发明的逆向排除算法的步骤流程图;包括有下列步骤:步骤a.由待查字的第一特征求得初级标题索引表50中的位置,若为空,则
表无以此单词为首的关键字10,即执行步骤e,否则按初级标题索
引表50的结束与起始位置寻找次级标题索引表40的相对应内容。步骤b.以待查字后面的单词第二特征与步骤a所查到次级标题索引表40
的第一项内容比较,若不同则表无此二词的关键字10,执行步骤3;
否则按其内容的结束与起始位置找寻标题关键字表30的相对应内
容。步骤c.取出标题关键字表30中相对应该关键字10的长度与字尾符,比对
待查字的字尾符字母是否相等于关键字10的字尾符,若不,则无此
待查字为首的关键字,执行步骤e;否则,将关键字10与待查字逐
个字符比较,若不同则执行步骤e,相同者则执行步骤d。步骤d.确认待查字是关键字10,再进一步对其进行单词标注等各项操作。步骤e.结束比较。
以表一、表二及表三对逆向排除算法作进一步的执行说明:假设待查字为“Wang dong sheng”,其第一特征为W4;依据前述的公式可获得其于初级标题索引表50中的位置为471,由初级标题索引表50中可查出其起始与结束位置分别为“2”与“2”,因此要查询次级标题索引表40中的位置“2”。
待查字的第二特征为“d”,次级标题索引表位置“2”的第一项内容为“d”,起始与结束位置内容分为是“2”、“3”,因此可以得知要查标题关键字表30中位置“3”、“2”的内容。
先取出标题关键字表30中位置“2”的内容,其对应关键字10长度为15,字尾符为“g”,然后再查询待查字的长度与字尾符是否相符,在本例中获得一相同的对比结果,则再对待查字和此关键字10逐字符相比较,比较结果相同即进行步骤e。如此即能将光盘片中所有包括有关键字10的每一笔数据,通过浏览程序20而显现于屏幕上。
再进一步,在关键TITLE时,可为其多媒体数据编写两个浏览程序20,第一个浏览程序称为电子书,可以浏览整个多媒体数据,第二个浏览程序可以接收参数,使用者可以通过参数将所要查询的内容提交给此浏览程序20,便可将相关的多媒体数据返传给使用者,由上述的过程,即可使得TITLE上的多媒体可以被以后的TITLE所使用,而使数据资源不会浪费。
承前所述,本发明所提供的查询索引多媒体TITLE数据的装置及方法,仅需通过关键字查询,即能对现有的或往后的多媒体TITLE数据进一步利用,使数据不致浪费不用,有助与使用者的数据查询与程序设计者缩短数据的输入时间。
以上已将本发明作一详细说明,但以上所述的,仅为本发明的一较佳实施例而已,不能限于本发明实施的范围。因此凡依本发明权利要求所作的各种变化与修饰,均仍属本发明的权利要求范围。
Claims (9)
1.一种查询索引多媒体标题数据的方法与装置,其特征在于,主要由通过在多媒体上设置标题关键字表、初级标题索引表、次级标题索引表的数个索引库,由使用者提供所需的关键字后传入浏览器中,利用多级索引的方式,依据关键字的特征进行编码,并进行查找以通过对关键字的各项特征比较,而获得多媒体数据中所有包括关键字的数据,回传至浏览器显现出来,能使多媒体数据可以重新利用,达到充分利用现成数据的目的。
2.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该关键字以其第一单词首字母、第一单词长度组成第一特征。
3.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该关键字是以其第二单词的首字母作为第二特征。
4.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该关键字可为多字节内码,其第一特征是取首字内码的低十二位,第二特征取第二字内码的高八位。
5.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该标题关键字表进一步包括关键字、关键字的字尾符及关键字长度三项内容。
6.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该次级标题索引表是记录第一和第二特征的关键字在关键字表中的位置,包括关键字的第二特征、所有包括第一和第二特征的关键字在关键字表中的起始位置、所有包括第一和第二特征的关键字在关键字表中的结束位置。
7.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该初级标题索引表的大小是固定的,与关键字的最大长度有关,包括第一特征的所有关键字在次级标题索引表中的起始位置,及第二特征的所有关键字在次级标题索引表中的结束位置。
8.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,可进一步利用逆向排除算法进行查询,通过总体到细部的思考模式,对细部的数据一一确认而确认整体。
9.如权利要求8所述的查询索引多媒体标题数据的方法与装置,其特征在于,该逆向排除算法包括:
a.由待查字的第一特征求得初级标题索引表中的位置步骤;
b.以待查字后面的单词第二特征与步骤a所查到次级标题索引表中第一项内容的比较步骤;
c.关键字表中相对应该关键字的长度与字尾符,与待查字的字尾符字母的比较步骤;
d.确认待查字是关键字的步骤;
e.进行单词标注等各项操作步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 98124160 CN1254136A (zh) | 1998-11-12 | 1998-11-12 | 查询索引多媒体标题数据的方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 98124160 CN1254136A (zh) | 1998-11-12 | 1998-11-12 | 查询索引多媒体标题数据的方法与装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1254136A true CN1254136A (zh) | 2000-05-24 |
Family
ID=5228517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 98124160 Pending CN1254136A (zh) | 1998-11-12 | 1998-11-12 | 查询索引多媒体标题数据的方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1254136A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007095834A1 (fr) * | 2006-02-22 | 2007-08-30 | Dong Wang | Procédé d'affichage composite et système pour moteur de recherche d'informations de ressources identiques sur la base du degré d'attention |
CN100430921C (zh) * | 2001-12-29 | 2008-11-05 | Lg电子株式会社 | 多媒体数据搜索和浏览*** |
CN101295312B (zh) * | 2008-06-18 | 2011-12-28 | 中兴通讯股份有限公司 | 一种使用表格呈现数据的方法 |
CN101089853B (zh) * | 2006-06-15 | 2013-06-19 | 三星电子株式会社 | 用于浏览内容的设备和方法 |
CN102298621B (zh) * | 2006-02-22 | 2013-11-06 | 王东 | 基于关注度的同源信息搜索引擎聚合显示方法的获取网页用户关注度PageFocus的*** |
-
1998
- 1998-11-12 CN CN 98124160 patent/CN1254136A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100430921C (zh) * | 2001-12-29 | 2008-11-05 | Lg电子株式会社 | 多媒体数据搜索和浏览*** |
WO2007095834A1 (fr) * | 2006-02-22 | 2007-08-30 | Dong Wang | Procédé d'affichage composite et système pour moteur de recherche d'informations de ressources identiques sur la base du degré d'attention |
CN101025737B (zh) * | 2006-02-22 | 2011-08-17 | 王东 | 基于关注度的同源信息搜索引擎聚合显示方法 |
CN102298621B (zh) * | 2006-02-22 | 2013-11-06 | 王东 | 基于关注度的同源信息搜索引擎聚合显示方法的获取网页用户关注度PageFocus的*** |
CN101089853B (zh) * | 2006-06-15 | 2013-06-19 | 三星电子株式会社 | 用于浏览内容的设备和方法 |
CN101295312B (zh) * | 2008-06-18 | 2011-12-28 | 中兴通讯股份有限公司 | 一种使用表格呈现数据的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6408270B1 (en) | Phonetic sorting and searching | |
US5649023A (en) | Method and apparatus for indexing a plurality of handwritten objects | |
CN102915299B (zh) | 一种分词方法及装置 | |
US8204921B2 (en) | Efficient storage and search of word lists and other text | |
EP2172853B1 (en) | Database index and database for indexing text documents | |
CN1325513A (zh) | 具有知识生成能力的文档语义分析/选择 | |
KR100847376B1 (ko) | 질의어 자동 추출을 이용한 검색 방법 및 장치 | |
WO2009005961A1 (en) | Phonetic search using normalized string | |
CN1345426A (zh) | 用于提取索引关键字数据字段的***和方法 | |
US20110113052A1 (en) | Query result iteration for multiple queries | |
CN1148657C (zh) | 文件处理方法和数据处理装置 | |
CN1254136A (zh) | 查询索引多媒体标题数据的方法与装置 | |
CN110019637B (zh) | 一种标准文献检索的排序算法 | |
CN102799661A (zh) | 一种对电子文件进行语义检索的方法和*** | |
CN102567424B (zh) | 一种诗词关联库***及其实现方法和电子学习设备 | |
CN1287316C (zh) | 在索引高键码生成期间压缩变长列的方法和*** | |
CN1147811C (zh) | 具有矫正功能的中文汉字辨别方法及*** | |
CN1648829A (zh) | 用于输入汉字的方法和*** | |
CN101063984A (zh) | 图框自动整理排序***及方法 | |
CN1667611A (zh) | 字汇查询方法及*** | |
CN1144144C (zh) | 快速文字查找方法 | |
CN1822001A (zh) | 一种应用于手持式数据处理装置的单字查询方法 | |
JP2001052024A (ja) | 類似特徴量の検索方法及び装置及び類似特徴量の検索プログラムを格納した記憶媒体 | |
CN1121655C (zh) | 实现不规则片语快速查找的方法 | |
CN1307273A (zh) | 智能注音输入***及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |