CN103020095B - 信息处理设备和信息处理方法 - Google Patents

信息处理设备和信息处理方法 Download PDF

Info

Publication number
CN103020095B
CN103020095B CN201210061835.9A CN201210061835A CN103020095B CN 103020095 B CN103020095 B CN 103020095B CN 201210061835 A CN201210061835 A CN 201210061835A CN 103020095 B CN103020095 B CN 103020095B
Authority
CN
China
Prior art keywords
information
metadata
presented
feature
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210061835.9A
Other languages
English (en)
Other versions
CN103020095A (zh
Inventor
任蓓丽
布施透
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN103020095A publication Critical patent/CN103020095A/zh
Application granted granted Critical
Publication of CN103020095B publication Critical patent/CN103020095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了信息处理设备和信息处理方法。该信息处理设备包括:呈现单元、信息提取单元、特征提取单元、限制单元。呈现单元呈现信息。在选择了由呈现单元呈现的信息的情况下,信息提取单元从存储多个信息条目和所述多个信息条目之间的关联的存储单元提取与该所选信息相关联的信息。特征提取单元提取关于所述多个信息条目和所述多个信息条目之间的关联的特征。在呈现单元呈现由信息提取单元提取的信息、并且要被呈现的信息条目的数量大于或大于等于预定数量的情况下,限制单元基于由特征提取单元提取的特征限制要呈现的信息。

Description

信息处理设备和信息处理方法
技术领域
本发明涉及信息处理设备和信息处理方法。
背景技术
现有多种涉及信息检索的技术。
作为相关技术,例如,在进行检索文档或数据库的过程中,为了有效缩小合适的检索结果以及在缩小检索结果的处理中参考相关信息,日本未审查专利申请公开No.2004-192355公开了这样的一种技术。在画面上标记元数据(概念信息)。该标记被选择为使得可以顺序显示下级元数据和相关元数据。元数据被选择为使得检索处理可以可视地进行并且可以找到想要的文档。以相关的方式显示彼此相关的信息项,例如,利用元数据名称的标记之间的线进行连接,或者相反地显示不相关的信息项,从而可以容易地找到相关信息。
例如,为了根据文档的特征以高精度对存储于信息处理设备中的大量文档进行分类,日本未审查专利申请公开No.2000-010996公开了这样的一种技术。关键字剪切单元参考同义字和不必要字来根据文档数据生成文档字对和文档元信息。关键字相关提取单元参考层级关系提取层级关系、等价关系、和相联关系。目录文件生成单元根据首位关键字(topkeyword)、相联关系、文档元信息生成目录文件。用户能够经由目录访问单元访问该目录文件。
发明内容
因此,本发明的一个目的是提供一种信息处理设备和一种信息处理方法,其中在呈现相关信息的情况下,基于该信息和关于多个信息之间的关联信息限制要呈现的信息条目数量。
根据本发明的第一方面,提供了一种信息处理设备,其包括:呈现单元、信息提取单元、特征提取单元、限制单元。呈现单元呈现信息。在选择了由呈现单元呈现的信息的情况下,信息提取单元从存储多个信息条目和所述多个信息条目之间的关联的存储单元提取与所选信息相关联的信息。特征提取单元提取关于所述多个信息条目和所述多个信息条目之间的关联的特征。在呈现单元呈现由信息提取单元提取的信息、并且要被呈现的信息条目的数量大于或大于等于预定数量的情况下,限制单元基于由特征提取单元提取的特征限制要呈现的信息。
根据本发明的第二方面,特征提取单元可以提取信息被选择的时刻或与该信息相关联的信息被选择的时刻作为关于该信息的特征。
根据本发明的第三方面,在选择了所述信息的情况下,特征提取单元可以提取与该所选信息相关联的信息条目的数量或与所选信息相关联的信息已经被选择的次数作为关于该信息的特征。
根据本发明的第四方面,特征提取单元可以提取基于路径中彼此相关联的所选信息和目标信息之一已经被选择的次数的值,来作为关于多个信息条目之间的关联的特征。
根据本发明的第五方面,在已经由呈现单元呈现了信息的情况下,限制单元可以根据要被呈现单元呈现的信息、或者在已经由呈现单元呈现了信息的情况下根据基于由特征提取单元提取到的特征的值和预定阈值之间的比较结果来选择要被删除由呈现单元对其进行呈现的信息。
根据本发明的第六方面,呈现单元可以呈现表明由限制单元删除了对其进行呈现的信息已经在之前呈现过的信息。
根据本发明的第七方面,提供了一种信息处理方法,包括:呈现信息;在选择了所呈现的信息的情况下,提取与所选择的信息相关联的信息;提取关于多个信息条目和所述多个信息条目之间的关联的特征;以及在呈现所提取的信息、并且要被呈现的信息条目的数量大于或大于等于预定数量的情况下,基于所提取的特征限制要呈现的信息。
在根据本发明第一方面的信息处理设备中,在呈现相关信息的情况下,可以基于所述信息和关于多个信息条目之间的关联的信息来限制要被呈现的信息条目的数量。
在根据本发明第二方面的信息处理设备中,基于选择所述信息的时刻或所述信息被信息提取单元提取的时刻来限制要呈现的信息条目的数量。
在根据本发明第三方面的信息处理设备中,在选择了所述信息的情况下,可以基于与所选择的信息相关联的信息条目的数量、或与所选信息相关联的信息已被选择的次数来限制要呈现的信息条目的数量。
在根据本发明第四方面的信息处理设备中,可以基于路径中彼此相关联的所选信息和目标信息之一已被选择的次数来限制要呈现的信息条目的数量。
在根据本发明第五方面的信息处理设备中,在已经呈现了信息的情况下,可以根据基于所述特征的值和预定阈值之间的比较结果来选择要删除对其进行呈现的信息。
在根据本发明第六方面的信息处理设备中,可以呈现表明由限制单元删除了对其进行呈现的信息已经在之前呈现过的信息。
在根据本发明第七方面的信息处理设备中,在呈现了相关联信息的情况下,可以基于所述信息和关于多个信息条目之间的关联的信息限制要呈现的信息条目的数量。
附图说明
以下将参考附图来详细描述本发明的示例实施例,其中:
图1是示出根据一个示例实施例的模块构造示例的示意图;
图2是示出根据一个示例实施例的处理示例的流程图;
图3是示出根据一个示例实施例的处理示例的流程图;
图4是示出根据一个示例实施例的处理示例的流程图;
图5是示出文档管理数据表格的数据结构的示例的说明性示意图;
图6是示出多个元数据条目之间的关联的示例的说明性示意图;
图7是示出事件元数据登记表格的数据结构的示例的说明性示意图;
图8是示出文档元数据登记表格的数据结构的示例的说明性示意图;
图9是示出项目元数据登记表格的数据结构的示例的说明性示意图;
图10是示出元数据呈现的转换示例的说明性示意图;
图11是示出显示画面示例的说明性示意图;
图12是示出节点数据表格的数据结构示例的说明性示意图;
图13是示出显示画面示例的说明性示意图;
图14是示出节点数据表格的数据结构示例的说明性示意图;
图15是示出边缘数据表格的数据结构示例的说明性示意图;
图16是示出显示画面示例的说明性示意图;
图17是示出节点数据表格的数据结构示例的说明性示意图;
图18是示出边缘数据表格的数据结构示例的说明性示意图;
图19是示出显示画面示例的说明性示意图;
图20是示出节点数据表格的数据结构示例的说明性示意图;
图21是示出边缘数据表格的数据结构示例的说明性示意图;
图22是示出显示画面示例的说明性示意图;
图23是示出节点数据表格的数据结构示例的说明性示意图;
图24是示出边缘数据表格的数据结构示例的说明性示意图;
图25是示出显示画面示例的说明性示意图;
图26是示出节点数据表格的数据结构示例的说明性示意图;
图27是示出边缘数据表格的数据结构示例的说明性示意图;
图28是示出节点数据的转换示例的说明性示意图;
图29是示出呈现画面示例的说明性示意图;以及
图30是示出实现示例实施例的计算机的硬件构造示例的框图。
具体实施方式
下面将参照附图详细描述本发明的示例实施例。
图1是示出根据一个示例实施例的模块构造示例的示意图。
术语“模块”通常表示诸如可逻辑分离的软件(计算机程序)、硬件等的部件。从而,各示例实施例中的模块表示具硬件构造的模块以及以计算机程序构成的模块。因此,各示例实施例还提供了用于使各部件用作模块的计算机程序(包括使计算机执行各种过程的程序、使计算机用作各种单元的程序、使计算机实现各种功能的程序)、***、和方法的说明。为了清楚的继续说明,使用了术语“存储”和“使某某存储”以及其他等同表达。在示例实施例涉及计算机程序的情况下,这些术语及表达表示“使存储装置进行存储”或“控制存储装置进行存储”。此外,模块可以以一对一的关系对应于功能。然而,对于实现,一个模块可以由一个程序实现,多个模块可以由一个程序实现,或一个模块可以由多个程序实现。此外,多个模块可以由一个计算机执行,或者一个模块可以由分布式或并行环境中的多个计算机执行。一个模块可以包括另一个模块。下文中,术语“连接”表示逻辑连接(交换数据、指令、数据间的交叉引用等)以及物理连接。术语“预先确定”表示在执行目标处理前进行的设定。进行“预先确定”表示根据当时的条件和状态或根据直到当时这一时期的条件和状态不仅在示例实施例中的处理开始前进行设定,而且还可以在示例实施例中的处理开始后进行设定,只要是在目标处理之前执行即可。
“***”或“设备”可以由单个计算机、硬件、设备等实现,以及由利用诸如网络(包括具一对一对应关系的通信连接)通信单元连接的多个计算机、硬件、设备等实现。“设备”用作术语“***”的同义词。显然,术语“***”不包括仅仅作为人为安排的社会“机构”(社会***)。
对于模块中的每个处理或对于执行多个处理的模块中的各处理,从存储装置读取目标信息,并在执行了处理后将处理结果写入存储装置。从而可以省略进行处理前从存储装置进行读取的说明或处理后写入存储装置的说明。存储装置可以是硬盘、随机存取存储器(RAM)、外部存储介质、利用通信线路的存储装置、中央处理单元(CPU)内 的寄存器等。此外,表示“在A的情况下,执行B”的说明意味着“确定是否为A,如果是A,则执行B”。然而,这不适用于不必针对是否为A进行确定的情形。
根据示例实施例的信息处理设备呈现多个元数据条目以及所述多个元数据条目之间的关联。如图1的示例所示,信息处理设备包括文档DB 100、数据接收模块102、元数据DB 108、元数据处理模块110、元数据检索模块120、元数据显示模块122、元数据对应文档检索模块128、元数据对应文档输出模块130、和检索/输出模块132。
数据接收模块102包括文档上传模块104和元数据接收模块106。
文档上传模块104连接至文档DB 100。文档上传模块104使文档DB 100存储文档(电子文档)。
元数据接收模块106连接至元数据DB 108。元数据接收模块106接收元数据,并使元数据DB 108存储元数据。在该示例实施例中,元数据是要呈现的信息。当文档上传模块104使文档DB 100存储文档时,元数据接收模块106可以将该文档的元数据登记到元数据DB108中。元数据可以是与文档无关的信息(例如,诸如事件、项目等的相关信息)、以及该文档的名称、属性等。此外,元数据接收模块106可以基于存储于文档DB 100中的文档利用日本未审查专利申请公开No.2000-010996中公开的技术来产生元数据。
文档DB 100连接至文档上传模块104和元数据对应文档输出模块130。文档DB 100是存储文档的数据库。
元数据DB 108连接至元数据接收模块106、元数据提取模块112、元数据结构处理模块114、图表生成模块116、元数据重要性计算模块118、元数据检索模块120、和元数据呈现模块126。元数据DB 108是存储多个元数据条目和所述多个元数据条目之间的关联的数据库。
要存储到元数据DB 108中的元数据包括例如事件元数据登记表格700、文档元数据登记表格800、和项目元数据登记表格900。图7、图8和图9是分别示出事件元数据登记表格700、文档元数据登记表格800、和项目元数据登记表格900的数据结构示例的说明性示意图。事件元数据登记表格700包含元数据名称字段710和元数据值字段720。 元数据名称字段710存储属性的名称。元数据值字段720存储各属性的值。文档元数据登记表格800包含元数据名称字段810和元数据值字段820。元数据名称字段810存储属性的名称。元数据值字段820存储各属性的值。项目元数据登记表格900包含元数据名称字段910和元数据值字段920。元数据名称字段910存储属性的名称。元数据值字段920存储各属性的值。
例如,针对元数据名称字段710中的“标题”的元数据值字段720中的信息可以提取为要被呈现的元数据。这同样适用于文档元数据登记表格800、和项目元数据登记表格900。
图6中示出的目录结构(树结构)是存储在元数据DB 108中的多个元数据条目之间的关联的示例。这些示例示出了事件、文档、和项目这三个目录结构。在第一目录结构中,在事件610的下级提供了首次会议(kick off)612、周报告会618、和例会620。战略报告614和报告616设置在首次会议612的下级。在第二目录结构中,在文档630的下级设置周报告632、战略报告614和报告616。T2Prj 634和首次会议612设置在战略报告614的下级。在第三目录结构中,T1Prj 652和T2Prj 634设置在项目650的下级。相同的元件以相同的参考标号表示。例如,设置在位于图6左侧的第一目录结构中首次会议612下级的战略报告614与设置在位于图6中间的第二目录结构中文档630下级的战略报告614相同。
相关元数据是与目录结构中的目标元数据具有父关系或子关系的元数据。在这些示例中,目录结构中的父亲仅表示目标元数据右上方的元数据,而目录结构中的孩子仅表示目标元数据右下方的元数据。然而,这仅是示例性的。相关元数据可以包括兄弟(具有同一父亲的元数据)、父亲的父亲、孩子的孩子等。例如,与事件610相关的元数据包括首次会议612、周报告会618、和例会620。例如,与首次会议612相关的元数据包括事件610、战略报告614、和报告616。
元数据DB 108以利用关键字检索元数据的方式存储文档管理表格500。图5是示出文档管理表格500的数据结构示例的说明性示意图。文档管理表格500包含文档ID字段510、关键字字段520、元数据字 段530、和存储位置字段540。
在该示例实施例中,用作唯一识别文档的信息的文档ID存储在文档ID字段510中。
分配给文档的关键字存储在关键字字段520中。该关键字用于进行检索。可以将多个关键字存储在关键字字段520中。
文档的元数据存储在元数据字段530中。元数据用于被呈现。例如,元数据可以包括文档的文档名称、属性等。
文档在文档DB 100中的存储位置存储在存储位置字段540中。例如,文档、URL等存储在存储位置字段540中。
尽管以上说明了其中存储了关于与文档有关的元数据等的信息的示例,但是还可以存储与文档无关的信息。
元数据处理模块110包括元数据提取模块112、元数据结构处理模块114、图表生成模块116、和元数据重要性计算模块118。
元数据提取模块112连接至元数据DB 108和元数据结构处理模块114。在选择了由元数据呈现模块126呈现的元数据的情况下,元数据提取模块112从元数据DB 108中提取与所选元数据相关的元数据。例如,信息的选择是根据由操作者执行且由检索UI模块124检测到的选择操作进行的。与目标元数据相关的元数据可以通过遵循上述目录结构汇总的目标元数据并检索与该目标元数据具有父或子关系的元数据进行提取。
元数据结构处理模块114连接至元数据DB 108、元数据提取模块112、和图表生成模块116。元数据结构处理模块114提取关于元数据或多个元数据条目之间的关联的特征。
例如,元数据结构处理模块114可以提取元数据被选择的时刻或选择与该元数据相关的元数据的时刻作为关于元数据的特征。此处,“选择与元数据(B)相关的元数据(A)的时刻”表示根据信息(A)的选择而呈现信息(B)的时刻。
此外,例如在选择了元数据的情况下,元数据结构处理模块114可以提取与该元数据相关的元数据条目的数量、或与该元数据相关的元数据条目已被选择的次数作为关于该元数据的特征。此处,“在选 择元数据(A)的情况下,与该元数据相关的元数据(B)的条目数量”表示根据对元数据(A)的选择而呈现的元数据(B)的条目数量。
此外,例如,元数据结构处理模块114可以提取基于路径中彼此相关联的所选元数据和目标元数据之一已被选择的次数的值,作为关于多个元数据条目之间的关联的特征。
图表生成模块116连接至元数据DB 108和元数据结构处理模块114。图表生成模块116生成由元数据提取模块112提取的多个元数据条目之间的关联的图表。例如,图表生成模块116生成有向非循环图(DAG)等。该图表包括多个节点和表明这些节点之间的关联的边缘(也称作弧等)。元数据对应于节点。在选择了所呈现的元数据(A)并提取了与元数据(A)相关的元数据(B)的情况中,在这两个元数据条目(节点)之间生成边缘。边缘具有方向。在上述示例中,生成了从元数据(A)指向元数据(B)的边缘。此处生成的图表可以与由元数据呈现模块126呈现在检索UI显示屏幕134上的图表不同。即,尽管由元数据呈现模块126呈现在检索UI显示屏幕134上的图表具有有限数量的待呈现元数据条目,但是由图表生成模块116生成的图表不具有有限数量的元数据条目,这是因为该图表是根据由元数据提取模块112提取的元数据(与所选的元数据相关的元数据)和多个元数据条目之间的关联生成的。
元数据重要性计算模块118连接至元数据DB 108。在元数据呈现模块126呈现由元数据提取模块112提取的元数据、并且要呈现的元数据条目的数量大于或大于等于预定数量的情况下,元数据重要性计算模块118基于由元数据结构处理模块114提取的特征限制要呈现的元数据。即,在检索UI显示屏幕134上的元数据的条目数量小于或等于预定数量。
此外,例如,元数据重要性计算模块118可以根据基于由元数据结构处理模块114提取的特征的值和预定阈值的比较结果,来限制通过选择要由元数据呈现模块126呈现的元数据、或在已由元数据呈现模块126呈现了元数据的情况下选择将要删除元数据呈现模块126对其进行呈现的信息而呈现的元数据。即,在将新呈现的元数据的数量 大于或大于等于预定数量的情况下,从检索UI显示屏幕134删除已经呈现的元数据。
元数据检索模块120连接至元数据DB 108、检索UI模块124、和元数据对应文档检索模块128。元数据检索模块120根据由操作者进行的检索操作等来利用由检索UI模块124接收的关键字等在元数据DB 108中检索元数据。
元数据显示模块122包括检索UI模块124、元数据呈现模块126、和检索UI显示屏幕134。
检索UI模块124连接至元数据检索模块120、元数据呈现模块126、和检索UI显示屏幕134。检索UI模块124接收由操作者执行的检索操作,并将用于检索的关键字传递至元数据检索模块120。检索UI模块124还检测操作者对呈现在检索UI显示屏幕134上的元数据进行的选择操作。当检测到选择操作时,检索UI模块124将所选择的元数据传递至元数据提取模块112。
元数据呈现模块126连接至元数据DB 108和检索UI模块124。元数据呈现模块126将元数据呈现给检索UI显示屏幕134。元数据呈现模块126还利用箭头等呈现多个元数据条目之间的关联。元数据呈现模块126呈现其呈现受到元数据重要性计算模块118的限制的元数据。
元数据呈现模块126还可以呈现表明其呈现被删除了的元数据已经在之前呈现过的信息(图表、标记、图形形式等)。
元数据对应文档检索模块128连接至元数据检索模块120和元数据对应文档输出模块130。元数据对应文档检索模块128在文档DB 100中检索与元数据相关的文档。例如,在元数据是文档的名称、属性等的情况中,元数据对应文档检索模块128在文档DB 100中检索所述文档。在元数据是与文档无关的信息的情况下,元数据对应文档检索模块128可以呈现与文档无关的元数据,或可以预先准备其中使元数据与文档相关联的表格,并基于该表格检索对应于该元数据的文档。
元数据对应文档输出模块130连接至文档DB 100、元数据对应文档检索模块128、和文档输出屏幕136。元数据对应文档输出模块130 从文档DB 100中提取由元数据对应文档检索模块128找到的文档,并将提取到的文档输出为文档输出屏幕136。
检索/输出模块132包括检索UI显示屏幕134和文档输出屏幕136。
检索UI显示屏幕134连接至检索UI模块124和文档输出屏幕136。检索UI显示屏幕134是用于接收检索关键字以及用于呈现作为检索结果的元数据(包括表明多个元数据条目之间的关联的箭头等)等。后文将参照图10等来描述检索UI显示屏幕134的示例。
文档输出屏幕136连接至元数据对应文档输出模块130和检索UI显示屏幕134。文档输出屏幕136是用于呈现由元数据对应文档输出模块130输出的文档的屏幕。
检索UI显示屏幕134和文档输出屏幕136呈现在示例实施例中提供的呈现装置(液晶显示器、触摸面板等)上。
图2是示出根据示例实施例的处理示例的流程图。
在步骤S202中,检索UI模块124接收关键字。图10是示出元数据呈现转换示例的说明性示意图。在图10的部分(A)的示例中示出的显示屏幕1000上,呈现了关键字接收区1010、检索指令按钮1020、和鼠标光标1030。在关键字接收区1010中,描述了用于进行检索的关键字。当根据操作者进行的操作而由鼠标光标1030选中检索指令按钮1020时,检索UI模块124接收关键字接收区1010内的字符串作为关键字。
在步骤S204中,元数据检索模块120在元数据DB 108中检索元数据。例如,元数据检索模块120可以在文档管理表格500的关键字字段520中检索在步骤S202中接收到的关键字,并提取对应于该关键字的元数据。
在步骤S206中,元数据呈现单元126呈现找到的元数据。在图10的部分(B)的示例中所示的显示屏幕1000上,呈现了事件610、文档630、和项目650,它们是在步骤S204中找到的元数据。这些元数据的安排可以通过将显示屏幕1000均等地分为要呈现的元数据的数量来确定。
在步骤S208中,检索UI模块124确定是否输出文档。如果确定要输出文档,则处理行进到步骤S220。如果确定不输出文档,则处理行进到步骤S210。例如,在已经由操作者针对对应于目标元数据的文档执行了文档输出操作的情况下,处理行进到步骤S220。
在步骤S210中,检索UI模块124接收所选的元数据。例如,在检测到由操作者针对呈现在检索UI显示屏幕134上的元数据执行的选择操作的情况下,则该元数据对应于所选的元数据。
在步骤S212中,元数据提取模块112和元数据结构处理模块114获取相关联的元数据。元数据提取模块112和元数据结构处理模块114获取与在步骤S210中选择的元数据相关联的元数据。
在步骤S214中,元数据重要性计算模块118计算重要性。后文将参照图3描述重要性的计算。
在步骤S216中,元数据呈现模块126生成要呈现的图表。后文将参照图4描述要呈现的图表的生成。
在步骤S218中,元数据呈现模块126呈现所生成的图表。在图10的部分(C)的示例中示出的显示屏幕1000上,从图10的部分(B)的示例中示出的状态选择了事件610,并且首次会议612、周报告会618、和例会620作为与事件610相关联的元数据而被呈现。此外,在事件610和首次会议612之间、事件610和周报告会618之间、以及事件610和例会620之间呈现箭头。
在步骤S220中,元数据对应文档检索模块128从文档DB 100提取文档。
在步骤S222中,元数据对应文档输出模块130将该文档输出至文档输出屏幕136。
图3是示出根据本发明示例实施例的处理(步骤S214)的示例的流程图。
在步骤S302中,元数据提取模块112生成或改变节点信息。元数据提取模块112生成对应于所找到或所选的元数据的节点信息。在已经生成了节点信息的情况下,元数据提取模块112改变对应于元数据的节点信息。对于与所选元数据相关联的元数据,元数据提取模块112 生成对应于该相关联元数据的节点信息。在已经生成了节点信息的情况下,元数据提取模块112改变对应于该相关联元数据的节点信息。节点和元数据以一对一的关系相互关联。然而,在选择了所找到的元数据或所呈现的元数据并提取了与所选的元数据相关联的元数据的情况下,将所提取的元数据称作节点。即,通过选择操作生成图表结构的情况中的元数据称作节点。
例如,节点信息包括<node_id><timestamp><update_timestamp><active_count><out_edge><in_edge>。
在节点信息中,<node_id>可以唯一标识该示例实施例中的节点。在节点信息中,<timestamp>表明节点被找到或被选择的事件(此处,该时间是年、月、日、时、分、秒、和小于秒的时间单位,这也适用于下述说明)。在节点信息中,<update_timestamp>表明节点被找到或被选择的最近时间。在节点信息中,<active_count>在节点被选择的情况中表明与所选节点相关联的节点的数量(即,可通过选择而显示的节点的数量)或与所选节点相关联的节点已被选择的总次数。在节点信息中,<out_edge>表明唯一标识连接至该节点并从该节点指向另一个节点的边缘ID(edge id)。也就是说,当该节点被选择并提取了相关联节点时,生成<out_edge>。在节点信息中,<in_edge>表明唯一标识连接至该节点并从另一节点指向该节点的边缘ID。也就是说,当选择了与该节点相关联的节点并提取了目标节点时,生成<in_edge>。
在下文参照图12描述的节点数据表格1200中,节点信息可以包括<disctence>。
在步骤S304中,元数据结构处理模块114生成或改变边缘信息。在新生成了多个节点间的关联的情况下(在生成了新节点或在现有节点间生成了新边缘的情况下),元数据结构处理模块114生成边缘信息。在与一个边缘相关联的两个节点之一被选择的情况下,改变边缘信息。
例如,边缘信息包括<edge_id><active_timestamp><update_active_timestamp><active_count><from><to>。
在边缘信息中,<edge_id>唯一标识该示例实施例中的边缘。在边缘信息中,<active_timestamp>表明与该边缘相关联的节点被找到或被选择的时间。在边缘信息中,<update_active_timestamp>表明与该边缘相关联的节点被找到或被选择的最近时间。在边缘信息中,<active_count>表明与该边缘相关联的节点已被找到或被选择的次数。由于在选择节点时生成了边缘,因此<active_count>的初始值为“1”。在与该边缘相关联的两个节点之一被选择时,<active_count>增加。在边缘信息中,<from>是唯一标识边缘的源节点的边缘ID。即,<from>标识在生成边缘的情况中所找到或所选择的节点。在边缘信息中,<to>表明唯一标识边缘指向的节点的边缘ID。即,<to>表明与在生成边缘的情况中所找到或所选择的节点相关联的节点(所提取的节点)。
在步骤S306中,图表生成模块116生成图表结构。例如,图表生成模块116基于节点信息和边缘信息生成用于生成DAG的图表结构。
在步骤S308中,元数据重要性计算模块118按照升序对节点信息中的<update_timestamp>值进行排序以计算得分1。即,该顺序被定义为得分1。
在步骤S310中,元数据重要性计算模块118基于节点信息中的<active_count>值计算得分2。
在步骤S312中,元数据重要性计算模块118基于边缘权重和至当前节点的路径计算得分3。即,得分3是基于路径中相互关联的所选节点和目标节点之一已被选择的次数计算出来的。更具体的,提取当前所选节点和将要计算其重要性的节点之间的路径的边缘,并获得该边缘的<active_count>的倒数。在有多个边缘作为路径而存在的情况中,各边缘的<active_count>的倒数和被计算作为得分3。
在步骤S314中,元数据重要性计算模块118基于得分1、2、和3计算节点的重要性。得分1、2、和3中的任一可以直接用作重要性。可替换的,重要性可以基于得分1、2、和3中的两个或更多的组合来计算。
例如,可以如下计算重要性:
重要性cid=w1*得分1+w2*得分2+w3*得分3,
其中,“w1”、“w2”、“w3”代表预定权重系数。在较高值的重要性代表较高的重要性(代表具有较高重要性的节点较不可能被删除)的情况中,“w3”代表负值。可替换的,可以如下计算重要性:
重要性cid=w1*得分1+w2*得分2+w3/得分3。
在步骤S316中,元数据重要性计算模块118将重要性写入元数据DB 108。
在步骤S318中,元数据提取模块112确定是否存在任何目标元数据。如果确定存在目标元数据,则处理返回步骤S302。如果确定不存在目标元数据,则处理结束(步骤S399)。
图4是示出根据示例实施例的处理示例(步骤S216)的流程图。
在步骤S402中,元数据提取模块112和元数据结构处理模块114获取目标元数据。例如,可以提取由图表生成模块116生成的图表中的元数据。所提取的元数据的条数是可以呈现的元数据的最大条数。
在步骤S404中,元数据呈现模块126确定目标元数据的条数是否大于可以呈现的元数据的最大条数。如果确定目标元数据的条数大于可以呈现的元数据的最大条数,则处理行进到步骤S406。如果确定目标元数据的条数小于或等于可以呈现的元数据的最大条数,则处理行进到步骤S408。可以呈现的元数据的最大条数是预定数量。
在步骤S406中,元数据呈现模块126基于元数据的重要性选择少于或等于可以呈现的元数据的最大条数的多条元数据作为要被呈现的元数据。例如,可以基于元数据的重要性按照降序进行排序,并且可以从具有最高重要性的元数据中选择可以呈现的最大条数的元数据。显然,可以以相似的方式选择其选中将被删除的节点。
在步骤S408中,元数据呈现模块126生成要呈现的图表。可以呈现表明其呈现被删除的信息已经在之前呈现过的信息。
图10是示出元数据的呈现转换示例的说明性示意图。
上面已在步骤S202中描述了图10的部分(A)的示例中所示的显示屏幕1000。
上面已在步骤S206中描述了图10的部分(B)的示例中所示的显示屏幕1000。上面已在步骤S218中描述了图10的部分(C)的示 例中所示的显示屏幕1000。可以呈现的元数据的最大条数设置为10。
在图10的部分(D)的示例中所示的显示屏幕1000中,从图10的部分(C)的示例中所示的状态中选择了文档630,并且战略报告614、报告616、和周报告632作为与文档630相关联的元数据被呈现。此外,在文档630和战略报告614之间、文档630和报告616之间、文档630和周报告632之间呈现了箭头。
在图10的部分(E)的示例中所示的显示屏幕1000中,从图10的部分(D)的示例中所示的状态中选择了首次会议612。没有元数据作为与首次会议612相关联的元数据新被呈现。在首次会议612和已经呈现的战略报告614之间、以及首次会议612和已经呈现的报告616之间呈现了箭头。还在首次会议612和事件610之间呈现了反向箭头。
在图10的部分(F)的示例中所示的显示屏幕1000中,从图10的部分(E)的示例中所示的状态中选择了项目650。T1Prj 652和T2Prj634要被作为与项目650相关联的元数据进行呈现。然而,要呈现的元数据的条数是11,超过了可以呈现的元数据的最大条数“10”。从而,基于重要性cid从要呈现的多条元数据中删除元数据,以使得要呈现的元数据的条数不超过可以呈现的元数据的最大条数。更具体地,如后文参照图22至图24所述删除元数据。
在图10的部分(G)的示例中示出的显示屏幕1000中,从图10的部分(F)的示例中所示的状态中选择了T2Prj 634。没有元数据作为与T2Prj 634相关联的元数据新被呈现。在T2Prj 634和已经呈现的战略报告614之间呈现了箭头。还在T2Prj 634和项目650之间呈现了反向箭头。然而,要呈现的元数据的条数(由图表生成模块116生成的图表中的节点数)为11,其超过了可以呈现的元数据的最大条数“10”。从而,删除了周报告会618和例会620。显然,还删除了事件610和周报告会618以及事件610和例会620之间的箭头的呈现。然后,呈现了T1Prj 652和T2Prj 634。此外,在项目650和T1Prj 652之间以及项目650和T2Prj 634之间呈现了箭头。
图11是示出图10的部分(B)的示例中所示的显示屏幕1000的示例的说明性示意图。将参照图12描述该状态中的节点数据表格1200。 节点数据表格1200包含节点字段1210、id字段1220、timestamp字段1230、update_timestamp字段1240、active_count字段1250、out_edge字段1260、in_edge字段1270、和disctence字段1280。节点字段1210存储节点信息(要呈现的元数据)的名称。id字段1220存储节点信息的<node_id>。timestamp字段1230存储节点信息的<timestamp>。update_timestamp字段1240存储节点信息的<update_timestamp>。active_count字段1250存储节点信息的<active_count>。out_edge字段1260存储节点信息的<out_edge>。in_edge字段1270存储节点信息的<in_edge>。disctence字段1280存储对应于得分3的值。此处,仅呈现找到的元数据,并且不存在边缘信息。从而,将“-1”存储为初始值。在于所选节点和该节点(节点数据表格1200中每行中的节点)之间存在路径的情况下,存储非“-1”的值。
节点数据表格1200由元数据结构处理模块114和元数据重要性计算模块118生成和改变。
图13是示出图10的部分(C)的示例中所示的显示屏幕1000的示例的说明性示意图。将参照图14说明该状态下的节点数据表格1200。此外,将参照图15说明该状态下的边缘数据表格1500。
图14示例中所示的节点数据表格1200与图12示例中所示的节点数据表格1200的区别之处在于:对节点字段1210添加了“首次会议”(id=3)行、“周报告会”(id=4)行、和“例会”(id=5)行,并且timestamp字段1230和update_timestamp字段1240存储了“00:05”,active_count字段1250存储了“1”,out_edge字段1260存储了“null”,in_edge字段1270存储了“e0”、“e1”、和“e2”,并且disctence字段1280存储了“1”。
active_count字段1250中的值“1”表示与该节点相关联的节点当时已经被选择的次数。
disctence字段1280中的值“1”表示通过将边缘数据表格1500中的active_count字段1540中路径的各边缘的倒数相加得到的结果。更具体的,例如,只存在边缘e0作为从首次会议612到事件610的路径,边缘e0的active_count字段1540为“1”,而“1”的倒数是“1”。
在节点字段1210中的事件行(id=0)中,update_timestamp字段1240的值改变为“00:05”,active_count字段1250的值改变为“3”,out_edge字段1260的值改变为“e0”、“e1”、和“e2”,并且disctence字段1280的值改变为“0”。
在选择了节点的情况下,active_count字段1250中的改变后的值“3”代表与该节点相关联的节点(首次会议612,周报告会618、和例会620)的数量。
disctence字段1280中的值“0”代表选择了该节点。
图15是示出边缘数据表格1500的数据结构的示例的说明性示意图。边缘数据表格1500包含edge id字段1510、active_timestamp字段1520、update_active_timestamp字段1530、和active_count字段1540。edge id字段1510存储边缘信息的<node_id>。active_timestamp字段1520存储边缘信息的<active_timestamp>。update_active_timestamp字段1530存储边缘信息的<update_active_timestamp>。active_count字段1540存储边缘信息的<active_count>。
此处,由于边缘是在选择了事件610的节点的情况下生成的,因此active_count字段1540存储“1”。
图16是示出图10的部分(D)中所示状态中显示屏幕1000的示例的说明性示意图。将参照图17说明该状态下的节点数据表格1200。此外,将参照图18说明该状态下的边缘数据表格1500。
图17示例中所示的节点数据表格1200与图14示例中所示的节点数据表格1200的区别之处在于,对节点字段1210添加了“战略报告”行(id=6)、“报告”行(id=7)、和“周报告”行(id=8),timestamp字段1230和update_timestamp字段1240存储“00:10”,active_count字段1250存储“1”,out_edge字段1260存储“null”,in_edge字段1270存储“e3”、“e4”、和“e5”,并且disctence字段1280存储“1”。disctence字段1280中的“1”代表通过将边缘数据表格的active_count字段1540中各路径的边缘的倒数求和而得到的结果。更具体的,例如,仅存在边缘e3作为从战略报告614到文档630的路径,该边缘e3的active_count字段1540的值为“1”,而“1”的倒数为“1”。
在节点字段1210中的“事件”(id=0)行中,disctence字段1280的值改变为“-1”。在节点字段1210中的“文档”(id=2)行中,update_timestamp字段1240的值改变为“00:10”,active_count字段1250的值改变为“3”,out_edge字段1260的值改变为“e3”、“e4”、和“e5”,并且disctence字段1280的值改变为“0”。在节点被选择的情况下,active_count字段1250中的改变后的值“3”代表与该节点相关联的节点(战略报告614、报告616、和周报告632)的数量。disctence字段1280中的改变后的值“0”代表当前选择的节点是文档630。
在“首次会议”(id=3)行、“周报告”(id=4)行、和“例会”(id=5)行中,disctence字段1280的值改变为“-1”。disctence字段1280中的改变后的值“-1”代表在当前选择的文档630和节点之间不存在路径。
图18的示例中所示的边缘数据表格1500与图15的示例中所示的边缘数据表格1500的区别之处在于,对edge id字段1510添加了行“e3”、“e4”、和“e5”,active_timestamp字段1520和update_active_timestamp字段1530存储“00:10”,并且active_count字段1540存储“1”。
图19是示出图10的部分(E)中所示状态下的显示屏幕1000的示例的说明性示意图。将参照图20说明该状态下的节点数据表格。此外,将参照图21说明该状态下的边缘数据表格1500。
图20的示例中所示的节点数据表格1200与图17的示例所示的节点数据表格1200的区别之处在于,在节点字段1210中的“事件”(id=0)行中,update_timestamp字段1240的值改变为“00:15”,active_count字段1250的值改变为“4”,并且disctence字段1280的值改变为“0.5”。active_count字段1250中改变后的值“4”代表由于选择了与事件610相关联的首次会议612,因此将“1”与处于前一状态的图17的示例中所示的节点数据表格1200中的active_count字段1250的值“3”相加。disctence字段1280中的改变后的值“0.5”代表“2”的倒数为1/2,其中“2”是active_count字段1540中从当前选择的首次会议612到事件610的路径“e0”的值。
此外,在“文档”(id=2)行中,disctence字段1280的值改变为“2”。disctence字段1280中的改变后的值“2”代表由于active_count字段1540中从当前选择的首次会议612到文档630的路径(e6和e3或e7和e4)的值均为“1”并且“1”的倒数是“1”,因此“1”和“1”的和为“2”。
此外,在“首次会议”(id=3)行中,update_timestamp字段1240的值改变为“00:15”,active_count字段1250的值改变为“4”,out_edge字段1260的值改变为“e6e7”,并且disctence字段1280的值改变为“0”。
此外,在“周报告会”(id=4)行和“例会”(id=5)行中,disctence字段1280的值改变为“1.5”。改变后的值“1.5”代表例如由于active_count字段1540中从当前选择的首次会议612到周报告会618的路径(e0和e1)的值为“2”和“1”并且“2”和“1”的倒数是“1/2”和“1”,因此“1/2”和“1”的和为“1.5”。
此外,在“战略报告”(id=6)行中,update_timestamp字段1240的值改变为“00:15”,active_count字段1250的值改变为“2”,并且in_edge字段1270中的值改变为“e3e6”。
此外,在“报告”(id=7)行中,update_timestamp字段1240的值改变为“00:15”,active_count字段1250的值改变为“2”,并且in_edge字段1270中的值改变为“e4 e7”。
此外,在“周报告”(id=8)行中,disctence字段1280的值改变为“3”。disctence字段1280中的改变后的值“3”代表例如由于active_count字段1540中从当前选择的首次会议612到周报告632的路径(e6、e3、和e5或e7、e4、和e5)的值均为“1”并且“1”的倒数是“1”,因此“1”、“1”和“1”的和为“3”。
图21的示例中所示的边缘数据表格1500与图18的示例中所示的边缘数据表格1500的区别之处在于,对edge id字段1510添加了行“e6”和“e7”行,active_timestamp字段1520和update_active_timestamp字段1530存储“00:15”,并且active_count字段1540存储“1”。
在edge id字段1510中的“e0”行中,update_active_timestamp 字段1530改变为“00:15”,并且active_count字段1540的值改变为“2”。active_count字段1540中的改变后的值“2”代表由于选择了与边缘e0相关联的节点的首次会议612,因此将“1”与处于前一状态的图18的示例中所示的边缘数据表格1500的active_count字段1540中的“1”相加。
图22是示出图10的部分(F)的状态下显示屏幕1000的示例的说明性示意图。将参照图23说明该状态下的节点数据表格1200。此外,将参照图24说明该状态下的边缘数据表格1500。
图23的示例中所示的节点数据表格1200与图20的示例中所示的节点数据表格1200的区别之处在于,对节点字段1210添加了“T1”行(id=9)和“T2”行(id=10),timestamp字段1230存储“00:20”,update_timestamp字段1240对于“T1”存储“00:20”、对于“T2”存储“00:25”,active_count字段1250存储“1”,out_edge字段1260存储“null”,in_edge字段1270对于“T1”存储“e8”、对于“T2”存储“e9”,并且disctence字段1280存储“1”。
在节点字段1210中的“事件”(id=0)行中,disctence字段1280的值改变为“-1”。在“项目”(id=1)行中,update_timestamp字段1240的值改变为“00:20”,active_count字段1250的值改变为“2”,out_edge字段1260的值改变为“e8e9”,并且disctence字段1280的值改变为“0”。
此外,在“文档”(id=2)行、“首次会议”(id=3)行、“周报告会”(id=4)、“例会”(id=5)、“战略报告”(id=6)、“报告”(id=7)、和“周报告”(id=8)中,disctence字段1280的值改变为“-1”。
图24的示例中所示的边缘数据表格1500与图21的示例中所示的边缘数据表格1500的区别之处在于,对edge id字段1510添加了“e8”和“e9”行,active_timestamp字段1520和update_active_timestamp字段1530存储“00:20”,并且active_count字段1540存储“1”。
在该时间点,要呈现的元数据的条数为“11”,超过了可以呈现的元数据的最大条数。从而,通过基于权重系数w1、w2、和w3计算 重要性cid而删除重要性低的元数据。
图25是示出图10的部分(G)的状态下的显示屏幕1000的示例的说明性示意图。将参照图26说明该状态下的节点数据表格1200。此外,将参照图27说明该状态下的边缘数据表格1500。
图26的示例中所示的节点数据表格1200与图23的示例所示的节点数据表格1200的区别之处在于,在节点字段1210中的“事件”(id=0)行中,disctence字段1280的值改变为“2.5”。
此外,在“项目”(id=1)行中,update_timestamp字段1240的值改变为“00:25”,active_count字段1250的值改变为“3”,并且disctence字段1280的值改变为“0.5”。
此外,在“文档”(id=2)行和“首次会议”(id=3)行中,disctence字段1280的值改变为“2”。
此外,在“周报告会”(id=4)行和“例会”(id=5)行中,disctence字段1280的值改变为“3.5”。
此外,在“战略报告”(id=6)行中,update_timestamp字段1240的值改变为“00:25”,active_count字段1250的值改变为“3”,并且disctence字段1280的值改变为“1”。
此外,在“报告”(id=7)行和“周报告”(id=8)行中,disctence字段1280的值改变为“3”。
此外,在“T1”(id=9)行中,disctence字段1280中的值改变为“1.5”。在“T2”(id=10)行中,active_count字段1250的值改变为“3”,out_edge字段1260的值改变为“e10”,并且disctence字段1280的值改变为“0”。
图27的示例中所示的边缘数据表格1500与图24的示例中所示的边缘数据表格1500的区别之处在于,对edge id字段1510添加了“e10”行,active_timestamp字段1520和update_active_timestamp字段1530存储“00:25”,并且active_count字段1540存储“1”。
在edge id字段1510中的“e9”行,update_active_timestamp字段1530的值改变为“00:25”,并且active_count字段1540的值改变为“2”。
在该时间点,要呈现的元数据的条数(由图表生成模块116生成 的图表的节点数量)是11,超过了可以呈现的元数据的最大数量“10”。周报告会618和例会620表现出低得分1(update_timestamp字段1240的升序排序),周报告会618和例会620表现出低得分2(active_count字段1250),以及周报告会618和例会620表现出高得分3(disctence字段1280)(在得分3为高的情况下,更可能删除节点的呈现)。从而,在该时间点,删除了周报告会618和例会620的呈现。
此外,如图25所示,周报告会618和例会620可以以亮色呈现,或可以呈现周报告会(表明最近的删除的标记)1092和例会(表明最近的删除的标记)1094。
图28是示出节点数据转换2800的示例的说明性示意图。节点数据转换2800代表节点数据表格1200的时间序列转换。节点数据转换2800包括节点字段2810、id字段2820、timestamp字段2830、update_timestamp字段2840、active_count字段2860、和disctence字段2880。update_timestamp字段2840包括(B)字段2842、(C)字段2844、(D)字段2846、(E)字段2848、(F)字段2850、(G)字段2852。active_count字段2860包括(B)字段2862、(C)字段2864、(D)字段2866、(E)字段2868、(F)字段2870、(G)字段2872。disctence字段2880包括(B)字段2882、(C)字段2884、(D)字段2886、(E)字段2888、(F)字段2890、(G)字段2892。
涉及得分1、2、和3的update_timestamp字段2840、active_count字段2860、和disctence字段2880中表明了图12、图14、图17、图20、图23、和图26中的值。
如从节点数据转换2800清楚看到的,周报告会618(id=4)和例会620(id=5)被选择作为在图25的示例中所示的时间点处要被删除的元数据。也就是说,周报告会618(id=4)和例会620(id=5)是(G)字段2852中被选择或被显示最久的节点。周报告会618(id=4)和例会620(id=5)在(G)字段2872中表现出最小值,并在(G)字段2892中表现出最大值。
图29是示出所呈现的屏幕的示例的说明性示意图。图表生成模块116生成元数据图表2900A,并且元数据呈现模块126呈现元数据呈现 屏幕2900B。删除的数据可以以如下方式呈现:最近删除的元数据(在预定步骤(step)内过去删除的元数据)与所述预定步骤之前删除的元数据区分开。例如,添加了诸如部门B(最近的删除)2906的标记的元数据代表最近删除的元数据,这样的标记不可以添加至在添加了该标记的元数据被删除之前就被删除的元数据。
如图30所示,执行程序的据示例实施例的计算机的硬件构造是通用计算机的硬件构造,更具体地,是能够用作个人计算机、服务器等的计算机的硬件构造。也就是说,例如,CPU 3001用作处理单元(运算单元),而RAM 3002、ROM 3003、和HD 3004用作存储器件。HD3004可以是例如硬盘。计算机包括:CPU 3001,其执行程序,所述程序诸如文档上传模块104、元数据接收模块106、元数据提取模块112、元数据结构处理模块114、图表生成模块116、元数据重要性计算模块118、元数据检索模块120、检索UI模块124、元数据呈现模块126、元数据对应文档检索模块128、元数据对应文档输出模块130等;RAM3002,其存储上述程序和数据;ROM 3003,其存储用于启动计算机的程序;HD 3004,其用作辅助存储器件;接收装置3006,其基于用于对键盘、鼠标、触摸面板等的操作接收数据;输出装置3005,诸如阴极射线管(CRT)、液晶显示器等;通信线路接口,其允许与诸如网络接口卡的通信网络连接;以及总线3008,其允许各元件之间的连接以进行数据交换。多个这样的计算机可以通过网络连接。
在上述示例实施例中,关于计算机程序的示例实施例如下实现:将用作软件的计算机程序读取至具有硬件构造并使得该软件和硬件资源协作的***。
图30所示的硬件构造仅是一个示例。各示例实施例可以构成为使得可以实现在各示例实施例中说明的各模块。例如,一些模块可以利用专用硬件(例如,特定用途集成电路(ASIC))构造。一些模块可以布置在外部***中并可以通过通信线路进行连接。此外,图30所示的***可以通过通信线路进行连接,从而可以执行协作。此外,具体地,除了个人计算机以外,该***还可以并入家用信息电器、复印机、传真机、扫描仪、打印机、复合机(具有扫描仪、打印机、复印机、 传真机等中的两个或更多的图像处理设备)等。
可以采用相关技术中说明的技术作为上述各模块的处理细节。此外,在前述示例实施例的说明中,相比于预定值,“等于或大于”、“小于或等于”、“大于”、以及“小于”可以是“大于”、“小于”、“等于或大于”、以及“小于或等于”,只要保持组合的一致即可。
上述程序可以存储在要提供的记录介质中或可以由通信单元提供。在这种情况下,例如上述程序可以被看作是关于“记录有程序的计算机可读记录介质”的发明。
“记录有程序的计算机可读记录介质”是记录有程序的计算机可读记录介质,其中记录介质用于安装程序、运行程序、流通程序等。
记录介质是例如由DVD论坛开发的数字通用可记录光盘(DVD-R)、可重写DVD(DVD-RW)、DVD-RAM等、由DVD+RW开发的DVD+R、DVD+RW等、压缩光盘只读存储器(CD-ROM)、可记录CD(CD-R)、可重写CD(CD-RW)、蓝光盘(注册商标)、磁光盘(MO)、软磁盘(FD)、磁带、硬盘、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM(注册商标))、闪存、随机存取存储器(RAM)、安全数字(SD)存储器卡等。
上述程序或上述程序的一部分可以记录在记录介质中以存储或流通。此外,程序可以通过例如局域网(LAN)、城域网(MAN)、广域网(WAN)、用于Internet、intranet、extranet的有线或无线网络、或利用上述一些网络的组合的传输介质传输,或可以承载在载波上。
此外,上述程序可以是不同程序的一部分或可以与不同的程序一起记录在记录介质中。程序可以分割并记录在多个记录介质中。程序可以以任何形式记录,只要可以进行恢复(诸如压缩或加密)即可。
前文已经出于例示和说明的目的提供了对本发明示例性实施例的说明。该描述并非排他性的或者将本发明限制为所公开的精确形式。显然,各种修改和变型对于本领域技术人员来说是显而易见的。这些实施例的选择和描述是为了对本发明的原理及其实际应用进行最佳的阐述,以使得本领域的其他技术人员能够理解本发明的各种实施例以及适用于具体应用场合的各种变型。本发明的范围应当由权利 要求及其等同部分限定。

Claims (10)

1.一种信息处理设备,包括:
呈现单元,其呈现信息;
检测选择单元,其检测操作者对所述呈现单元所呈现的信息进行的选择;
信息提取单元,其响应于所述检测选择单元检测到操作者选择了由呈现单元呈现的信息,从存储多个信息条目和所述多个信息条目之间的关联的存储单元提取与操作者所选信息相关联的信息;
特征提取单元,其提取关于所述多个信息条目和所述多个信息条目之间的关联的特征;以及
限制单元,其在呈现单元呈现由信息提取单元提取的信息、并且要被呈现的信息条目的数量大于或大于等于预定数量的情况下,基于由特征提取单元提取的特征,限制要在呈现单元呈现的由信息提取单元提取的信息,
其中,所述限制单元通过选择要被所述呈现单元呈现的信息来限制要呈现的信息,或者在已经由所述呈现单元呈现了信息的情况下,所述限制单元根据基于由所述特征提取单元提取的特征的值和预定阈值之间的比较结果来选择要被删除由呈现单元对其进行呈现的信息来限制要呈现的信息。
2.根据权利要求1所述的信息处理设备,其中,所述特征提取单元提取信息被选择的时刻或与该信息相关联的信息被选择的时刻作为关于该信息的特征。
3.根据权利要求1所述的信息处理设备,其中,在选择了所述信息的情况下,所述特征提取单元提取与所选信息相关联的信息条目的数量或与所选信息相关联的信息已经被选择的次数作为关于所选信息的特征。
4.根据权利要求2所述的信息处理设备,其中,在选择了所述信息的情况下,所述特征提取单元提取与所选信息相关联的信息条目的数量或与所选信息相关联的信息已经被选择的次数作为关于所选信息的特征。
5.根据权利要求1所述的信息处理设备,其中,所述特征提取单元提取基于路径中彼此相关联的所选信息和目标信息之一已经被选择的次数的值,来作为关于所述多个信息条目之间的关联的特征。
6.根据权利要求2所述的信息处理设备,其中,所述特征提取单元提取基于路径中彼此相关联的所选信息和目标信息之一已经被选择的次数的值,来作为关于所述多个信息条目之间的关联的特征。
7.根据权利要求3所述的信息处理设备,其中,所述特征提取单元提取基于路径中彼此相关联的所选信息和目标信息之一已经被选择的次数的值,来作为关于所述多个信息条目之间的关联的特征。
8.根据权利要求4所述的信息处理设备,其中,所述特征提取单元提取基于路径中彼此相关联的所选信息和目标信息之一已经被选择的次数的值,来作为关于所述多个信息条目之间的关联的特征。
9.根据权利要求1至8中的任一项所述的信息处理设备,其中,所述呈现单元呈现表明由所述限制单元删除了对其进行呈现的信息已经在之前呈现过的信息。
10.一种信息处理方法,包括:
呈现信息;
检测操作者对所呈现的信息进行的选择;
响应于检测到操作者选择了所呈现的信息,提取与操作者所选择的信息相关联的信息;
提取多个信息条目和所述多个信息条目之间的关联的相关特征;以及
在呈现所提取的信息、并且要被呈现的信息条目的数量大于或大于等于预定数量的情况下,基于所提取的特征,限制要呈现的与操作者所选择的信息相关联的信息,
其中,通过选择要被所述呈现单元呈现的信息来限制要呈现的信息,或者在已经呈现了信息的情况下,根据基于所提取的特征的值和预定阈值之间的比较结果来选择针对其的呈现要被删除的信息来限制要呈现的信息。
CN201210061835.9A 2011-09-21 2012-03-09 信息处理设备和信息处理方法 Active CN103020095B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011205991A JP5810792B2 (ja) 2011-09-21 2011-09-21 情報処理装置及び情報処理プログラム
JP2011-205991 2011-09-21

Publications (2)

Publication Number Publication Date
CN103020095A CN103020095A (zh) 2013-04-03
CN103020095B true CN103020095B (zh) 2017-09-01

Family

ID=47881641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210061835.9A Active CN103020095B (zh) 2011-09-21 2012-03-09 信息处理设备和信息处理方法

Country Status (4)

Country Link
US (1) US9176954B2 (zh)
JP (1) JP5810792B2 (zh)
CN (1) CN103020095B (zh)
AU (1) AU2012201069B2 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6372056B2 (ja) * 2013-07-05 2018-08-15 富士ゼロックス株式会社 情報処理装置及び表示制御プログラム
WO2015141101A1 (ja) * 2014-03-20 2015-09-24 日本電気株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP6280859B2 (ja) * 2014-11-20 2018-02-14 日本電信電話株式会社 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム
CN110210640A (zh) * 2019-06-20 2019-09-06 南京旅游职业学院 一种会议室预定的信息处理方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755681A (zh) * 2004-09-30 2006-04-05 微软公司 管理电子文档中特类内容的方法、装置和计算机可读介质

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0511952A (ja) * 1991-07-05 1993-01-22 Ricoh Co Ltd 情報表示方法及び装置
US6490620B1 (en) * 1997-09-26 2002-12-03 Worldcom, Inc. Integrated proxy interface for web based broadband telecommunications management
JP3665480B2 (ja) * 1998-06-24 2005-06-29 富士通株式会社 文書整理装置および方法
US20030050927A1 (en) * 2001-09-07 2003-03-13 Araha, Inc. System and method for location, understanding and assimilation of digital documents through abstract indicia
US7885987B1 (en) * 2001-08-28 2011-02-08 Lee Eugene M Computer-implemented method and system for managing attributes of intellectual property documents, optionally including organization thereof
JP4344105B2 (ja) * 2001-09-12 2009-10-14 セイコーエプソン株式会社 ソースファイル生成装置
US7228496B2 (en) * 2002-07-09 2007-06-05 Kabushiki Kaisha Toshiba Document editing method, document editing system, server apparatus, and document editing program
JP4084647B2 (ja) * 2002-12-11 2008-04-30 株式会社 日立東日本ソリューションズ 情報検索システム、情報検索方法及び情報検索プログラム
US20040148278A1 (en) * 2003-01-22 2004-07-29 Amir Milo System and method for providing content warehouse
US20060036615A1 (en) * 2004-08-12 2006-02-16 International Business Machines Corporation Method, system, and computer program product for navigating and displaying very large trees
US8332738B2 (en) * 2005-08-31 2012-12-11 Sap Ag Method for enforcing group oriented workflow requirements for multi-layered documents
WO2008006197A1 (en) * 2006-07-09 2008-01-17 90 Degree Software Inc. Methods and apparatus for reusing data access and presentation elements
US20080028308A1 (en) * 2006-07-31 2008-01-31 Black Fin Software Limited Visual display method for sequential data
US9015301B2 (en) * 2007-01-05 2015-04-21 Digital Doors, Inc. Information infrastructure management tools with extractor, secure storage, content analysis and classification and method therefor
US8655939B2 (en) * 2007-01-05 2014-02-18 Digital Doors, Inc. Electromagnetic pulse (EMP) hardened information infrastructure with extractor, cloud dispersal, secure storage, content analysis and classification and method therefor
US8468244B2 (en) * 2007-01-05 2013-06-18 Digital Doors, Inc. Digital information infrastructure and method for security designated data and with granular data stores
US8145677B2 (en) * 2007-03-27 2012-03-27 Faleh Jassem Al-Shameri Automated generation of metadata for mining image and text data
JP4894658B2 (ja) * 2007-07-18 2012-03-14 ソニー株式会社 表示制御装置および方法、並びにプログラム
US8463779B2 (en) * 2007-10-30 2013-06-11 Yahoo! Inc. Representative keyword selection
US11461785B2 (en) * 2008-07-10 2022-10-04 Ron M. Redlich System and method to identify, classify and monetize information as an intangible asset and a production model based thereon
US8205242B2 (en) * 2008-07-10 2012-06-19 Mcafee, Inc. System and method for data mining and security policy management
JP4911389B2 (ja) * 2009-09-30 2012-04-04 Necビッグローブ株式会社 情報表示システム、サーバ、端末、及び方法
US20110119262A1 (en) * 2009-11-13 2011-05-19 Dexter Jeffrey M Method and System for Grouping Chunks Extracted from A Document, Highlighting the Location of A Document Chunk Within A Document, and Ranking Hyperlinks Within A Document
JP5522721B2 (ja) * 2009-11-14 2014-06-18 アルパイン株式会社 オーディオ装置
US8780130B2 (en) * 2010-11-30 2014-07-15 Sitting Man, Llc Methods, systems, and computer program products for binding attributes between visual components
US9026907B2 (en) * 2010-02-12 2015-05-05 Nicholas Lum Indicators of text continuity
US8396894B2 (en) * 2010-11-05 2013-03-12 Apple Inc. Integrated repository of structured and unstructured data
US8442982B2 (en) * 2010-11-05 2013-05-14 Apple Inc. Extended database search

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755681A (zh) * 2004-09-30 2006-04-05 微软公司 管理电子文档中特类内容的方法、装置和计算机可读介质

Also Published As

Publication number Publication date
JP2013069042A (ja) 2013-04-18
AU2012201069A1 (en) 2013-04-04
US20130073549A1 (en) 2013-03-21
CN103020095A (zh) 2013-04-03
US9176954B2 (en) 2015-11-03
JP5810792B2 (ja) 2015-11-11
AU2012201069B2 (en) 2014-01-16

Similar Documents

Publication Publication Date Title
JP2017224184A (ja) 機械学習装置
KR100706389B1 (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
US20070219994A1 (en) Methods and systems for displaying media utilizing user-generated data
US9535954B2 (en) Join processing device, data management device, and string similarity join system
JP2014134991A (ja) パターン抽出装置および制御方法
JP5556711B2 (ja) カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム
US20240211496A1 (en) Systems and Methods for Determining Entity Attribute Representations
CN103020095B (zh) 信息处理设备和信息处理方法
US20210173857A1 (en) Data generation device and data generation method
US10296635B2 (en) Auditing and augmenting user-generated tags for digital content
JP6972935B2 (ja) 関連スコア算出システム、方法およびプログラム
JP5010624B2 (ja) 検索装置
US9342589B2 (en) Data classifier system, data classifier method and data classifier program stored on storage medium
JP5284064B2 (ja) 商品idサーバ装置、および商品idサーバ装置の制御方法
NL2016846B1 (en) Computer implemented and computer controlled method, computer program product and platform for arranging data for processing and storage at a data storage engine.
KR101273646B1 (ko) 멀티 모달리티 데이터 색인 및 검색 방법, 그 시스템
JP4287464B2 (ja) システム基盤構成策定支援システム及び支援方法
RU2433467C1 (ru) Способ формирования структуры агрегированных данных и способ поиска данных посредством структуры агрегированных данных в системе управления базами данных
JP2010286888A (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
CN109614542B (zh) 公众号推荐方法、装置、计算机设备及存储介质
JP5954742B2 (ja) 文書を検索する装置及び方法
JP2007066228A (ja) コンテンツ検索システムおよびその方法
JP2008026968A (ja) データ管理装置、データプログラム及びデータ管理方法
CN104731867B (zh) 一种对对象进行聚类的方法和装置
JP2013152607A (ja) 管理プログラムおよび装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Tokyo

Patentee after: Fuji film business innovation Co.,Ltd.

Address before: Tokyo

Patentee before: Fuji Xerox Co.,Ltd.