CN101876999A - 一种生成传真索引的方法、报文分析装置和传真检索*** - Google Patents

一种生成传真索引的方法、报文分析装置和传真检索*** Download PDF

Info

Publication number
CN101876999A
CN101876999A CN2009102500928A CN200910250092A CN101876999A CN 101876999 A CN101876999 A CN 101876999A CN 2009102500928 A CN2009102500928 A CN 2009102500928A CN 200910250092 A CN200910250092 A CN 200910250092A CN 101876999 A CN101876999 A CN 101876999A
Authority
CN
China
Prior art keywords
facsimile message
characteristic information
message
fax
facsimile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009102500928A
Other languages
English (en)
Inventor
于洪涛
冯晓磊
李鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA Information Engineering University
Original Assignee
PLA Information Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA Information Engineering University filed Critical PLA Information Engineering University
Priority to CN2009102500928A priority Critical patent/CN101876999A/zh
Publication of CN101876999A publication Critical patent/CN101876999A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)

Abstract

本发明实施例提供的一种生成传真索引的方法,包括:对传真报文进行版面分析,提取所述传真报文中的特征信息,根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。使用本发明提供的生成传真索引的方法,方便了传真的管理和检索,节约了大量的人力资源。

Description

一种生成传真索引的方法、报文分析装置和传真检索***
技术领域
本发明属于传真技术领域,尤其涉及一种生成传真索引的方法、报文分析装置和传真检索***。
背景技术
在经济全球化的今天,很多跨国跨地区的业务不可能当面办理,由于传真特有的法律效力,可以使得大量的订单、合同等通过传真签署,而许多跨地区的业务甚至需要多个子公司的协作完成;另外对这些大公司来说,很重要的一个办公方式是公司内部资料、通知、命令等信息通过传真方式进行交互。
在这种应用中,公司需要对所有的办公传真统一存档、分类管理,到目前为止,传真的分类和检索都是靠人力实现的,浪费了大量的人力资源,效率低下,因此需要实现传真的自动分类,从而大幅度地降低人力成本,提高工作效率。
发明内容
有鉴于此,本发明的目的在于提供一种生成传真索引的方法、报文分析装置和传真检索***。
本发明实施例提供的一种生成传真索引的方法,包括:对传真报文进行版面分析,提取所述传真报文中的特征信息,根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。
进一步的,所述进行版面分析包括:提取所述传真报文的页眉部分;所述提取传真报文中的特征信息包括:提取所述传真报文的页眉部分中的号码、收发时间和收发单位信息。
进一步的,所述进行版面分析包括:将所述传真报文正文部分划分成图标图像区域、文本图像区域和表格图像区域。
进一步的,所述提取传真报文中的特征信息包括:从所述图标图像区域中提取图标特征信息。
进一步的,所述提取传真报文中的特征信息包括:从所述文本图像区域中提取关键字信息。
进一步的,所述提取传真报文中的特征信息包括:从所述表格图像区域中提取表格特征信息。
本发明实施例还提供一种报文分析装置,包括:版面分析模块,用于对传真报文进行版面分析;特征信息提取模块,用于提取所述传真报文中的特征信息;索引生成模块,用于根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。
进一步的,所述版面分析模块具体用于提取所述传真报文的页眉部分,并将所述传真报文正文部分划分成图标图像区域、文本图像区域和表格图像区域。
进一步的,所述特征信息提取模块包括:页眉信息识别子模块,用于提取传真报文的页眉部分中的号码、收发时间和收发单位信息;图标识别子模块,用于从所述图标图像区域中提取图标特征信息;关键词识别子模块,用于从所述文本图像区域中提取关键字信息;表格识别子模块,用于从所述表格图像区域中提取表格特征信息。
本发明实施例还提供一种传真检索***,包括所述的报文分析装置,还包括:中心服务器、传真报文存储单元、数据库、特征信息存储单元,特征信息描述单元、属性表、传真检索单元和用户接口单元;其中,所述传真报文存储单元用于存储经过所述中心服务器接收和分发的传真报文;所述特征信息描述单元用于从所述报文分析装置分析得到的特征信息中生成特征描述符;所述特征信息存储单元用于与所述传真报文数据相关联存储所述传真报文的特征描述符;所述属性表为基于传真报文的特征信息生成的属性表;所述传真检索单元,用于接收输入的与所述特征信息相关的检索条件,并对所述属性进行检索,生成满足所述检索条件的传真报文。
本发明通过对传真建立多重标签的方法,方便了传真的管理和检索,节约了大量的人力资源。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种生成传真索引的方法的流程图;
图2是本发明实施例二提供的一种报文分析装置的示意图;
图3是本发明实施例三提供的一种传真检索***的示意图;
图4是本发明实施例提供的传真检索***应用场景的示意图;
图5是利用本实施例提供的传真检索***对传真报文进行检索的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例一提供一种生成传真索引的方法,如图1所示,该方法包括:
步骤S101:对传真报文进行版面分析;
步骤S102:提取所述传真报文中的特征信息;
步骤S103:根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。
其中传真报文的版面通常可以分为页眉和正文部分。因此步骤S101中对传真报文进行版面分析可以包括:提取所述传真报文的页眉部分,并将所述传真报文正文部分划分成图标图像区域、文本图像区域和表格图像区域。
这样,步骤S102中提取报文中的特征信息可以包括:
步骤S 1021:提取传真报文的页眉部分中的号码、收发时间和收发单位信息;其中收发时间的格式可以是年月日小时分秒,号码包括主被叫号码,收发单位信息可以是传真业务所属公司名称。
步骤S1022:从图标图像区域中提取图标特征信息;
上述图标特征信息可以是徽标信息。
步骤S1023:从文本图像区域中提取关键字信息;
步骤S1024:从表格图像区域中提取表格特征信息。
需要说明的是,上述步骤S1021-S1024的执行顺序没有限制,并且不必要限定全部执行,即可以执行其中的任意步骤的任意组合。
实施例二
本实施例相应提供一种报文分析装置,如图2所示,该装置200包括:
版面分析模块201,用于对传真报文进行版面分析;
特征信息提取模块202,用于对提取所述传真报文中的特征信息;
索引生成模块203,用于根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。
其中,版面分析模块201可以具体用于提取传真报文的页眉部分,并将所述传真报文正文部分划分成图标图像区域、文本图像区域和表格图像区域。而特征信息提取模块202可以包括:
页眉信息识别子模块2021,用于提取传真报文的页眉部分中的号码、收发时间和收发单位信息
图标识别子模块2022,用于从所述图标图像区域中提取图标特征信息;
关键词识别子模块2023,用于从所述文本图像区域中提取关键字信息;
表格识别子模块2024,用于从所述表格图像区域中提取表格特征信息。
实施例三
本实施例相应提供一种传真检索***,如图3所示,该***包括上述实施例二中的报文分析装置200,还包括:中心服务器301、传真报文存储单元302、数据库303、特征信息存储单元304,特征信息描述单元305、属性表306、传真检索单元307和用户接口单元308;
其中,所述传真报文存储单元302、报文分析装置200、用户接口单元308均与中心服务器301相连,所述中心服务器301与各分公司的服务器通过公司内部IP连接,接收和分发的传真均要经过中心服务器301存入传真报文存储单元302,并且所述属性表306是包含于所述数据库303之中的。
所述传真报文存储单元302用于存储经过所述中心服务器301接收和分发的传真报文;其中传真报文可以为bmp格式的二值图像;数据库303用来存储所有传真的分公司ID、文件生成时间、传真收发方向、传真的存储路径、处理标志等信息;
所述特征信息描述单元305用于从所述报文分析装置200分析得到的特征信息中生成特征描述符;
所述特征信息存储单元304用于与所述传真报文数据相关联存储所述传真报文的特征描述符;
所述属性表306为基于传真报文的特征信息生成的属性表;
所述传真检索单元307,用于接收输入的与所述特征信息相关的检索条件,并对所述属性进行检索,生成满足所述检索条件的传真报文。
图4示出了本发明实施例的应用场合的示意图。
下面举例说明利用本实施例提供的传真检索***对传真报文进行检索的过程:如图5所示,首先用户输入检索条件(对应步骤S501);然后***查找对应的存储模块(对应步骤S502);接着对照属性表(对应步骤S503)。如果没有相关文件,则程序退出,如果有相关文件,则继续执行步骤S504:查找存储数据;最后执行步骤S505:输出满足检索条件的传真报文检索结果。
本发明通过对传真按收发时间(格式为年月日小时分秒)、主被叫号码、传真业务所属分公司名、图标特征、关键字、表格特征、传真类型以及范围建立多重标签的方法,方便了传真的管理和检索,节约了大量的人力资源。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种生成传真索引的方法,其特征在于,包括:
对传真报文进行版面分析,提取所述传真报文中的特征信息,根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。
2.根据权利要求1所述的方法,其特征在于,所述进行版面分析包括:
提取所述传真报文的页眉部分;
所述提取传真报文中的特征信息包括:
提取所述传真报文的页眉部分中的号码、收发时间和收发单位信息。
3.根据权利要求1所述的方法,其特征在于,所述进行版面分析包括:
将所述传真报文正文部分划分成图标图像区域、文本图像区域和表格图像区域。
4.根据权利要求3所述的方法,其特征在于,所述提取传真报文中的特征信息包括:
从所述图标图像区域中提取图标特征信息。
5.根据权利要求3所述的方法,其特征在于,所述提取传真报文中的特征信息包括:
从所述文本图像区域中提取关键字信息。
6.根据权利要求3所述的方法,其特征在于,所述提取传真报文中的特征信息包括:
从所述表格图像区域中提取表格特征信息。
7.一种报文分析装置,其特征在于,包括:
版面分析模块,用于对传真报文进行版面分析;
特征信息提取模块,用于提取所述传真报文中的特征信息;
索引生成模块,用于根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。
8.根据权利要求7所述的报文分析装置,其特征在于,所述版面分析模块具体用于提取所述传真报文的页眉部分,并将所述传真报文正文部分划分成图标图像区域、文本图像区域和表格图像区域。
9.根据权利要求8所述的报文分析装置,其特征在于,所述特征信息提取模块包括:
页眉信息识别子模块,用于提取传真报文的页眉部分中的号码、收发时间和收发单位信息;
图标识别子模块,用于从所述图标图像区域中提取图标特征信息;
关键词识别子模块,用于从所述文本图像区域中提取关键字信息;
表格识别子模块,用于从所述表格图像区域中提取表格特征信息。
10.一种传真检索***,其特征在于,包括如权利要求7至9中任意一项所述的报文分析装置,还包括:中心服务器、传真报文存储单元、数据库、特征信息存储单元,特征信息描述单元、属性表、传真检索单元和用户接口单元;
其中,所述传真报文存储单元用于存储经过所述中心服务器接收和分发的传真报文;
所述特征信息描述单元用于从所述报文分析装置分析得到的特征信息中生成特征描述符;
所述特征信息存储单元用于与所述传真报文数据相关联存储所述传真报文的特征描述符;
所述属性表为基于传真报文的特征信息生成的属性表;
所述传真检索单元,用于接收输入的与所述特征信息相关的检索条件,并对所述属性进行检索,生成满足所述检索条件的传真报文。
CN2009102500928A 2009-12-04 2009-12-04 一种生成传真索引的方法、报文分析装置和传真检索*** Pending CN101876999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009102500928A CN101876999A (zh) 2009-12-04 2009-12-04 一种生成传真索引的方法、报文分析装置和传真检索***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102500928A CN101876999A (zh) 2009-12-04 2009-12-04 一种生成传真索引的方法、报文分析装置和传真检索***

Publications (1)

Publication Number Publication Date
CN101876999A true CN101876999A (zh) 2010-11-03

Family

ID=43019557

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102500928A Pending CN101876999A (zh) 2009-12-04 2009-12-04 一种生成传真索引的方法、报文分析装置和传真检索***

Country Status (1)

Country Link
CN (1) CN101876999A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081732A (zh) * 2010-12-29 2011-06-01 方正国际软件有限公司 一种版式识别模板方法及***
CN102571535A (zh) * 2010-12-22 2012-07-11 深圳市恒扬科技有限公司 一种数据延迟装置、方法及通信***
CN102622358A (zh) * 2011-01-27 2012-08-01 天脉聚源(北京)传媒科技有限公司 一种搜索信息的方法和***
CN108334725A (zh) * 2017-04-24 2018-07-27 广东健凯医疗有限公司 健康数据电子化处理***和方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571535A (zh) * 2010-12-22 2012-07-11 深圳市恒扬科技有限公司 一种数据延迟装置、方法及通信***
CN102571535B (zh) * 2010-12-22 2015-02-18 深圳市恒扬科技股份有限公司 一种数据延迟装置、方法及通信***
CN102081732A (zh) * 2010-12-29 2011-06-01 方正国际软件有限公司 一种版式识别模板方法及***
CN102081732B (zh) * 2010-12-29 2013-06-05 方正国际软件有限公司 一种版式识别模板方法及***
CN102622358A (zh) * 2011-01-27 2012-08-01 天脉聚源(北京)传媒科技有限公司 一种搜索信息的方法和***
CN108334725A (zh) * 2017-04-24 2018-07-27 广东健凯医疗有限公司 健康数据电子化处理***和方法

Similar Documents

Publication Publication Date Title
Aalders The IT outsourcing guide
Head et al. Method, media, and mode: Clarifying the discussion of distance education effectiveness
US10528626B2 (en) Document processing
WO2010122429A3 (en) Image-based data management method and system
CN105493076A (zh) 通过通信通道的捕捉服务
CN103309998A (zh) 一种消息查询方法及装置、终端设备
US20150278248A1 (en) Personal Information Management Service System
CN101876999A (zh) 一种生成传真索引的方法、报文分析装置和传真检索***
CN107741972A (zh) 一种图片的搜索方法、终端设备及存储介质
CN107679208A (zh) 一种图片的搜索方法、终端设备及存储介质
CN104182549A (zh) 一种电子邮件摘要生成方法及装置
CN105761057A (zh) 一种基于电子的人力资源档案查询及调取的管理***
CN112182174A (zh) 业务问答知识查询方法、装置、计算机设备和存储介质
CN101673299B (zh) 一种erp***及其数据搜索方法和装置
CN111046634A (zh) 文档处理方法、装置、计算机设备以及存储介质
KR950001526A (ko) 전표 처리방법
AU2016222279A1 (en) Generating a signed electronic document
US20140289742A1 (en) Method of sharing contents
CN107450995A (zh) 一种在即时通讯软件中输入结构化数据的方法及***
CN109740130B (zh) 用于生成文件的方法和装置
CN102081758A (zh) 一种数字内容资源收集整理加工的方法和***
CN105913215A (zh) 电子邮件处理方法及设备
CN104244204A (zh) 短信内容提取方法及***
CN105791503A (zh) 一种将名片信息存储到通讯录的方法及装置
US20180253488A1 (en) Personal connection information creating device, computer readable recording medium having a personal connection information creation program stored therein, and a personal connection information creating method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20101103