CN101247603A - 多层锚点提取方法及装置 - Google Patents
多层锚点提取方法及装置 Download PDFInfo
- Publication number
- CN101247603A CN101247603A CNA2008100840935A CN200810084093A CN101247603A CN 101247603 A CN101247603 A CN 101247603A CN A2008100840935 A CNA2008100840935 A CN A2008100840935A CN 200810084093 A CN200810084093 A CN 200810084093A CN 101247603 A CN101247603 A CN 101247603A
- Authority
- CN
- China
- Prior art keywords
- information
- chained
- chained list
- lists
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了多层锚点提取方法及装置,该方法包括以下步骤:步骤一,扫描短消息文本并根据预定的规则提取信息;步骤二,根据提取的信息的类型创建一个或多个链表,并将信息存储到一个或多个链表中;以及步骤三,判断信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将一个或多个链表整合为至少一个链表。本发明为简单、快速、全面、灵活地提取短信内容中的电话号码、Email地址和URL地址提供了一种有效的途径。
Description
技术领域
本发明涉及手机领域,尤其涉及手机短信的多层锚点提取技术。
背景技术
当前,大多数的手机用户都会使用手机来发送短信息,手机的短信息服务传递及时,方便灵活,即可传情达意,也能联络通知,还能对重要信息保存备案,因而深受人们的喜爱。习惯用短信息的人都知道,能够轻松地将信息发送者的手机号码以及短信息中包含的电话号码保存到自己话机的通讯录中,方便地保存短信中包含的Email地址或者向其发送Email,甚至对短信内容中包含的URL地址进行快速连接和保存书签等操作。
通常,基于锚点提取的提取电话号码、Email地址、URL地址可以分为三部分:内容提取、聚焦高亮显示和使用聚焦项。
内容提取作为锚点提取的核心部分,主要是通过扫描整个短信字符,结合RFC规范(规定电子邮件的标准格式的RFC 822-Standard for the format of ARPA Internet text messages,以及规定统一资源标识符的RFC 2396-Uniform Resource Identifiers(URI):Generic Syntax.)中相应的(电话号码、Email和URL地址)语法规则对其中的有效字符串进行提取,并以某种方式存储提取结果。
聚焦高亮显示则根据读取到的提取结果,在手机阅读接收短信界面中,判断相应的内容(电话号码、Email地址和URL地址)的起始和终点位置,对该部分内容聚焦并高亮显示,使用户可以选择是否对该内容进行操作以及如何操作。同时要实现在多项可选内容之间切换,如短信内容中包含多个电话号码以及Email地址和URL地址,则用户可对每条内容进行操作,一般由方向键按照顺序实现前后切换。
使用聚焦项是指手机通过平台的菜单功能对用户按键触发的事件做出反应,实现对聚焦内容的具体操作。用户通过功能键调用可选的操作项,通过方向键选择要进行的操作,如对电话号码进行呼叫、保存、发送短信、发送彩信等操作,对Email地址进行保存和发送mail等操作,对URL地址进行连接和保存书签等操作。
目前大多数手机都实现了锚点提取的功能。然而效果并不尽人意,究其原因主要是对提取规则理解单一、没有容错机制和智能化程度不够。短信内容是由用户编辑的,在编辑过程中每个人习惯又有所不同。尤其在短信中同时包含电话号码、Email地址和URL地址时,三者之间、甚至是同一类型的两条提取内容之间都有可能存在着重叠交叉的现象。比如URL中包含类似电话号码的数字串、Email地址中包含类似URL地址的后缀等等。
因此,需要一种多层锚点提取的解决方案,能够解决上述相关技术中的问题。
发明内容
本发明旨在在锚点提取的基础上,实现容错机制,对出现交叉提取的内容进行智能判断,尽可能多的提取内容供用户选择使用。
根据本发明的一个方面,提供了一种多层锚点提取方法,包括以下步骤:步骤一,扫描短消息文本并根据预定的规则提取信息;步骤二,根据提取的信息的类型创建一个或多个链表,并将信息存储到一个或多个链表中;以及步骤三,判断信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将一个或多个链表整合为至少一个链表。
步骤三包括以下步骤:如果判断出信息之间没有重叠,则根据预定的整合规则将一个或多个链表整合为至少一个链表,否则,根据预定的整合规则将一个或多个链表整合为多于一个链表。
步骤三还包括以下步骤:将具有彼此相互重叠部分的信息分别存储到多于一个链表中的不同链表中;以及根据预定的算法确定提取的信息是否为非法提取信息,如果是,则将其删除。
上述方法还包括以下步骤:确定至少一个链表的显示顺序;以及按照确定的顺序显示存储在至少一个链表中的所提取的信息。
预定的提取规则包括容错机制,信息包括地址信息,以及地址信息的类型包括:电话号码、Email地址、和URL地址。
根据本发明的另一个方面,提供了一种多层锚点提取装置,包括:提取模块,用于扫描短消息文本并根据预定的规则提取信息;链表创建及存储模块,根据提取的信息的类型创建一个或多个链表,并将信息存储到一个或多个链表中;以及判断整合模块,判断信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将一个或多个链表整合为至少一个链表。
链表创建及存储模块包括:链表创建单元,用于根据提取的信息的类型创建一个或多个链表;以及存储单元,用于将提取的信息存储到一个或多个链表中。
判断整合模块包括:判断单元,用于判断信息之间是否有重叠部分;以及整合单元,用于根据判断结果以及根据预定的整合规则将一个或多个链表整合为至少一个链表。
本发明为简单、快速、全面、灵活地提取短信内容中的电话号码、Email地址和URL地址提供了一种有效的途径。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明一个实施例的多层锚点提取方法的流程图;
图2示出了根据本发明一个实施例的多层锚点提取装置的框图;以及
图3示出了根据本发明另一个实施例的多层锚点提取方法的流程图。
具体实施方式
下面将结合附图来详细说明本发明的实施例。
图1示出了根据本发明实施例的多层锚点提取方法的流程图。参照图1,根据本发明实施例的多层锚点提取方法包括以下步骤:步骤S102,扫描短消息文本并根据预定的规则提取信息;步骤S104,根据提取的信息的类型创建一个或多个链表,并将信息存储到一个或多个链表中;以及步骤S106,判断信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将一个或多个链表整合为至少一个链表。
步骤S106包括以下步骤:如果判断出信息之间没有重叠,则根据预定的整合规则将一个或多个链表整合为至少一个链表,否则,根据预定的整合规则将一个或多个链表整合为多于一个链表。
步骤S106还包括以下步骤:将具有彼此相互重叠部分的信息分别存储到多于一个链表中的不同链表中;以及根据预定的算法确定提取的信息是否为非法提取信息,如果是,则将其删除。
上述方法还包括以下步骤:确定至少一个链表的显示顺序;以及按照确定的顺序显示存储在至少一个链表中的所提取的信息。
预定的提取规则包括容错机制,信息包括地址信息,以及地址信息的类型包括:电话号码、Email地址、和URL地址。
图2示出了根据本发明实施例的多层锚点提取装置的框图。参照图2,根据本发明实施例的多层锚点提取装置200包括:提取模块202,用于扫描短消息文本并根据预定的规则提取信息;链表创建及存储模块204,根据提取的信息的类型创建一个或多个链表,并将信息存储到一个或多个链表中;以及判断整合模块206,判断信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将一个或多个链表整合为至少一个链表。
链表创建及存储模块204包括:链表创建单元,用于根据提取的信息的类型创建一个或多个链表;以及存储单元,用于将提取的信息存储到一个或多个链表中。
判断整合模块206包括:判断单元,用于判断信息之间是否有重叠部分;以及整合单元,用于根据判断结果以及根据预定的整合规则将一个或多个链表整合为至少一个链表。
下面参照图3来详细描述本发明的另一个实施例。
本实施例的多层锚点提取的方法包括以下步骤:
步骤S302,定义电话号码、Email地址和URL地址的提取规则,有效字符及字符段(参考前文所述的RFC规范);
步骤S304,分别根据电话号码、Email地址和URL地址的语法扫描整个短信文本,提取相应内容,生成对应的链表;
步骤S306,整合生成的三个链表,根据整合规则删除可确定的非法提取;
步骤S308,根据链表的交叉结构,确定并组合分层显示结构;以及
步骤S310,对菜单中use highlight的管理和控制。
实施例的主要包含两部分,一是提取电话号码、Email地址和URL地址并生成对应的链表;二是对链表进行整合,使之合理的组合并显示给用户。
在该实施例中,对提取内容按照单链表的方式存储,而三种不同内容是分别提取的。提取的过程主要是逐字符扫描,按照对应的语法进行判别。如果确定一个字符串是要提取的内容,则在链表中创建一个新的节点,节点包含类型、起点、长度、内容等信息。链表头节点则包含整个链表中节点个数、起始节点、终止节点等信息。链表中各个节点按照其起点在短信中出现的顺序进行排序,以便链表整合以及用户根据方向键顺序聚焦显示。
链表的整合主要是针对不同链表或者同一链表中内容的交叉情况而设计的,也就是说经过提取,电话号码跟URL地址可能是有重叠部分的,同样电话号码跟Email地址之间、Email地址跟URL地址之间也可能存在着重叠部分。举例而言,比如说一个长8位的数字串出现在一个URL地址中,在电话号码提取时这8位的数字串作为一个电话号码提取出来,而在URL提取使包含这8位数字串的整个字符串又作为一个URL地址提取出来,于是生成的电话号码链表跟URL链表就有重叠部分。目前大多数手机都是按照某个优先级进行取舍,比如默认URL的提取级别高于电话号码,则这8位的数字串就不作为电话号码使用,仅仅是当作URL的一部分。然而这种提取显然并不能满足用户的要求,因为用户可能需要这8位字符串作为一个电话号码存储起来的。本***采用的链表整合方式既按照设计好的整合规则,对三个提取链表进行整合,根据链表结构的特点最终生成一条或者两条链表,包含所有对用户来说可能是有用信息的提取内容,并且每个链表中没有节点在位置上的重叠交叉。
菜单中use highlight选项需要根据最终生成的链表个数增加相应的菜单项。对于一条链表的情况,按照链表中内容的先后顺序高亮显示对应的内容,方向键控制向前或向后选择,用户可以对某个需要使用的内容进行use highlight操作。对于两条链表的情况,首先按照连表中内容的先后顺序高亮显示对应内容,当用户通过方向键浏览整个短信文本没有发现自己想要聚焦的内容时,可以通过菜单选择第二条链表进行浏览,如同第一条链表一样,按照顺序进行高亮显示,方向键控制向前或向后浏览,遇到需要使用的内容即可做use highlight操作。
综上所述,本实施例主要分为两大块:提取内容生成链表,整合链表。其中提取内容采用RFC规范并通过扫描短信内容对电话号码、Email地址、URL地址进行提取,整合链表则是对提取出的内容进行准确的容错处理以及重叠内容的完整显示。通过采用以上的技术,本发明实现对短信中电话号码、Email地址和URL地址的快速、全面、灵活提取,并在阅读短信的用户界面合理地显示所有提取到的内容,极大地方便了用户对提取内容的操作。
本发明为简单、快速、全面、灵活地提取短信内容中的电话号码、Email地址和URL地址提供了一种有效的途径。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种多层锚点提取方法,其特征在于,包括以下步骤:
步骤一,扫描短消息文本并根据预定的规则提取信息;
步骤二,根据提取的所述信息的类型创建一个或多个链表,并将所述信息存储到所述一个或多个链表中;以及
步骤三,判断所述信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将所述一个或多个链表整合为至少一个链表。
2.根据权利要求1所述的方法,其特征在于,所述步骤三包括以下步骤:
如果判断出所述信息之间没有重叠,则根据所述预定的整合规则将所述一个或多个链表整合为至少一个链表,否则,根据所述预定的整合规则将所述一个或多个链表整合为多于一个链表。
3.根据权利要求2所述的方法,其特征在于,所述步骤三还包括以下步骤:
将具有彼此相互重叠部分的所述信息分别存储到所述多于一个链表中的不同链表中。
4.根据权利要求3所述的方法,其特征在于,所述步骤三还包括以下步骤:
根据预定的算法确定提取的所述信息是否为非法提取信息,如果是,则将其删除。
5.根据权利要求4所述的方法,其特征在于,还包括以下步骤:
确定所述至少一个链表的显示顺序;以及
按照确定的顺序显示存储在所述至少一个链表中的所提取的信息。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述预定的提取规则包括容错机制。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述信息包括地址信息。
8.根据权利要求7所述的方法,其特征在于,所述地址信息的类型包括:电话号码、Email地址、和URL地址。
9.一种多层锚点提取装置,其特征在于,包括:
提取模块,用于扫描短消息文本并根据预定的规则提取信息;
链表创建及存储模块,根据提取的所述信息的类型创建一个或多个链表,并将所述信息存储到所述一个或多个链表中;以及
判断整合模块,判断所述信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将所述一个或多个链表整合为至少一个链表。
10.根据权利要求9所述的装置,其特征在于,所述链表创建及存储模块包括:
链表创建单元,用于根据提取的所述信息的类型创建一个或多个链表;以及
存储单元,用于将提取的所述信息存储到所述一个或多个链表中。
11.根据权利要求10所述的装置,其特征在于,所述判断整合模块包括:
判断单元,用于判断所述信息之间是否有重叠部分;以及
整合单元,用于根据判断结果以及根据预定的整合规则将所述一个或多个链表整合为至少一个链表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100840935A CN101247603B (zh) | 2008-03-26 | 2008-03-26 | 多层锚点提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100840935A CN101247603B (zh) | 2008-03-26 | 2008-03-26 | 多层锚点提取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101247603A true CN101247603A (zh) | 2008-08-20 |
CN101247603B CN101247603B (zh) | 2012-04-04 |
Family
ID=39947750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100840935A Expired - Fee Related CN101247603B (zh) | 2008-03-26 | 2008-03-26 | 多层锚点提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101247603B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101741756B (zh) * | 2008-11-19 | 2012-09-26 | 中兴通讯股份有限公司 | 对即时通讯文本消息中特殊字符串转换的方法和*** |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106597049B (zh) * | 2016-12-15 | 2019-01-25 | 电子科技大学 | 基于链表数组的多幅波形包络提取方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001111672A (ja) * | 1999-10-05 | 2001-04-20 | Kenwood Corp | 移動体通信端末 |
KR100596918B1 (ko) * | 2003-11-28 | 2006-07-06 | 엘지전자 주식회사 | 단문메시지에 포함된 특정 정보 추출방법 |
US8301702B2 (en) * | 2004-01-20 | 2012-10-30 | Cloudmark, Inc. | Method and an apparatus to screen electronic communications |
KR100627718B1 (ko) * | 2005-06-15 | 2006-09-25 | 에스케이 텔레콤주식회사 | 문자 메시지에 포함되어 있는 전화 번호에 하이퍼링크기능을 제공하는 이동통신 단말기 및 그 방법 |
-
2008
- 2008-03-26 CN CN2008100840935A patent/CN101247603B/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101741756B (zh) * | 2008-11-19 | 2012-09-26 | 中兴通讯股份有限公司 | 对即时通讯文本消息中特殊字符串转换的方法和*** |
Also Published As
Publication number | Publication date |
---|---|
CN101247603B (zh) | 2012-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101178190B1 (ko) | 지능형 수령자 리스트 | |
US8169409B2 (en) | Method of managing a language information for a text input and method of inputting a text and a mobile terminal | |
CN101552829B (zh) | 一种彩信的编辑方法、***及信息终端 | |
CN101951577B (zh) | 一种短消息的处理方法及装置 | |
KR101113873B1 (ko) | 이동단말기의 에이전트 표시 방법 및, 이동단말기 | |
CN101645086B (zh) | 检索方法 | |
US20100138441A1 (en) | Method for storing telephone number by automatically analyzing message and mobile terminal executing the method | |
CN101199217A (zh) | 具有消息传送应用程序的终端 | |
CN102404251A (zh) | 具有备注功能的即时通信的实现方法、客户端及*** | |
CN103906012A (zh) | 信息发送方法及装置 | |
CN101978353A (zh) | 便携式信息终端、字符交付方法和临时字符保存程序产品 | |
CN104881279A (zh) | 一种群发消息的方法及装置 | |
CN102394977B (zh) | 一种手机未读短信的处理方法及手机 | |
CN101488997A (zh) | 一种手机的本地搜索方法 | |
KR100774187B1 (ko) | 이동통신단말기 및 이를 위한 문자메시지 디스플레이 방법 | |
CN108132742B (zh) | 一种终端设备及其关联窗口的显示方法 | |
US20100178909A1 (en) | Apparatus and method for managing data in portable terminal | |
CN100479552C (zh) | 文本消息通话的用户界面的功能性 | |
CN101247603B (zh) | 多层锚点提取方法及装置 | |
KR101139136B1 (ko) | 휴대 통신 단말 | |
CN102262441A (zh) | 输入方法及装置 | |
CN103164122A (zh) | 一种调用通讯录内容的方法及装置 | |
CN102946592B (zh) | 一种移动终端收发信息的方法及*** | |
CN101527889A (zh) | 一种图形短信的编辑显示方法及其移动通信终端 | |
CN100377616C (zh) | 移动通信终端的文字消息预览方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120404 Termination date: 20170326 |
|
CF01 | Termination of patent right due to non-payment of annual fee |