CN1256689C - 一种包含手写体文本的电子文档的保存方法 - Google Patents

一种包含手写体文本的电子文档的保存方法 Download PDF

Info

Publication number
CN1256689C
CN1256689C CN 03102073 CN03102073A CN1256689C CN 1256689 C CN1256689 C CN 1256689C CN 03102073 CN03102073 CN 03102073 CN 03102073 A CN03102073 A CN 03102073A CN 1256689 C CN1256689 C CN 1256689C
Authority
CN
China
Prior art keywords
text
handwritten
machine inner
pattern
inner code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 03102073
Other languages
English (en)
Other versions
CN1521660A (zh
Inventor
姜珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN 03102073 priority Critical patent/CN1256689C/zh
Publication of CN1521660A publication Critical patent/CN1521660A/zh
Application granted granted Critical
Publication of CN1256689C publication Critical patent/CN1256689C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种包含手写体文本的电子文档的保存方法,至少包括:保存电子文档的文档结构信息;保存电子文档的文本机器内码信息;保存电子文档中包含的手写体文本的机器内码与模式的对应关系信息,其中每个模式代表一个手写体文字,该对应关系在形成手写体文本之前预先建立;保存由手写体文本包含的所有模式组成的局部模式库。使用本发明可以保存具有个性化的手写体文本,并且可以方便地对其进行编辑和显示操作。

Description

一种包含手写体文本的电子文档的保存方法
技术领域
本发明涉及计算机的文字处理技术,具体涉及一种包含手写体文本的电子文档的保存方法。
背景技术
随着社会的发展,各种印刷品和电子文档逐渐取代了手写文件的位置。同样,亲笔给远方的亲人或朋友写一封信,对于大多数人来说也成了一项久远的回忆。虽然目前计算机、打字机和诸如移动电话的各种手持设备越来越普及,人们完全可以利用这些现代的文明成果进行交流和沟通,而不再需要纸和笔。但是,无论是电子邮件、手机短消息还是字处理文档使用的都是样式统一的文字,虽然便于人们的阅读,但是缺乏一种亲切感,没有那种见字如见人所能留下的想象空间。千篇一律的黑体、宋体、楷体在很多场合已经让人感到厌倦,人们迫切希望通过计算机也能得到亲切、自然和具有独特个性的手写体文字,特别是在和亲人、朋友之间进行交流的电子邮件中更是如此。
目前为了安全和庄重,在一些电子文档中需要手写体的姓名签字。此时的通常做法是先在纸上写下手写体的文字,然后通过扫描仪的扫描作为一个位图输入到计算机中,再将这个位图通过贴图的方式***到电子文档中。通过这种方式***和显示的手写体文字是位图,而不是机器内码,因此不能进行和文字相关的普通编辑操作,使用起来特别不方便。另外,这种方式只适用于***姓名之类较少的字符,对于由很多字符组成的一篇文章之类的电子文档,要通过这种方法生成手写体文字,则几乎是没有实用意义的。
为了解决这个问题,在中国专利公开CN 1374637中公开了一种手写文字字库以及利用手写文字字库在显示装置上形成手写体文字的方法。该方法通过建立手写文字字库,可以在例如计算机显示器的显示装置上显示手写体文字字库中包含的手写体文字,从而解决了手写体文字生成的问题。但是该手写文字字库包含在本地的计算机上,对于包含所生成的手写体文字的电子文档如何进行保存,以便在不包含手写体文字的其它计算机上可以正常显示和编辑,却没有在这篇专利公开中有丝毫的涉及。
在中国专利公开CN 1372208中,公开了一种图文编辑方法及***。通过该方法与***,用户可以编辑手写输入的文字。但是这里的手写输入的文字和本发明所涉及的手写体文字具有本质的区别,当然该专利公开中也就没有涉及如何保存包含手写体文字的电子文档。
目前电子文档的保存是通过记录电子文档的结构信息和文本机器内码来保存和电子文档相关的信息。换句话说,目前保存的电子文档包括文档结构信息和文档文本机器内码两部分的内容。其中,文档结构信息进一步包括两方面内容:一是格式命令串之后的诸如文字、图片等后继媒体的特征,也就是对媒体显示方式的描述,例如字符的大小、颜色、形状等等;二是后继媒体的位置,也就是媒体在页面上显示的坐标点。文档文本机器内码包含电子文档的每一个字符的机器内码信息。在这种保存方法中,并不保存字库的内容,因为目前字库已经标准化,普通计算机中都安装有标准的字库,因此不需要再在保存的电子文档中附加字库内容。但是对于手写体文本而言,很明显一个人的手写体不可能大量地存在于其它计算机之中,因此如果将用户计算机内的手写体文本拷贝到其它计算机中,很可能造成无法正常浏览的情况。因此目前在电子文档的保存中仅仅记录结构信息和机器内码信息不适用于保存包含手写体文本的电子文档。
发明内容
有鉴于此,本发明的目的是提供一种使包含手写体文本的电子文档可以在任意计算机内正常打开和浏览的方法。
本发明的上述目的是通过如下技术方案予以解决的:
一种包含手写体文本的电子文档的保存方法,包括:
保存所述电子文档的文档结构信息;
保存所述电子文档的文本机器内码信息;
保存所述电子文档中包含的手写体文本的机器内码与预先建立的模式的对应关系信息,其中每个模式代表一个手写体文字,所述对应关系在形成手写体文本之前预先建立;
保存由所述手写体文本包含的所有模式组成的局部模式库。
在上述方法中,该手写体文本可以通过如下步骤形成:检测载入或输入文字的机器内码,通过机器内码和模式的对应关系确定机器内码所对应的手写模式,调用并显示机器内码所对应的手写模式,从而形成手写体文本。
在上述方法中,预先建立机器内码与模式的对应关系的步骤可以进一步包括:a.输入或载入手写体文字,并记录每一个手写体文字的模式;b.识别手写体文字得到相应机器内码,并建立分别代表每一个手写体文字的每一个模式和相应的机器内码之间的对应关系。
在上述方法中,在步骤a可以通过扫描纸质载体上的手写体文字并进行文字识别实现手写体文字载入,这里的模式是分别代表每一个手写体文字的位图。或者通过手写输入装置输入手写体文字,这里的模式是分别代表每一个手写体文字的输入轨迹信息。并且在步骤a之后可以进一步对所有的模式进行格式统一化处理。
在上述方法中,机器内码和模式的对应关系是一个机器内码对应1个模式或者一个机器内码对应大于1个的模式。
在上述方法中,机器内码可以是汉字内码或ASCII内码。
在上述方法中,局部模式库可以进一步进行压缩处理。
从本发明的技术方案可以看出,通过预先建立手写模式库,并通过手写模式库将已经存在的印刷体文本转换为手写体文本或者直接输入手写体文本,可以方便地在电子文档中生成手写体。并且通过在文本的保存过程中附加机器内码与手写体模式的对应关系信息以及局部模式库,可以方便地在没有建立所使用的手写模式库的其它计算机中浏览和编辑手写体文本。
使用本发明可以建立具有个性化的电子文档,它突破了现有手写体只能以图片方式存在的缺陷,可以方便地对手写体进行编辑操作。另外,由于手写体文字具有个人的独特特征,他人不易模仿,因此本发明保存电子文档的方法在电子商务或电子政务中具有更高的安全性。
附图说明
图1是本发明简单的总体流程图;
图2是本发明的一种手写模式库建立方法的流程图;
图3是本发明手写模式库数据格式示意图;
图4是本发明将印刷体文本转换为手写体文本的处理方法流程图;
图5是本发明通过键盘直接输入手写体文字的处理方法流程图;
图6是本发明具有汉字内码的手写体文本的电子文档的结构示意图。
具体实施方式
下面结合附图和具体实施方式并以纯汉字文本为例对本发明进行进一步的说明。
图1示出了本发明总的流程,和目前在电子文档中生成诸如宋体、楷体等标准的字体一样,为了在电子文档中生成手写体文字,也需要预先在步骤101建立手写体字库,也就是手写模式库。然后在步骤102即可通过调用该手写模式库生成手写体文本,在生成了手写体文本之后,在步骤103可以通过附加机器内码与模式对照表以及局部模式库保存在步骤102生成的手写体文本。上述每一个步骤的具体处理将在稍后进行详细介绍。
建立手写模式库是本发明的基础和核心。本发明提供了如下两种建立手写模式库的方法,在实际情况中可以采用其中的任意一种。
建立手写模式库的方法1:
图2示出了本发明的一种手写模式库建立方法的流程。如图2所示,这种建立手写模式库的方法主要包括如下步骤:
在步骤201,对写在纸质等载体上的手写文本通过扫描仪进行扫描,形成一个作为位图的手写体文本文件。
在步骤202、203,使用目前现有的文字识别方法将位图切分出一个个由单独文字组成的单元位图,然后对切分出的每一个单元位图中的单独文字进行文字识别,得到它们所代表的汉字的机器内码。
在步骤204,由于目前的文字识别方法不可能完全准确地识别每一个手写体文字,因此需要对识别的文字和机器内码之间的对应关系进行人工校验。例如将实际单元位图和它们对应的机器内码所对应的标准汉字进行列表显示,如果发现位图和对应标准汉字不符,则在列表中将显示的错误的标准汉字修改为正确的标准汉字,然后在该位图和修改的正确的汉字对应的机器内码之间重新建立对应关系。
在步骤205,对手写体汉字形成的每一个单元位图进行背景及去噪处理,以提高手写体文字的显示效果。
在步骤206,对每一个单元位图进行格式化处理,例如统一大小等,然后将这些表示手写体文字的位图和对应的机器内码一同存储到手写汉字模式库,其中机器内码作为检索汉字手写识别库的索引。
按照如上步骤即建立一个手写模式库,它在实际的使用中类似于现有的字库。在上述步骤中,步骤202、203、205等处理都属于公知范畴,和目前的文字识别处理类似。在本发明中将按照这种方法建立的手写模式库称作A类模式库。
建立手写模式库的方法2:
这种方法同前面介绍的方法1稍有不同,它不是对纸质等载体上的手写文字进行扫描和文字识别,而是通过现有的手写板直接输入汉字,并记录汉字的书写轨迹,将这些书写轨迹信息和输入汉字的机器内码共同存储在汉字模式库内。其中机器内码作为检索汉字手写识别库的索引。在本发明中将这种手写模式库称作B类模式库。
在按照上述方法1或方法2建立了手写模式库的过程中,为了方便字库的存取,都需要对字库中汉字的格式进行统一,这需要进行去噪、使尺寸统一的规格化、平滑和去毛刺等处理,这些处理都是公知技术,在此不再赘述。
在建立手写模式库的过程中,有可能同一个机器内码会对应几个不同的手写体文字。这是因为在同一篇手写的文件中可能会在不同位置出现同一个字,例如在汉字中出现频率极高的“的”字,可能在一句话中就会出现数次。此时可以只保留其中一个手写体,也可以保留部分甚至所有的手写体,如果要保留多种手写体,则同一个机器内码就会对应多个不同的单元位图或者轨迹信息。图3示出了本发明手写体的示意格式,每一个内码都可能对应多个手写体模式,在手写模式库中,这些手写体模式可以和同一个机器内码建立对应关系。在实际应用过程中,当检测到一个机器内码对应多个手写模式时,可以要求用户在多个手写模式中进行选择。
在建立了格式统一的手写模式库之后,即可使用该手写模式库在计算机中生成手写体文本。如何生成手写体文本有多种方法,这里举两个具体示例。
生成手写体文本的方法1:
在这种方法中,可以通过现有的输入方法输入印刷体文字文本,或者直接载入已经存在的印刷体文字文本,然后再将这些印刷体文字文本转换成手写体文字文本。图4示出了这种方法的流程图,从图4中可以看出,这种方法主要包括如下步骤:
在步骤401,在载入当前输入的印刷体文字文本或者已经存在的印刷体文字文本后,按顺序确定需要从印刷体文字转换为手写体文字的第一个汉字的机器内码。
在步骤402,利用上一步确定的机器内码在手写模式库中查找该汉字的手写模式。
在步骤403,判断是否存在该汉字的手写模式,如果存在该汉字的手写模式,执行步骤404及后续步骤;否则顺序执行步骤407和步骤408。
在步骤404、405,对所选择的手写模式进行***或者替换前的常规处理,包括规格化处理和背景处理等等,具体如何进行处理是公知技术,这里不再详述。
在步骤406,对所选择的手写模式进行替换操作,也就是用所选择的手写体文字替换与之相对应的印刷体文字。这里的替换操作可以采用某种动画效果,例如对于A类模式库,可以采用淡入淡出等动画效果,而对于B类模式库,可以更进一步按照每一个手写模式的书写笔划来顺序动画显示。
在步骤407,如果没有找到该汉字的手写模式,则对原印刷体的该汉字进行变色处理,以提醒用户目前的手写模式库中没有该汉字的手写模式。
在步骤408,判断是否完成了所有汉字的字体转换工作,如果是,结束本流程,否则执行步骤409和步骤402。
在步骤409,按照顺序确定下一个汉字的机器内码。然后重复执行步骤402,对该汉字进行相同的替换处理。
生成手写体文本的方法2:
在这种方法中,可以通过键盘直接输入手写体文本。图5示出了这种方法的流程图,从图5中可以看出,这种方法主要包括如下步骤:
在步骤501,选择标准的汉字输入方法,例如目前常用的全拼输入法等。
在步骤502,载入所选汉字输入法和机器内码之间的对应关系,这里的对应关系可能是通过函数或表格等方式来表示。
在步骤503,接收用户汉字输入键码。
在步骤504,根据用户汉字输入键码是否有对应的机器内码来判断所接收的用户汉字输入键码是否是合理的汉字输入键码序列。如果是,执行步骤505及后续步骤,否则重新执行步骤503,要求用户重新输入键码序列。
在步骤505,根据用户汉字输入键码序列通过诸如函数或表格的对应关系确定输入汉字的机器内码。
在步骤506,利用汉字的机器内码在手写模式库中查找该汉字的手写模式。
在步骤507,进一步判断是否查询到该汉字的汉字模式,如果是,执行步骤508和后续步骤,否则执行步骤510。
在步骤508,在计算机屏幕上显示手写体汉字,在显示的过程中也可以使用在前面介绍过的动画效果。
在步骤509,判断是否完成了所有输入。如果是,结束本流程,否则执行步骤503,重新接收汉字输入键码。
在步骤510,如果没有输入汉字的手写模式,则显示该汉字的印刷体模式并变色,以提醒用户目前的手写模式库中没有该汉字的手写模式。
在上述方法中,步骤501至步骤505均为公知技术,不再进行具体说明。
上面以两个示例介绍了具体可以如何生成手写体文本。在实际情况中还可以有多种变化,例如可以载入整篇印刷体文本并将其转换为手写体文本,也可以将整篇印刷体文本中的部分汉字转换为手写体,在这种方式中可以将手写体变换的程序作为一个插件嵌入在文本编辑软件的工具栏上。和目前改变文字字体的方式一样,选择需要转换的文字并用颜色显示,然后点击工具栏上的相应图标即可实现手写体转换。
在生成了手写体文本之后,还需要在计算机内保存该文本的手写体信息,否则将该文本在其他没有该手写模式库的计算机中打开时,将不能正确显示手写体,因此需要在保存该文本的同时保存文本的手写体信息。图6示出了本发明保存的具有汉字内码的手写体文本的电子文档的结构示意图。
如图6所示,本发明保存的电子文档包括四个部分:文档结构信息、文档文本机器内码、机器内码与模式对照表以及局部模式库。其中文档结构信息和文档文本机器内码在现有技术部分已经介绍过,本发明的创新在于除了这两部分内容之外,本发明进一步包含了机器内码与模式对照表以及局部模式库。机器内码与模式对照表在前面已经介绍过,它是一个双向链表,既可以通过机器内码查询到手写体模式,也可以通过手写体模式查询到机器内码。局部模式库是手写体模式库的一个子集,它包含了电子文档中所包含所有文字的手写体模式。为了节约存储空间,局部模式库最好采用压缩方式进行存储。
当然除了上述保存方法以外,如果不需要在其他场合对手写体文本进行添加、删除、修改等编辑操作,只要求能够打开并正常浏览,那么也可以将手写体文本保存为图片文件的格式,例如通常使用的截屏操作等,这种方法是公知技术,不再详述。
在本发明的具体实施例中是以汉字为例,但是可以理解,本发明并不局限于汉字,而是可以通过键盘输入或进行文字识别的任何语言文字。文本文字的机器内码可以是汉字内码,也可以是ASCII内码。因此本发明的具体实施例仅仅是对本发明精神的一种展示,而不应当作为对本发明的限制。

Claims (9)

1.一种包含手写体文本的电子文档的保存方法,包括:
保存所述电子文档的文档结构信息;
保存所述电子文档的文本机器内码信息;
保存所述电子文档中包含的手写体文本的机器内码与预先建立的模式的对应关系信息,其中每个模式代表一个手写体文字,所述对应关系在形成手写体文本之前预先建立;
保存由所述手写体文本包含的所有模式组成的局部模式库。
2.根据权利要求1所述的方法,其中该手写体文本通过如下步骤形成:检测载入或输入文字的机器内码,通过所述机器内码和模式的对应关系确定机器内码所对应的手写模式,调用并显示所述机器内码所对应的手写模式,从而形成手写体文本。
3.根据权利要求1所述的方法,其特征是,所述预先建立机器内码与模式的对应关系的步骤进一步包括:
a.输入或载入手写体文字,并记录每一个手写体文字的模式;
b.识别所述手写体文字得到相应机器内码,并建立分别代表每一个手写体文字的每一个模式和相应的机器内码之间的对应关系。
4.根据权利要求3所述的方法,其特征是,在步骤a通过扫描纸质载体上的手写体文字并进行文字识别实现手写体文字载入,所述模式是分别代表每一个手写体文字的位图。
5.根据权利要求3所述的方法,其特征是,在步骤a通过手写输入装置输入手写体文字,所述模式是分别代表每一个手写体文字的输入轨迹信息。
6.根据权利要求3所述的方法,其特征是,在步骤a之后进一步包括对所有的模式进行格式统一化处理。
7.根据权利要求1所述的方法,其特征是,所述机器内码和模式的对应关系是一个机器内码对应1个模式或者一个机器内码对应大于1个的模式。
8.根据权利要求1所述的方法,其特征是,所述机器内码是汉字内码或ASCII内码。
9.根据权利要求1所述的方法,其特征是,保存所述局部模式库时进一步包括对所述局部模式库进行压缩处理。
CN 03102073 2003-01-29 2003-01-29 一种包含手写体文本的电子文档的保存方法 Expired - Fee Related CN1256689C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 03102073 CN1256689C (zh) 2003-01-29 2003-01-29 一种包含手写体文本的电子文档的保存方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 03102073 CN1256689C (zh) 2003-01-29 2003-01-29 一种包含手写体文本的电子文档的保存方法

Publications (2)

Publication Number Publication Date
CN1521660A CN1521660A (zh) 2004-08-18
CN1256689C true CN1256689C (zh) 2006-05-17

Family

ID=34281587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 03102073 Expired - Fee Related CN1256689C (zh) 2003-01-29 2003-01-29 一种包含手写体文本的电子文档的保存方法

Country Status (1)

Country Link
CN (1) CN1256689C (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4733415B2 (ja) * 2005-04-05 2011-07-27 シャープ株式会社 電子文書の表示装置及び方法、並びにコンピュータプログラム
WO2012037721A1 (en) * 2010-09-21 2012-03-29 Hewlett-Packard Development Company,L.P. Handwritten character font library
CN102455867B (zh) * 2011-09-29 2015-06-24 北京壹人壹本信息科技有限公司 一种手写文字信息的匹配处理方法及装置
CN102646023A (zh) * 2012-04-11 2012-08-22 广东欧珀移动通信有限公司 一种用户原始笔迹字体的生成方法
CN110489724A (zh) * 2019-03-13 2019-11-22 北京壹人壹本信息科技有限公司 手写字体的合成方法、移动终端及存储介质
CN110488997A (zh) * 2019-07-03 2019-11-22 深圳市九洲电器有限公司 基于语音的书写板实现方法及相关产品

Also Published As

Publication number Publication date
CN1521660A (zh) 2004-08-18

Similar Documents

Publication Publication Date Title
US7715630B2 (en) Interfacing with ink
KR0163178B1 (ko) 중국문자를 부호화하고 해독하는 장치 및 방법
US7319789B2 (en) Serial storage of ink and its properties
JP3425408B2 (ja) 文書読取装置
CN100351839C (zh) 文档检索·阅览方法以及文档检索·阅览装置
RU2406142C2 (ru) Система и способ для сохранения документа в последовательном двоичном формате
US6956970B2 (en) Information storage using tables and scope indices
CN1338068A (zh) 表意语言及非表意语言的文字输入***
CN101833545B (zh) 数字资源加工过程中的数据标引方法
CN1256689C (zh) 一种包含手写体文本的电子文档的保存方法
CN1371043A (zh) 数码操作***
CN1180858A (zh) 字符输入装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
CN105825250A (zh) 一种不良显示面板的统计方法及装置
CN1136496C (zh) 简化拼音-触摸屏鼠标式汉字输入方法
CN1140864C (zh) 掌上型数据处理装置的手写输入方法
CN103488616A (zh) 一种内嵌字体处理方法与装置
CN1169073C (zh) 图文编辑方法以及***
CN2643402Y (zh) 多国语言汉字查询装置
CN1359079A (zh) 超大型汉字信息处理装置及方法
CN114332875A (zh) 一种笔记卡片结构化方法
CN1549166A (zh) 电子读物制作和浏览的新的方法、装置以及***
CN115994521A (zh) 文档编辑方法、呈现方法、文档段落的识别方法及装置
CN1310371A (zh) 字符输入方法和装置
JPH0869477A (ja) 頁画像検索方法及び頁画像検索装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060517

Termination date: 20210129