CN105574930B - 一种汉字立体化数据采集与处理*** - Google Patents

一种汉字立体化数据采集与处理*** Download PDF

Info

Publication number
CN105574930B
CN105574930B CN201510958332.5A CN201510958332A CN105574930B CN 105574930 B CN105574930 B CN 105574930B CN 201510958332 A CN201510958332 A CN 201510958332A CN 105574930 B CN105574930 B CN 105574930B
Authority
CN
China
Prior art keywords
data
chinese character
dimensional
information
font
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510958332.5A
Other languages
English (en)
Other versions
CN105574930A (zh
Inventor
王健
黄卫星
张桂刚
岳野
杨颐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Jun Sheng (shenzhen) Intelligent Data Science And Technology Development Co Ltd
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN201510958332.5A priority Critical patent/CN105574930B/zh
Publication of CN105574930A publication Critical patent/CN105574930A/zh
Application granted granted Critical
Publication of CN105574930B publication Critical patent/CN105574930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明为一种汉字立体化数据采集与处理***包括:汉字立体化数据采集模块、汉字立体化数据存储模块、汉字立体化数据处理模块、汉字立体化数据整合模块;该方法可用于还原对甲骨文、女书、古书法字帖、碑刻、竹简、摩崖石刻或题词等文物上的文字,使其真实的立体化还原;汉字立体技术的应用主要体现在如下两个方面,一方面汉字立体化技术采集到的数据可以分类存储到汉字基础资源池中,可以用于建设中华字体库等;另一方面汉字立体化技术还原的碑刻、甲骨文等可以供给第三方使用,实现让用户足不出户就能观赏到这些在全国各地的文物信息并传播中华的汉字文化。

Description

一种汉字立体化数据采集与处理***
技术领域
本发明属于对于不同汉字载体进行3D仿真还原的数据采集与数据处理领域,特别涉及一种汉字立体化数据采集与处理***。
背景技术
近年来我国对于中国传统文化发展越来越重视,并提出文物数字化、文化数字化、汉字数字化等一系列国家发展战略。
作为汉字数字化的重要组成部分—汉字立体化技术的实现无疑会带来巨大的价值和意义。随着三维激光扫描设备、彩色CCD相机、太赫兹设备、GPS设备等精度的提高,以及数据集成、数据融合、数据处理、数据存储等处理技术的发展,使得数字化在历史建筑保护领域、隧道监测等领域都有了不同层次的应用。本方法描述的是针对甲骨文、女书、古代书法帖、碑刻、竹简、题词等上的文字通过不同的方法采集不同的数据,通过不同的汉字处理技术进行处理,使其可以方便存储并能真实的还原立体化汉字的模型。
发明内容
本发明的目的在于提供一种汉字立体化数据采集与处理***,该***可以对文字载体进行三维建模,可以为人们提供真实的汉字立体化模型。
为了实现上述目的,本发明提出了一种汉字立体化数据采集与处理***,包括汉字立体化数据采集模块、汉字立体化数据存储模块、汉字立体化数据处理模块、汉字立体化数据整合模块;
汉字立体化数据采集模块用于对字体载体的点云数据、地理位置数据、材质数据和图文信息数据进行采集;所述点云数据包括字体载体的三维空间坐标数据、颜色数据和表面纹理数据;
汉字立体化数据存储模块用于对汉字立体化数据采集模块采集到的数据进行数据集成,得到原始数据集,将原始数据集按照结构的不同分成结构化数据、半结构化数据和非结构化数据,并进行分别存储;
汉字立体化数据处理模块用于对汉字立体化数据存储模块中的数据进行处理,具体包括:
对点云数据进行处理,实现字体载体的三维曲面重建和三维模型输出;
对图文信息数据进行处理,利用采集到的图文信息对点云数据处理中输出的三维模型进行优化,得到新的字体载体的三维模型;
对地理信息数据处理,得到描述性的地理位置信息;
汉字立体化数据整合模块用于对汉字立体化数据处理模块处理后的数据进行融合,生成字体载体的综合数据集,并进行分类存储,以待第三方使用。
优选的,所述的点云数据包括三维激光扫描仪采集字体载体的三维空间坐标数据和彩色CCD相机采集字体载体表面纹理数据和颜色信息;
所述的地理位置数据为全球定位装置采集的字体载体发掘所在地的地理坐标数据;
所述材质数据为利用太赫兹扫描仪采集字体载体材质的相关数据信息及字体载体组成材质的分析结果;
所述图文信息数据包括字体载体不同角度的照片和数字化的文字资料。
优选的,所述点云数据的处理包括点云数据预处理、三维曲面重建和三维模型输出三步;
所述点云数据预处理包括点云数据修补、点云配准、点云噪声消除、点云数据压缩、点云数据平滑和点云数据分块;
所述三维曲面重建是依据预处理后的点云数据重建字体载体的三维模型和/或字体载体上单个字体的三维模型;
所述三维模型输出是将重建后的三维模型进行输出和存储,以备使用。
优选的,所述图文信息数据的处理具体为:对字体载体照片中的文字进行图像识别,获得字体载体中文字的具体数据信息,并结合数字化的文字资料对点云数据处理后得到的三维模型进行优化,生成更接近真实的新的三维模型。
优选的,所述地理信息数据的处理为通过文字载体中文字信息及数字化的文字资料信息提取文字载体的原始归属地信息,通过原始归属地信息分析其发掘地的坐标,利用所得到的坐标信息通过GPS获得的发掘地的当前实际地理位置,并采用描述性信息输出。
优选的,字体载体的综合数据集按照平面静态资源、平面动态资源、立体可移动资源、立体不可移动资源、活态文化资源进行分类存储。
本发明通过多重数据采集技术进行原始数据的采集,通过不同的数据处理方法实现了字体载体的三维模型和/或字体载体上单个字体的三维模型的重建,更将贴近文字载体最真实的立体形态,对展览、学习、研究等多方面均具有较大的意义。
附图说明
图1是本发明的架构图;
图2是本发明的实施例示意图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施方式,并参照附图,对本发明进一步详细说明。
如图1所示,本发明的一种汉字立体化数据采集与处理***,包括汉字立体化数据采集模块、汉字立体化数据存储模块、汉字立体化数据处理模块、汉字立体化数据整合模块;
汉字立体化数据采集模块用于对字体载体的点云数据、地理位置数据、材质数据和图文信息数据进行采集;所述点云数据包括字体载体的三维空间坐标数据、颜色数据和表面纹理数据。
所述的点云数据包括三维激光扫描仪采集字体载体的三维空间坐标数据和彩色CCD相机采集字体载体表面纹理数据和颜色信息;所述的地理位置数据为全球定位装置采集的字体载体发掘所在地的地理坐标数据;所述材质数据为利用太赫兹扫描仪采集字体载体材质的相关数据信息及字体载体组成材质的分析结果;所述图文信息数据包括字体载体不同角度的照片和数字化的文字资料。
汉字立体化数据存储模块用于对汉字立体化数据采集模块采集到的数据进行数据集成,得到原始数据集,将原始数据集按照结构的不同分成结构化数据、半结构化数据和非结构化数据,并进行分别存储。
汉字立体化数据处理模块用于对汉字立体化数据存储模块中的数据进行处理,具体包括:对点云数据进行处理,实现字体载体的三维曲面重建和三维模型输出;对图文信息数据进行处理,利用采集到的图文信息对点云数据处理中输出的三维模型进行优化,得到新的字体载体的三维模型;对地理信息数据处理,得到描述性的地理位置信息。
所述点云数据的处理包括点云数据预处理、三维曲面重建和三维模型输出三步;所述点云数据预处理包括点云数据修补、点云配准、点云噪声消除、点云数据压缩、点云数据平滑和点云数据分块;所述三维曲面重建是依据预处理后的点云数据重建字体载体的三维模型和/或字体载体上单个字体的三维模型;所述三维模型输出是将重建后的三维模型进行输出和存储,以备使用。
所述图文信息数据的处理具体为:对字体载体照片中的文字进行图像识别,获得字体载体中文字的具体数据信息,并结合数字化的文字资料对点云数据处理后得到的三维模型进行优化,生成更接近真实的新的三维模型。
所述地理信息数据的处理为通过文字载体中文字信息及数字化的文字资料信息提取文字载体的原始归属地信息,通过原始归属地信息分析其发掘地的坐标,利用所得到的坐标信息通过GPS获得的发掘地的当前实际地理位置,并采用描述性信息输出。
汉字基础资源库具有汉字立体化数据整合模块,用于对汉字立体化数据处理模块处理后的数据进行融合,生成字体载体的综合数据集,并在汉字基础资源库库中进行分类存储,以待第三方使用。
字体载体的综合数据集按照平面静态资源、平面动态资源、立体可移动资源、立体不可移动资源、活态文化资源进行分类存储。
汉字基础资源库通过不断地信息添加,逐步完成汉字基础资源库的建设,以更好的为第三方提供完善的信息。
该方法可用于还原对甲骨文、女书、古书法字帖、碑刻、竹简、摩崖石刻或题词等文物上的文字,使其真实的立体化还原。
如图2所示,本发明实施例以碑刻为例进行更进一步的描述。
1、本实施例中碑刻的数据采集模块采集的数据包括石碑空间数据、石碑外表、石碑材质、地理位置信息,以及碑刻的真实图文信息。具体包括:
1)碑刻点云数据
本例中所采集的碑刻的点云数据包括三维激光扫描仪采集碑刻的三维空间坐标数据和彩色CCD相机采集石碑表面纹理数据和颜色信息。
2)石碑材质信息
使用太赫兹扫描仪采集石碑材质的相关数据信息,并对这些数据信息进行分析,从而判断碑刻的组成材质,并得出结果数据。
3)地理位置信息
使用全球定位设备采集石碑发掘所在地的地理位置信息,并进行整理成相应的地理坐标数据。
4)碑刻图文信息
使用高分辨率相机对碑刻拍摄不同角度的照片,并尽可能多的涵盖了碑刻所有信息,结合有历史记载的文字资料,全方位、多视角的收集碑刻信息。
2、本实施例中的碑刻汉字立体化数据存储模块为源数据库:使用数据集成技术,将不同类型的碑刻数据从逻辑上进行集成,从而形成碑刻数据的原始数据集。将原始数据集按照结构的不同分成结构化数据、半结构化数据和非结构化数据,并分别存储相应的数据存储***中。
3、本实施例中的碑刻汉字立体化数据处理模块主要功能包括碑刻点云数据处理、碑刻图文信息数据处理和碑刻地理信息数据处理。
碑刻点云数据处理包括点云数据预处理、曲面重建和模型输出三步:
1)点云数据预处理
点云数据的预处理包括点云数据修补、点云配准、点云噪声消除、点云数据压缩、点云数据平滑和点云数据分块。
点云数据修补:由于测量设备的限制、待测对象自身形状的特点,采集的点云数据中经常包含各种无法测量的区域,即为空洞。这些空洞不仅影响三维模型的视觉效果,更会影响后期网格模型的一系列操作。
点云配准:在地面三维激光扫描中,受激光扫描仪视场角的限制和物体间遮蔽的影响,每站扫描只能获得当前扫描仪坐标系下的点云数据,因此,必须从不同的视场角对场景进行扫描,并将多个站点下获取的点云进行拼接,得到一个统一坐标系下的三维数据点集。
点云噪声消除:测量仪器中获得的海量点云数据中不可避免的存在许多冗余点和噪声点,这些噪声不仅会增加点云数据量,而且会影响建模的效率和精度,必须予以消除。
点云数据压缩:许多情况并不需要利用高精度的海量点云数据表达实体模型,而且采用海量点云还会直接影响点云的处理效率、特征的有效判断以及模型的构建质量等。因此,在实际中会根据不同的应用需求从原始的采样点云中抽取出足够表达模型特征的信息。
点云数据平滑:点云数据有很大的随机性误差,而且误差容易累计传递,影响后期的重构曲面的质量,因此重构曲面之前要对点云数据进行平滑处理。
点云数据分块:三维激光扫描仪采集的点云相当密集,经过数据精简后,仍旧有些点云数据很大,因此会造成表示曲面的数学模型和处理拟合算法的难度加大,无法用相对简单的数学表达式描述三维模型,所以可以采用“先分割再拼接”的思想,最后进行整体匹配恢复原始实体的形状。
2)三维曲面重建
量采集到的点云数据使其恢复原始曲面的几何模型,其实质就是如何将“点”变为“体”的过程。曲面重建首先是为散乱点添加拓扑结构信息,通常采用三角网格剖分建立散乱点之间的拓扑关系;在此基础上,再采用一定的数学形式去描述被测目标表面。
3)三维模型输出
经过点云数据的预处理和三维曲面重建后得到碑刻的三维模型,本例中可以重建两种三维模型,一种是碑刻整体的三维模型,另一种是碑刻中单个汉字的三维模型。二者都可以存储在汉字基础资源库中供第三方使用。
碑刻图文信息数据处理:
对于碑刻的真实照片,我们使用文字识别技术,识别碑刻中的文字,从而获得碑刻中汉字的具体数据信息,并结合正规历史记载的文字资料,将点云重建中得到的三维模型,包括碑刻整体的模型和单个汉字的模型,还原为最真实的立体形态。
碑刻地理信息数据处理:
由GPS获得的地理位置信息并不直接就是我们常用的经纬度信息,而是根据碑文信息和数字化文字信息提取地理位置相关信息,依据该信息分析该碑文的原始所在地坐标,利用所得到的坐标信息通过GPS获得的发掘地的当前实际地理位置,并采用描述性信息输出,供第三方应用***使用。
4、碑刻汉字立体化数据整合、存储及使用
在数据加工的处理中,我们采用不同的技术对点云数据进行预处理,将碑刻照片使用文字识别技术识别出的汉字数据信息,将地理位置信息转换成描述性信息,还要将数据进行融合,从而得到碑刻综合数据集,并最终将获得这些数据存入汉字资源素材库中的立体不可移动资源类别,汉字资源素材库通过统一数据接口向第三方应用***提供碑刻汉字立体化数据信息。
将碑刻数据集作为第三方应用***的后台资源库,供用户观赏体验。用户可以得到碑刻数据的三维模型及附件信息,如地理位置信息。并可以360°旋转观察汉字的结构、体验汉字的立体感。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (6)

1.一种汉字立体化数据采集与处理***,其特征在于,包括汉字立体化数据采集模块、汉字立体化数据存储模块、汉字立体化数据处理模块、汉字立体化数据整合模块;
汉字立体化数据采集模块用于对字体载体的点云数据、地理位置数据、材质数据和图文信息数据进行采集;所述点云数据包括字体载体的三维空间坐标数据、颜色数据和表面纹理数据;
汉字立体化数据存储模块用于对汉字立体化数据采集模块采集到的数据进行数据集成,得到原始数据集,将原始数据集按照结构的不同分成结构化数据、半结构化数据和非结构化数据,并进行分别存储;
汉字立体化数据处理模块用于对汉字立体化数据存储模块中的数据进行处理,具体包括:
对点云数据进行处理,实现字体载体的三维曲面重建和三维模型输出;
对图文信息数据进行处理,利用采集到的图文信息对点云数据处理中输出的三维模型进行优化,得到新的字体载体的三维模型;
对地理信息数据处理,得到描述性的地理位置信息;
汉字立体化数据整合模块用于对汉字立体化数据处理模块处理后的数据进行融合,生成字体载体的综合数据集,并进行分类存储,以待第三方使用。
2.根据权利要求1所述的***,其特征在于,
所述点云数据包括三维激光扫描仪采集字体载体的三维空间坐标数据和彩色CCD相机采集字体载体表面纹理数据和颜色信息;
所述地理位置数据为全球定位装置采集的字体载体的发掘地的地理坐标数据;
所述材质数据为利用太赫兹扫描仪采集字体载体材质的相关数据信息及字体载体组成材质的分析结果;
所述图文信息数据包括字体载体不同角度的照片和数字化的文字资料。
3.根据权利要求1所述的***,其特征在于,所述点云数据的处理包括点云数据预处理、三维曲面重建和三维模型输出三步;
所述点云数据预处理包括点云数据修补、点云配准、点云噪声消除、点云数据压缩、点云数据平滑和点云数据分块;
所述三维曲面重建是依据预处理后的点云数据重建字体载体的三维模型和/或字体载体上单个字体的三维模型;
所述三维模型输出是将重建后的三维模型进行输出和存储,以备使用。
4.根据权利要求2所述的***,其特征在于,所述图文信息数据的处理具体为:
对字体载体照片中的文字进行图像识别,获得字体载体中文字的具体数据信息,并结合数字化的文字资料对点云数据处理后得到的三维模型进行优化,生成更接近真实的新的三维模型。
5.根据权利要求1所述的***,其特征在于,所述地理信息数据的处理为通过文字载体中文字信息及数字化的文字资料信息提取文字载体的原始归属地信息,通过原始归属地信息分析其发掘地的坐标,利用所得到的坐标信息,并通过GPS获得的发掘地的当前实际地理位置,并采用描述性信息输出。
6.根据权利要求1-5任一项所述的***,其特征在于,字体载体的综合数据集按照平面静态资源、平面动态资源、立体可移动资源、立体不可移动资源、活态文化资源进行分类存储。
CN201510958332.5A 2015-12-18 2015-12-18 一种汉字立体化数据采集与处理*** Active CN105574930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510958332.5A CN105574930B (zh) 2015-12-18 2015-12-18 一种汉字立体化数据采集与处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510958332.5A CN105574930B (zh) 2015-12-18 2015-12-18 一种汉字立体化数据采集与处理***

Publications (2)

Publication Number Publication Date
CN105574930A CN105574930A (zh) 2016-05-11
CN105574930B true CN105574930B (zh) 2018-03-30

Family

ID=55885013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510958332.5A Active CN105574930B (zh) 2015-12-18 2015-12-18 一种汉字立体化数据采集与处理***

Country Status (1)

Country Link
CN (1) CN105574930B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784691A (zh) * 2016-08-26 2018-03-09 上海宝冶集团有限公司 基于钢构件特征的曲边界拟合方法
CN110001052B (zh) * 2019-04-12 2020-11-06 河南师范大学 一种基于3d打印技术制作三维立体柔性甲骨文书法作品的方法
CN114491109B (zh) * 2022-01-21 2022-10-21 河北地质大学 一种化石标本数据库***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077516A (zh) * 2012-12-31 2013-05-01 温佩芝 一种石刻文字的数字化拓片方法
CN104504750A (zh) * 2014-12-16 2015-04-08 陈碧帆 一种不可移动文物全景数据采集技术

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077516A (zh) * 2012-12-31 2013-05-01 温佩芝 一种石刻文字的数字化拓片方法
CN104504750A (zh) * 2014-12-16 2015-04-08 陈碧帆 一种不可移动文物全景数据采集技术

Also Published As

Publication number Publication date
CN105574930A (zh) 2016-05-11

Similar Documents

Publication Publication Date Title
CN106127771B (zh) 基于激光雷达lidar点云数据获取隧道正射影像***及方法
CN112115198B (zh) 一种城市遥感智能服务平台
WO2018152942A1 (zh) 一种基于多源大数据融合的城市空间全息地图的构建方法
CN106846478A (zh) 水电水利工程地质三维实景野外编录填图***
CN105005580B (zh) 一种用于显示水库地形的方法及其装置
CN102708587A (zh) 一种快速获取三维建筑信息的方法及***
CN111985161A (zh) 一种变电站三维模型重构方法
CN105574930B (zh) 一种汉字立体化数据采集与处理***
CN106097433A (zh) 物体工业与影像模型的叠加方法及***
CN112819066A (zh) 一种Res-UNet单木树种分类技术
CN110197035B (zh) 一种航道水下地形变化分析***及方法
CN110827406A (zh) 一种实现大水网隧洞快速三维重构方法
Khayyal et al. Creation and spatial analysis of 3D city modeling based on GIS data
CN101364311A (zh) 大规模城市仿真中快速自动建立模型的方法
Gavryushkina The potential and problems of volumetric 3D modeling in archaeological stratigraphic analysis: A case study from Chlorakas-Palloures, Cyprus
CN103745019A (zh) 一种海量数据处理方法
Ackerman et al. Geospatial capabilities of HEC-RAS for model development and mapping
CN105678097B (zh) 数字高程模型自动化构建方法
WO2018196214A1 (zh) 一种地理影响民居建筑形态的统计***及统计方法
Lou et al. Cave feature extraction and classification from rockery point clouds acquired with handheld laser scanners
Heitzler et al. Unlocking the geospatial past with deep learning–establishing a hub for historical map data in switzerland
Jin et al. Analysis of the Modeling Method and Application of 3D City Model based on the CityEngine
Li et al. Research and application of 3D visualization plug-in integration with arcgis
Zeng et al. 3D plants reconstruction based on point cloud
Cai et al. BIM technology of implicit and explicit parts of historical building components based on point cloud data and digital radiographic image: a review

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20180601

Address after: 518057 A, 6 yuan, Zhuyuan garden, No. 5 KELONG Road, Yuhai street, Nanshan District, Shenzhen, Guangdong.

Patentee after: Zhongke Jun Sheng (Shenzhen) intelligent data science and Technology Development Co., Ltd.

Address before: 100080 No. 95 East Zhongguancun Road, Beijing, Haidian District

Patentee before: Institute of Automation, Chinese Academy of Sciences

TR01 Transfer of patent right