CN106599083A - 云藏藏文搜索引擎服务*** - Google Patents
云藏藏文搜索引擎服务*** Download PDFInfo
- Publication number
- CN106599083A CN106599083A CN201611043848.8A CN201611043848A CN106599083A CN 106599083 A CN106599083 A CN 106599083A CN 201611043848 A CN201611043848 A CN 201611043848A CN 106599083 A CN106599083 A CN 106599083A
- Authority
- CN
- China
- Prior art keywords
- platform
- service
- data
- retrieval
- *** language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供了云藏藏文搜索引擎服务***,包括数据采集、数据索引***、检索服务终端、身份验证识别服务平台、网络数据通讯安全防护平台、数据检索服务平台、检索信息服务推送平台、数据库服务支持平台、数据通讯网络平台、藏文在线编译、转换编码***、藏文搜索词自动纠错***、相关词计算***、藏文拉丁转写***、藏文同义词***及基于云数据处理***的基础信息存储服务器平台,检索服务终端、身份验证识别服务平台、网络数据通讯安全防护平台、数据检索服务平台、检索信息服务推送平台分别通过数据通讯网络平台与数据库服务支持平台连接。本发明一方面可有效的提高数据检索作业的效率,提高数据检索作业的安全性和可靠性,另一方面有助于有效的整合网络资源,提高***的使用灵活性和资源覆盖范围。
Description
技术领域
本发明涉及一种语言编译***,确切是一种藏文词性标注***。
背景技术
结合当前藏区经济文化发展需要及藏区文化与其他文化的交流的需要,除了传统的信息交流驱动之外,当前越来越多的开始依靠网络平台进行交流,但在实际的操作中发现,由于藏文是一个比较独特的语种,在文字、词义发音等方面与当前主流的语言之间存在着极大的差异,从而严重制约基于藏文的网络***与当前主流语言网络***之间的信息交流和数据检索,而针对这一问题,当前尚无有效的解决方式,仅仅是通过一些简单编译***直接进行编译,然后生硬的进行引用,一方面造成了藏文信息在交流过程中的数据交互效率低下,数据交互安全性严重不足,数据过于稀疏,冗余信息或信息噪声过多,另一方面藏文信息在交流过程中由于歧义等问题没能很好地解决,往往与实际词义存在较大的误差,严重影响信息交流的准确性和可靠性,除此之外,也极大的制约了当前基于藏文的网络***与其他网络***之间数据交流和使用的需要,因此针对这一现状,需要开发一种全新网络智能数据检索服务***,以满足实际使用的需要。
发明内容
本发明的目的是提供本发明提供云藏藏文搜索引擎服务***。
为了达到上述目的,本发明提供如下技术方案:
云藏藏文搜索引擎服务***,包括数据采集***、数据索引***、检索服务终端、身份验证识别服务平台、网络数据通讯安全防护平台、数据检索服务平台、检索信息服务推送平台、数据库服务支持平台、数据通讯网络平台、藏文在线编译、转换编码***、藏文搜索词自动纠错***、相关词计算***藏文拉丁转写***、藏文同义词***及基于云数据处理***的基础信息存储服务器平台,其中数据库服务支持平台和藏文在线编译编码平台嵌于基于云数据处理***的基础信息存储服务器平台内,检索服务终端、身份验证识别服务平台、网络数据通讯安全防护平台、数据检索服务平台、检索信息服务推送平台分别通过数据通讯网络平台与数据库服务支持平台连接,数据库服务支持平台和藏文在线编译编码平台均至少一个并分别与基于云数据处理***的基础信息存储服务器平台连接,其中检索服务终端若干并相互并联,数据检索服务平台、检索信息服务推送平台、数据库服务支持平台和基于云数据处理***的基础信息存储服务器平台均至少一个,且各数据检索服务平台、检索信息服务推送平台、数据库服务支持平台和基于云数据处理***的基础信息存储服务器平台之间均相互串联。
进一步的,所述的检索服务终端包括PC客户端网站、移动通讯装置及APP***服务终端中的任意一种或几种共用。
进一步的,所述的数据检索服务平台为在Lucene的开源架构下二次开发而成,包括检索服务服务***及第三方网络搜索平台,其中所述的检索服务服务***与若干个第三方网络搜索平台连接,且各第三方网络搜索平台间均相互并联。
进一步的,所述的检索服务服务***包括至少一个域内数据访问子***、至少一个跨域数据访问子***及至少一个数据访问信任度计算统计子***,其中所述域内数据访问子***和跨域数据访问子***相互并联并分别与数据访问信任度计算统计子***连接。
进一步的,所述的第三方网络搜索平台为诸如百度搜索平台、360搜索平台等现有数据检索平台。
进一步的,所述的检索信息服务推送平台包括包括用户信息管理子***、图文信息管理子***、视频信息管理子***、音频信息管理子***、数据编码转换子***及数据输出管理子***,且用户信息管理子***、图文信息管理子***、视频信息管理子***、音频信息管理子***、数据编码转换子***及数据输出管理子***均至少一个并相互串联。
进一步的,所述的数据库服务支持平台采用Oracle、DB2、Sybase、MS SQL Server、Informax、MySQL、MongoDB***中的任意一种。
进一步的,所述的基于云数据处理***的基础信息存储服务器平台包括至少一个核心操作服务平台、若干维护管理操作终端平台、图文信息处理***、视频信息处理***、音频信息处理***、文件编码转换***、数据存储平台及数据存储备份平台,其中所述的维护管理操作终端平台、数据存储平台及数据存储备份平台均与核心操作服务平台连接,所述的图文信息处理***、视频信息处理***、音频信息处理***、文件编码转换***均嵌于核心操作服务平台上。
进一步的,所述的藏文在线编译编码平台包括藏文在线编译***、藏文分词***、藏文词性标注***及数据库服务器,所述的藏文在线编译***、藏文分词***、藏文词性标注***均与数据库服务器连接。
本发明***构成结构简单,结构模块化设计特征显著,数据处理能力强,数据运行安全性好,同时另具有良好的扩展性和与外部第三方***信息交互写作能力,从而一方面可有效的提高数据检索作业的效率,提高数据检索作业的安全性和可靠性,另一方面有助于有效的整合网络资源,提高***的使用灵活性和资源覆盖范围,从而满足多种不同类型用户使用的需要。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明***结构示意图。
具体实施方式
下面将结合本发明的附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,云藏藏文搜索引擎服务***,包括数据采集***1、数据索引***2、检索服务终端3、身份验证识别服务平台4、网络数据通讯安全防护平台5、数据检索服务平台6、检索信息服务推送平台7、数据库服务支持平台8、数据通讯网络平台9、藏文在线编译、转换编码***10、藏文搜索词自动纠错***11、相关词计算***12及基于云数据处理***的基础信息存储服务器平台13,其中数据库服务支持平台6和藏文在线编译、转换编码***10嵌于基于云数据处理***的基础信息存储服务器平台9内,检索服务终端1、身份验证识别服务平台2、网络数据通讯安全防护平台3、数据检索服务平台4、检索信息服务推送平台5分别通过数据通讯网络平台7与数据库服务支持平台6连接,数据库服务支持平台6和藏文在线编、转换译编码***8均至少一个并分别与基于云数据处理***的基础信息存储服务器平台9连接,其中检索服务终端1若干并相互并联,数据检索服务平台4、检索信息服务推送平台5、数据库服务支持平台6和基于云数据处理***的基础信息存储服务器平台9均至少一个,且各数据检索服务平台4、检索信息服务推送平台5、数据库服务支持平台6和基于云数据处理***的基础信息存储服务器平台9之间均相互串联。
本实施例中,所述的检索服务终端包括PC客户端网站、移动通讯装置及APP***服务终端中的任意一种或几种共用。
本实施例中,所述的数据检索服务平台为在Lucene的开源架构下二次开发而成,包括检索服务服务***及第三方网络搜索平台,其中所述的检索服务服务***与若干个第三方网络搜索平台连接,且各第三方网络搜索平台间均相互并联。
本实施例中,所述的检索服务服务***包括至少一个域内数据访问子***、至少一个跨域数据访问子***及至少一个数据访问信任度计算统计子***,其中所述域内数据访问子***和跨域数据访问子***相互并联并分别与数据访问信任度计算统计子***连接。
本实施例中,所述的第三方网络搜索平台为诸如百度搜索平台、360搜索平台等现有数据检索平台。
本实施例中,所述的检索信息服务推送平台包括包括用户信息管理子***、图文信息管理子***、视频信息管理子***、音频信息管理子***、数据编码转换子***及数据输出管理子***,且用户信息管理子***、图文信息管理子***、视频信息管理子***、音频信息管理子***、数据编码转换子***及数据输出管理子***均至少一个并相互串联。
本实施例中,所述的数据库服务支持平台采用Oracle、DB2、Sybase、MS SQLServer、Informax、MySQL、MongoDB***中的任意一种。
本实施例中,所述的基于云数据处理***的基础信息存储服务器平台包括至少一个核心操作服务平台、若干维护管理操作终端平台、图文信息处理***、视频信息处理***、音频信息处理***、文件编码转换***、数据存储平台及数据存储备份平台,其中所述的维护管理操作终端平台、数据存储平台及数据存储备份平台均与核心操作服务平台连接,所述的图文信息处理***、视频信息处理***、音频信息处理***、文件编码转换***均嵌于核心操作服务平台上。
本实施例中,所述的藏文在线编译编码平台包括藏文在线编译***、藏文分词***、藏文词性标注***及数据库服务器,所述的藏文在线编译***、藏文分词***、藏文词性标注***均与数据库服务器连接。
本发明***构成结构简单,结构模块化设计特征显著,数据处理能力强,数据运行安全性好,同时另具有良好的扩展性和与外部第三方***信息交互写作能力,从而一方面可有效的提高数据检索作业的效率,提高数据检索作业的安全性和可靠性,另一方面有助于有效的整合网络资源,提高***的使用灵活性和资源覆盖范围,从而满足多种不同类型用户使用的需要。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (9)
1.云藏藏文搜索引擎服务***,其特征在于:所述的智能在线搜索引擎服务***包括数据采集、数据索引***、检索服务终端、身份验证识别服务平台、网络数据通讯安全防护平台、数据检索服务平台、检索信息服务推送平台、数据库服务支持平台、数据通讯网络平台、藏文在线编译、转换编码***、藏文搜索词自动纠错***、相关词计算***、藏文拉丁转写***、藏文同义词***及基于云数据处理***的基础信息存储服务器平台,其中所述的数据库服务支持平台和藏文在线编译编码平台嵌于基于云数据处理***的基础信息存储服务器平台内,所述的检索服务终端、身份验证识别服务平台、网络数据通讯安全防护平台、数据检索服务平台、检索信息服务推送平台分别通过数据通讯网络平台与数据库服务支持平台连接,所述的数据库服务支持平台和藏文在线编译编码平台均至少一个并分别与基于云数据处理***的基础信息存储服务器平台连接,其中所述检索服务终端若干并相互并联,所述的数据检索服务平台、检索信息服务推送平台、数据库服务支持平台和基于云数据处理***的基础信息存储服务器平台均至少一个,且各数据检索服务平台、检索信息服务推送平台、数据库服务支持平台和基于云数据处理***的基础信息存储服务器平台之间均相互串联。
2.根据权利要求1所述的云藏藏文搜索引擎服务***,其特征在于:所述的检索服务终端包括PC客户端网站、移动通讯装置及APP***服务终端中的任意一种或几种共用。
3.根据权利要求1所述的云藏藏文搜索引擎服务***,其特征在于:所述的数据检索服务平台为在Lucene的开源架构下二次开发而成,包括检索服务服务***及第三方网络搜索平台,其中所述的检索服务服务***与若干个第三方网络搜索平台连接,且各第三方网络搜索平台间均相互并联。
4.根据权利要求3所述的云藏藏文搜索引擎服务***,其特征在于:所述的检索服务服务***包括至少一个域内数据访问子***、至少一个跨域数据访问子***及至少一个数据访问信任度计算统计子***,其中所述域内数据访问子***和跨域数据访问子***相互并联并分别与数据访问信任度计算统计子***连接。
5.根据权利要求3所述的云藏藏文搜索引擎服务***,其特征在于:所述的第三方网络搜索平台为诸如百度搜索平台、360搜索平台等现有数据检索平台。
6.根据权利要求1所述的云藏藏文搜索引擎服务***,其特征在于:所述的检索信息服务推送平台包括用户信息管理子***、图文信息管理子***、视频信息管理子***、音频信息管理子***、数据编码转换子***及数据输出管理子***,且用户信息管理子***、图文信息管理子***、视频信息管理子***、音频信息管理子***、数据编码转换子***及数据输出管理子***均至少一个并相互串联。
7.根据权利要求1所述的云藏藏文搜索引擎服务***,其特征在于:所述的数据库服务支持平台采用Oracle、DB2、Sybase、MS SQL Server、Informax、MySQL、MongoDB***中的任意一种。
8.根据权利要求1所述的云藏藏文搜索引擎服务***,其特征在于:所述的基于云数据处理***的基础信息存储服务器平台包括至少一个核心操作服务平台、若干维护管理操作终端平台、图文信息处理***、视频信息处理***、音频信息处理***、文件编码转换***、数据存储平台及数据存储备份平台,其中所述的维护管理操作终端平台、数据存储平台及数据存储备份平台均与核心操作服务平台连接,所述的图文信息处理***、视频信息处理***、音频信息处理***、文件编码转换***均嵌于核心操作服务平台上。
9.根据权利要求1所述的云藏藏文搜索引擎服务***,其特征在于:所述的藏文在线编译编码平台包括藏文在线编码编译***、藏文分词***、藏文词性标注***及数据库服务器,所述的藏文在线编码编译***、藏文分词***、藏文词性标注***均与数据库服务器连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611043848.8A CN106599083A (zh) | 2016-11-24 | 2016-11-24 | 云藏藏文搜索引擎服务*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611043848.8A CN106599083A (zh) | 2016-11-24 | 2016-11-24 | 云藏藏文搜索引擎服务*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106599083A true CN106599083A (zh) | 2017-04-26 |
Family
ID=58593009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611043848.8A Pending CN106599083A (zh) | 2016-11-24 | 2016-11-24 | 云藏藏文搜索引擎服务*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106599083A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1685341A (zh) * | 2002-09-30 | 2005-10-19 | 陈宁萍 | 跨语言搜索结果的闪烁注释标注加亮 |
CN102609408A (zh) * | 2012-01-11 | 2012-07-25 | 清华大学 | 基于多文种文档图像识别的跨文种理解方法 |
CN202486780U (zh) * | 2012-03-06 | 2012-10-10 | 郑州航空工业管理学院 | 基于云计算的信息检索*** |
CN104239294A (zh) * | 2014-09-10 | 2014-12-24 | 华建宇通科技(北京)有限责任公司 | 藏汉翻译***的多策略藏语长句切分方法 |
CN104809176A (zh) * | 2015-04-13 | 2015-07-29 | 中央民族大学 | 藏语实体关系抽取方法 |
CN104834633A (zh) * | 2015-05-29 | 2015-08-12 | 厦门大学 | 一种云翻译输入法及*** |
CN105378775A (zh) * | 2013-03-14 | 2016-03-02 | 微软技术许可有限责任公司 | 多语言信息检索与广告 |
CN105531706A (zh) * | 2013-07-17 | 2016-04-27 | 索特斯波特有限公司 | 用于信息检索***的搜索引擎 |
CN105760531A (zh) * | 2016-03-03 | 2016-07-13 | 华南师范大学 | 多语言搜索引擎方法及*** |
-
2016
- 2016-11-24 CN CN201611043848.8A patent/CN106599083A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1685341A (zh) * | 2002-09-30 | 2005-10-19 | 陈宁萍 | 跨语言搜索结果的闪烁注释标注加亮 |
CN102609408A (zh) * | 2012-01-11 | 2012-07-25 | 清华大学 | 基于多文种文档图像识别的跨文种理解方法 |
CN202486780U (zh) * | 2012-03-06 | 2012-10-10 | 郑州航空工业管理学院 | 基于云计算的信息检索*** |
CN105378775A (zh) * | 2013-03-14 | 2016-03-02 | 微软技术许可有限责任公司 | 多语言信息检索与广告 |
CN105531706A (zh) * | 2013-07-17 | 2016-04-27 | 索特斯波特有限公司 | 用于信息检索***的搜索引擎 |
CN104239294A (zh) * | 2014-09-10 | 2014-12-24 | 华建宇通科技(北京)有限责任公司 | 藏汉翻译***的多策略藏语长句切分方法 |
CN104809176A (zh) * | 2015-04-13 | 2015-07-29 | 中央民族大学 | 藏语实体关系抽取方法 |
CN104834633A (zh) * | 2015-05-29 | 2015-08-12 | 厦门大学 | 一种云翻译输入法及*** |
CN105760531A (zh) * | 2016-03-03 | 2016-07-13 | 华南师范大学 | 多语言搜索引擎方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110990664A (zh) | 一种大数据运营管理*** | |
CN102722525A (zh) | 通讯录人名的语言模型建立方法、语音搜索方法及其*** | |
CN105183834A (zh) | 一种基于本体库的交通大数据语义应用服务方法 | |
US10924551B2 (en) | IRC-Infoid data standardization for use in a plurality of mobile applications | |
CN103500173A (zh) | 一种轨道交通监测数据的查询方法 | |
WO2023131218A1 (zh) | 图数据的存储 | |
CN102262680A (zh) | 一种基于海量数据存取需求的分布式数据库代理*** | |
CN103871402A (zh) | 语言模型训练***、语音识别***及相应方法 | |
CN111899822B (zh) | 医疗机构数据库构建方法、查询方法、装置、设备和介质 | |
CN106570153A (zh) | 一种海量url的数据提取方法及*** | |
CN104391899B (zh) | 一种集中清算***的数据管理方法及*** | |
CN104536700B (zh) | 一种码流数据的快速存储/读取方法及*** | |
CN114792145A (zh) | 一种基于知识图谱的标准数字化管理维护***及方法 | |
CN103198146B (zh) | 面向网络流式数据的事件实时过滤方法和*** | |
CN104407839A (zh) | 一种复杂运算逻辑的解析方法及装置 | |
CN111737655A (zh) | 一种云管理平台的用户权限管理方法、***及存储介质 | |
CN106599083A (zh) | 云藏藏文搜索引擎服务*** | |
CN104391892A (zh) | 一种基于元数据驱动的地产信息访问*** | |
CN106570152A (zh) | 一种手机号码的海量提取方法及*** | |
CN109828953A (zh) | 基于分布式内存数据库的图片检索***及其方法 | |
CN1716241A (zh) | 采用声频数据比较的自动翻译处理方法及自动翻译器 | |
CN103473281A (zh) | 数字影音图书馆*** | |
CN114721582A (zh) | 信息共享方法、装置及相关设备 | |
CN102053997B (zh) | 一种人物踪迹的搜索方法及装置 | |
CN105589803A (zh) | 一种测试工具的生成方法和终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170426 |