CN102799795B - 物种移动鉴别***、终端、服务器及方法 - Google Patents

物种移动鉴别***、终端、服务器及方法 Download PDF

Info

Publication number
CN102799795B
CN102799795B CN201110136064.0A CN201110136064A CN102799795B CN 102799795 B CN102799795 B CN 102799795B CN 201110136064 A CN201110136064 A CN 201110136064A CN 102799795 B CN102799795 B CN 102799795B
Authority
CN
China
Prior art keywords
species
sequence
code
base sequence
base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110136064.0A
Other languages
English (en)
Other versions
CN102799795A (zh
Inventor
刘昶
李欢
陈士林
邢航
梁栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Institute of Medicinal Plant Development of CAMS and PUMC
Original Assignee
Beihang University
Institute of Medicinal Plant Development of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University, Institute of Medicinal Plant Development of CAMS and PUMC filed Critical Beihang University
Priority to CN201110136064.0A priority Critical patent/CN102799795B/zh
Publication of CN102799795A publication Critical patent/CN102799795A/zh
Application granted granted Critical
Publication of CN102799795B publication Critical patent/CN102799795B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种物种移动鉴别***,包括:通信终端,用于采集被鉴定对象的二维码图像,并向网络侧发送物种鉴定请求,物种鉴定请求中携带二维码图像;物种鉴定服务器,包括物种数据库,用于接收通信终端发送的物种鉴定请求,并对物种鉴定请求中携带的二维码图像进行解码,获得对应的碱基序列,然后根据获得的碱基序列在物种数据库进行匹配,并根据匹配物种的信息组装鉴定结论,将鉴定结论反馈给通信终端。本发明还涉及一种物种鉴定服务器和物种移动鉴别方法。本发明通过具备摄像/扫描功能的通信终端采集被鉴定对象的二维码图像,并利用网络侧的物种鉴定服务器来进行物种鉴定,整个过程无需手动输入请求参数,因此操作简便,鉴别过程时间短且高效。

Description

物种移动鉴别***、终端、服务器及方法
技术领域
本发明涉及物种鉴定技术,尤其涉及一种物种移动鉴别***、终端、服务器及方法。
背景技术
传统的物种鉴定技术采用形态学的方法鉴定物种,生物分类学家通过生物的外观形态来区分各种生物,但是地球生物物种繁多,据统计地球生物种类超过1000万种,当前已鉴定的物种约170万种,依靠生物分类学家,通过形态学鉴定物种是一项非常艰巨的任务。同时,相邻的物种往往具有非常相似的形态特征,即使是熟练的分类专家也很难通过形态特征对物种进行快速,准确的鉴定。另外,同一物种在不同的发育时期其形态也是不同的,在某些发育时期可能不具备其用来做物种鉴定的特征,例如,对于种子样品,就无法根据根,茎和叶的形态来做物种鉴定。
DNA条形码是近年来发展起来的一项新技术,已经在学术界进行了广泛的研究。DNA条形码指的是生物体DNA序列中一段标准DNA片段,这个片段的序列对研究的物种具有特异性。换句话说,根据DNA序列,就可以确定相应样品的物种来源。在建立DNA条形码数据库的基础上,通过比对待测生物DNA条形码与DNA条形码数据库中的DNA条形码,就可以快速、准确地鉴定物种。
在现在已知的基于DNA条形码数据库的物种鉴定***中,DNA条形码数据库中保存的是已经确定的物种的条形码,在鉴定时,需从待鉴定生物中提取DNA条形码序列,使用序列比对算法在DNA条形码数据库中通过序列匹配找到与待鉴定生物DNA条形码最相似的条形码,如果数据库中最佳匹配的条形码与待鉴定生物条形码的近似度高于给定阈值,则判断待鉴定生物就属于数据库中与之匹配的条形码代表的物种。
上述物种鉴定***采用B/S模式(浏览器/服务器模式),用户通过网页浏览器打开鉴定***的主页,在鉴定功能栏目中利用专用扫描设备扫描输入待鉴定生物的DNA条形码,发送鉴定请求,服务器接收请求,对该DNA条形码进行鉴定,最后将鉴定结果反馈给客户端。
该已知物种鉴定***尚存在以下缺陷:
(1)缺乏标准的DNA条形码数据库,在DNA条形码数据库中还存在大量非标准的原始数据或待处理数据,影响鉴别的准确度;
(2)缺乏简单,快速,高容量的DNA条形码表达方式;现在的DNA条形码仍然用DNA序列来表示,DNA序列是一段200-600个碱基长的字符串,打印出来占的面积较大,不能直接用来标记相应的样品;
(3)缺乏简便的DNA条形码采集和识别方式,当前的DNA条形码用字符串来表示,只能用能够识别字符串的仪器来扫描,识别,速度慢,错误率高;
(4)缺乏快速和准确的序列比对方法,当前的方法主要包括常用的基于BLAST的序列相似性比对算法,该算法首先找出被检测序列与标准序列相似的部分,然后再根据这些相似部分中的不相似部分进行比对。这种方法忽视了被测部分与标准序列中不相似的部分,从而降低了鉴定效率。
发明内容
本发明的目的是提出一种物种移动鉴别***、终端、服务器及方法,能够实现以移动方式进行物种信息的采集和识别,使得物种鉴别更为方便快速。
为实现上述目的,本发明提供了一种物种移动鉴别***,包括:
通信终端,用于通过摄像/扫描功能采集被鉴定对象的二维码图像,并向网络侧发送物种鉴定请求,所述物种鉴定请求中携带所述二维码图像;
物种鉴定服务器,包括物种数据库,用于接收所述通信终端发送的所述物种鉴定请求,并对所述物种鉴定请求中携带的二维码图像进行解码,获得对应的碱基序列,然后根据获得的碱基序列在所述物种数据库进行匹配,并根据匹配物种的信息组装鉴定结论,将所述鉴定结论反馈给所述通信终端。
为实现上述目的,本发明提供了一种物种鉴定服务器,设于网络侧,包括:
鉴定请求接收模块,用于接收通信终端发送的物种鉴定请求,所述物种鉴定请求中携带有所述通信终端通过摄像/扫描功能采集到的被鉴定对象的二维码图像;
二维码图像解码模块,用于对所述二维码图像进行解码,获得对应的碱基序列;
物种数据库,用于保存各个物种的参考碱基序列;
碱基序列匹配模块,用于根据获得的碱基序列在所述物种数据库进行匹配;
鉴定结论组装模块,用于根据匹配物种的信息组装鉴定结论;
鉴定结论反馈模块,用于将所述鉴定结论反馈给所述通信终端。
为实现上述目的,本发明提供了一种物种移动鉴别方法,包括:
网络侧的物种鉴定服务器接收通信终端发送的物种鉴定请求,所述物种鉴定请求中携带有所述通信终端通过摄像/扫描功能采集到的被鉴定对象的二维码图像;
所述物种鉴定服务器对所述二维码图像进行解码,获得对应的碱基序列;
所述物种鉴定服务器根据获得的碱基序列在物种数据库进行匹配,并根据匹配物种的信息组装鉴定结论;
所述物种鉴定服务器将所述鉴定结论反馈给所述通信终端。
为实现上述目的,本发明提供了一种物种移动鉴别终端,包括:
二维码采集模块,用于通过摄像/扫描功能采集被鉴定对象的二维码图像;
物种数据库,用于保存各个物种的参考碱基序列;
二维码图像解码模块,用于对所述二维码图像进行解码,获得对应的碱基序列;
碱基序列匹配模块,用于根据获得的碱基序列在所述物种数据库进行匹配;
鉴定结论组装模块,用于根据匹配物种的信息组装鉴定结论;
鉴定结论展示模块,用于通过展示功能展示所述鉴定结论。
为实现上述目的,本发明还提供了一种物种移动鉴别方法,包括:
物种移动鉴别终端通过摄像/扫描功能采集到的被鉴定对象的二维码图像;
所述物种移动鉴别终端对所述二维码图像进行解码,获得对应的碱基序列;
所述物种移动鉴别终端根据获得的碱基序列在物种数据库进行匹配,并根据匹配物种的信息组装鉴定结论;
所述物种移动鉴别终端通过展示功能展示所述鉴定结论。
基于上述技术方案,本发明通过具备摄像/扫描功能的终端采集被鉴定对象的二维码图像,并在本地或利用网络侧的物种鉴定服务器来进行物种鉴定,整个过程无需手动输入请求参数,因此操作简便,鉴别过程时间短且高效。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明物种移动鉴别***的一实施例的结构示意图。
图2为本发明物种移动鉴别方法的一实施例的流程示意图。
图3为本发明物种移动鉴别方法的另一实施例中物种数据库的建立流程的示意图。
图4为本发明物种移动鉴别方法的又一实施例中二维码图像的编码过程的示意图。
图5为本发明物种鉴定服务器的一实施例的结构示意图。
图6为本发明物种移动鉴别终端的一实施例的结构示意图。
图7为本发明物种移动鉴别方法的再一实施例的流程示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
针对于现有技术中采用DNA序列的表达方式的缺点,本发明利用了二维码所具有的易产生、易采集、可靠性高、信息容量大、尺寸大小可调的特点,将二维码作为DNA的信息载体,并利用日益普及的携带摄像/扫描功能的通信终端、带宽不断提高以及覆盖面积不断扩大的无线网络使得待鉴定对象的信息采集与传输都变得更加简单方便。
优选的,利用了哈夫曼编码方法的最优特性和QR二维码的特性,将两者结合起来生成动态的QR二维码(也称DDQR)作为DNA条形码序列的信息载体。
如图1所示,为本发明物种移动鉴别***的一实施例的结构示意图。在本实施例中,物种移动鉴别***主要包括:通信终端1和物种鉴定服务器2。通信终端1可以是传统通信终端或智能通信终端,要求具备摄像/扫描功能和无线通信能力,能够与网络侧的鉴定设备进行信息的交互。在需要对某个对象进行物种鉴定时,通信终端1通过摄像/扫描功能采集被鉴定对象的二维码图像,并向网络侧发送物种鉴定请求,所述物种鉴定请求中携带所述二维码图像。二维码图像可以被印刷、粘贴或镶嵌在该物种的标牌等记录信息的载体上。
物种鉴定服务器2处于网络侧,通过无线网络与通信终端1进行信息交互,物种鉴定服务器2包括物种数据库3(也包括物种数据库外接的情形),物种鉴定服务器2负责接收通信终端1发送的物种鉴定请求,并对物种鉴定请求中携带的二维码图像进行解码,获得对应的碱基序列,然后根据获得的碱基序列在物种数据库3进行匹配,并根据匹配物种的信息组装鉴定结论,将鉴定结论反馈给通信终端1。
在本实施例中,二维码由于其自身特点,相比于传统的DNA序列(约200-600个碱基长的字符串),其信息容量更大,且尺寸可调,适合于直接标记样品,作为DNA条形码表达方式效果要好于DNA序列。同时也能充分的利用通信终端的摄像/扫描功能和无线通信功能,使得二维码的采集和远程鉴别更加易于操作和便捷。
基于该物种移动鉴别***,本发明还提供了一系列物种移动鉴别方法的实施例。如图2所示,为本发明物种移动鉴别方法的一实施例的流程示意图。在本实施例中,物种移动鉴别流程具体包括:
步骤101、网络侧的物种鉴定服务器接收通信终端发送的物种鉴定请求,所述物种鉴定请求中携带有所述通信终端通过摄像/扫描功能采集到的被鉴定对象的二维码图像;
步骤102、所述物种鉴定服务器对所述二维码图像进行解码,获得对应的碱基序列;
步骤103、所述物种鉴定服务器根据获得的碱基序列在物种数据库进行匹配;
步骤104、所述物种鉴定服务器根据匹配物种的信息组装鉴定结论;
步骤105、所述物种鉴定服务器将所述鉴定结论反馈给所述通信终端。
在本实施例中,如果步骤102中对二维码图像解码不成功,则物种鉴定服务器可以向通信终端返回解码失败的反馈信息;如果解码成功,但在步骤103中未找到匹配的碱基序列,此时可以向通信终端返回匹配失败的反馈信息。
下面通过图3来说明一下本发明物种移动鉴别方法的另一实施例中的物种数据库的建立流程。该流程包括:
步骤201、导入公共数据库的碱基序列文件;
步骤202、解析所述碱基序列文件,得到所有的COI、rbcL,matk,ITS2,psbA-trnH基因的序列,这些序列在下文中简称为DNA条形码序列;
步骤203、对所述DNA条形码的序列进行预处理,并将预处理后得到的序列存入物种数据库;
步骤204、按照预设物种对已存入所述物种数据库中的序列进行分类;
步骤205、分别对每个物种进行判断,判断该物种是否只对应一条序列,是则执行步骤206,否则执行步骤207;
步骤206、将该序列设为该物种的参考碱基序列,并执行步骤211;
步骤207、采用Phrap软件将该物种对应的多条碱基序列组装成一条一致序列(consensus sequence);
步骤208、判断组装后的碱基序列中是否只包括一个一致序列,是则执行步骤209,否则执行步骤210;
步骤209、将该一致序列设为该物种的参考碱基序列,并执行步骤211;
步骤210、将所述组装后的碱基序列所包括的多个一致序列中的每个一致序列均作为该物种的参考碱基序列;
步骤211、在所述物种数据库中保存每个物种的参考碱基序列。
在本实施例中,步骤203中的预处理操作包括删除低质量的、短的或者有注释的侧翼序列,具体来说,即去除所述DNA条形码的序列两端的非核心序列,将属于同一物种的不同个体的DNA条形码的序列进行拼接,生成表示该物种DNA条形码序列的一致序列。
一致序列是由属于同一物种的不同个体的相同位的出现频率最高的碱基组成。DNA条形码序列如上所述,包括以上5类基因的核心序列。Phrap是一款用于基因组序列组装的软件,该软件包由华盛顿大学分子生物技术学院的Phil Green和Brent Ewing开发,主要用于学术科研活动。Phrap最早被用于人类基因组测序的组装。通过建立标准的数据处理过程,可以形成标准的DNA条形码标准序列数据库,以备后续的物种鉴别操作。
在上一实施例中,步骤102中的解码的具体步骤包括:物种鉴定服务器采用标准的QR算法对二维码图像进行解码,得到对应的十进制数字串;进而判断所述十进制数字串采用的编码方式,如果是定长编码方式,则采用定长解码方式对所述十进制数字串进行解码,得到对应的碱基序列;如果是哈夫曼编码方式,则采用哈夫曼解码方式对所述十进制数字串进行解码,得到对应的碱基序列。
对应着,二维码图像的编码过程可参见图4,在图4中二维码图像的编码过程具体包括:
步骤301、扫描输入的待编码DNA序列,并统计碱基A、C、G和T的出现频率;
步骤302、分别计算采用定长编码方式和哈夫曼编码方式对所述待编码DNA序列编码时所需占用的平均位数;
步骤303、比较两种编码方式对应的所需占用的平均位数,并选择占用较少位数的编码方式进行编码,得到编码后的十进制数字串;
步骤304、采用标准QR code算法对所述十进制数字串进行编码,得到对应的二维码图像。
在本实施例中涉及的QR code算法所得出的二维码图像属于一种广泛使用的二维码,其基本编码过程如下:(1)根据QR code编码(简称QR码)原则,将信息编码成比特(bit)流;(2)对bit流每8位为一个数据码字,对数据码字进行分块,分别计算每一块的纠错码字,将纠错码字加到每一块的尾部,并调整码字序列;(3)将码字按bit位填入到表示二维码的矩阵中;(4)对矩阵进行掩模,提高QR码阅读的可靠性;(5)填入格式信息和版本信息;(6)生成QR码。
本发明为了解决标准QR code的编码容量有限的问题,还增加了步骤301-303中的动态编码方法,从而大大增加了标准条形码的编码容量。下面对动态编码方法进行详细说明。
这种动态编码方法可以提高QR码存储DNA序列的信息量,根据信息论的熵压缩理论,可以实现对DNA序列的压缩编码。当碱基A、C、G、T出现的频率差别较大时,使用哈夫曼编码对A、C、G、T进行编码。当A、C、G、T出现的频率差别不大时,四个字母可以用两个bit进行标识,例如:00-A,01-C,10-G,11-T,再将编码后的bit串用QR的编码模式进行编码。这种使每个碱基用更少的bit数表示,再对编码内容进行QR码预处理的方式,可以实现QR码编码的碱基数量最多。具体编码方案例如以下:
预先设计比特(bit)串格式,下表中以及后续说明中涉及的实例仅为方便说明,并不表示限制于所举实例,本领域的技术人员可以根据需要参考该实例来选择其它可行实例。
用两个比特编码 哈夫曼编码碱基
A:00 b1:1
T:01 b2:01
C:10 b3:000
G:11 b4:001
根据选用预处理的方式不同,码表有两种情况,1)选用两个比特表示一个碱基时,码表的内容为两个比特(bit),表示在编码内容中,00-A,01-C,10-G,11-T;2)选择用哈夫曼编码碱基时,“1”、“01”、“001”、“000”分别对应碱基DNA序列中出现频率从最高到最低的碱基,在码表中,将ACGT对应的编码按频率顺序填入码表。因为四个碱基是按照哈夫曼编码进行编码,所以,任意一个碱基的编码都不会是另外一个碱基编码的前缀。按顺序读入DNA序列的每个碱基,按照码表的规定将每个碱基对应的编码填入编码内容中。
在选择编码方式时,扫描输入的DNA序列,并统计碱基A、C、G、T中每个碱基各自对应的出现频率,然后根据各个碱基出现的频率用b1,b2,b3 and b4表示,这里b1>b2>b3>b4,sum为待编码DNA序列中碱基的数目。
(1)编码方式1(定长编码),每个碱基平均占用的位数为:2+(2+32)/sum;
(2)编码方式2(哈夫曼编码),每个碱基平均占用的位数为:1×b1%+2×b2%+3×(b3%+b4%)+(9+32)/sum。
当编码方式1对应的位数<=编码方式2对应的位数时,我们选择编码方式(1)对碱基进行编码,否则选用编码方式(2)进行编码,将对应编码填入bit串的编码内容部分。通常来说,碱基出现的频率差距越大,使用哈夫曼编码的效果越好。
接下来,将上一步得到的由0和1组成的bit串,按照每3位一组,转换成十进制的数,最后不足3位用0补齐,从而使整个bit串转换为十进制数字组成的字符串,然后再采用QR码的数字模式对其进行编码,每3个数字转换成10个bit,作为内容填入到QR码中。这样QR码中的10位表示bit串中的9位,利用率为90%。QR码的数字模式最多能编码7089个数字,采用QR码编码预处理后,QR码最多可以编码的碱基满足:
10633<=(7089×3)/avg<=21267
(备注:avg为QR码前处理中表示每个碱基的平均bit数目,1<=avg<=2)
这样,对比QR码直接使用数字模式(7089个)、字母数字模式(4296个)和8bit模式(2953个),能编码的碱基数目为[10633,21267],从而容量得到大幅度提高。
在物种鉴定服务器解码出碱基序列后,就需要在物种数据库中进行参考碱基序列的比对,具体比对过程可采用现有的序列比对方案,例如基于Blast的序列相似性比对算法等。本发明还可采用基于kmerfrequency profile(KFP,频率矢量),另一种则是运用Edit Distance(ED,编辑距离)的方法。KFP的方法首先将所有的序列用相应的kmer frequency来表示,即每种类型的kmer和其出现的频率。然后通过比较代表被测序列和标准数据库的KFP的相关性,来区分两条序列。运用ED的方法,首先用dynamic programming(动态规划)的算法将两条待比较的序列进行比对,然后计算其中一条序列变成另一条序列所需要的步骤,这些步骤包括***(insertion),缺失(deletion),和转化(transition)。这两种方法利用了两条待比较序列中的所有差异,因此能够达到最高的鉴定效率。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
下面,通过图5来进一步说明一下本发明物种鉴定服务器的一实施例。在本实施例中,物种鉴定服务器被设于网络侧,包括:
鉴定请求接收模块21,用于接收通信终端发送的物种鉴定请求,所述物种鉴定请求中携带有所述通信终端通过摄像/扫描功能采集到的被鉴定对象的二维码图像;
二维码图像解码模块22,用于对所述二维码图像进行解码,获得对应的碱基序列;
物种数据库23,用于保存各个物种的参考碱基序列;
碱基序列匹配模块24,用于根据获得的碱基序列在所述物种数据库进行匹配;
鉴定结论组装模块25,用于根据匹配物种的信息组装鉴定结论;
鉴定结论反馈模块26,用于将所述鉴定结论反馈给所述通信终端。
在另一实施例中,二维码图像解码模块22可以具体包括:
QR code解码单元,用于采用标准QR code算法对所述二维码图像进行解码,得到对应的十进制数字串;
动态解码单元,用于判断所述十进制数字串采用的编码方式,如果是定长编码方式,则采用定长解码方式对所述十进制数字串进行解码,得到对应的碱基序列;如果是哈夫曼编码方式,则采用哈夫曼解码方式对所述十进制数字串进行解码,得到对应的碱基序列。
本发明除了提供远程鉴别的方式,也可以将二维码鉴别应用于本地,仍可采用移动的方式,即利用一移动终端来完成被鉴定对象的二维码图像的采集、解码、物种匹配及结论展示。如图6所示,为本发明物种移动鉴别终端的一实施例的结构示意图。在本实施例中,物种移动鉴别终端包括:
二维码采集模块27,用于通过摄像/扫描功能采集被鉴定对象的二维码图像;
物种数据库23,用于保存各个物种的参考碱基序列;
二维码图像解码模块22,用于对所述二维码图像进行解码,获得对应的碱基序列;
碱基序列匹配模块24,用于根据获得的碱基序列在所述物种数据库进行匹配;
鉴定结论组装模块25,用于根据匹配物种的信息组装鉴定结论;
鉴定结论展示模块28,用于通过展示功能展示所述鉴定结论。
在另一实施例中,二维码图像解码模块22可以具体包括:
QR code解码单元,用于采用标准QR code算法对所述二维码图像进行解码,得到对应的十进制数字串;
动态解码单元,用于判断所述十进制数字串采用的编码方式,如果是定长编码方式,则采用定长解码方式对所述十进制数字串进行解码,得到对应的碱基序列;如果是哈夫曼编码方式,则采用哈夫曼解码方式对所述十进制数字串进行解码,得到对应的碱基序列。
这种本地的物种移动鉴别终端可以利用现有的具有较好运算能力的智能终端实现,即使缺乏或不利用通信功能,仍然能够快速准确的完成物种鉴定操作。
基于这种本地鉴别方式,如图7所示,给出了本发明物种移动鉴别方法的再一实施例的流程示意图。在本实施例中,物种移动鉴别方法,包括:
步骤401、物种移动鉴别终端通过摄像/扫描功能采集到的被鉴定对象的二维码图像;
步骤402、所述物种移动鉴别终端对所述二维码图像进行解码,获得对应的碱基序列;
步骤403、所述物种移动鉴别终端根据获得的碱基序列在物种数据库进行匹配;
步骤404、所述物种移动鉴别终端根据匹配物种的信息组装鉴定结论;
步骤405、所述物种移动鉴别终端通过展示功能展示所述鉴定结论。
在物种移动鉴别终端中的物种数据库的建立流程仍可参考前述图3在物种鉴别服务器实施例上的流程,这里简单罗列一下流程,如下:
导入公共数据库中的碱基序列文件;
解析所述碱基序列文件,得到所有的DNA条形码的序列;
对所述DNA条形码的序列进行预处理,并将预处理后得到的序列存入物种数据库;
按照预设物种对已存入所述物种数据库中的序列进行分类;
分别对每个物种进行判断,判断该物种是否只对应一条序列,是则将该序列设为该物种的参考碱基序列,否则采用Phrap方法将该物种对应的多条碱基序列组装成一条一致碱基序列;
判断组装后的碱基序列中是否只包括一个一致序列,是则将该一致序列设为该物种的参考碱基序列,否则将所述组装后的碱基序列所包括的多个一致序列中的每个一致序列均作为该物种的参考碱基序列;
在所述物种数据库中保存每个物种的参考碱基序列。
其中,对DNA条形码的序列进行预处理的操作可具体为:去除所述DNA条形码的序列两端的非核心序列,将属于同一物种的不同个体的DNA条形码的序列进行拼接,生成表示该物种DNA条形码序列的一致序列。
物种移动鉴定终端对二维码图像的解码过程也可参考前述图4物种鉴定服务器对二维码图像的解码流程,这里简单罗列一下流程,如下:
所述物种移动鉴定终端采用标准QR code算法对所述二维码图像进行解码,得到对应的十进制数字串;
判断所述十进制数字串采用的编码方式,如果是定长编码方式,则采用定长解码方式对所述十进制数字串进行解码,得到对应的碱基序列;如果是哈夫曼编码方式,则采用哈夫曼解码方式对所述十进制数字串进行解码,得到对应的碱基序列。
在另一个实施例中,还可包括二维码图像的编码过程,具体为:
扫描输入的待编码DNA序列,并统计碱基A、C、G和T的出现频率;
分别计算采用定长编码方式和哈夫曼编码方式对所述待编码DNA序列编码时所需占用的平均位数;
比较两种编码方式对应的所需占用的平均位数,并选择占用较少位数的编码方式进行编码,得到编码后的十进制数字串;
采用标准QR code算法对所述十进制数字串进行编码,得到对应的二维码图像。
其中,所述根据匹配物种的信息组装的鉴定结论包括:匹配的碱基序列信息、匹配的碱基序列信息所对应的物种信息和鉴别所需时间。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于***实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
通过前述对本发明的论述,可看出本发明可实现对待鉴定对象的质量进行检测与控制。对待鉴定对象的规格与质量提供检测标准和方法,辨别样品真伪。对于任何可疑样品,将其与数据库存储***中的标准DNA条形码相比较,即可确定其真伪,从而确保待鉴定物的规格与质量。
以中草药产品为例,本发明可为国家药品管理部门和我国中成药生产企业、经营企业,以及广大的药农、药商等,对中草药及各类中药材进行规范化和标准化管理提供依据,通过调查、选择和拟定各类药材及药品的DNA标准,为我国中草药资源及中成药产品标准化打下基础。同时也为进出口相关药品提供检测依据。据调查,目前国际上尚无此类植物药品DNA检测***,我国作为世界上最大的植物药品原材料出口国,单一材料的质量会直接影响到同类型产品的出口。本发明将为我国植物药品出口提供国际领先检测技术。此项工作的开展将极大地增加我国产品质量的可信度,提高企业产品的竞争力和出口额。与此同时,对于进口的动植物,也可以利用本发明DNA条形码***确定其身份,防止引入对我国环境、人和牲畜有害的物种。另外,本发明通过建立物种DNA条形码也能够进一步填补我国药品管理研究的空白。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (14)

1.一种物种鉴定服务器,设于网络侧,包括:
鉴定请求接收模块,用于接收通信终端发送的物种鉴定请求,所述物种鉴定请求中携带有所述通信终端通过摄像/扫描功能采集到的被鉴定对象的二维码图像,且所述二维码图像为结合哈夫曼编码方法和QR二维码的动态的QR二维码图像;
二维码图像解码模块,用于对所述二维码图像进行解码,获得对应的碱基序列;
物种数据库,用于保存各个物种的参考碱基序列;
碱基序列匹配模块,用于根据获得的碱基序列在所述物种数据库进行匹配;
鉴定结论组装模块,用于根据匹配物种的信息组装鉴定结论;
鉴定结论反馈模块,用于将所述鉴定结论反馈给所述通信终端;
其中,所述物种数据库的建立流程具体包括:
导入公共数据库中的碱基序列文件;
解析所述碱基序列文件,得到所有的DNA条形码的序列;
对所述DNA条形码的序列进行预处理,并将预处理后得到的序列存入物种数据库;
按照预设物种对已存入所述物种数据库中的序列进行分类;
分别对每个物种进行判断,判断该物种是否只对应一条序列,是则将该序列设为该物种的参考碱基序列,否则采用Phrap方法将该物种对应的多条碱基序列组装成一条一致序列;
判断组装后的碱基序列中是否只包括一个一致序列,是则将该一致序列设为该物种的参考碱基序列,否则将所述组装后的碱基序列所包括的多个一致序列中的每个一致序列均作为该物种的参考碱基序列;
在所述物种数据库中保存每个物种的参考碱基序列。
2.根据权利要求1所述的物种鉴定服务器,其中所述二维码图像解码模块具体包括:
Qrcode解码单元,用于采用标准Qrcode算法对所述二维码图像进行解码,得到对应的十进制数字串;
动态解码单元,用于判断所述十进制数字串采用的编码方式,如果是定长编码方式,则采用定长解码方式对所述十进制数字串进行解码,得到对应的碱基序列;如果是哈夫曼编码方式,则采用哈夫曼解码方式对所述十进制数字串进行解码,得到对应的碱基序列。
3.一种物种移动鉴别方法,包括:
网络侧的物种鉴定服务器接收通信终端发送的物种鉴定请求,所述物种鉴定请求中携带有所述通信终端通过摄像/扫描功能采集到的被鉴定对象的二维码图像,且所述二维码图像为结合哈夫曼编码方法和QR二维码的动态的QR二维码图像;
所述物种鉴定服务器对所述二维码图像进行解码,获得对应的碱基序列;
所述物种鉴定服务器根据获得的碱基序列在物种数据库进行匹配,并根据匹配物种的信息组装鉴定结论;
所述物种鉴定服务器将所述鉴定结论反馈给所述通信终端;
其中还包括所述物种数据库的建立流程,具体包括:
导入公共数据库中的碱基序列文件;
解析所述碱基序列文件,得到所有的DNA条形码的序列;
对所述DNA条形码的序列进行预处理,并将预处理后得到的序列存入物种数据库;
按照预设物种对已存入所述物种数据库中的序列进行分类;
分别对每个物种进行判断,判断该物种是否只对应一条序列,是则将该序列设为该物种的参考碱基序列,否则采用Phrap方法将该物种对应的多条碱基序列组装成一条一致序列;
判断组装后的碱基序列中是否只包括一个一致序列,是则将该一致序列设为该物种的参考碱基序列,否则将所述组装后的碱基序列所包括的多个一致序列中的每个一致序列均作为该物种的参考碱基序列;
在所述物种数据库中保存每个物种的参考碱基序列。
4.根据权利要求3所述的物种移动鉴别方法,其中对DNA条形码的序列进行预处理的操作具体为:
去除所述DNA条形码的序列两端的非核心序列,将属于同一物种的不同个体的DNA条形码的序列进行拼接,生成表示该物种的DNA条形码的序列的一致序列。
5.根据权利要求3所述的物种移动鉴别方法,其中所述物种鉴定服务器对所述二维码图像进行解码,获得对应的碱基序列的操作具体为:
所述物种鉴定服务器采用标准QR code算法对所述二维码图像进行解码,得到对应的十进制数字串;
判断所述十进制数字串采用的编码方式,如果是定长编码方式,则采用定长解码方式对所述十进制数字串进行解码,得到对应的碱基序列;如果是哈夫曼编码方式,则采用哈夫曼解码方式对所述十进制数字串进行解码,得到对应的碱基序列。
6.根据权利要求5所述的物种移动鉴别方法,其中还包括二维码图像的编码过程,具体为:
扫描输入的待编码DNA序列,并统计碱基A、C、G和T的出现频率;
分别计算采用定长编码方式和哈夫曼编码方式对所述待编码DNA序列编码时所需占用的平均位数;
比较两种编码方式对应的所需占用的平均位数,并选择占用较少位数的编码方式进行编码,得到编码后的十进制数字串;
采用标准QR code算法对所述十进制数字串进行编码,得到对应的二维码图像。
7.根据权利要求3所述的物种移动鉴别方法,其中所述根据匹配物种的信息组装的鉴定结论包括:匹配的碱基序列信息、匹配的碱基序列信息所对应的物种信息和鉴别所需时间。
8.一种物种移动鉴别终端,包括:
二维码采集模块,用于通过摄像/扫描功能采集被鉴定对象的二维码图像,且所述二维码图像为结合哈夫曼编码方法和QR二维码的动态的QR二维码图像;
物种数据库,用于保存各个物种的参考碱基序列;
二维码图像解码模块,用于对所述二维码图像进行解码,获得对应的碱基序列;
碱基序列匹配模块,用于根据获得的碱基序列在所述物种数据库进行匹配;
鉴定结论组装模块,用于根据匹配物种的信息组装鉴定结论;
鉴定结论展示模块,用于通过展示功能展示所述鉴定结论;
其中,所述物种数据库的建立流程具体包括:
导入公共数据库中的碱基序列文件;
解析所述碱基序列文件,得到所有的DNA条形码的序列;
对所述DNA条形码的序列进行预处理,并将预处理后得到的序列存入物种数据库;
按照预设物种对已存入所述物种数据库中的序列进行分类;
分别对每个物种进行判断,判断该物种是否只对应一条序列,是则将该序列设为该物种的参考碱基序列,否则采用Phrap方法将该物种对应的多条碱基序列组装成一条一致碱基序列;
判断组装后的碱基序列中是否只包括一个一致序列,是则将该一致序列设为该物种的参考碱基序列,否则将所述组装后的碱基序列所包括的多个一致序列中的每个一致序列均作为该物种的参考碱基序列;
在所述物种数据库中保存每个物种的参考碱基序列。
9.根据权利要求8所述的物种移动鉴别终端,其中所述二维码图像解码模块具体包括:
QR code解码单元,用于采用标准QR code算法对所述二维码图像进行解码,得到对应的十进制数字串;
动态解码单元,用于判断所述十进制数字串采用的编码方式,如果是定长编码方式,则采用定长解码方式对所述十进制数字串进行解码,得到对应的碱基序列;如果是哈夫曼编码方式,则采用哈夫曼解码方式对所述十进制数字串进行解码,得到对应的碱基序列。
10.一种物种移动鉴别方法,包括:
物种移动鉴别终端通过摄像/扫描功能采集到的被鉴定对象的二维码图像,且所述二维码图像为结合哈夫曼编码方法和QR二维码的动态的QR二维码图像;
所述物种移动鉴别终端对所述二维码图像进行解码,获得对应的碱基序列;
所述物种移动鉴别终端根据获得的碱基序列在物种数据库进行匹配,并根据匹配物种的信息组装鉴定结论;
所述物种移动鉴别终端通过展示功能展示所述鉴定结论;
其中还包括所述物种数据库的建立流程,具体包括:
导入公共数据库中的碱基序列文件;
解析所述碱基序列文件,得到所有的DNA条形码的序列;
对所述DNA条形码的序列进行预处理,并将预处理后得到的序列存入物种数据库;
按照预设物种对已存入所述物种数据库中的序列进行分类;
分别对每个物种进行判断,判断该物种是否只对应一条序列,是则将该序列设为该物种的参考碱基序列,否则采用Phrap方法将该物种对应的多条碱基序列组装成一条一致碱基序列;
判断组装后的碱基序列中是否只包括一个一致序列,是则将该一致序列设为该物种的参考碱基序列,否则将所述组装后的碱基序列所包括的多个一致序列中的每个一致序列均作为该物种的参考碱基序列;
在所述物种数据库中保存每个物种的参考碱基序列。
11.根据权利要求10所述的物种移动鉴别方法,其中对DNA条形码的序列进行预处理的操作具体为:
去除所述DNA条形码的序列两端的非核心序列,将属于同一物种的不同个体的DNA条形码的序列进行拼接,生成表示该物种的DNA条形码的序列的一致序列。
12.根据权利要求10所述的物种移动鉴别方法,其中所述物种移动鉴别终端对所述二维码图像进行解码,获得对应的碱基序列的操作具体为:
所述物种移动鉴别终端采用标准QR code算法对所述二维码图像进行解码,得到对应的十进制数字串;
判断所述十进制数字串采用的编码方式,如果是定长编码方式,则采用定长解码方式对所述十进制数字串进行解码,得到对应的碱基序列;如果是哈夫曼编码方式,则采用哈夫曼解码方式对所述十进制数字串进行解码,得到对应的碱基序列。
13.根据权利要求12所述的物种移动鉴别方法,其中还包括二维码图像的编码过程,具体为:
扫描输入的待编码DNA序列,并统计碱基A、C、G和T的出现频率;
分别计算采用定长编码方式和哈夫曼编码方式对所述待编码DNA序列编码时所需占用的平均位数;
比较两种编码方式对应的所需占用的平均位数,并选择占用较少位数的编码方式进行编码,得到编码后的十进制数字串;
采用标准QR code算法对所述十进制数字串进行编码,得到对应的二维码图像。
14.根据权利要求10所述的物种移动鉴别方法,其中所述根据匹配物种的信息组装的鉴定结论包括:匹配的碱基序列信息、匹配的碱基序列信息所对应的物种信息和鉴别所需时间。
CN201110136064.0A 2011-05-25 2011-05-25 物种移动鉴别***、终端、服务器及方法 Expired - Fee Related CN102799795B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110136064.0A CN102799795B (zh) 2011-05-25 2011-05-25 物种移动鉴别***、终端、服务器及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110136064.0A CN102799795B (zh) 2011-05-25 2011-05-25 物种移动鉴别***、终端、服务器及方法

Publications (2)

Publication Number Publication Date
CN102799795A CN102799795A (zh) 2012-11-28
CN102799795B true CN102799795B (zh) 2016-08-17

Family

ID=47198902

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110136064.0A Expired - Fee Related CN102799795B (zh) 2011-05-25 2011-05-25 物种移动鉴别***、终端、服务器及方法

Country Status (1)

Country Link
CN (1) CN102799795B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184517A (zh) * 2015-10-23 2015-12-23 常州威远电工器材有限公司 绕组线质量检测智能化管理***
CN106919882A (zh) * 2015-12-28 2017-07-04 航天信息股份有限公司 一种二维码内容转为纯数字符号编码的方法
CN106520518A (zh) * 2016-10-14 2017-03-22 中山出入境检验检疫局检验检疫技术中心 一种物种检疫鉴定中心的运行模式
CN109979536B (zh) * 2019-03-07 2022-12-23 青岛市疾病预防控制中心(青岛市预防医学研究院) 一种基于dna条形码对物种的鉴定方法
CN110276706A (zh) * 2019-06-20 2019-09-24 山西清众科技股份有限公司 一种按需匹配的精准扶贫信息公开公示***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1471443A1 (en) * 2002-01-09 2004-10-27 Hideaki Umeyama Method of constructing stereostructure of protein having plural number of chains
CN1963843A (zh) * 2006-11-16 2007-05-16 深圳矽感科技有限公司 二维码及其解码方法、应用该二维码的印刷出版物
CN101495652A (zh) * 2005-06-16 2009-07-29 海军部长代表的美国政府 计算机执行的生物序列鉴定***和方法
CN101694696A (zh) * 2009-09-30 2010-04-14 浙江大学 动植物描述和甄别的分子条码***的制备方法及其用途
CN101727637A (zh) * 2009-06-26 2010-06-09 广州宽度信息技术有限公司 一种手机二维码防伪识别***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4588636B2 (ja) * 2003-10-27 2010-12-01 ラボラトリオス・ドクトル・エフェ・エチェバルネ・アナリシス・ソシエダッド・アノニマ 生物種を同定する方法。
WO2008000090A1 (en) * 2006-06-30 2008-01-03 University Of Guelph Dna barcode sequence classification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1471443A1 (en) * 2002-01-09 2004-10-27 Hideaki Umeyama Method of constructing stereostructure of protein having plural number of chains
CN101495652A (zh) * 2005-06-16 2009-07-29 海军部长代表的美国政府 计算机执行的生物序列鉴定***和方法
CN1963843A (zh) * 2006-11-16 2007-05-16 深圳矽感科技有限公司 二维码及其解码方法、应用该二维码的印刷出版物
CN101727637A (zh) * 2009-06-26 2010-06-09 广州宽度信息技术有限公司 一种手机二维码防伪识别***
CN101694696A (zh) * 2009-09-30 2010-04-14 浙江大学 动植物描述和甄别的分子条码***的制备方法及其用途

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DNA条形码识别Ⅵ:基于微型DNA条形码的果实蝇物种鉴定;范京安等;《应用与环境生物学报》;20090425;全文 *
物种鉴定的新武器-基因条码;钱路等;《植物检疫》;20090630;第23卷(第3期);全文 *

Also Published As

Publication number Publication date
CN102799795A (zh) 2012-11-28

Similar Documents

Publication Publication Date Title
CN102799795B (zh) 物种移动鉴别***、终端、服务器及方法
KR101638594B1 (ko) Dna 서열 검색 방법 및 장치
CN110347839A (zh) 一种基于生成式多任务学习模型的文本分类方法
CN104715073B (zh) 基于改进Apriori算法的关联规则挖掘***
CN110168651A (zh) 用于选择性访问存储的或传输的生物信息数据的方法和***
CN102732973B (zh) 一种高通量棉花品种dna指纹库构建方法
CN102194139B (zh) 标签通信装置及其控制方法、标签通信装置控制程序
CN104679777A (zh) 一种用于检测欺诈交易的方法及***
CN103473056B (zh) 一种遥测配置文件自动生成方法
US20110288785A1 (en) Compression of genomic base and annotation data
CN105886613A (zh) 大豆品种ssr指纹图谱身份证的构建方法
CN104978307A (zh) 一种清单处理方法及装置
CN110428868A (zh) 基因测序质量行数据压缩预处理、解压还原方法及***
CN101702171A (zh) 一种大量字符串的近似匹配方法
CN101887519A (zh) 文字识别、编改的方法
CN104573405B (zh) 一种基于大树构建子树的***进化树重建方法
CN106407471A (zh) 图码扫描用数据处理方法、装置及***
CN103929499B (zh) 一种物联网异构标识识别方法和***
CN107164471A (zh) 一种快速鉴别中药材僵蚕中白僵菌真伪的分子鉴定方法
CN104243095A (zh) 一种卷积码与线性分组码的码字类型盲识别方法
CN110176282A (zh) 一种基于最大期望算法的患者身份匹配方法
CN107609609A (zh) 一种基于识别标签的快递物流方法
CN102453751A (zh) Dna测序仪短序列回贴基因组方法
CN113674003A (zh) 一种利用宏基因组和机器学习进行蜂蜜蜜源地追踪的方法
CN209168157U (zh) 一种智能二次分拣装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160817

CF01 Termination of patent right due to non-payment of annual fee