CN102831629A - 基于图形处理器的乳腺ct图像重建方法 - Google Patents

基于图形处理器的乳腺ct图像重建方法 Download PDF

Info

Publication number
CN102831629A
CN102831629A CN2012103037600A CN201210303760A CN102831629A CN 102831629 A CN102831629 A CN 102831629A CN 2012103037600 A CN2012103037600 A CN 2012103037600A CN 201210303760 A CN201210303760 A CN 201210303760A CN 102831629 A CN102831629 A CN 102831629A
Authority
CN
China
Prior art keywords
process unit
video memory
graphic process
carry out
thread
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012103037600A
Other languages
English (en)
Other versions
CN102831629B (zh
Inventor
郭境峰
王海潮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shantou Ultrasonic Testing Technology Co., Ltd.
Original Assignee
SHANTOU DONGFANG ULTRASONIC TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANTOU DONGFANG ULTRASONIC TECHNOLOGY CO LTD filed Critical SHANTOU DONGFANG ULTRASONIC TECHNOLOGY CO LTD
Priority to CN201210303760.0A priority Critical patent/CN102831629B/zh
Publication of CN102831629A publication Critical patent/CN102831629A/zh
Application granted granted Critical
Publication of CN102831629B publication Critical patent/CN102831629B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

一种基于图形处理器的乳腺CT图像重建方法,依次包括下述步骤:(1)数据接收与传输:将由扫描检测装置检测到的模拟信号经模/数转换器转换而成的数字信号传输到***内存,并把***内存中的数字信号传输到图形处理器的显存;(2)按并行的有限角度重建成像算法,在图形处理器中并行进行数据运算;在图形处理器中并行进行的数据运算为迭代计算;(3)判定步骤(2)的计算结果是否达到预期目标,如达到预期目标则执行步骤(4),否则重新回到步骤(2);(4)图形处理器将迭代计算的结果传送至***内存,进行图像后处理。本发明在图形处理器上进行重建运算,可非常大的提升迭代计算速度,快速准确地实现在有限角度下的乳腺CT图像重建。

Description

基于图形处理器的乳腺CT图像重建方法
技术领域
本发明涉及图像数据处理方法,具体地说,涉及一种基于图形处理器的乳腺CT图像重建方法。
背景技术
乳腺疾病是妇女的常见疾病,特别是乳腺癌在女性恶性肿瘤中的发病率占第一位,对女性的健康具有极大的威胁。
传统的CT医疗设备在进行乳腺检查时,大都采用让患者躺于扫描床进行全身或者局部检查的方式,扫描角度往往是大于180度甚至达到360度,成像方式为完全数据重建成像,这种方式不仅需要花费较多的时间进行图像重建,而且使患者受到更多的辐射剂量,不利于患者的身体健康。
当扫描角度小于120度时,成像方式为有限角度重建成像。特别的考虑到辐射剂量与图像对比度的因素,乳腺成像一般采用有限角度重建成像,以减少患者受到的辐射剂量,但有限角度重建成像算法(如著名的GP (Gerchberg-Papoulis) 算法)在Fourier 空间和图像空间之间迭代,需要较多的迭代次数才能得到较好的收敛性,同时也花费较多时间进行迭代计算,存在收敛速度欠佳、图像重建速度慢等问题,降低了检查效率。
发明内容
本发明所要解决的技术问题是提供一种基于图形处理器的乳腺CT图像重建方法,这种乳腺CT图像重建方法可方便有效地利用图形处理器,快速准确地实现在有限角度下的乳腺CT图像重建。采用的技术方案如下:
一种基于图形处理器的乳腺CT图像重建方法,其特征在于依次包括下述步骤:
(1)数据接收与传输:将由乳腺CT设备的扫描检测装置检测到的模拟信号经模/数转换器(A/D)转换而成的数字信号经过***总线传输到***内存,然后根据数字信号的数据量大小申请显存,并把***内存中的数字信号传输到图形处理器(简称GPU)的显存中;
上述数字信号是在有限角度重建成像方式下获得的信号。
通常,对***内存中的数字信号依次进行数据预测(即利用级比生成的方法预测出其相邻部分的投影数据信息)、FIR低通滤波等处理后,再根据数字信号的数据量大小申请显存,并把数据通过PCIEx16接口传输到图形处理器的显存中。
本发明优先采用NVidia公司推出的CUDA(Compute Unified DeviceArchitecture)架构编写程序,首先对图形处理器进行初始化,检测当前图形处理器和图形处理器驱动是否符合CUDA运行的需求。并且,在***内存与显存之间进行数据传输之前,通过下述步骤建立CUDA环境:(a)下载并安装CUDA TooKit 和 CUDA SDK;(b)在新建项目中包含必要的CUDA 头文件、库文件与链接库;(c)加载CUDA的nvcc编译器,nvcc 编译器会把 CUDA 的图形处理器程序的部分转换成 PTX code,最后变成在图形处理器可以执行的程序;(d)生成后缀名为.cu 的文件,这样,在编译的时候,就会把后缀名为 .cu 的文件丢给 CUDA 的 nvcc编译器进行编译,其它文件则仍然由VC编译器进行编译。
(2)按并行的有限角度重建成像算法,在图形处理器中并行进行数据运算;
有限角度重建成像算法的基本思路是迭代,有限角度成像的数据在Fourier 空间为有限频带,因此可以用GP算法来恢复缺失的数据。
定义算子B和C,有限角度重建成像算法中GP迭代的过程为:
Bƒ = TFƒ , Cƒ = FTI F−1ƒ ①
ƒ0 = ƒk
ƒi+1 = Cƒk + (I-CB) ƒi
其中Fourier空间的已知数据定义为ƒk,全部数据表示为ƒ,F 表示Fourier变换,F−1表示Fourier逆变换,TI和TF是图像空间和频率空间的二值函数矩阵,I 是单位矩阵。
GP 迭代最终以(1-λi)n 的速度收敛到ƒ ,其中,{λi} 是CB的特征值,并且0<λi < 1。
在图形处理器中并行进行的数据运算为迭代计算,迭代计算包括下述步骤:(2-1)Fourier变换与逆变换;(2-2)求空域与频域的特征值;(2-3)求算子B、C的特征值。其中:
上述步骤(2-1)具体包括下述步骤:(2-1-1)图形处理器的各流处理器接收数据,也就是说,将图形处理器的显存所接收到的数字信号数据分配到图形处理器的各流处理器中;(2-1-2)一维Fourier变换;(2-1-3)二维Fourier变换;(2-1-4)二维Fourier逆变换;(2-1-5)将计算结果写入共享显存。
步骤(2-1)中:在进行步骤(2-1-2)一维Fourier变换之前,通过kernel设计(即核设计),使GPU进行一维Fourier变换计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步,从而提高运行速度;在进行步骤(2-1-3)二维Fourier变换之前,通过原子操作,使多个线程同时访问全局显存或共享显存的同一地址时保证每个线程能够实现对共享可写数据的互斥操作,在其中一个线程完成操作之前,其它任何线程都无法访问此地址,从而使访问线程数据的速度得到提高;在进行步骤(2-1-4)二维Fourier逆变换之前,通过kernel设计,使GPU进行二维Fourier逆变换计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步,从而提高运行速度;在进行步骤(2-1-5)将计算结果写入共享显存之前,发送同步指令,保证同一线程块中的所有线程都执行到同一位置,当其中任意一个线程运行到同步指令标记处后会暂停运行,直到整个线程块中所有的线程都运行到同一位置,整个线程块才会继续执行下面的语句。
上述步骤(2-2)具体包括下述步骤:(2-2-1)初始化算子B、C,包括算子矩阵的显存申请并赋初始值,避免空指针;(2-2-2)使用cublas库函数;(2-2-3)求空域特征值;(2-2-4)求频域特征值;(2-2-5)将计算结果写入共享显存。
步骤(2-2)中:在进行步骤(2-2-2)使用cublas库函数之前,通过kernel设计,使GPU进行空域特征值计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步,从而提高运行速度;在进行步骤(2-2-3)求空域特征值之前,通过原子操作,使多个线程同时访问全局显存或共享显存的同一地址时,保证每个线程能够实现对共享可写数据的互斥操作,在其中一个线程完成操作之前其它任何线程都无法访问此地址,从而使访问线程数据的速度得到提高;在进行步骤(2-2-4)求频域特征值之前,通过异步流操作,使得当GPU进行计算时,主机CPU线程不必等待即可进行其它计算,从而使CPU与GPU同时进行工作,提高资源利用率;在进行步骤(2-2-5)将计算结果写入共享显存之前,发送同步指令,保证同一线程块中的所有线程都执行到同一位置,当其中任意一个线程运行到同步指令标记处后会暂停运行,直到整个线程块中所有的线程都运行到同一位置,整个线程块才会继续执行下面的语句。
上述步骤(2-3)具体包括下述步骤:(2-3-1)读取共享显存变量,即读取步骤(2-2)计算完成后写入共享显存的变量;(2-3-2)求逆矩阵;(2-3-3)求共轭矩阵;(2-3-4)求出算子B、C的特征值;(2-3-5)将计算结果写入共享显存。
步骤(2-3)中:在进行步骤(2-3-2)求逆矩阵之前,通过kernel设计,使GPU进行逆矩阵计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步,从而提高运行速度;在进行步骤(2-3-3)求共轭矩阵之前,对读取逆矩阵计算结果的指令作出访问优先标记, 使该具有访问优先标记的指令(即读取逆矩阵计算结果的指令)获得共享显存访问的最高优先级,保证能最快的获得所需数据而不需等待;在进行步骤(2-3-4)求出算子B、C的特征值之前,通过异步执行指令,使一个流内的计算能够和另一个流的数据传输同时进行,提高资源利用率;在进行步骤(2-3-5)将计算结果写入共享显存之前,通过offset对齐设计, 使数据对齐方式为最符合GPU计算的4字节对齐或者8字节对齐。
图形处理器的运算机制为并行运算机制,适合大量具有相同计算的数据运算,也就是说,可以把图形处理器想像成有多个(可多达几十到几百个)流处理器的CPU,它们可以同时进行运算。设计CUDA算法的目标是把具有相同计算的数据分别送到不同的流处理器进行运算,以节约运算时间。
(3)利用预定条件判定步骤(2)的计算结果是否达到预期目标,如达到预期目标则执行步骤(4),否则重新回到步骤(2)进行迭代计算。
(4)图形处理器将迭代计算的结果传送至***内存,进行图像后处理。
图像后处理可包括对数压缩、开窗等,经图像后处理后输出并显示。
本发明利用图形处理器(GPU)的可编程和高性能并行运算的特点,在图形处理器上进行重建运算,可非常大的提升迭代计算速度,快速准确地实现在有限角度下的乳腺CT图像重建,使图像显示更快速,同时节约出时间进行更多的图像后处理,提高图像显示效果,使图像显示更清晰,更利于乳腺疾病的检测。
附图说明
图1是本发明优选实施例的总体流程图;
图2是步骤(1)数据接收与传输的流程图;
图3是图形处理器并行运算机制的示意图;
图4是步骤(2-1)Fourier变换与逆变换的流程图;
图5是步骤(2-2)求空域与频域的特征值的流程图;
图6是步骤(2-3)求算子B、C的特征值的流程图。
具体实施方式
参考图1,这种基于图形处理器的乳腺CT图像重建方法依次包括下述步骤:
(1)数据接收与传输:将由乳腺CT设备的扫描检测装置检测到的模拟信号经模/数转换器(A/D)转换而成的数字信号(该数字信号是在有限角度重建成像方式下获得的信号),经过***总线传输到***内存,然后根据数字信号的数据量大小申请显存,并把***内存中的数字信号传输到图形处理器的显存中。参考图2,本实施例中,数字信号传输到***内存后,对***内存中的数字信号依次进行数据预测(即利用级比生成的方法预测出其相邻部分的投影数据信息)、FIR低通滤波等处理后,再根据数字信号的数据量大小申请显存,并把数据通过PCIEx16接口传输到图形处理器的显存中。
本实施例采用NVidia公司推出的CUDA(Compute Unified DeviceArchitecture)架构编写程序,首先对图形处理器进行初始化,检测当前图形处理器和图形处理器驱动是否符合CUDA运行的需求。并且,在***内存与显存之间进行数据传输之前,通过下述步骤建立CUDA环境:(a)下载并安装CUDA TooKit 和 CUDA SDK;(b)在新建项目中包含必要的CUDA 头文件、库文件与链接库;(c)加载CUDA的nvcc编译器,nvcc 编译器会把 CUDA 的图形处理器程序的部分转换成 PTX code,最后变成在图形处理器可以执行的程序;(d)生成后缀名为.cu 的文件,这样,在编译的时候,就会把后缀名为 .cu 的文件丢给 CUDA 的 nvcc编译器进行编译,其它文件则仍然由VC编译器进行编译。
以下为数据在内存与显存间交换的CUDA代码:
Figure BDA0000204966631
(2)按并行的有限角度重建成像算法,在图形处理器中并行进行数据运算;
定义算子B和C,有限角度重建成像算法中GP迭代的过程为:
Bƒ = TFƒ , Cƒ = FTI F−1ƒ ①
ƒ0 = ƒk
ƒi+1 = Cƒk + (I-CB) ƒi
其中Fourier空间的已知数据定义为ƒk,全部数据表示为ƒ,F 表示Fourier变换,F−1表示Fourier逆变换,TI和TF是图像空间和频率空间的二值函数矩阵,I 是单位矩阵。
GP 迭代最终以(1-λi)n 的速度收敛到ƒ ,其中,{λi} 是CB的特征值,并且0<λi < 1。
参考图1,在图形处理器中并行进行的数据运算为迭代计算,迭代计算包括下述步骤:(2-1)Fourier变换与逆变换;(2-2)求空域与频域的特征值;(2-3)求算子B、C的特征值。其中:
参考图4,步骤(2-1)(Fourier变换与逆变换)具体包括下述步骤:(2-1-1)由图形处理器的流处理器接收数据,也就是说,将图形处理器的显存所接收到的数字信号数据分配到图形处理器的各流处理器中;(2-1-2)一维Fourier变换;(2-1-3)二维Fourier变换;(2-1-4)二维Fourier逆变换;(2-1-5)将计算结果写入共享显存。
步骤(2-1)中:在进行步骤(2-1-2)一维Fourier变换之前,通过kernel设计(即核设计),使GPU进行一维Fourier变换计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步,从而提高运行速度;在进行步骤(2-1-3)二维Fourier变换之前,通过原子操作,使多个线程同时访问全局显存或共享显存的同一地址时保证每个线程能够实现对共享可写数据的互斥操作,在其中一个线程完成操作之前,其它任何线程都无法访问此地址,从而使访问线程数据的速度得到提高;在进行步骤(2-1-4)二维Fourier逆变换之前,通过kernel设计,使GPU进行二维Fourier逆变换计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步,从而提高运行速度;在进行步骤(2-1-5)将计算结果写入共享显存之前,发送同步指令,保证同一线程块中的所有线程都执行到同一位置,当其中任意一个线程运行到同步指令标记处后会暂停运行,直到整个线程块中所有的线程都运行到同一位置,整个线程块才会继续执行下面的语句。
以下为步骤(2-1)Fourier变换与逆变换的CUDA代码:
Figure BDA0000204966632
参考图5,步骤(2-2)(求空域与频域的特征值)具体包括下述步骤:(2-2-1)初始化算子B、C,包括算子矩阵的显存申请并赋初始值;(2-2-2)使用cublas库函数;(2-2-3)求空域特征值;(2-2-4)求频域特征值;(2-2-5)将计算结果写入共享显存。
步骤(2-2)中:在进行步骤(2-2-2)使用cublas库函数之前,通过kernel设计,使GPU进行空域特征值计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步,从而提高运行速度;在进行步骤(2-2-3)求空域特征值之前,通过原子操作,使多个线程同时访问全局显存或共享显存的同一地址时,保证每个线程能够实现对共享可写数据的互斥操作,在其中一个线程完成操作之前其它任何线程都无法访问此地址,从而使访问线程数据的速度得到提高;在进行步骤(2-2-4)求频域特征值之前,通过异步流操作,使得当GPU进行计算时,主机CPU线程不必等待即可进行其它计算,从而使CPU与GPU同时进行工作,提高资源利用率;在进行步骤(2-2-5)将计算结果写入共享显存之前,发送同步指令,保证同一线程块中的所有线程都执行到同一位置,当其中任意一个线程运行到同步指令标记处后会暂停运行,直到整个线程块中所有的线程都运行到同一位置,整个线程块才会继续执行下面的语句。
以下为步骤(2-2)求空域与频域的特征值的CUDA代码:
Figure BDA0000204966633
参考图6,步骤(2-3)(求算子B、C的特征值)具体包括下述步骤:(2-3-1)读取共享显存变量,即读取步骤(2-2)计算完成后写入共享显存的变量;(2-3-2)求逆矩阵;(2-3-3)求共轭矩阵;(2-3-4)求出算子B、C的特征值;(2-3-5)将计算结果写入共享显存。
步骤(2-3)中:在进行步骤(2-3-2)求逆矩阵之前,通过kernel设计,使GPU进行逆矩阵计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步,从而提高运行速度;在进行步骤(2-3-3)求共轭矩阵之前,对读取逆矩阵计算结果的指令作出访问优先标记, 使该具有访问优先标记的指令(即读取逆矩阵计算结果的指令)获得共享显存访问的最高优先级,保证能最快的获得所需数据而不需等待;在进行步骤(2-3-4)求出算子B、C的特征值之前,通过异步执行指令,使一个流内的计算能够和另一个流的数据传输同时进行,提高资源利用率;在进行步骤(2-3-5)将计算结果写入共享显存之前,通过offset对齐设计, 使数据对齐方式为最符合GPU计算的4字节对齐或者8字节对齐。
以下为步骤(2-3)求算子B、C的特征值的CUDA代码:
Figure BDA0000204966634
参考图3,图形处理器的运算机制为并行运算机制,适合大量具有相同计算的数据运算,也就是说,可以把图形处理器想像成有多个(可多达几十到几百个)流处理器的CPU,它们可以同时进行运算。
(3)利用预定条件判定步骤(2)的计算结果是否达到预期目标,如达到预期目标则执行步骤(4),否则重新回到步骤(2)进行迭代计算。
(4)图形处理器将迭代计算的结果传送至***内存,进行图像后处理。
图像后处理可包括对数压缩、开窗等,经图像后处理后输出并显示。

Claims (9)

1.一种基于图形处理器的乳腺CT图像重建方法,其特征在于依次包括下述步骤:
(1)数据接收与传输:将由乳腺CT设备的扫描检测装置检测到的模拟信号经模/数转换器转换而成的数字信号经过***总线传输到***内存,然后根据数字信号的数据量大小申请显存,并把***内存中的数字信号传输到图形处理器的显存中;
所述数字信号是在有限角度重建成像方式下获得的信号;
(2)按并行的有限角度重建成像算法,在图形处理器中并行进行数据运算;
定义算子B和C,有限角度重建成像算法中GP迭代的过程为:
Bƒ = TFƒ , Cƒ = FTI F−1ƒ ①
ƒ0 = ƒk
ƒi+1 = Cƒk + (I-CB) ƒi
其中Fourier空间的已知数据定义为ƒk,全部数据表示为ƒ,F 表示Fourier变换,F−1表示Fourier逆变换,TI和TF是图像空间和频率空间的二值函数矩阵,I 是单位矩阵; GP 迭代最终以(1-λi)n 的速度收敛到ƒ ,其中,{λi} 是CB的特征值,并且0<λi < 1;
在图形处理器中并行进行的数据运算为迭代计算,迭代计算包括下述步骤:(2-1)Fourier变换与逆变换;(2-2)求空域与频域的特征值;(2-3)求算子B、C的特征值;
(3)利用预定条件判定步骤(2)的计算结果是否达到预期目标,如达到预期目标则执行步骤(4),否则重新回到步骤(2)进行迭代计算;
(4)图形处理器将迭代计算的结果传送至***内存,进行图像后处理。
2.根据权利要求1所述的基于图形处理器的乳腺CT图像重建方法,其特征是: 步骤(1)中,数字信号传输到***内存后,对***内存中的数字信号依次进行数据预测、FIR低通滤波后,再根据数字信号的数据量大小申请显存,并把数据通过PCIEx16接口传输到图形处理器的显存中。
3.根据权利要求1所述的基于图形处理器的乳腺CT图像重建方法,其特征是: 步骤(1)中,在***内存与显存之间进行数据传输之前,通过下述步骤建立CUDA环境:(a)下载并安装CUDA TooKit 和 CUDASDK;(b)在新建项目中包含必要的CUDA 头文件、库文件与链接库;(c)加载CUDA的nvcc编译器,nvcc 编译器把 CUDA 的图形处理器程序的部分转换成 PTX code,最后变成在图形处理器可以执行的程序;(d)生成后缀名为.cu 的文件。
4.根据权利要求1所述的基于图形处理器的乳腺CT图像重建方法,其特征是:步骤(2-1)具体包括下述步骤:(2-1-1)由图形处理器的流处理器接收数据,也就是说,将图形处理器的显存所接收到的数字信号数据分配到图形处理器的各流处理器中;(2-1-2)一维Fourier变换;(2-1-3)二维Fourier变换;(2-1-4)二维Fourier逆变换;(2-1-5)将计算结果写入共享显存。
5.根据权利要求4所述的基于图形处理器的乳腺CT图像重建方法,其特征是:
步骤(2-1)中:在进行步骤(2-1-2)一维Fourier变换之前,通过kernel设计,使GPU进行一维Fourier变换计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步;在进行步骤(2-1-3)二维Fourier变换之前,通过原子操作,使多个线程同时访问全局显存或共享显存的同一地址时保证每个线程能够实现对共享可写数据的互斥操作,在其中一个线程完成操作之前,其它任何线程都无法访问此地址;在进行步骤(2-1-4)二维Fourier逆变换之前,通过kernel设计,使GPU进行二维Fourier逆变换计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步;在进行步骤(2-1-5)将计算结果写入共享显存之前,发送同步指令,保证同一线程块中的所有线程都执行到同一位置,当其中任意一个线程运行到同步指令标记处后会暂停运行,直到整个线程块中所有的线程都运行到同一位置,整个线程块才会继续执行下面的语句。
6.根据权利要求1所述的基于图形处理器的乳腺CT图像重建方法,其特征是:步骤(2-2)具体包括下述步骤:(2-2-1)初始化算子B、C,包括算子矩阵的显存申请并赋初始值;(2-2-2)使用cublas库函数;(2-2-3)求空域特征值;(2-2-4)求频域特征值;(2-2-5)将计算结果写入共享显存。
7.根据权利要求6所述的基于图形处理器的乳腺CT图像重建方法,其特征是:
步骤(2-2)中:在进行步骤(2-2-2)使用cublas库函数之前,通过kernel设计,使GPU进行空域特征值计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步;在进行步骤(2-2-3)求空域特征值之前,通过原子操作,使多个线程同时访问全局显存或共享显存的同一地址时,保证每个线程能够实现对共享可写数据的互斥操作,在其中一个线程完成操作之前其它任何线程都无法访问此地址;在进行步骤(2-2-4)求频域特征值之前,通过异步流操作,使得当GPU进行计算时,主机CPU线程不必等待即可进行其它计算;在进行步骤(2-2-5)将计算结果写入共享显存之前,发送同步指令,保证同一线程块中的所有线程都执行到同一位置,当其中任意一个线程运行到同步指令标记处后会暂停运行,直到整个线程块中所有的线程都运行到同一位置,整个线程块才会继续执行下面的语句。
8.根据权利要求1所述的基于图形处理器的乳腺CT图像重建方法,其特征是:步骤(2-3)具体包括下述步骤:(2-3-1)读取共享显存变量;(2-3-2)求逆矩阵;(2-3-3)求共轭矩阵;(2-3-4)求出算子B、C的特征值;(2-3-5)将计算结果写入共享显存。
9.根据权利要求8所述的基于图形处理器的乳腺CT图像重建方法,其特征是:
步骤(2-3)中:在进行步骤(2-3-2)求逆矩阵之前,通过kernel设计,使GPU进行逆矩阵计算时符合warp发射条件,保证从属于同一个warp的线程间进行通信时不需要进行栅栏同步;在进行步骤(2-3-3)求共轭矩阵之前,对读取逆矩阵计算结果的指令作出访问优先标记, 使该具有访问优先标记的指令获得共享显存访问的最高优先级;在进行步骤(2-3-4)求出算子B、C的特征值之前,通过异步执行指令,使一个流内的计算能够和另一个流的数据传输同时进行;在进行步骤(2-3-5)将计算结果写入共享显存之前,通过offset对齐设计, 使数据对齐方式为最符合GPU计算的4字节对齐或者8字节对齐。
CN201210303760.0A 2012-08-23 2012-08-23 基于图形处理器的乳腺ct图像重建方法 Active CN102831629B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210303760.0A CN102831629B (zh) 2012-08-23 2012-08-23 基于图形处理器的乳腺ct图像重建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210303760.0A CN102831629B (zh) 2012-08-23 2012-08-23 基于图形处理器的乳腺ct图像重建方法

Publications (2)

Publication Number Publication Date
CN102831629A true CN102831629A (zh) 2012-12-19
CN102831629B CN102831629B (zh) 2014-12-17

Family

ID=47334743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210303760.0A Active CN102831629B (zh) 2012-08-23 2012-08-23 基于图形处理器的乳腺ct图像重建方法

Country Status (1)

Country Link
CN (1) CN102831629B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102783967A (zh) * 2012-08-23 2012-11-21 汕头市超声仪器研究所有限公司 一种乳腺ct设备
CN105684043A (zh) * 2013-06-06 2016-06-15 唯盼健康科技有限公司 根据投影视图对对象进行重建的方法
CN110012252A (zh) * 2019-04-09 2019-07-12 北京奥特贝睿科技有限公司 一种适用于自主驾驶仿真平台的快速图像存储方法以及***
CN110537209A (zh) * 2017-04-17 2019-12-03 皇家飞利浦有限公司 实时诊断成像预览
CN110766704A (zh) * 2019-10-22 2020-02-07 深圳瀚维智能医疗科技有限公司 ***点云分割方法、装置、存储介质及计算机设备
CN112051285A (zh) * 2020-08-18 2020-12-08 大连理工大学 X射线实时成像与ct断层扫描一体化智能无损检测***
CN112258378A (zh) * 2020-10-15 2021-01-22 武汉易维晟医疗科技有限公司 基于gpu加速的实时三维测量***及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008017076A2 (en) * 2006-08-03 2008-02-07 The Regents Of The University Of California Iterative methods for dose reduction and image enhancement in tomography
CN101336831A (zh) * 2008-08-13 2009-01-07 汕头超声仪器研究所 实时三维医学超声图像的重建方法
US20110267054A1 (en) * 2010-04-30 2011-11-03 Qiang He Magnetic resonance imaging water-fat separation method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008017076A2 (en) * 2006-08-03 2008-02-07 The Regents Of The University Of California Iterative methods for dose reduction and image enhancement in tomography
CN101336831A (zh) * 2008-08-13 2009-01-07 汕头超声仪器研究所 实时三维医学超声图像的重建方法
US20110267054A1 (en) * 2010-04-30 2011-11-03 Qiang He Magnetic resonance imaging water-fat separation method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GANG-RONG QU, ET AL.: "An Iterative Algorithm for Angle-limited Three-dimensional Image Reconstruction", 《ACTA MATHEMATICAE APPLICATAE SINICA, ENGLISH SERIES》, vol. 24, no. 1, 31 December 2008 (2008-12-31), pages 157 - 166, XP019567397 *
TAKESHI FUJITA, ET AL.: "Phase recovery for electron holography using Gerchberg–Papoulis iterative algorithm", 《ULTRAMICROSCOPY》, vol. 102, 31 December 2005 (2005-12-31), pages 279 - 286 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102783967A (zh) * 2012-08-23 2012-11-21 汕头市超声仪器研究所有限公司 一种乳腺ct设备
CN102783967B (zh) * 2012-08-23 2014-06-04 汕头市超声仪器研究所有限公司 一种乳腺ct设备
CN105684043A (zh) * 2013-06-06 2016-06-15 唯盼健康科技有限公司 根据投影视图对对象进行重建的方法
CN110537209A (zh) * 2017-04-17 2019-12-03 皇家飞利浦有限公司 实时诊断成像预览
CN110012252A (zh) * 2019-04-09 2019-07-12 北京奥特贝睿科技有限公司 一种适用于自主驾驶仿真平台的快速图像存储方法以及***
CN110766704A (zh) * 2019-10-22 2020-02-07 深圳瀚维智能医疗科技有限公司 ***点云分割方法、装置、存储介质及计算机设备
CN110766704B (zh) * 2019-10-22 2022-03-08 深圳瀚维智能医疗科技有限公司 ***点云分割方法、装置、存储介质及计算机设备
CN112051285A (zh) * 2020-08-18 2020-12-08 大连理工大学 X射线实时成像与ct断层扫描一体化智能无损检测***
CN112051285B (zh) * 2020-08-18 2021-08-20 大连理工大学 X射线实时成像与ct断层扫描一体化智能无损检测***
CN112258378A (zh) * 2020-10-15 2021-01-22 武汉易维晟医疗科技有限公司 基于gpu加速的实时三维测量***及方法

Also Published As

Publication number Publication date
CN102831629B (zh) 2014-12-17

Similar Documents

Publication Publication Date Title
CN102831629B (zh) 基于图形处理器的乳腺ct图像重建方法
Pratx et al. GPU computing in medical physics: A review
Shackleford et al. On developing B-spline registration algorithms for multi-core processors
Shamonin et al. Fast parallel image registration on CPU and GPU for diagnostic classification of Alzheimer's disease
US20200090383A1 (en) Multi-level image reconstruction using one or more neural networks
CN108122263B (zh) 图像重建***及方法
CN103310484B (zh) 一种基于cuda架构加速ct图像重建的方法
CN107223267B (zh) 图像重建方法和***
Blas et al. Surfing the optimization space of a multiple-GPU parallel implementation of a X-ray tomography reconstruction algorithm
Choi et al. Acceleration of EM-based 3D CT reconstruction using FPGA
CN114067013A (zh) 用于经由单应重采样变换进行重投影和反投影的***和方法
Scherl et al. Evaluation of state-of-the-art hardware architectures for fast cone-beam CT reconstruction
Flores et al. Parallel CT image reconstruction based on GPUs
CN110136218A (zh) 基于噪声生成机制与数据驱动紧框架的ct投影去噪重建方法及装置
Li et al. Parallel iterative cone beam CT image reconstruction on a PC cluster
Li et al. cuMBIR: An efficient framework for low-dose x-ray CT image reconstruction on GPUs
Goel et al. ComputeCOVID19+: Accelerating COVID-19 diagnosis and monitoring via high-performance deep Learning on CT images
Jimenez et al. An irregular approach to large-scale computed tomography on multiple graphics processors improves voxel processing throughput
Diakite et al. OpenCL FPGA Optimization guided by memory accesses and roofline model analysis applied to tomography acceleration
MA et al. Cuda parallel implementation of image reconstruction algorithm for positron emission tomography
KR101493683B1 (ko) 콘-빔 기반 반응선 재구성을 이용한 초고해상도 pet 영상 재구성 장치 및 그 방법
Xu et al. Mapping iterative medical imaging algorithm on cell accelerator
Zhang et al. High performance parallel backprojection on multi-GPU
Herraiz et al. GPU acceleration of a fully 3D iterative reconstruction software for PET using CUDA
Fan et al. A block-wise approximate parallel implementation for ART algorithm on CUDA-enabled GPU

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: 515041 Guangdong City, Longhu Province Wan Industrial Zone, Longjiang Road, Mount Everest road and the junction of the northwest side of the area, building 2, on the east side of the East

Patentee after: Shantou Ultrasonic Testing Technology Co., Ltd.

Address before: 1 floor, No. 77 Jinsha Road, Jinping District, Guangdong, Shantou, China

Patentee before: Shantou Dongfang Ultrasonic Technology Co.,Ltd.