CN111709293A - 一种基于ResUNet神经网络的化学结构式分割方法 - Google Patents

一种基于ResUNet神经网络的化学结构式分割方法 Download PDF

Info

Publication number
CN111709293A
CN111709293A CN202010419502.3A CN202010419502A CN111709293A CN 111709293 A CN111709293 A CN 111709293A CN 202010419502 A CN202010419502 A CN 202010419502A CN 111709293 A CN111709293 A CN 111709293A
Authority
CN
China
Prior art keywords
size
multiplied
chemical structural
neural network
resunet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010419502.3A
Other languages
English (en)
Other versions
CN111709293B (zh
Inventor
王毅刚
邵***
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202010419502.3A priority Critical patent/CN111709293B/zh
Publication of CN111709293A publication Critical patent/CN111709293A/zh
Application granted granted Critical
Publication of CN111709293B publication Critical patent/CN111709293B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于ResUNet神经网络的化学结构式分割方法。本发明步骤如下:步骤(1)构造训练集T,训练集T包括手动标注训练集T‑1和自动生成训练集T‑2两部分;步骤(2)将训练集T送入ResUNet神经网络进行训练,达到训练指定次数或者Loss曲线不再下降且精度不再提高为止,将训练好的ResUNet神经网络模型保存;步骤(3)使用步骤(2)中训练好的ResUNet神经网络模型对化学结构式进行分割。本发明在ResUNet神经网络基础上,提出一种改进的ResUNet神经网络,同时,提出一种自动生成大量化学结构式训练集的方法进行训练集的生成,从而使ResUNet神经网络能够对化学结构式进行分割,达到以大量数据提升神经网络识别精度的目的。

Description

一种基于ResUNet神经网络的化学结构式分割方法
技术领域
本发明属于计算机检测技术领域,具体涉及一种基于ResUNet神经网络的化学结构式分割方法,本发明在ResUNet神经网络基础上,提出一种改进的ResUNet神经网络,同时,提出一种自动生成大量化学结构式训练集的方法进行训练集的生成,从而使ResUNet神经网络能够对化学结构式进行分割,达到以大量数据提升神经网络识别精度的目的。
背景技术
科学实验通常至关重要的一部分是快速处理和吸收新获得的数据。此外,新的研究方法也离不开收集、分析和利用先前发表的实验数据。这对于小分子药物的发现尤其适用,其中实验测试的分子集合用于虚拟筛选程序、定量结构活性/性质关系(QSAR/QSPR)分析或基于物理建模方法的验证。由于产生大量实验数据的难度和费用,许多药物发现项目被迫依赖于相对较小的内部实验数据库。解决药物发现中普遍缺乏适当的训练集数据的一个有希望的解决方案是利用目前正在发表的数据。Medline报告每天发表超过2000多篇新的生命科学论文,鉴于新的实验数据以如此高的速度进入公共文献,解决与数据提取和管理相关的问题,并尽可能地自动化这些过程变得越来越重要。生命科学中从公开的来源,如期刊文章和专利文件中提取化学结构仍然是困难和非常耗时的。
目前,大量书籍和其它出版物依然只有纸质版或扫描版可得,造成重用上的困难。一方面,纸质版或扫描版的材料不便于进行检索,导致分散在大量文献中的信息不容易被发现,从而得不到充分利用。另一方面,对这些材料进行进一步处理涉及繁琐和易误的重新输入工作。
化学结构式识别的研究进展缓慢,主要原因是:一、在文档中公式被自然语言环绕,难以定位;二,由于化学结构式结构复杂,符号种类繁多且字体多样、大小不一,具有非规则性,逻辑性,复杂性等特征。
目前的化学结构式的识别方法都分为两个步骤:一、将化学结构式从自然语言中定位并分割出来;二、将分割出的化学结构式送入识别引擎中进行识别。其中,当前的化学结构式分割方法基本上是基于传统图像处理方法来完成的,其分割准确度较低,并无法处理一些如自然语言和化学分子式距离较近等特殊情况。
发明内容
基于此,为了提高化学结构式的定位与分割准确度,本发明在 ResUNet神经网络基础上,提出一种改进的ResUNet神经网络,同时,提出一种自动生成大量化学结构式训练集的方法进行训练集的生成,从而使ResUNet神经网络能够对化学结构式进行分割,达到以大量数据提升神经网络识别精度的目的。
一种基于ResUNet神经网络的化学结构式分割方法,包括如下步骤:
步骤(1)构造训练集T,训练集T包括手动标注训练集T-1和自动生成训练集T-2两部分。其中,手动标注出版物中的化学式作为部分训练集T-1,并使用一种自动生成化学结构式训练集的方法生成训练集T-2,训练集T-1和训练集T-2的容量比例为1:50;
步骤(2)将训练集T送入改进的ResUNet神经网络进行训练,达到训练指定次数或者Loss曲线不再下降且精度不再提高为止,将训练好的ResUNet神经网络模型保存;
步骤(3)使用步骤(2)中训练好的ResUNet神经网络模型对化学结构式进行分割。
进一步的,使用所述的一种自动生成化学结构式训练集的方法,基于排版模板的图像随机填充生成训练集,其构建方法包括如下步骤:
a.构造排版模板,在文字区域随机生成文本数据。
b.生成大量化学结构式图像。
c.在排版模板中寻找空白位置随机填充化学结构式图像式并标记。
进一步的,所述构造排版模板的方法包括以下步骤:
a-1.手动标定200页出版物中的文字区域,并进行旋转、上下左右反转进行数据扩充,共生成排版模板1000页,手动标记的排版模板如附图2所示。
a-2.将互联网文字和随机文本生成器产生的文字作为文本数据,并随机将文本数据填充排版模板中的文字区域,生成结果如附图3所示。
进一步的,所述生成大量化学结构式图像方法包括以下步骤:
b-1.将PubChem数据库中可用的5700万分子数据,使用Indigo 软件随机将其中的部分分子数据渲染成各种类型(键宽度、字符大小等)的256x256像素的3通道PNG格式图像。
b-2.将图像进行角度旋转,上下左右反转的数据扩充操作,共生成10万张小分子化学结构式图像。
进一步的,所述在排版模板中寻找空白位置随机填充化学结构式图像并标记的方法包括以下步骤:
c-1.随机取出生成的化学结构式图像,经过随机缩放比例后放置在文本区域外的空白位置,得到训练集T-2中数据部分,如附图4 所示。
c-2.逐像素的标记化学结构式图像所占用像素的位置,得到训练集T-2的标签部分,如附图5所示。
进一步的,所述改进ResUNet神经网络,其实现为:
将训练集T作为改进ResUNet神经网络的输入图像,输入图像为 512×512×3大小,经过第一层7×7卷积后输出大小为256×256×64的特征图res-1;接着先使用3×3大小的最大值池化,再经过重复三次1×1大小、3×3大小、1×1大小共9次卷积,输出128×128×256大小的特征图res-2;再接着经过重复四次1×1大小、3×3 大小、1×1大小共12次卷积,输出64×64×512大小特征图res-3,接着经过重复六次1×1大小、3×3大小、1×1大小共18次卷积,输出32×32×1024大小特征图res-4;接着经过重复三次1×1大小、 3×3大小、1×1大小共9次卷积,输出16×16×2048大小特征图 res-5;接着再进行1×1大小卷积,输出16×16×1024大小特征图 conv-1;接着进行2×2上采样,将输出特征图up-1与特征图res-4 拼接得到32×32×2048大小特征图concat-1;接着进行3×3大小卷积,输出32×32×512大小特征图conv-2;接着进行2×2上采样,将输出特征图up-2与特征图res-3拼接得到64×64×1024大小特征图concat-2;接着进行3×3大小卷积,输出64×64×256大小特征图conv-3;接着进行2×2上采样,将输出特征图up-3与特征图res-2 拼接得到128×128×512大小特征图concat-3;接着进行3×3大小卷积,输出128×128×64大小特征图conv-4;接着进行2×2上采样,将输出特征图up-4与特征图res-1拼接得到256×256×128大小特征图concat-4;接着进行3×3大小卷积,输出256×256×64大小特征图conv-5;最后,经过2×2上采样和1×1大小卷积,输出与原输入图像大小对应的512×512×2结果图。
本发明有益效果如下:
本发明在ResUNet神经网络基础上,提出一种改进的ResUNet神经网络,同时,提出一种自动生成大量化学结构式训练集的方法进行训练集的生成,从而使ResUNet神经网络能够对化学结构式进行分割,达到以大量数据提升神经网络识别精度的目的。
附图说明
图1为本发明改进的ResUNet神经网络流程示意图;
图2为本发明手动标记模板样例示意图;
图3为本发明随机文本填充后的模板样例示意图;
图4为本发明随机填充化学结构式后的模板样例示意图;
图5为本发明模板对应的标记样例示意图;
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明一种基于ResUNet神经网络的化学结构式分割方法进行详细说明。
一种基于ResUNet神经网络的化学结构式分割方法,包括如下步骤:
步骤(1)构造训练集T,训练集T包括手动标注训练集T-1和自动生成训练集T-2两部分。其中,手动标注出版物中的化学式作为部分训练集T-1,并使用一种自动生成化学结构式训练集的方法生成训练集T-2,训练集T-1和训练集T-2的容量比例为1:50;
使用所述的一种自动生成化学结构式训练集的方法,基于排版模板的图像随机填充生成训练集,其构建方法包括如下步骤:
a.构造排版模板,在文字区域随机生成文字数据,手动标定200 页出版物中的文字区域,并进行旋转、上下左右反转进行数据扩充,共生成模板1000页,手动标记模板如附图2所示,将互联网文字和随机文本生成器产生的文字作为文本数据,并随机将文本数据填充排版模板中的文字区域,生成结果如附图3所示。
b.生成大量化学结构式图像,使用PubChem数据库中可用的5700 万分子数据,使用Indigo软件随机将其中的部分分子数据渲染成各种类型(键宽度、字符大小等)的256x256像素的3通道PNG格式图像,将图像进行角度旋转,上下左右反转数据扩充操作,共生成10 万张小分子化学结构式图像。
c.在排版模板中寻找空白位置随机填充化学结构式并标记,随机取出生成的化学结构式图像,经过随机缩放比例后放置在文本区域外的空白位置,如附图4所示。逐像素的标记化学结构式图像所占用像素的位置,如附图5所示。
步骤(2)如图1所示构造改进的ResUNet神经网络,将训练数据集送入改进的ResUNet神经网络进行训练,达到训练指定次数或者 Loss曲线不再下降且精度不再提高为止,将训练好的模型保存;
进一步的,所述改进ResUNet神经网络,其流程为:将训练集T 作为改进ResUNet神经网络的输入图像,输入图像为512×512×3大小,经过第一层7×7卷积后输出大小为256×256×64的特征图res-1;接着先使用3×3大小的最大值池化,再经过重复三次1×1大小、3 ×3大小、1×1大小共9次卷积,输出128×128×256大小的特征图 res-2;再接着经过重复四次1×1大小、3×3大小、1×1大小共12 次卷积,输出64×64×512大小特征图res-3,接着经过重复六次1 ×1大小、3×3大小、1×1大小共18次卷积,输出32×32×1024 大小特征图res-4;接着经过重复三次1×1大小、3×3大小、1×1 大小共9次卷积,输出16×16×2048大小特征图res-5;接着再进行1×1大小卷积,输出16×16×1024大小特征图conv-1;接着进行2×2上采样,将输出特征图up-1与特征图res-4拼接得到32× 32×2048大小特征图concat-1;接着进行3×3大小卷积,输出32× 32×512大小特征图conv-2;接着进行2×2上采样,将输出特征图 up-2与特征图res-3拼接得到64×64×1024大小特征图concat-2;接着进行3×3大小卷积,输出64×64×256大小特征图conv-3;接着进行2×2上采样,将输出特征图up-3与特征图res-2拼接得到 128×128×512大小特征图concat-3;接着进行3×3大小卷积,输出 128×128×64大小特征图conv-4;接着进行2×2上采样,将输出特征图up-4与特征图res-1拼接得到256×256×128大小特征图 concat-4;接着进行3×3大小卷积,输出256×256×64大小特征图conv-5;最后,经过2×2上采样和1×1大小卷积,输出与原输入图像大小对应的512×512×2结果图。
根据下表构造改进的ResUNet神经网络:
Figure BDA0002496323150000071
Figure BDA0002496323150000081
步骤(3)使用步骤(2)中训练好的神经网络进行分割,得到分割结果。

Claims (6)

1.一种基于ResUNet神经网络的化学结构式分割方法,其特征在于包括如下步骤:
步骤(1)构造训练集T,训练集T包括手动标注训练集T-1和自动生成训练集T-2两部分;
步骤(2)将训练集T送入ResUNet神经网络进行训练,达到训练指定次数或者Loss曲线不再下降且精度不再提高为止,将训练好的ResUNet神经网络模型保存;
步骤(3)使用步骤(2)中训练好的ResUNet神经网络模型对化学结构式进行分割;
所述的训练集T-2是通过一种自动生成化学结构式训练集的方法,基于排版模板的图像随机填充生成训练集,其构建方法包括如下步骤:
a.构造排版模板,在文字区域随机生成文本数据;
b.生成大量化学结构式图像;
c.在排版模板中寻找空白位置随机填充化学结构式图像式并标记。
2.根据权利要求1所述的一种基于ResUNet神经网络的化学结构式分割方法,其特征在于将手动标注出版物中的化学式作为部分训练集T-1,且训练集T-1和训练集T-2的容量比例为1:50。
3.根据权利要求1或2所述的一种基于ResUNet神经网络的化学结构式分割方法,其特征在于所述构造排版模板的方法包括以下步骤:
a-1.手动标定200页出版物中的文字区域,并进行旋转、上下左右反转进行数据扩充,共生成排版模板1000页;
a-2.将互联网文字和随机文本生成器产生的文字作为文本数据,并随机将文本数据填充排版模板中的文字区域。
4.根据权利要求3所述的一种基于ResUNet神经网络的化学结构式分割方法,其特征在于所述生成大量化学结构式图像方法包括以下步骤:
b-1.将PubChem数据库中可用的5700万分子数据,使用Indigo软件随机将其中的部分分子数据渲染成各种类型的256x256像素的3通道PNG格式图像;
b-2.将图像进行角度旋转,上下左右反转的数据扩充操作,共生成10万张小分子化学结构式图像。
5.根据权利要求4所述的一种基于ResUNet神经网络的化学结构式分割方法,其特征在于所述在排版模板中寻找空白位置随机填充化学结构式图像并标记的方法包括以下步骤:
c-1.随机取出生成的化学结构式图像,经过随机缩放比例后放置在文本区域外的空白位置,得到训练集T-2中数据部分;
c-2.逐像素的标记化学结构式图像所占用像素的位置,得到训练集T-2的标签部分。
6.根据权利要求5所述的一种基于ResUNet神经网络的化学结构式分割方法,其特征在于所述ResUNet神经网络为改进后的ResUNet神经网络,其实现为:
将训练集T作为改进后的ResUNet神经网络的输入图像,输入图像为512×512×3大小,经过第一层7×7卷积后输出大小为256×256×64的特征图res-1;接着先使用3×3大小的最大值池化,再经过重复三次1×1大小、3×3大小、1×1大小共9次卷积,输出128×128×256大小的特征图res-2;再接着经过重复四次1×1大小、3×3大小、1×1大小共12次卷积,输出64×64×512大小特征图res-3,接着经过重复六次1×1大小、3×3大小、1×1大小共18次卷积,输出32×32×1024大小特征图res-4;接着经过重复三次1×1大小、3×3大小、1×1大小共9次卷积,输出16×16×2048大小特征图res-5;接着再进行1×1大小卷积,输出16×16×1024大小特征图conv-1;接着进行2×2上采样,将输出特征图up-1与特征图res-4拼接得到32×32×2048大小特征图concat-1;接着进行3×3大小卷积,输出32×32×512大小特征图conv-2;接着进行2×2上采样,将输出特征图up-2与特征图res-3拼接得到64×64×1024大小特征图concat-2;接着进行3×3大小卷积,输出64×64×256大小特征图conv-3;接着进行2×2上采样,将输出特征图up-3与特征图res-2拼接得到128×128×512大小特征图concat-3;接着进行3×3大小卷积,输出128×128×64大小特征图conv-4;接着进行2×2上采样,将输出特征图up-4与特征图res-1拼接得到256×256×128大小特征图concat-4;接着进行3×3大小卷积,输出256×256×64大小特征图conv-5;最后,经过2×2上采样和1×1大小卷积,输出与原输入图像大小对应的512×512×2结果图。
CN202010419502.3A 2020-05-18 2020-05-18 一种基于ResUNet神经网络的化学结构式分割方法 Active CN111709293B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010419502.3A CN111709293B (zh) 2020-05-18 2020-05-18 一种基于ResUNet神经网络的化学结构式分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010419502.3A CN111709293B (zh) 2020-05-18 2020-05-18 一种基于ResUNet神经网络的化学结构式分割方法

Publications (2)

Publication Number Publication Date
CN111709293A true CN111709293A (zh) 2020-09-25
CN111709293B CN111709293B (zh) 2023-10-03

Family

ID=72538017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010419502.3A Active CN111709293B (zh) 2020-05-18 2020-05-18 一种基于ResUNet神经网络的化学结构式分割方法

Country Status (1)

Country Link
CN (1) CN111709293B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241505A (zh) * 2021-12-20 2022-03-25 苏州阿尔脉生物科技有限公司 化学结构图像的提取方法、装置、存储介质及电子设备
CN114842486A (zh) * 2022-07-04 2022-08-02 南昌大学 一种手写化学结构式识别方法、***、存储介质以及设备

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1381795A (zh) * 2001-04-18 2002-11-27 无敌科技(西安)有限公司 应用于掌上型浏览装置的自动格式排版方法
CN101561805A (zh) * 2008-04-18 2009-10-21 日电(中国)有限公司 文档分类器生成方法和***
WO2018138104A1 (en) * 2017-01-27 2018-08-02 Agfa Healthcare Multi-class image segmentation method
CN109087306A (zh) * 2018-06-28 2018-12-25 众安信息技术服务有限公司 动脉血管图像模型训练方法、分割方法、装置及电子设备
CN109118491A (zh) * 2018-07-30 2019-01-01 深圳先进技术研究院 一种基于深度学习的图像分割方法、***及电子设备
CN109191476A (zh) * 2018-09-10 2019-01-11 重庆邮电大学 基于U-net网络结构的生物医学图像自动分割新方法
WO2019015785A1 (en) * 2017-07-21 2019-01-24 Toyota Motor Europe METHOD AND SYSTEM FOR LEARNING A NEURAL NETWORK TO BE USED FOR SEMANTIC INSTANCE SEGMENTATION
CN109658422A (zh) * 2018-12-04 2019-04-19 大连理工大学 一种基于多尺度深监督网络的视网膜图像血管分割方法
US10304193B1 (en) * 2018-08-17 2019-05-28 12 Sigma Technologies Image segmentation and object detection using fully convolutional neural network
CN109903292A (zh) * 2019-01-24 2019-06-18 西安交通大学 一种基于全卷积神经网络的三维图像分割方法及***
US20190205606A1 (en) * 2016-07-21 2019-07-04 Siemens Healthcare Gmbh Method and system for artificial intelligence based medical image segmentation
CN110210362A (zh) * 2019-05-27 2019-09-06 中国科学技术大学 一种基于卷积神经网络的交通标志检测方法
CN110705459A (zh) * 2019-09-29 2020-01-17 北京爱学习博乐教育科技有限公司 数理化公式自动识别方法及装置、模型训练方法及装置
US20200057917A1 (en) * 2018-08-17 2020-02-20 Shenzhen Dorabot Inc. Object Location Method, Device and Storage Medium Based on Image Segmentation

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1381795A (zh) * 2001-04-18 2002-11-27 无敌科技(西安)有限公司 应用于掌上型浏览装置的自动格式排版方法
CN101561805A (zh) * 2008-04-18 2009-10-21 日电(中国)有限公司 文档分类器生成方法和***
US20190205606A1 (en) * 2016-07-21 2019-07-04 Siemens Healthcare Gmbh Method and system for artificial intelligence based medical image segmentation
WO2018138104A1 (en) * 2017-01-27 2018-08-02 Agfa Healthcare Multi-class image segmentation method
WO2019015785A1 (en) * 2017-07-21 2019-01-24 Toyota Motor Europe METHOD AND SYSTEM FOR LEARNING A NEURAL NETWORK TO BE USED FOR SEMANTIC INSTANCE SEGMENTATION
CN109087306A (zh) * 2018-06-28 2018-12-25 众安信息技术服务有限公司 动脉血管图像模型训练方法、分割方法、装置及电子设备
CN109118491A (zh) * 2018-07-30 2019-01-01 深圳先进技术研究院 一种基于深度学习的图像分割方法、***及电子设备
US10304193B1 (en) * 2018-08-17 2019-05-28 12 Sigma Technologies Image segmentation and object detection using fully convolutional neural network
US20200057917A1 (en) * 2018-08-17 2020-02-20 Shenzhen Dorabot Inc. Object Location Method, Device and Storage Medium Based on Image Segmentation
CN109191476A (zh) * 2018-09-10 2019-01-11 重庆邮电大学 基于U-net网络结构的生物医学图像自动分割新方法
CN109658422A (zh) * 2018-12-04 2019-04-19 大连理工大学 一种基于多尺度深监督网络的视网膜图像血管分割方法
CN109903292A (zh) * 2019-01-24 2019-06-18 西安交通大学 一种基于全卷积神经网络的三维图像分割方法及***
CN110210362A (zh) * 2019-05-27 2019-09-06 中国科学技术大学 一种基于卷积神经网络的交通标志检测方法
CN110705459A (zh) * 2019-09-29 2020-01-17 北京爱学习博乐教育科技有限公司 数理化公式自动识别方法及装置、模型训练方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
于玉海: "面向医学文献的图像模式识别关键技术研究", no. 2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241505A (zh) * 2021-12-20 2022-03-25 苏州阿尔脉生物科技有限公司 化学结构图像的提取方法、装置、存储介质及电子设备
CN114842486A (zh) * 2022-07-04 2022-08-02 南昌大学 一种手写化学结构式识别方法、***、存储介质以及设备

Also Published As

Publication number Publication date
CN111709293B (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
JP2022541199A (ja) データテーブルの画像表現に基づいて構造化されたデータベースにデータ挿入するためのシステムおよび方法。
Li et al. Tablebank: A benchmark dataset for table detection and recognition
CN114005123B (zh) 一种印刷体文本版面数字化重建***及方法
EP1894144A2 (en) Grammatical parsing of document visual structures
CN111709293B (zh) 一种基于ResUNet神经网络的化学结构式分割方法
Baluja Learning typographic style: from discrimination to synthesis
CN113869017A (zh) 基于人工智能的表格图像重构方法、装置、设备及介质
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
CN109685061A (zh) 适用于结构化的数学公式的识别方法
Godfrey et al. An adaptable approach for generating vector features from scanned historical thematic maps using image enhancement and remote sensing techniques in a geographic information system
CN113255767B (zh) 票据分类方法、装置、设备及存储介质
CN116610304B (zh) 页面代码生成方法、装置、设备和存储介质
CN112560849A (zh) 基于神经网络算法的文理分割方法及***
Lopresti et al. Issues in ground-truthing graphic documents
Aswatha et al. A method for extracting text from stone inscriptions using character spotting
CN115019310B (zh) 图文识别方法及设备
CN111026899A (zh) 一种基于深度学习的产品生成方法
CN116341489A (zh) 一种文本信息读取方法、装置及终端
CN114913382A (zh) 一种基于CBAM-AlexNet卷积神经网络的航拍场景分类方法
CN114565749A (zh) 一种电力建设现场签证文档关键内容识别方法及***
CN114861595A (zh) 一种基于矢量线条变换的个性字体生成方法
Scius-Bertrand et al. Annotation-free keyword spotting in historical Vietnamese manuscripts using graph matching
Hamplová et al. Character Segmentation in the Development of Palmyrene Aramaic OCR
Hamplová et al. Cuneiform Stroke Recognition and Vectorization in 2D Images.
Waugh et al. GIMMS/An Example of an Operational System for Computer Cartography

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant