CN110689447A - 一种基于深度学习的社交软件用户发布内容的实时检测方法 - Google Patents
一种基于深度学习的社交软件用户发布内容的实时检测方法 Download PDFInfo
- Publication number
- CN110689447A CN110689447A CN201910817334.0A CN201910817334A CN110689447A CN 110689447 A CN110689447 A CN 110689447A CN 201910817334 A CN201910817334 A CN 201910817334A CN 110689447 A CN110689447 A CN 110689447A
- Authority
- CN
- China
- Prior art keywords
- information
- template
- neural network
- deep neural
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013135 deep learning Methods 0.000 title claims abstract description 16
- 238000011897 real-time detection Methods 0.000 title claims description 6
- 238000001514 detection method Methods 0.000 claims abstract description 60
- 238000013528 artificial neural network Methods 0.000 claims abstract description 29
- 238000002372 labelling Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 9
- 238000010992 reflux Methods 0.000 claims description 4
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 102100032202 Cornulin Human genes 0.000 description 1
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Economics (AREA)
- Image Analysis (AREA)
- Machine Translation (AREA)
Abstract
本发明一种基于深度学习的社交软件用户发布内容的实时检测方法,属于深度学习和图像处理技术领域。所述方法包括:进行模板标注,生成标注模板信息;利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类,生成带类别的文字区域信息;根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配,生成结构化信息数据。
Description
技术领域
本发明属于社交软件发布内容检测领域,具体涉及一种基于深度学习的社交软件用户发布内容的实时检测***。
背景技术
随着移动互联网的快速发展,越来越多的人使用社交软件来分享他们的生活,社交软件的用户正在呈指数上升,同时用户人群不分年龄段,青少年一直是使用社交软件的主力军。在社交软件发展的过程中,不时地会出现色情,暴力,血腥等低俗内容(文字,图像,视频等),这严重阻碍了社交软件的发展,也同时给社会带了极其恶劣的影响,尤其是对心智尚未成熟的青少年极为严重的迫害。提高社交软件的监管审查力度也越来越迫切。但是,随着用户人群不断增多,发布内容激增,依靠人力一条一条地甄别这些内容显得极其不实际。因此,社交软件急需一款内置的检测工具,利用AI在用户按下发布按钮之后对用户所发布的内容进行实时且快速的评价,只有经鉴定合格之后才能发布到社交平台之上。
传统的文字,图像检测方法存在精度低速度慢等特点。随着深度学习的发展,越来越多的实际问题如文本检测,目标检测都开始使用深度学习技术,其识别精度比传统方法有了质的飞越,同时在速度上也有了较大的提升,因此,这用于社交软件之上也并不会让用户感受到明显的等待时间,不会影响到用户体验。目前,针对社交软件中的不良低俗内容,大多数社交软件依然是依靠用户举报继而人力甄别,网络管理员巡查等手段为主,文字、图像在线算法自动检测为辅来实现的,这就存在很多问题:
(1)传统的检测方法精度过低,容易造成漏检等现象。同时,传统检测方法速度过慢,影响用户的主观体验。
(2)依靠人力的检测已经完全应付不了呈指数增长的发布内容,对于社交软件来说,也相应地增加了成本。
(3)人力的监管也无法做到24小时不间断的工作,疲劳以及长时间重复的工作这种种因素也会导致人力检测精度的降低。
为了解决以上问题,本专利提出了一种基于深度学习的社交软件发布内容的实时检测方法和***,该工具能实时且快速地在用户按下发布按钮之前,自动检测且评定用户即将发布的内容是否包含不良或低俗的内容,只有评定合格之后才准予发布,从而实现了自动检测为主,人力审查为辅的监管模式。
发明内容
针对现有技术上存在的不足,本发明提供一种基于深度学习的社交软件用户发布内容的实时检测***。针对文本,图像,视频等内容,利用基于深度学习的检测方法,进行实时评定,如若判定不合格则不允许发布。基于深度学习的文本,图像实时检测评定技术,即利用训练好的深度学习模型对社交软件用户即将发布的内容(文本,图像,视频)进行实时分类,如若判定模型的输入为不良或低速的内容,则不允许发布。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,提供了一种基于深度学习的社交软件用户发布内容的实时监测方法所述方法包括:进行模板标注,生成标注模板信息;利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类,生成带类别的文字区域信息;根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配,生成结构化信息数据。
结合第一方面,在第一种可能的实现方式中,进行模板标注,生成标注模板信息,包括:标注模板锚点和非锚点文字区域的大小及相对位置,以及实体与所述锚点、非锚点文字区域的映射关系,生成标注模板信息。
结合第一方面,在第二种可能的实现方式中,利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类,生成带类别的文字区域信息,包括:利用预设深度神经网络检测模型检测待检测图像的文字行,通过输出的类别获取包括的锚点和非锚点文字区域的文字区域信息。
结合第一方面,在第三种可能的实现方式中,根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配,生成结构化信息数据,包括:将所述标注模板信息与所述带类别的文字区域信息作为输出,匹配定位锚点,并通过锚点将所述带类别的文字区域映射到对应的实体,去除包括非文本区域和无关文本在内的冗余部分,生成结构化信息。
结合第一方面方式中,所述方法还包括:对输入的待检测图像进行图像预处理,所述图像预处理包括图像 矫正和/或缩放到统一尺寸。
结合第一方面方式中,所述方法还包括:训练获得所述预设深度神经网络检测模型。
结合第一方面方式中,训练获得所述预设深度神经网络检测模型,包括:使用样本生成工具生成样本;使用样本进行训练;获得初步深度神经网络检测模型;在检测应用中形成数据回流,获得更多的新样本;用新样本在初步深度神经网络检测模型上进行Fine-tuning。
第二方面,提供了一种基于深度神经网络的文本检测分析装置,包括:标注模块,用于进行模板标注,生成标注模板信息;文字区域检测模块,用于利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类,生成带类别的文字区域信息;匹配模块,用于根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配,生成结构化信息数据。
结合第二方面,在第一种可能的实现方式中,所述标注模块用于:标注模板锚点和非锚点文字区域的大小及相对位置,以及实体与所述锚点、非锚点文字区域的映射关系,生成标注模板信息。
结合第二方面,在第二种可能的实现方式中,所述文字区域检测模块用于:利用预设深度神经网络检测模型检测待检测图像的文字行,通过输出的类别获取包括的锚点和非锚点文字区域的文字区域信息。
结合第二方面,在第三种可能的实现方式中,所述匹配模块用于:将所述标注模板信息与所述带类别的文字区域信息作为输出,匹配定位锚点,并通过锚点将所述带类别的文字区域映射到对应的实体,去除包括非文本区域和无关文本在内的冗余部分,生成结构化信息。
结合第二方面及第二方面的第一至三任一种可能方式,所述装置还包括图像预处理模块,用于对输入的待检测图像进行图像预处理,所述图像预处理包括图像矫正和/或缩放到统一尺寸。
结合第二方面及第二方面的第一至三任一种可能方式,所述装置还包括模型训练模块,用于训练获得所述预设深度神经网络检测模型。
结合第二方面方式,所述模型训练模块用于:使用样本生成工具生成样本;使用样本进行训练;获得初步深度神经网络检测模型;在检测应用中形成数据回流,获得更多的新样本;用新样本在初步深度神经网络检测模型上进行Fine-tuning。
本发明具有以下优点:1.使用强大且先进的深度学习检测框架,使得检测结果更加的可靠。2.在可靠性提升的基础上并不会增加用户的等待时间,不会影响到用户的主管使用体验。3.与纯人工监管相比,大大提升了工作效率,一定程度上缓解了使用人力带来的不定因素。4.大大减少了社交软件上不良或低俗信息的发布,对于净化网络环境和风气,给青少年营造出一个健康良好的成长氛围具有重大的意义。
附图说明
图1是本发明方法流程图
图2是优选实施例方式的模板匹配示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
本发明实施例提供的一种基于深度学习的社交软件发布内容的实时检测方法,通过利用深度神经网络检测模型进行图像文字区域的检测、分类,然后结合标注的模板信息与 检测分类得到的带类别的文字区域信息,进行模板匹配,生成结构化信息数据,能够针对如 票据图像中各种字段,实现快速、准确的检测分析,对于文档图像的检测与分析具有实时、 准确、通用、鲁棒、可扩展的特点,可广泛应用于多种包含文本的图像文本检测、分析与识别领域中。
图1具体的包括以下步骤:
步骤1:进行模板标注,生成标注模板信息。
进一步的,标注模板锚点和非锚点文字区域的大小及相对位置,以及实体与锚点、非锚点文字区域的映射关系,生成标注模板信息。这一过程用于标注所有需要识别字段的位置和类别,类别包括是否为锚点,文字行是否为日期、汉字、英文等等。生成的标注模板信息 用于后续的模板匹配。
需要注意的是,这里进行标注的模板并不限于一种或两种,根据实际需要,可以预先设置多种模板。
步骤2:利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类,生成带类别的文字区域信息。
进一步的,利用预设深度神经网络检测模型检测待检测图像的文字行,通过输出的类别获取包括的锚点和非锚点文字区域的文字区域信息。使用检测模型检测文字行,通过输出的类别就可以获取所有锚点,这个过程中也可以筛选置信度最高的锚点,通过锚点就可以确定版面的相对位置。这里的预设深度网络检测模型可以采用faster-rcnn网络模型、mask-rcnn网络模型或者现有技术中其他任何可能的深度神经网络模型,本发明实施例不对其加以特别限制。
采用深度神经网络物体检测框架能够精准找出不同尺度(字号)的文字区域,并对文字内容进行初步分类,锚点确定了,相当于确定了整个版面各个字段的相对位置,然后结合之前的检测结果和版面的相对位置就可以准确的定位想要的字段对位置和内容信息,因此稳定的锚点能够实现准确的匹配,提升后续匹配步骤的准确率。
步骤3:根据标注模板信息和带类别的文字区域信息进行模板匹配,生成结构化信息数据。
进一步的,将标注模板信息与带类别的文字区域信息作为输出,匹配定位锚点,并通过锚点将带类别的文字区域映射到对应的实体,去除包括非文本区域和无关文本在内的冗余部分,生成结构化信息。根据检测出的文字行与锚点的相对位置,就可以确定该文字行的类型,识别之后就可以将结果结构化。然后可以将结构化信息输出,以便进行相应应用。这里涉及的识别过程可以采用现有技术中tessract、CRNN之类的识别模型,本发明实施例不对其加以特别限制。
图2是一优选实施方式的模板匹配过程示意图,如图2所示,上述步骤3又可进一步包括:
301:结合标注模板信息与带类别的文字区域信息进行模板匹配;
302:结合标注模板信息、带类别的文字区域信息以及匹配成功的锚点进行文字区域的映射;
303:将映射的结果去重,去除重复冗余的文字区域;
304:将完整的检测结果根据模板信息结构化,完成模板匹配。
根据通过检验得到的文字检出区域的相对位置,匹配标注模板,排除非文本区域与无关文本,比通用识别方法更能抓住关键信息。
进一步的,本发明实施例提供的一种基于深度学习的社交软件发布内容的实时检测方法除了包括以上步骤1—步骤3外,还包括以下步骤:
对输入的待检测图像进行图像预处理,图像预处理包括但不限于图像矫正和/或 缩放到统一尺寸,可以根据实际情况进行图像预处理操作的相应设置。
另外,进一步的,本发明实施例提供的基于深度神经网络的文本检测分析方法,还包括以下步骤:
训练获得预设深度神经网络检测模型,具体地包括:
使用样本生成工具生成样本;
使用样本进行训练;
获得初步深度神经网络检测模型;
在检测应用中形成数据回流,获得更多的新样本
用新样本在初步深度神经网络检测模型上进行Fine-tuning。
在上述过程中,会对样本中的文字行分类(包括但不限于进行锚点类和非锚点类的分类),然后训练检测模型。
对图像而言,直接输入到训练好的模型之中,对视频而言,进行在线图像动态截取之后输入到训练好的模型之中进行检测,如若检测出来的结果属于不良或低俗类的标签则不允许发布。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1. 一种基于深度学习的社交软件用户发布内容的实时检测方法,其特征在于:所述方法包括:进行模板标注,生成标注模板信息;利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类,生成带类别的文字区域信息; 根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配,生成结构化信息数据。
2.根据权利要求1所述的方法,其特征在于,进行模板标注,生成标注模板信息,包括:标注模板锚点和非锚点文字区域的大小及相对位置,以及实体与所述锚点、非锚点文字区域的映射关系,生成标注模板信息。
3.根据权利要求1所述的方法,其特征在于,利用预设深度神经网络检测模型对待检测图像进行文字区域的检测和分类,生成带类别的文字区域信息,包括:利用预设深度神经网络检测模型检测待检测图像的文字行,通过输出的类别获取包括的锚点和非锚点文字区域的文字区域信息。
4. 根据权利要求1所述的方法,其特征在于,根据所述标注模板信息和所述带类别的文字区域信息进行模板匹配,生成结构化信息数据,包括:将所述标注模板信息与所述带类别的文字区域信息作为输出,匹配定位锚点,并通过锚点将所述带类别的文字区域映射到对应的实体,去除包括非文本区域和无关文本在内的 冗余部分,生成结构化信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:对输入的待检测图像进行图像预处理,所述图像预处理包括图像矫正和/或缩放到统一尺寸。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:训练获得所述预设深度神经网络检测模型。
7.根据权利要求6所述的方法,其特征在于,训练获得所述预设深度神经网络检测模型,包括:使用样本生成工具生成样本;使用样本进行训练获得初步深度神经网络检测模型;在检测应用中形成数据回流,获得更多的新样本;用新样本在初步深度神经网络检测模型上进行Fine-tuning。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910817334.0A CN110689447A (zh) | 2019-08-30 | 2019-08-30 | 一种基于深度学习的社交软件用户发布内容的实时检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910817334.0A CN110689447A (zh) | 2019-08-30 | 2019-08-30 | 一种基于深度学习的社交软件用户发布内容的实时检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110689447A true CN110689447A (zh) | 2020-01-14 |
Family
ID=69107647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910817334.0A Pending CN110689447A (zh) | 2019-08-30 | 2019-08-30 | 一种基于深度学习的社交软件用户发布内容的实时检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110689447A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111695518A (zh) * | 2020-06-12 | 2020-09-22 | 北京百度网讯科技有限公司 | 结构化文档信息标注的方法、装置及电子设备 |
CN112381086A (zh) * | 2020-11-06 | 2021-02-19 | 厦门市美亚柏科信息股份有限公司 | 一种结构化输出图像文字识别结果的方法及装置 |
CN114611497A (zh) * | 2022-05-10 | 2022-06-10 | 北京世纪好未来教育科技有限公司 | 语病诊断模型的训练方法、语病诊断方法、装置及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469047A (zh) * | 2015-11-23 | 2016-04-06 | 上海交通大学 | 基于无监督学习深度学习网络的中文检测方法及*** |
KR101769918B1 (ko) * | 2017-05-17 | 2017-08-21 | 주식회사 마인드그룹 | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 |
US20180246873A1 (en) * | 2017-02-28 | 2018-08-30 | Cisco Technology, Inc. | Deep Learning Bias Detection in Text |
CN108664996A (zh) * | 2018-04-19 | 2018-10-16 | 厦门大学 | 一种基于深度学习的古文字识别方法及*** |
CN109086756A (zh) * | 2018-06-15 | 2018-12-25 | 众安信息技术服务有限公司 | 一种基于深度神经网络的文本检测分析方法、装置及设备 |
KR20190093752A (ko) * | 2018-01-10 | 2019-08-12 | 네이버 주식회사 | 딥 러닝을 이용한 씬 텍스트 검출 방법 및 시스템 |
-
2019
- 2019-08-30 CN CN201910817334.0A patent/CN110689447A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469047A (zh) * | 2015-11-23 | 2016-04-06 | 上海交通大学 | 基于无监督学习深度学习网络的中文检测方法及*** |
US20180246873A1 (en) * | 2017-02-28 | 2018-08-30 | Cisco Technology, Inc. | Deep Learning Bias Detection in Text |
KR101769918B1 (ko) * | 2017-05-17 | 2017-08-21 | 주식회사 마인드그룹 | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 |
KR20190093752A (ko) * | 2018-01-10 | 2019-08-12 | 네이버 주식회사 | 딥 러닝을 이용한 씬 텍스트 검출 방법 및 시스템 |
CN108664996A (zh) * | 2018-04-19 | 2018-10-16 | 厦门大学 | 一种基于深度学习的古文字识别方法及*** |
CN109086756A (zh) * | 2018-06-15 | 2018-12-25 | 众安信息技术服务有限公司 | 一种基于深度神经网络的文本检测分析方法、装置及设备 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111695518A (zh) * | 2020-06-12 | 2020-09-22 | 北京百度网讯科技有限公司 | 结构化文档信息标注的方法、装置及电子设备 |
US11687704B2 (en) | 2020-06-12 | 2023-06-27 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method, apparatus and electronic device for annotating information of structured document |
CN111695518B (zh) * | 2020-06-12 | 2023-09-29 | 北京百度网讯科技有限公司 | 结构化文档信息标注的方法、装置及电子设备 |
CN112381086A (zh) * | 2020-11-06 | 2021-02-19 | 厦门市美亚柏科信息股份有限公司 | 一种结构化输出图像文字识别结果的方法及装置 |
CN114611497A (zh) * | 2022-05-10 | 2022-06-10 | 北京世纪好未来教育科技有限公司 | 语病诊断模型的训练方法、语病诊断方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109086756B (zh) | 一种基于深度神经网络的文本检测分析方法、装置及设备 | |
CN108074231B (zh) | 一种基于卷积神经网络的磁片表面缺陷检测方法 | |
CN109670494B (zh) | 一种附带识别置信度的文本检测方法及*** | |
WO2018006294A1 (zh) | 一种基于图像模式识别技术的阅卷***、装置和方法 | |
CN110689447A (zh) | 一种基于深度学习的社交软件用户发布内容的实时检测方法 | |
Weaver et al. | LeafMachine: Using machine learning to automate leaf trait extraction from digitized herbarium specimens | |
CN110598693A (zh) | 一种基于Faster-RCNN的船牌识别方法 | |
CN114218391B (zh) | 一种基于深度学习技术的敏感信息识别方法 | |
CN114663904A (zh) | 一种pdf文档布局检测方法、装置、设备及介质 | |
CN110689018A (zh) | 一种智能阅卷***及其处理方法 | |
CN110135225A (zh) | 样本标注方法及计算机存储介质 | |
CN114494103A (zh) | 缺陷检测方法及检测装置 | |
CN115019294A (zh) | 一种指针式仪表读数识别方法及*** | |
CN114972880A (zh) | 一种标签识别方法、装置、电子设备及存储介质 | |
CN117593244A (zh) | 一种基于改进注意力机制的膜产品缺陷检测方法 | |
CN117216264A (zh) | 一种基于bert算法的机床设备故障分析方法和*** | |
CN116843677A (zh) | 钣金件的外观质量检测***及其方法 | |
CN111160756A (zh) | 基于二次人工智能算法的景区评估方法及模型 | |
CN116110066A (zh) | 票据文本的信息提取方法、装置、设备及存储介质 | |
CN110956174A (zh) | 一种器件编号的识别方法 | |
CN114005054A (zh) | 一种ai智能评分*** | |
CN113988064A (zh) | 一种半自动实体标注监督方法 | |
Zhao et al. | Barcode character defect detection method based on Tesseract-OCR | |
CN116306576B (zh) | 一种书刊印刷检错***及其方法 | |
CN116994270B (zh) | 一种简历解析方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 211000 floor 3, building 3, Qilin artificial intelligence Industrial Park, 266 Chuangyan Road, Nanjing, Jiangsu Applicant after: Zhongke Nanjing artificial intelligence Innovation Research Institute Address before: 211000 3rd floor, building 3, 266 Chuangyan Road, Jiangning District, Nanjing City, Jiangsu Province Applicant before: NANJING ARTIFICIAL INTELLIGENCE CHIP INNOVATION INSTITUTE, INSTITUTE OF AUTOMATION, CHINESE ACADEMY OF SCIENCES |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200114 |