CN116484802B - 字符串颜色标记方法、装置、计算机设备及存储介质 - Google Patents

字符串颜色标记方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN116484802B
CN116484802B CN202310730750.3A CN202310730750A CN116484802B CN 116484802 B CN116484802 B CN 116484802B CN 202310730750 A CN202310730750 A CN 202310730750A CN 116484802 B CN116484802 B CN 116484802B
Authority
CN
China
Prior art keywords
color
target
character string
value
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310730750.3A
Other languages
English (en)
Other versions
CN116484802A (zh
Inventor
杨智广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310730750.3A priority Critical patent/CN116484802B/zh
Publication of CN116484802A publication Critical patent/CN116484802A/zh
Application granted granted Critical
Publication of CN116484802B publication Critical patent/CN116484802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Color Image Communication Systems (AREA)

Abstract

本发明涉及颜色标记技术领域,公开了字符串颜色标记方法、装置、计算机设备及存储介质,本发明获取目标字符串以及可用颜色值序列;基于目标字符串中的字符信息,确定目标字符串对应的颜色索引值;字符信息包括字符内容以及字符位置;基于颜色索引值,在可用颜色值序列中确定目标字符串的目标颜色值;基于目标颜色值,对目标字符串进行颜色标记。如此,可以自动为文本字符串选取颜色值并进行颜色标记,简化了颜色标记的操作,并且不易出错。

Description

字符串颜色标记方法、装置、计算机设备及存储介质
技术领域
本发明涉及颜色标记技术领域,具体涉及字符串颜色标记方法、装置、计算机设备及存储介质。
背景技术
在人工智能训练过程中,往往需要对用于训练的样本数据进行标注,以对样本数据进行区分,为了能够快速区分出不同类型的样本数据,通常会对样本数据的文本标注进行颜色标注。在对文本相似度进行比对时,也通常需要对文本字符串进行标注。在标注的过程中,对不同的文本字符串标注出不同的特定颜色,以从视觉上便于区分和识别。
目前为文本标注颜色的方法,通常是人为手动选择颜色值,这就存在颜色标注不确定性和不可预测性的问题,比如选取的颜色值无法体现出不同文本的相似度和联系、错误的为不同的文本选取了相同的颜色值等等,尤其是在多人进行协作操作时,这样的问题也更容易发生;并且手动选择颜色值的操作往往也比较复杂繁琐。
发明内容
有鉴于此,本发明提供了一种字符串颜色标记方法、装置、计算机设备及存储介质,以解决手动为文本标注颜色时操作复杂繁琐、易出错,并且不能体现不同文本之间的联系的问题。
第一方面,本发明提供了一种字符串颜色标记方法,该方法包括:
获取目标字符串以及可用颜色值序列;
基于目标字符串中的字符信息,确定目标字符串对应的颜色索引值;字符信息包括字符内容以及字符位置;
基于颜色索引值,在可用颜色值序列中确定目标字符串的目标颜色值;
基于目标颜色值,对目标字符串进行颜色标记。
如此,可以自动为文本字符串选取颜色值并进行颜色标记,简化了颜色标记的操作,并且不易出错。
在一种可选的实施方式中,基于目标字符串中的字符信息,确定目标字符串对应的颜色索引值,包括:
基于目标字符串中的字符信息,确定目标字符串的颜色参数;
基于颜色参数和可用颜色值序列,确定目标字符串对应的颜色索引值。
如此,可以基于目标字符串的字符信息确定颜色索引值,使颜色索引值能够体现目标字符串中的文本特征。
在一种可选的实施方式中,基于目标字符串中的字符信息,确定目标字符串的颜色参数,包括:
基于目标字符串中的字符信息,确定目标字符串中每个字符的颜色子参数;
对每个字符的颜色子参数求和,得到颜色参数。
在一种可选的实施方式中,确定目标字符串中每个字符的颜色子参数,包括:
基于字符内容,确定目标字符串中每个字符的编码值;每个字符的编码值为字符内容对应的十进制数值;
将每个字符的编码值与每个字符的字符位置相乘,得到每个字符的颜色子参数。
如此,可以根据目标字符串中包含的字符来确定其对应的颜色参数,从而使颜色参数能够充分代表目标字符串中包含的信息。
在一种可选的实施方式中,基于颜色参数和可用颜色值序列,确定目标字符串对应的颜色索引值,包括:
将颜色参数与可用颜色值序列的颜色容量相除,并将余数作为目标字符串的颜色索引值。
如此,可以基于目标字符串的颜色参数确定颜色索引值,从而从可用颜色值序列中选取目标颜色值,使目标颜色值能够体现目标字符串的文本特征。
在一种可选的实施方式中,基于目标颜色值,对目标字符串进行颜色标记,包括:
将目标颜色值转换为与目标字符串相同的表示方式,得到标记颜色值;
基于标记颜色值,对目标字符串进行颜色标记。
在一种可选的实施方式中,基于标记颜色值,对目标字符串进行颜色标记,包括:
基于标记颜色值,生成目标字符串对应的颜色标识码;
基于颜色标识码,对目标字符串进行颜色标记。
在一种可选的实施方式中,获取可用颜色值序列,包括:
确定颜色稀释系数;
基于颜色稀释系数,将初始颜色值集合分为多个颜色值子集;
分别从多个颜色值子集中选取颜色值,构成可用颜色值序列。
如此,可以从初始颜色值集合中选取颜色值构成可用颜色值序列,以稀释可用颜色值序列中颜色值的相似度,提高不同颜色值之间的差异性,从而便于从视觉上区分并反应不同文本字符串之间的差异性。
在一种可选的实施方式中,基于颜色稀释系数,将初始颜色值集合分为多个颜色值子集,包括:
基于颜色稀释系数,确定可用颜色值序列的颜色容量;颜色容量为可用颜色值序列含有的颜色值的数量;
将颜色容量作为多个颜色值子集的数量,按照初始颜色值集合中颜色值的排列顺序,划分初始颜色值集合,得到多个颜色值子集。
在一种可选的实施方式中,基于颜色稀释系数,确定可用颜色值序列的颜色容量,包括:
将初始颜色容量与颜色稀释系数对应的颜色稀释值相除,得到颜色容量;初始颜色容量为初始颜色值集合含有的颜色值的数量;颜色稀释值与颜色稀释系数成指数关系。
如此,可以通过颜色稀释系数调整可用颜色值序列中颜色值的数量。
在一种可选的实施方式中,分别从多个颜色值子集中选取颜色值,构成可用颜色值序列,包括:
分别从多个颜色值子集中选取预设位置处的颜色值;
将预设位置处的颜色值,按照多个颜色值子集的排列顺序进行排列,得到可用颜色值序列。
如此,可以从颜色值子集中抽选颜色值构成可用颜色值序列,提高了可用颜色值序列中相邻的颜色值的视觉差异性,从而提高不同文本字符串在视觉上的差异性。
在一种可选的实施方式中,预设位置为颜色值子集中排列顺序对应于颜色值子集容量的一半的颜色值的位置;
和/或,预设位置为颜色值子集中排列顺序对应于颜色值子集容量的一半加一的颜色值的位置。
如此,可以选取位于颜色值子集中位于中间位置处的颜色值,从而降低可用颜色值序列中相邻颜色值的相似度。
在一种可选的实施方式中,该方法还包括:
当存在两个目标字符串对应的目标颜色值相同时,调整颜色稀释系数,以重新构建可用颜色值序列。
如此,可以在出现不同文本字符串的颜色标记相同的情况时,调整颜色稀释系数,以调整可用颜色值序列,使不同文本字符串的颜色标记均不相同。
在一种可选的实施方式中,获取目标字符串,包括:
获取目标文本;
将目标文本对应的字符串,作为目标字符串。
如此,直接输入目标文本,就可以为目标文本进行颜色标记。
在一种可选的实施方式中,获取目标字符串,包括:
获取目标文本;
对目标文本中的字符串进行分割,得到目标字符串。
如此,对目标文本中不同的字符串分别进行颜色标记。
在一种可选的实施方式中,对目标文本中的字符串进行分割,得到目标字符串,包括:
获取目标关键词;
提取目标文本中的目标关键词,并将目标关键词对应的字符串作为目标字符串。
如此,可以对目标文本中的特定关键词进行颜色标记。
在一种可选的实施方式中,对目标文本中的字符串进行分割,得到目标字符串,包括:
基于预设分割符,对目标文本进行分割,得到多个目标关键词;
将多个目标关键词对应的字符串,作为目标字符串。
如此,可以对目标文本中的特定关键词进行颜色标记。
第二方面,本发明提供了一种字符串颜色标记装置,该装置包括:
目标字符串获取模块,用于获取目标字符串以及可用颜色值序列;
颜色索引值确定模块,用于基于目标字符串中的字符信息,确定目标字符串对应的颜色索引值;字符信息包括字符内容以及字符位置;
目标颜色值确定模块,用于基于颜色索引值,在可用颜色值序列中确定目标字符串的目标颜色值;
颜色标记模块,用于基于目标颜色值,对目标字符串进行颜色标记。
第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的字符串颜色标记方法。
第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的字符串颜色标记方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的字符串颜色标记方法的流程示意图;
图2是根据本发明实施例的字符串颜色标记方法的构建可用颜色值序列的流程图;
图3是根据本发明实施例的另一字符串颜色标记方法的流程示意图;
图4是根据本发明实施例的又一字符串颜色标记方法的流程示意图;
图5是根据本发明实施例的字符串颜色标记装置的结构框图;
图6是本发明实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在人工智能训练、文本相似度对比等需要对文本字符串进行颜色标注的场景下,相关技术中通常采用人为手动选取颜色值为文本字符串进行手动标注的方法,这样的方法存在以下缺陷:
(1)人为选取的颜色值主观性强,不能直观地体现出不同文本字符串之间的差异与联系;
(2)人为选取颜色值存在不确定性和不可预测性,尤其是在多人协作的情况下,容易将同一文本字符串标注成不同颜色,或者将不同文本字符串标注成相同颜色;
(3)人为选取颜色值操作复杂繁琐、效率低下。
基于此,本发明实施例提供了一种字符串颜色标记方法,该方法获取目标字符串以及可用颜色值序列;基于目标字符串中的字符信息,确定目标字符串对应的颜色索引值;字符信息包括字符内容以及字符位置;基于颜色索引值,在可用颜色值序列中确定目标字符串的目标颜色值;基于目标颜色值,对目标字符串进行颜色标记。如此,可以自动为文本字符串选取颜色值并进行颜色标记,简化了颜色标记的操作,并且不易出错。
根据本发明实施例,提供了一种字符串颜色标记方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种字符串颜色标记方法,可用于上述的人工智能训练等文本字符串颜色标记场景,图1是根据本发明实施例的字符串颜色标记方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,获取目标字符串以及可用颜色值序列。
本发明实施例中,可用颜色值序列中包括多个颜色值,可用颜色值序列中的颜色值就是能够为目标字符串进行颜色标记的所有可用颜色值。
本发明实施例中,目标字符串为需要进行颜色标记的字符串,可以基于输入的目标文本获得。根据输入的目标文本的来源和类型,具体可以将目标字符串的获取方法分为以下两种情况:
第一种情况,目标文本就是需要进行颜色标记的最小单位,例如词语、短句等文本,该种情况通常对应于人工智能等机器学习或深度学习的训练过程中对样本数据的标注或者标签的颜色标记。在该种情况下,获取目标字符串,就只需要获取目标文本,然后将目标文本对应的字符串,作为目标字符串。由此,直接输入目标文本,就可以为目标文本进行颜色标记。
第二种情况,目标文本中包括多个需要进行颜色标记的文本字符串,也可以包括不需要进行颜色标记的文本字符串,例如长句、文章等文本,该种情况通常对应于需要在文本中将特定内容进行颜色标记的情况,例如需要对文本中相似的两个词语标注出来以形成区分,或者需要结合文本字符串前后的文本信息等。在该种情况下,获取目标字符串,需要先获取目标文本,然后对目标文本中的字符串进行分割,得到目标字符串。由此,对目标文本中不同的字符串分别进行颜色标记。同时,对目标文本中的字符串进行分割,得到目标字符串,也可以根据需求采用不同的方法。
在一种可选的实施方式中,当已经通过人为分割的方式在目标文本中划分出需要进行标注的文本,也就是目标关键词时,可以直接从目标文本中提取出分割出来的目标关键词,并将目标关键词对应的字符串作为目标字符串。
在一种可选的实施方式中,可以由用户给出需要分割提取出来的关键词,然后再在目标文本中搜索查找这些关键词,以将其提取出来。具体的,获取目标关键词,然后提取目标文本中的目标关键词,并将目标关键词对应的字符串作为目标字符串。
上述两种对目标文本分割的方法可以适用于对目标文本中特定关键字或者特定文本进行颜色标注的情况。
在一种可选的实施方式中,可以基于目标文本中的预设分割符对目标文本进行分割,以得到目标字符串。可以由用户在目标文本中预先键入分隔符或者换行符等可以作为分割符的符号,然后按照预设分隔符对目标文本进行分割,得到目标关键字。具体的,首先基于预设分割符,对目标文本进行分割,得到多个目标关键词,然后将多个目标关键词对应的字符串,作为目标字符串。其中,目标关键词可以是词语、短句,也可以是长句、段落等,具体由预设分隔符设定的位置来决定。如此,可以对目标文本中的特定关键词进行颜色标记。
在一种可选的实施方式中,通常可以采用换行符作为预设分割符,然后将每行作为一个目标关键词,将这些目标关键词对应的字符串作为目标字符串。该文本分割方法适用于需要对两个或多个文本进行相似度比对的情况。
通过上述几种获取目标字符串的方法,可以实现字符串颜色标记方法在对不同应用场景下的应用,从而提高本发明的字符串颜色标记方法的实用性。
步骤S102,基于目标字符串中的字符信息,确定目标字符串对应的颜色索引值。
本发明实施例中,为了使最终选取得到的目标颜色值能够体现目标字符串中的文本信息,通过目标字符串中的字符信息,来确定其对应的颜色值索引。其中,字符信息包括字符内容以及字符位置,字符内容也就是目标字符串中具体包含的字符,字符位置也就是目标字符串中各个字符在目标字符串中的位置。颜色索引值表征了其对应的目标颜色值在可用颜色值序列中的位置,基于颜色索引值就能够在可用颜色值序列中确定对应的目标颜色值。
步骤S103,基于颜色索引值,在可用颜色值序列中确定目标字符串的目标颜色值。
本发明实施例中,可用颜色值序列中包括多个颜色值,可用颜色值序列中的颜色值就是能够为目标字符串进行颜色标记的所有可用颜色值。根据目标字符串的颜色索引值,从可用颜色值序列中选取对应位置的颜色值,就能够得到最终标记目标字符串的目标颜色值。
步骤S104,基于目标颜色值,对目标字符串进行颜色标记。
本发明实施例中,一个颜色值唯一代表一个颜色,那么基于目标颜色值就能够唯一确认一个目标字符串的颜色,由此对目标字符串进行对应的颜色标记。
本实施例提供的字符串颜色标记方法,通过目标字符串自身包含的字符信息,为文本字符串选取颜色值并进行颜色标记,简化了颜色标记的操作,不易出错。
在一种可选的实施方式中,具体的,图2是根据本发明实施例的字符串颜色标记方法的获取可用颜色值序列的流程图,如图2所示,获取可用颜色值序列,包括:
步骤S201,确定颜色稀释系数。
本发明实施例中,颜色稀释系数决定了可用颜色值序列中包含的颜色值的数量,因此调整颜色稀释系数的大小,就能够相应的调整可用颜色值序列中包含的颜色值。可以基于需求的可用颜色值序列中颜色值的数量,来确定颜色稀释系数。
步骤S202,基于颜色稀释系数,将初始颜色值集合分为多个颜色值子集。
本发明实施例中,初始颜色值集合为所有颜色值的集合,具体的,颜色值代表了红(R)、绿(G)、蓝(B)三个通道的值,为对应颜色的RGB色彩值,由此通过红、绿、蓝三个通道的叠加得到对应的颜色。RGB颜色的表示方式有两种,RGB(255, 255, 255)或者#FFFFFF。在第一种表示方法中,三个元素分别表示红、绿、蓝三个通道的值,其取值范围为(0,0,0)至(255,255,255);第二种表示方法则为十六进制表示法,其取值范围为#000000至#FFFFFF,转换为十进制也就是。由此最终组成的RGB颜色共有/>个不同的颜色值。由于两个相邻的颜色值的视觉差别往往较小,在视觉上不易区别,因此通过颜色稀释系数对初始颜色值集合进行稀释,减少颜色总数,由此提高相邻颜色的视觉差异,从而能够提高对文本字符串的颜色标记在视觉上的差异性。
具体的,步骤S202,可以包括:
步骤a1,基于颜色稀释系数,确定可用颜色值序列的颜色容量。
本发明实施例中,颜色容量为可用颜色值序列含有的颜色值的数量。可用颜色值序列是从初始颜色值集合中选取颜色值然后构建形成的。
在一种可选的实施方式中,将初始颜色容量与颜色稀释系数对应的颜色稀释值相除,得到颜色容量,其中,初始颜色容量为初始颜色值集合含有的颜色值的数量,也就是;颜色稀释值与颜色稀释系数成指数关系,具体的,颜色稀释值为颜色稀释系数关于2的指数。由此通过颜色稀释系数调整可用颜色值序列中颜色值的数量。
在一种可选的实施方式中,可以通过如下公式(1)确定可用颜色值序列的颜色容量:
公式(1)
其中,为可用颜色值序列的颜色容量,/>为初始颜色容量的值,/>为颜色稀释系数,/>为颜色系数值。
步骤a2,将颜色容量作为多个颜色值子集的数量,按照初始颜色值集合中颜色值的排列顺序,划分初始颜色值集合,得到多个颜色值子集。
本发明实施例中,为了在可用颜色值序列中的颜色值之间形成区分,从初始颜色值集合中选取的颜色值之间需要具有一定的间隔,也就是可用颜色值序列中相邻的颜色值的数值上需要有较大区别,那么可以将初始颜色值集合按照其中颜色值的排列顺序划分成语颜色容量数值一致的颜色值子集,然后从这些颜色值子集中分别选取一个颜色值,从而避免可用颜色值序列中的颜色值在数值上差异较小,以提高可用颜色值序列中颜色值的视觉差异度。
本发明实施例中,初始颜色值子集进行划分后得到的多个颜色值子集如下所示:
……
其中,为当前颜色值子集在所有颜色值子集中的索引位置,该索引位置从0开始计数,即第一个可用颜色值序列的/>值为0。
步骤S203,分别从多个颜色值子集中选取颜色值,构成可用颜色值序列。
本发明实施例中,仅从划分得到的多个颜色值子集中选取颜色值还不能完全保证可用颜色值序列中颜色值在数值上差异较大,如果从上一颜色值子集中选取位于后面位置的颜色值,从下一颜色值子集中选取位于前面位置的颜色值,那么可用颜色值序列中颜色值在数值上的差异就会比较小,因此,需要从多个颜色值子集中选取同一位置处的颜色值。
在一种可选的实施方式中,步骤S203,包括:
步骤b1,分别从多个颜色值子集中选取预设位置处的颜色值。
本发明实施例中,该预设位置固定了选取的颜色值的位置,使选取的每两个相邻的颜色值之间的数值差相同,避免可用颜色值序列中有颜色值的数值差较小而导致视觉差异小。
在一种可选的实施方式中,预设位置可以为颜色值子集中排列顺序对应于颜色值子集容量的一半的颜色值的位置,也就是数值为的颜色值,其中/>为上述步骤S202中颜色值子集在所有颜色值子集中的索引位置,即该颜色值来自的颜色值子集的索引位置。
在一种可选的实施方式中,预设位置为可以颜色值子集中排列顺序对应于颜色值子集容量的一半加一的颜色值的位置,也就是数值为的颜色值,其中/>为上述步骤S202中颜色值子集在所有颜色值子集中的索引位置,即该颜色值来自的颜色值子集的索引位置。
如此,可以选取位于颜色值子集中位于中间位置处的颜色值,从而降低可用颜色值序列中相邻颜色值的相似度。
在一种可选的实施方式中,预设位置还可以是颜色值子集中的任何索引位置。
步骤b2,将预设位置处的颜色值,按照多个颜色值子集的排列顺序进行排列,得到可用颜色值序列。
在一种可选的实施方式中,当预设位置为颜色值子集中排列顺序对应于颜色值子集容量的一半的颜色值的位置时,得到可用颜色值序列为
在一种可选的实施方式中,当预设位置为颜色值子集中排列顺序对应于颜色值子集容量的一半加一的颜色值的位置时,得到可用颜色值序列为
在一种可选的实施方式中,当预设位置对应于索引位置为时,得到可用颜色值序列为/>
如此,可以从颜色值子集中抽选颜色值构成可用颜色值序列,提高了可用颜色值序列中相邻的颜色值的视觉差异性,从而提高不同文本字符串在视觉上的差异性。
在一种可选的实施方式中,在后续对目标字符串进行颜色标记时,当存在两个目标字符串对应的目标颜色值相同时,可以调整颜色稀释系数,以重新构建可用颜色值序列,并重新对目标字符串进行颜色标记,以避免对不同的目标字符串标记相同的颜色。如此,可以在出现不同文本字符串的颜色标记相同的情况时,调整颜色稀释系数,以调整可用颜色值序列,使不同文本字符串的颜色标记均不相同。
本实施例提供的可用颜色值序列构建的方法,可以从初始颜色值集合中选取颜色值构成可用颜色值序列,以稀释可用颜色值序列中颜色值的相似度,提高不同颜色值之间的差异性,从而便于从视觉上区分并反应不同文本字符串之间的差异性。
在本实施例中提供了一种字符串颜色标记方法,可用于上述的人工智能训练等文本字符串颜色标记场景,图3是根据本发明实施例的另一字符串颜色标记方法的流程图,如图3所示,该流程包括如下步骤:
步骤S301,获取目标字符串以及可用颜色值序列。详细请参见图1所示实施例的步骤S101,在此不再赘述。
步骤S302,基于目标字符串中的字符信息,确定目标字符串对应的颜色索引值。
具体的,步骤S302,包括:
步骤S3021,基于目标字符串中的字符信息,确定目标字符串的颜色参数。
本发明实施例中,每个目标字符串都有其对应的颜色参数,颜色参数能够表征目标字符串内部包含的字符信息,也就是说不同的目标字符串,其颜色参数也不相同,颜色参数的值越接近的目标字符串,其内部包含的字符信息的相似度也就越大,由此通过颜色参数就能够实现不同目标字符串的区分,那么由颜色参数确定得到的目标字符串的目标颜色值也就能够实现不同目标字符串的区分,同时能够根据目标颜色值的相近程度就能够体现不同字符串之间的相似程度。具体,颜色参数可以综合目标字符串内部包含的字符数量、包含的具体字符以及这些字符的位置等。
在一种可选的实施方式中,上述步骤S202可以包括如下步骤:
步骤c1,基于目标字符串中的字符信息,确定目标字符串中每个字符的颜色子参数。
本发明实施例中,目标字符串由一系列字符组成,字符包括字母、数字运算符号、标点符号和其他符号等。为了能够充分表征目标字符串中包含的信息,对目标字符串中的每个字符分别进行计算,得到其颜色子参数,由字符的颜色子参数确定目标字符串的颜色参数。
在一种可选的实施方式中,可以基于目标字符串中的字符信息,也就是目标字符串中的字符内容,以及每个字符的字符位置,确定每个字符的颜色子参数。具体的,首先基于字符内容,确定目标字符串中每个字符的编码值,然后将每个字符的编码值与每个字符的字符位置相乘,得到每个字符的颜色子参数。其中,每个字符的编码值为字符内容对应的十进制数值。
在一种可选的实施方式中,可以使用Unicode码作为编码信息,来计算字符的颜色子参数。Unicode码即统一码,也叫万国码、单一码,是由统一码联盟开发的,计算机科学领域里的一项业界标准。Unicode标准中包含了世界上大部分的字符,每个字符使用一个十六进制数字表示,这个十六进制数字即为字符对应的Unicode码。同时,考虑到可用颜色值序列中颜色值的索引位置,以及颜色容量均为十进制数字,采用Unicode码对应的十进制数字来作为字符的编码值。也就是说,采用Unicode码作为字符的编码信息,然后将编码信息对应的十进制数值作为字符的编码值。
在一种可选的实施方式中,每个字符的字符位置即每个字符在目标字符串中的位置信息。可以将目标字符串中的所有字符拆分开存储在一个数组内,例如,然后将字符在数组中的位置作为该字符的字符位置,也就是数值中第一个字符的字符位置为1,第二个字符的字符位置为2,以此类推,第/>个字符的字符位置为/>
步骤c2,对每个字符的颜色子参数求和,得到颜色参数。
本发明实施例中,对每个字符的颜色子参数求和,得到颜色参数,从而可以根据目标字符串中包含的字符来确定其对应的颜色参数,从而使颜色参数能够充分代表目标字符串中包含的信息。
步骤S3022,基于颜色参数和可用颜色值序列,确定目标字符串对应的颜色索引值。
本发明实施例中,将颜色参数与可用颜色值序列的颜色容量相除,并将余数作为目标字符串的颜色索引值。其中,颜色索引值为颜色值在可用颜色值序列中的位置,颜色容量为可用颜色值序列中包含的颜色值的数量,那么考虑到存在颜色参数与可用颜色值序列的颜色容量整除,余数为0的情况,颜色索引值从0开始计数。
步骤S303,基于颜色索引值,在可用颜色值序列中确定目标字符串的目标颜色值。
本发明实施例中,基于颜色索引值,从可用颜色值序列中取出对应位置的颜色值,作为目标颜色值。举例而言,若颜色索引值为,则对应的目标颜色值为/>。如此,可以基于目标字符串的颜色参数从可用颜色值序列中选取目标颜色值,从而使目标颜色值能够体现目标字符串的文本特征。
步骤S304,基于目标颜色值,对目标字符串进行颜色标记。详细请参见图1所示实施例的步骤S104,在此不再赘述。
本实施例提供的字符串颜色标记方法,一方面,通过目标字符串中每个字符的编码值和权重,确定目标字符串的颜色参数,从而使颜色参数能够充分代表目标字符串中包含的信息,以使根据颜色参数选取的目标颜色值能够充分体现目标字符串中的信息;另一方面,通过将颜色参数与可用颜色值序列的颜色容量相除得到的余数,作为目标字符串对应的目标颜色值在可用颜色值序列中颜色索引值,能够基于目标字符串的文本信息确定其对应的目标颜色值,并且具有不同文本信息的目标字符串对应的目标颜色值也不同,从而能够自动为不同文本字符串标记不同的颜色。
在本实施例中提供了一种字符串颜色标记方法,可用于上述的人工智能训练等文本字符串颜色标记场景,图4是根据本发明实施例的又一字符串颜色标记方法的流程图,如图4所示,该流程包括如下步骤:
步骤S401,获取目标字符串以及可用颜色值序列。详细请参见图1所示实施例的步骤S101,在此不再赘述。
步骤S402,基于目标字符串中的字符信息,确定目标字符串对应的颜色索引值。详细请参见图1所示实施例的步骤S102,在此不再赘述。
步骤S403,基于颜色索引值,在可用颜色值序列中确定目标字符串的目标颜色值。详细请参见图1所示实施例的步骤S103,在此不再赘述。
步骤S404,基于目标颜色值,对目标字符串进行颜色标记。
具体的,步骤S404,包括:
步骤S4041,将目标颜色值转换为与目标字符串相同的表示方式,得到标记颜色值。
本发明实施例中,为了便于计算,将可用颜色值序列中的颜色转换到了与颜色参数相同的表示方式,也就是十进制,但是在实际为目标字符串进行颜色标注的过程中,颜色值往往是以十六进制的形式存在,也就是与目标字符串中字符相同的表示方式,因此在得到目标颜色值后,需要将目标颜色值进行表示方式的转换,转换到十六进制,得到标记颜色值。
步骤S4042,基于标记颜色值,对目标字符串进行颜色标记。
本发明实施例中,基于标记颜色值,生成目标字符串对应的颜色标识码,然后基于颜色标识码,对目标字符串进行颜色标记。颜色值在使用十六进制表示时,会在数值在添加一个“#”标识,例如 #123F45,“#”标识并不是十六进制颜色值的数值的一部分而是表明其后跟随的数值为颜色,即颜色标识位。在不同的软件程序中,标记颜色值前的标识位也是不同的,例如在基于网络的程序中,通常是使用CSS(Cascading Style Sheets,层叠样式表)样式表来实现,那么相应的,其颜色显示的方法为在对应的文本元素上添加样式:color: #123F45。由上可见,同一标记颜色值,对于不同的软件程序,用于标记颜色的标识也是不相同的,因此在得到标记颜色值后,需要根据采用的软件程序生成对应的颜色标识码,也就是在标记颜色值前添加上对应的标识位,由此识别出对目标字符串的颜色显示,从而为目标字符串进行颜色标记。
在本实施例中还提供了一种字符串颜色标记装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种字符串颜色标记装置,如图5所示,包括:
数据获取模块501,用于获取目标字符串以及可用颜色值序列;
颜色索引值确定模块502,用于基于目标字符串中的字符信息,确定目标字符串对应的颜色索引值;字符信息包括字符内容以及字符位置;
目标颜色值确定模块503,用于基于颜色索引值,在可用颜色值序列中确定目标字符串的目标颜色值;
颜色标记模块504,用于基于目标颜色值,对目标字符串进行颜色标记。
在一种可选的实施方式中,颜色索引值确定模块502,包括:
颜色参数确定单元,用于基于目标字符串中的字符信息,确定目标字符串的颜色参数;
颜色索引值确定单元,用于基于颜色参数和可用颜色值序列,确定目标字符串对应的颜色索引值。
在一种可选的实施方式中,颜色参数确单元,包括:
颜色子参数确定子单元,用于基于目标字符串中的字符信息,确定目标字符串中每个字符的颜色子参数;
颜色参数确定子单元,用于对每个字符的颜色子参数求和,得到颜色参数。
在一种可选的实施方式中,颜色子参数确定子单元,包括:
编码值确定子模块,用于基于字符内容,确定目标字符串中每个字符的编码值;每个字符的编码值为字符内容对应的十进制数值;
颜色子参数确定子模块,用于将每个字符的编码值与每个字符的字符位置相乘,得到每个字符的颜色子参数。
在一种可选的实施方式中,颜色索引值确定单元,用于:
将颜色参数与可用颜色值序列的颜色容量相除,并将余数作为目标字符串的颜色索引值。
在一种可选的实施方式中,颜色标记模块504,包括:
标记颜色值确定单元,用于将目标颜色值转换为与目标字符串相同的表示方式,得到标记颜色值;
颜色标记单元,用于基于标记颜色值,对目标字符串进行颜色标记。
在一种可选的实施方式中,基标记颜色值确定单元,包括:
颜色表示码生成子单元,用于基于标记颜色值,生成目标字符串对应的颜色标识码;
颜色标记子单元,用于基于颜色标识码,对目标字符串进行颜色标记。
在一种可选的实施方式中,数据获取模块501,包括:
颜色稀释系数确定单元,用于确定颜色稀释系数;
初始颜色值集合划分单元,用于基于颜色稀释系数,将初始颜色值集合分为多个颜色值子集;
可用颜色值序列构建单元,用于分别从多个颜色值子集中选取颜色值,构成可用颜色值序列。
在一种可选的实施方式中,初始颜色值集合划分单元,包括:
颜色容量确定子单元,用于基于颜色稀释系数,确定可用颜色值序列的颜色容量;颜色容量为可用颜色值序列含有的颜色值的数量;
颜色值子集确定子单元,用于将颜色容量作为多个颜色值子集的数量,按照初始颜色值集合中颜色值的排列顺序,划分初始颜色值集合,得到多个颜色值子集。
在一种可选的实施方式中,颜色容量确定子单元,用于:
将初始颜色容量与颜色稀释系数对应的颜色稀释值相除,得到颜色容量;初始颜色容量为初始颜色值集合含有的颜色值的数量;颜色稀释值与颜色稀释系数成指数关系。
在一种可选的实施方式中,可用颜色值序列构建单元,包括:
颜色值选取子单元,用于分别从多个颜色值子集中选取预设位置处的颜色值;
颜色值排列子单元,用于将预设位置处的颜色值,按照多个颜色值子集的排列顺序进行排列,得到可用颜色值序列。
在一种可选的实施方式中,预设位置为颜色值子集中排列顺序对应于颜色值子集容量的一半的颜色值的位置;
和/或,预设位置为颜色值子集中排列顺序对应于颜色值子集容量的一半加一的颜色值的位置。
在一种可选的实施方式中,该装置还包括:
颜色稀释系数调整模块,用于当存在两个目标字符串对应的目标颜色值相同时,调整颜色稀释系数,以重新构建可用颜色值序列。
在一种可选的实施方式中,数据获取模块501,包括:
目标文本获取单元,用于获取目标文本;
目标字符串确定单元,用于将目标文本对应的字符串,作为目标字符串。
在一种可选的实施方式中,数据获取模块501,包括:
目标文本获取单元,用于获取目标文本;
目标文本分割单元,用于对目标文本中的字符串进行分割,得到目标字符串。
在一种可选的实施方式中,目标文本分割单元,包括:
目标关键词获取子单元,用于获取目标关键词;
目标关键词提取子单元,用于提取目标文本中的目标关键词,并将目标关键词对应的字符串作为目标字符串。
在一种可选的实施方式中,目标文本分割单元,包括:
目标文本分割子单元,用于基于预设分割符,对目标文本进行分割,得到多个目标关键词;
目标字符串确定子单元,用于将多个目标关键词对应的字符串,作为目标字符串。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本实施例中的字符串颜色标记装置是以功能单元的形式来呈现,这里的单元是指ASIC(Application Specific Integrated Circuit,专用集成电路),执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
本发明实施例还提供一种计算机设备,具有上述图5所示的字符串颜色标记装置。
请参阅图6,图6是本发明可选实施例提供的一种计算机设备的结构示意图,如图6所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器***)。图6中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (16)

1.一种字符串颜色标记方法,其特征在于,所述方法包括:
获取目标字符串,以及获取可用颜色值序列;
基于所述目标字符串中的字符信息,确定所述目标字符串对应的颜色索引值;所述字符信息包括字符内容以及字符位置;所述基于所述目标字符串中的字符信息,确定所述目标字符串对应的颜色索引值,包括:基于所述目标字符串中的字符信息,确定所述目标字符串的颜色参数;基于所述颜色参数和所述可用颜色值序列,确定所述目标字符串对应的颜色索引值;所述基于所述目标字符串中的字符信息,确定所述目标字符串的颜色参数,包括:基于所述目标字符串中的字符信息,确定所述目标字符串中每个字符的颜色子参数;对所述每个字符的颜色子参数求和,得到所述颜色参数;所述确定所述目标字符串中每个字符的颜色子参数,包括:基于所述字符内容,确定所述目标字符串中每个字符的编码值;所述每个字符的编码值为所述字符内容对应的十进制数值;将所述每个字符的编码值与所述每个字符的字符位置相乘,得到所述每个字符的颜色子参数;所述基于所述颜色参数和所述可用颜色值序列,确定所述目标字符串对应的颜色索引值,包括:将所述颜色参数与所述可用颜色值序列的颜色容量相除,并将余数作为所述目标字符串的颜色索引值;基于所述颜色索引值,在所述可用颜色值序列中确定所述目标字符串的目标颜色值;
基于所述目标颜色值,对所述目标字符串进行颜色标记。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标颜色值,对所述目标字符串进行颜色标记,包括:
将所述目标颜色值转换为与所述目标字符串相同的表示方式,得到标记颜色值;
基于所述标记颜色值,对所述目标字符串进行颜色标记。
3.根据权利要求2所述的方法,其特征在于,所述基于所述标记颜色值,对所述目标字符串进行颜色标记,包括:
基于所述标记颜色值,生成所述目标字符串对应的颜色标识码;
基于所述颜色标识码,对所述目标字符串进行颜色标记。
4.根据权利要求1所述的方法,其特征在于,所述获取可用颜色值序列,包括:
确定颜色稀释系数;
基于所述颜色稀释系数,将初始颜色值集合分为多个颜色值子集;
分别从所述多个颜色值子集中选取颜色值,构成所述可用颜色值序列。
5.根据权利要求4所述的方法,其特征在于,所述基于所述颜色稀释系数,将初始颜色值集合分为多个颜色值子集,包括:
基于所述颜色稀释系数,确定所述可用颜色值序列的颜色容量;所述颜色容量为所述可用颜色值序列含有的颜色值的数量;
将所述颜色容量作为多个颜色值子集的数量,按照所述初始颜色值集合中颜色值的排列顺序,划分所述初始颜色值集合,得到所述多个颜色值子集。
6.根据权利要求5所述的方法,其特征在于,所述基于所述颜色稀释系数,确定所述可用颜色值序列的颜色容量,包括:
将初始颜色容量与所述颜色稀释系数对应的颜色稀释值相除,得到所述颜色容量;所述初始颜色容量为所述初始颜色值集合含有的颜色值的数量;所述颜色稀释值与所述颜色稀释系数成指数关系。
7.根据权利要求4所述的方法,其特征在于,所述分别从所述多个颜色值子集中选取颜色值,构成所述可用颜色值序列,包括:
分别从所述多个颜色值子集中选取预设位置处的颜色值;
将所述预设位置处的颜色值,按照所述多个颜色值子集的排列顺序进行排列,得到所述可用颜色值序列。
8.根据权利要求7所述的方法,其特征在于,所述预设位置为所述颜色值子集中排列顺序对应于所述颜色值子集的容量的一半的颜色值的位置;
和/或,所述预设位置为所述颜色值子集中排列顺序对应于所述颜色值子集的容量的一半加一的颜色值的位置。
9.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当存在两个所述目标字符串对应的所述目标颜色值相同时,调整所述颜色稀释系数,以重新构建所述可用颜色值序列。
10.根据权利要求1所述的方法,其特征在于,所述获取目标字符串,包括:
获取目标文本;
将所述目标文本对应的字符串,作为所述目标字符串。
11.根据权利要求1所述的方法,其特征在于,所述获取目标字符串,包括:
获取目标文本;
对所述目标文本中的字符串进行分割,得到所述目标字符串。
12.根据权利要求11所述的方法,其特征在于,所述对所述目标文本中的字符串进行分割,得到所述目标字符串,包括:
获取目标关键词;
提取所述目标文本中的所述目标关键词,并将所述目标关键词对应的字符串作为所述目标字符串。
13.根据权利要求11所述的方法,其特征在于,所述对所述目标文本中的字符串进行分割,得到所述目标字符串,包括:
基于预设分割符,对所述目标文本进行分割,得到多个目标关键词;
将所述多个目标关键词对应的字符串,作为所述目标字符串。
14.一种字符串颜色标记装置,其特征在于,所述装置包括:
目标字符串获取模块,用于获取目标字符串,以及获取可用颜色值序列;
颜色索引值确定模块,用于基于所述目标字符串中的字符信息,确定所述目标字符串对应的颜色索引值;所述字符信息包括字符内容以及字符位置;所述基于所述目标字符串中的字符信息,确定所述目标字符串对应的颜色索引值,包括:基于所述目标字符串中的字符信息,确定所述目标字符串的颜色参数;基于所述颜色参数和所述可用颜色值序列,确定所述目标字符串对应的颜色索引值;所述基于所述目标字符串中的字符信息,确定所述目标字符串的颜色参数,包括:基于所述目标字符串中的字符信息,确定所述目标字符串中每个字符的颜色子参数;对所述每个字符的颜色子参数求和,得到所述颜色参数;所述确定所述目标字符串中每个字符的颜色子参数,包括:基于所述字符内容,确定所述目标字符串中每个字符的编码值;所述每个字符的编码值为所述字符内容对应的十进制数值;将所述每个字符的编码值与所述每个字符的字符位置相乘,得到所述每个字符的颜色子参数;所述基于所述颜色参数和所述可用颜色值序列,确定所述目标字符串对应的颜色索引值,包括:将所述颜色参数与所述可用颜色值序列的颜色容量相除,并将余数作为所述目标字符串的颜色索引值;
目标颜色值确定模块,用于基于所述颜色索引值,在所述可用颜色值序列中确定所述目标字符串的目标颜色值;
颜色标记模块,用于基于所述目标颜色值,对所述目标字符串进行颜色标记。
15.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至13中任一项所述的字符串颜色标记方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至13中任一项所述的字符串颜色标记方法。
CN202310730750.3A 2023-06-20 2023-06-20 字符串颜色标记方法、装置、计算机设备及存储介质 Active CN116484802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310730750.3A CN116484802B (zh) 2023-06-20 2023-06-20 字符串颜色标记方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310730750.3A CN116484802B (zh) 2023-06-20 2023-06-20 字符串颜色标记方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN116484802A CN116484802A (zh) 2023-07-25
CN116484802B true CN116484802B (zh) 2023-09-05

Family

ID=87221719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310730750.3A Active CN116484802B (zh) 2023-06-20 2023-06-20 字符串颜色标记方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN116484802B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5756555B1 (ja) * 2014-11-07 2015-07-29 パナソニック株式会社 発話評価装置、発話評価方法及びプログラム
CN111681731A (zh) * 2020-06-10 2020-09-18 杭州美腾科技有限公司 一种对检查报告进行自动颜色标注的方法
CN114677507A (zh) * 2022-03-11 2022-06-28 吉林化工学院 一种基于双向注意力网络的街景图像分割方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7634454B2 (en) * 2006-11-21 2009-12-15 Microsoft Corporation Concept keywords colorization in program identifiers

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5756555B1 (ja) * 2014-11-07 2015-07-29 パナソニック株式会社 発話評価装置、発話評価方法及びプログラム
CN111681731A (zh) * 2020-06-10 2020-09-18 杭州美腾科技有限公司 一种对检查报告进行自动颜色标注的方法
CN114677507A (zh) * 2022-03-11 2022-06-28 吉林化工学院 一种基于双向注意力网络的街景图像分割方法及***

Also Published As

Publication number Publication date
CN116484802A (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
CN108287858B (zh) 自然语言的语义提取方法及装置
CN110020424B (zh) 合同信息的提取方法、装置和文本信息的提取方法
CN109446885B (zh) 一种基于文本的元器件识别方法、***、装置和存储介质
WO2017075957A1 (zh) 一种识别率确定方法及装置
WO2021151270A1 (zh) 图像结构化数据提取方法、装置、设备及存储介质
US11763583B2 (en) Identifying matching fonts utilizing deep learning
CN107315817B (zh) 电子图纸文本匹配方法、装置、存储介质和计算机设备
CN110705226A (zh) 电子表格的创建方法、装置及计算机设备
US11914641B2 (en) Text to color palette generator
CN109508448A (zh) 基于长篇文章生成短资讯方法、介质、装置和计算设备
CN107153469B (zh) 为输入数据搜索匹配候选项的方法、数据库创建方法、装置及计算机程序产品
US20170323007A1 (en) Identifier Based Glyph Search
CN110489559A (zh) 一种文本分类方法、装置及存储介质
CN113657395A (zh) 文本识别方法、视觉特征提取模型的训练方法及装置
KR102015454B1 (ko) 문서 자동 편집 방법
US9984065B2 (en) Optimizing generation of a regular expression
CN112395880B (zh) 结构化三元组的纠错方法、装置、计算机设备及存储介质
CN111046627A (zh) 一种中文文字显示方法及***
CN111274813A (zh) 语言序列标注方法、装置存储介质及计算机设备
CN116484802B (zh) 字符串颜色标记方法、装置、计算机设备及存储介质
CN110362691B (zh) 一种句法树库构建***
WO2024138859A1 (zh) 跨语言实体词检索方法、装置、设备及存储介质
JP6568968B2 (ja) 文書校閲装置およびプログラム
CN114220113A (zh) 一种论文质量检测方法、装置和设备
CN113283231A (zh) 获取签章位的方法、设置***、签章***及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant