CN110196956B - 用户头像生成方法、装置、电子设备及存储介质 - Google Patents

用户头像生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110196956B
CN110196956B CN201910365350.0A CN201910365350A CN110196956B CN 110196956 B CN110196956 B CN 110196956B CN 201910365350 A CN201910365350 A CN 201910365350A CN 110196956 B CN110196956 B CN 110196956B
Authority
CN
China
Prior art keywords
user information
character
determining
preset user
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910365350.0A
Other languages
English (en)
Other versions
CN110196956A (zh
Inventor
付超群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201910365350.0A priority Critical patent/CN110196956B/zh
Publication of CN110196956A publication Critical patent/CN110196956A/zh
Application granted granted Critical
Publication of CN110196956B publication Critical patent/CN110196956B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种用户头像生成方法,属于计算机技术领域,解决了现有技术中的方法生成的头像视觉区分度较弱的问题。本申请实施例公开的用户头像生成方法包括:获取目标用户的预设用户信息,所述目标用户为未设置头像的用户;通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数;根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符;根据所述关键字符生成所述目标用户的默认头像。通过本申请公开了一种用户头像生成方法,有助于提升自动生成的用户头像的视觉区分度。

Description

用户头像生成方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种用户头像生成方法、装置、电子设备及计算机可读存储介质。
背景技术
用户头像是直观识别不同用户身份的一种标识,在即时通信应用客户端、互联网平台客户端等应用场景中得到了广泛应用。通常,在用户执行线上注册的时候,客户端会提醒用户设置用户头像,或者,支持用户修改用户头像。但是,还会有很多用户忽略了设置用户头像这一环节,导致客户端或***只能为用户设置一个默认头像。通常,***或客户端为所有用户提供的默认用户头像为***内置的同一幅图像图片。在一些较人性化的***中,***会根据注册用户的姓名信息为用户提供***内置的男性的头像图片或女性的头像图片。
尽管如此,我们可以发现,现有技术中为用户设置的默认头像没有任何有价值的信息,几乎不具备视觉区分度。
发明内容
本申请提供一种用户头像生成方法,有助于提升自动生成的用户头像的视觉区分度。
为了解决上述问题,第一方面,本申请实施例提供了一种用户头像生成方法,包括:
获取目标用户的预设用户信息,所述目标用户为未设置头像的用户;
通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数;
根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符;
根据所述关键字符生成所述目标用户的默认头像。
第二方面,本申请实施例提供了一种用户头像生成装置,包括:
用户信息获取模块,用于获取目标用户的预设用户信息,所述目标用户为未设置头像的用户;
区别特征参数确定模块,用于通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数;
关键字符确定模块,用于根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符;
头像生成模块,用于根据所述关键字符生成所述目标用户的默认头像。
第三方面,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的用户头像生成方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的用户头像生成方法的步骤。
本申请实施例公开的用户头像生成方法,通过获取目标用户的预设用户信息,所述目标用户为未设置头像的用户;通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数;根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符;根据所述关键字符生成所述目标用户的默认头像,有助于提升自动生成的用户头像的视觉区分度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一的用户头像生成方法流程图;
图2是现有技术中生成的默认用户头像示意图;
图3是本申请实施例一的用户头像生成方法生成的用户头像示意图;
图4是本申请实施例三的用户头像生成装置结构示意图之一;
图5是本申请实施例三的用户头像生成装置结构示意图之二;
图6是本申请实施例三的用户头像生成装置结构示意图之三;
图7是本申请实施例三的用户头像生成装置结构示意图之四;
图8是本申请实施例三的用户头像生成装置结构示意图之五。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本申请实施例公开的一种用户头像生成方法,如图1所示,该方法包括:步骤110至步骤140。
步骤110,获取目标用户的预设用户信息,所述目标用户为未设置头像的用户。
在本申请的一些实施例中,可以通过用户管理***获取到已注册用户的用户信息,所述用户信息包括用户的头像属性、用户的名字、用户名、昵称、备注等信息。
进一步的,对于某个注册用户,当获取的该用户的图像属性显示该用户未设置头像时,确定该用户为目标用户。如果该用户设置了默认头像,即该用户的默认头像不是***预置的头像图片(如图2所示),则不对该用户的默认图像做处理。
在本申请的一些实施例中,所述预设用户信息包括:用户名或昵称。
当获取到的用户信息中昵称中包括有效字符时,即昵称不为空时,将所述昵称确定为目标用户的预设用户信息;当获取到的用户信息中昵称为空时,如用户没有设置昵称的情况,将获取的用户名确定为目标用户的预设用户信息。
步骤120,通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数。
在本申请的一些实施例中,所述的关键字符识别模型可以为数学模型,也可以为方法模型。例如,所述字符识别模型包括但不限于以下任意一个:基于词频确定字符权重值的数学模型、基于词向量确定字符相似度的数学模型、基于音律确定重音字符的方法模型。
相应的,各关键字符识别模型会输出所述预设用户信息中各目标字符的区别特征参数。在本申请的一些实施例中,所述区别特征参数包括:权重值(所述权重值用于指示对应目标字符对所述预设用户信息产生的视觉区分度)、各目标字符与所述预设用户信息的词向量相似度、重音字符。
步骤130,根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符。
在确定了所述预设用户信息中各目标字符的区别特征参数之后,可以进一步根据确定的区别特征参数确定所述预设用户信息对应的关键字符。
下面详细结合确定所述预设用户信息中各目标字符的区别特征参数的不同关键字符识别模型或方法,详细介绍用于确定所述预设用户信息中的关键字符的几种优选实施方式。
在本申请的一些实施例中,所述通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数的步骤,包括:基于词频分析技术确定所述预设用户信息中各目标字符对应的权重值,其中,所述权重值用于指示对应目标字符对所述预设用户信息产生的视觉区分度;相应的,所述根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符的步骤,包括:确定最大的所述权重值对应的所述预设用户信息中的目标字符,作为所述预设用户信息中的关键字符。
在本申请的一些实施例中,所述基于词频分析技术确定所述预设用户信息中各目标字符对应的权重值的步骤,包括:确定所述预设用户信息中的目标字符;确定各所述目标字符基于所述预设用户信息的词频,其中,所述目标字符的词频与该目标字符在所述预设用户信息中出现的次数成指数正相关;对于每个所述目标字符,根据所述目标字符基于所述预设用户信息的词频和预先确定的所述目标字符基于指定训练数据集的逆向文本词频的乘积,确定所述目标字符对应的权重值。
在确定所述预设用户信息中的关键字符之前,首先确定所述预设用户信息中的目标字符。
在本申请的一些实施例中,可以将所述预设用户信息中包括的每个字符分别作为目标字符。在本申请的另一些实施例中,当所述预设用户信息为名字时,可以将所述预设用户信息中除姓氏之外的每个字符分别作为目标字符。
之后,还需要确定各所述目标字符基于所述预设用户信息的词频。
词频(term frequency,TF)指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被正规化,以防止它偏向长的文件。因此,对于在某一特定文件里的词语来说,它的重要性可表示为:该词在某一文件中的出现次数除以在该文件中所有词语的出现次数之和。本申请实施例中,对现有技术中的词频计算方法进行改进,对于确定的某一所述预设用户信息中的单个目标字符,由该目标字符在所述预设用户信息中出现的次数的M次方除以所述预设用户信息中包含的字符总数得到的结果,作为该目标字符的词频。
例如,可以通过公式:
Figure BDA0002047974000000051
确定某一名字中包含的目标字符ti的词频tfij,其中,nij表示目标字符ti在名字dj中出现的次数;
Figure BDA0002047974000000052
表示名字dj中所有字符的出现次数之和;m为自定义的一个系数,m≥2,用以增强词频权重。
假设m=2,以预设用户信息为“上官云”举例,字符“云”在预设用户信息“上官云”中出现的次数为1,预设用户信息“上官云”中包括的所有字符的个数为3,则字符“云”在预设用户信息“上官云”中词频为1/3。而对于以预设用户信息为“上官菲菲”的情况,字符“菲”在预设用户信息“上官菲菲”中出现的次数为2,预设用户信息“上官菲菲”中包括的所有字符的个数为4,则字符“菲”在预设用户信息“上官菲菲”中词频为1。通过对目标字符在所述预设用户信息中出现的次数进行幂运算,使得所述目标字符的词频与该目标字符在所述预设用户信息中出现的次数成指数正相关可以有效提升名字中重叠字作为关键字符的权重,更加符合用户对名字区分度的认知。
接下来,根据所述目标字符基于所述预设用户信息的词频和预先确定的所述目标字符基于指定训练数据集的逆向文本词频的乘积,确定所述预设用户信息中所述目标字符对应的权重值。
其中,所述目标字符是基于指定训练数据集的逆向文本词频预先确定的。
本领域技术人员应但理解,本申请具体实施时,可以获取全网数据或字段数据或名字数据等作为指定训练数据集,用于确定所述预设用户信息中可能包括的字符的逆向文本词频;也可以仅获取昵称数据和名字数据作为指定训练数据集,用于确定所述预设用户信息中可能包括的字符的逆向文本词频。下面一获取全网名字数据作为指定训练数据集举例,详细说明确定目标字符的逆向文本词频的技术方案。
首先,获取全网的名字数据,作为指定训练数据集。
确定所述指定训练数据集中包括的每个名字在所述指定训练数据集中的出现次数。例如,名字“张三”在指定训练数据集的出现的次数为128,名字“李四”在指定训练数据集的出现的次数为256。然后,所述指定训练数据集中包括的所有名字的数量,即为|D|。
之后,确定所述指定训练数据集中包括的所有名字中出现的每个字符的逆向文本词频。逆向文件频率(inverse document frequency,IDF)是一个词语普遍重要性的度量。某一特定词语的逆向文件频率,可以由总文件数目除以包含该词语的文件的数目,再将得到的商取对数得到。本申请实施例中,将确定文件中词语逆向文本词频的方法转用到确定名字中字符的逆向文本词频,由所述指定训练数据集中包括的所有名字的数量除以包含指定字符的名字的数量,再将得到的商取对数,作为所述指定字符的逆向文本词频。具体实施时,可以通过公式
Figure BDA0002047974000000061
计算字符ti的逆向文本词频idfi,其中,|D|表示所述指定训练数据集中包括的所有名字的数量,|{j:ti∈dj}|表示包含字符ti的名字的数量;dj为包含字符ti的名字。
按照前述计算方法,可以确定所述指定训练数据集中包括的每个字符的逆向文本词频。
在本申请实施例中,只要构建的指定训练数据集中包括足够多的数据,就可以确定后续可能出现在用户的用户名、名字、昵称等所述预设用户信息中的每个字符的逆向文本词频。
最后,根据所述目标字符基于所述预设用户信息的词频和预先确定的所述目标字符基于指定训练数据集的逆向文本词频的乘积,确定所述目标字符对应的权重值。例如,将所述目标字符基于所述预设用户信息的词频和预先确定的所述目标字符基于指定训练数据集的逆向文本词频的乘积,作为所述目标字符对应的权重值。
以所述预设用户信息为“学友”举例,将目标字符“学”的词频和逆向文本词频的乘积作为目标字符“学”在预设用户信息为“学友”中的权重值,将目标字符“友”的词频和逆向文本词频的乘积作为目标字符“友”在预设用户信息为“学友”中的权重值,之后,选择权重值最高的目标字符作为所述预设用户信息“学友”的关键字符。假设目标字符“友”在预设用户信息为“学友”中的权重值为5.25,目标字符“学”在预设用户信息为“学友”中的权重值为4.74,目标字符“友”在预设用户信息中的权重值更高,适合作为头像文字,因此,确定目标字符“友”作为预设用户信息为“学友”的关键字符。
在本申请的另一些实施例中,所述通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数的步骤,包括:基于词向量技术,分别确定所述预设用户信息的词向量和所述预设用户信息中每个字符的字向量;分别计算所述字符的所述字向量与所述词向量之间的相似度。相应的,所述根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符的步骤,包括:确定最大的所述相似度对应的所述字向量所属字符作为所述预设用户信息中的关键字符。
在基于词向量技术,分别确定所述预设用户信息的词向量和所述预设用户信息中每个字符的字向量之前,首先需要训练词向量和字向量。
在本申请的一些实施例中,可以获取新闻资料或者字典内容,构建训练词向量和字向量的训练数据集。然后,对训练数据集中的每条语料进行分词处理,之后,利用gensim(一个公用软件包)等软件训练词向量,获取基于所述训练数据集获取的分词的词向量。
另一方面,对训练数据集中的每条语料,通过1-gram分割法(一元分割法)将每条语料分割成由1个字符组成的片段序列,利用gensim等软件训练字向量,获取基于所述训练数据集获取的每个字符的词向量。
在具体应用过程中,当获取到所述预设用户信息之后,可以进一步确定所述预设用户信息中的词语的词向量和单个字符的字向量,以确定所述预设用户信息中的关键字符。在本申请的一些优选实施例中,对于获取到所述预设用户信息(所述预设用户信息可能为用户名或昵称),首先去掉所述预设用户信息中包括的姓氏字符;然后,将所述预设用户信息中去掉姓氏字符之后剩余的字符构成的词语作为名字;最后,通过预先训练的词向量确定所述作为名字的词语的词向量,作为所述预设用户信息的词向量。
在本申请的一些实施例中可以根据百家姓确定所述预设用户信息中包括的姓氏字符,并去掉确定的所述姓氏字符。在本申请的另一些实施例中还可以通过其他方式确定所述预设用户信息中包括的姓氏字符,例如,默认所述预设用户信息中的第一个字符为姓氏字符。本申请对确定姓氏字符的具体技术手段不做限定。
在确定了所述预设用户信息中包括的作为名字的词语之后,进一步通过预先训练的字向量分别确定所述名字中每个字符的字向量。
接下来,分别计算每个所述字符的所述字向量与所述词向量之间的相似度。例如,利用余弦相似度,jaccard(杰卡德)距离等距离函数计算每个所述字符的所述字向量与所述词向量之间的相似度,作为每个字符的区别特征参数。之后,根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符。例如,确定计算得到的相似度最大值对应的所述字向量所属字符作为所述预设用户信息中的关键字符。通过一个具有代表性的字符代替整个用户信息生成用户头像,在保留所述用户信息特征的基础上,使得生成的用户头像更加清晰、简介,视觉区分度更高。
以获取的所述预设用户信息为“张三疯”举例,去掉所述预设用户信息中包括的姓氏字符“张”之后,得到词语“三疯”作为名字;之后,通过预先训练的词向量确定所述作为名字的词语“三疯”的词向量,作为所述预设用户信息的词向量,以及,分别确定字符“三”和字符“疯”的字向量;最后,分别计算字符“三”的字向量与词语“三疯”的词向量的相似度、字符“疯”的字向量与词语“三疯”的词向量的相似度,并选择相似度最高的“疯”字作为所述预设用户信息中的关键字符。本申请的实施例中通过首先去掉所述预设用户信息中包括的姓氏字符,可以减少后续计算词向量和字向量,以及计算相似度的运算量,提升头像生成效率。另一方便,姓氏对于名字的区分度通常是比较低的,去掉姓氏之后,并不会降低生成的头像的视觉区分度。
在本申请的另一些实施例中,所述通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数的步骤,包括:确定所述预设用户信息包括的各目标字符中的重音字符。相应的,所述根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符的步骤,包括:将所述重音字符作为所述预设用户信息中的关键字符。
例如,可以基于专家领域知识预先构建名字和重音字符对应关系,所述名字和重音字符对应关系中包括相应名字中的重音字符。在确定所述预设用户信息中的重音字符时,可以将所述预设用户信息与所述名字和重音字符对应关系中的名字进行比对,确定比对成功的名字,然后,将所述比对成功的名字对应的重音字符,作为所述预设用户信息中的关键字符。
对于通过与名字和重音字符对应关系进行比对,比对失败的所述预设用户信息(即所述名字和重音字符对应关系中不存在所述预设用户信息),可以进一步根据基于专家经验预设的重音选择规则确定所述预设用户信息中的重音字符,并将选择的重音字符作为所述预设用户信息中的关键字符。在本申请的一些实施例中,所述预设的重音选择规则可以为:按照去声、平声、入声、上声的顺序优先选择具有该声调的字符作为重音字符,平声中阴平优先,对于具有同样声调的字符取最后一个字符作为重音字符。以所述预设用户信息为名字“国忠”举例,其中,“国”字为平声,属于阳平,“忠”字为平声,属于阴平,优先选择“忠”字作为重音字符,即选择“忠”字作为名字“国忠”中的关键字符。再以所述预设用户信息为名字“李四”举例,其中,“李”字为上声,“四”字为入声,优先选择“四”字作为重音字符,即选择“四”字作为名字“李四”中的关键字符。又以所述预设用户信息为名字“胜利”举例,其中,“胜”字为入声,“利”字为入声,优先选择最后一个入声“利”字作为重音字符,即选择“利”字作为名字“胜利”中的关键字符。
基于音律规则,将所述预设用户信息中的重音字符,作为所述预设用户信息中的关键字符,符合用户对音律规则的感知,且运算量小,便于实施。
在本申请的其他实施例中,还可以直接根据基于专家经验预设的重音选择规则确定所述预设用户信息中的重音字符,并将选择的重音字符作为所述预设用户信息中的关键字符,而不需要预先构建名字和重音字符对应关系。
在本申请的一些实施例中,可以仅根据上述一个关键字符识别模型,确定所述预设用户信息中各目标字符的关键字符,在本申请的另一些实施例中,也可以根据上述至少两个关键字符识别模型,确定所述预设用户信息中各目标字符的关键字符。例如,所述通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数的步骤,包括:通过至少两个关键字符识别模型分别确定所述预设用户信息中的各目标字符的区别特征参数;所述根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符的步骤,包括:通过至少两个关键字符识别模型分别确定的所述区别特征参数,分别确定所述预设用户信息中的候选关键字符;通过预设加权融合模型对各所述候选关键字符进行加权投票运算,确定各所述候选关键字符的投票数;确定所述投票数最大的一个所述候选关键字符,作为所述预设用户信息中的关键字符。通过设置多个关键字符识别模型,并通过所述多个关键字符识别模型分别识别所述预设用户信息中的关键字符,作为候选关键字符,然后,再基于预设的加权融合模型对多个关键字符识别模型的识别结果进行加权投票,可以进一步提升确定的关键字符对所述预设用户信息的差异性体现。
其中,所述至少两个关键字符识别模型可以包括本申请实施例中介绍的基于词频确定字符权重值的数学模型、基于词向量确定字符相似度的数学模型、基于音律确定重音字符的方法模型中的一个或多个模型,还可以包括现有技术中的机器学习模型。
当所述至少两个关键字符识别模型包括机器学习模型时,首先需要对如前述步骤中获取的训练数据集中的每条预料进行标注,设置该预料的关键字符,然后再基于长短记忆网络等神经网络,训练关键字符识别模型。
本申请实施例中对所述至少两个关键字符识别模型的类型、训练方法不做限定。本领域技术人员在本申请公开的内容的基础上可以选择任何可以确定一串文本中的关键字的模型。
本申请实施例中的加权融合模型可以为如下所示的线性融合模型:
Figure BDA0002047974000000111
其中,x为候选关键字符;gt(x)为关键字符识别模型t计算出来候选关键字符x作为关键字符的权重;at为关键字符识别模型t的权重,根据专家经验预先设置;G(x)为融合后的候选关键字符x作为关键字符的权重。最后,选择G(x)最大的候选关键字符x作为所述预设用户信息中的关键字符。
在本申请的一些实施例中,如果G(x)最大的候选关键字符为多个,则随机取其中一个作为所述预设用户信息中的关键字符。
步骤140,根据所述关键字符生成所述目标用户的默认头像。
接下来,在确定了所述目标用户的预设用户信息中包括的关键字符,进一步根据确定的所述关键字符,生成一张图片,并将该图片作为所述目标用户的默认头像。以获取的所述预设用户信息为“张三疯”举例,如果前述步骤中确定“疯”字作为所述预设用户信息中的关键字符,则根据所述关键字符生成所述目标用户的默认头像可以如图3所示。
本申请实施例中,确定的所述目标用户的预设用户信息中包括的关键字符为字符编码的形式,因此,首先需要根据所述关键字符为字符编码生成一张图片。
在本申请的一些实施例中,可以创建一个画板,然后通过调用***提供的字库接口获取所述字符编码的字模数据,然后,根据所述字模数据在画板上绘制所述字符编码对应的图片。
在本申请的另一些实施例中,还可以通过调用现有技术中的字符转图片的应用接口,通过输入所述字符编码,得到所述字符编码对应的字符图片。
当然,本领域技术人员还可以采用其他方法生成与所述字符编码对应的字符图片,本申请实施例中不再一一例举。本申请对根据所述关键字符生成图片的具体技术手段不作限定。
之后,将根据所述关键字符生成的图片作为所述目标用户的默认头像。
本申请实施例公开的用户头像生成方法,通过获取目标用户的预设用户信息,所述目标用户为未设置头像的用户;通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数;根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符;根据所述关键字符生成所述目标用户的默认头像,有助于提升自动生成的用户头像的视觉区分度。对于不同的用户,其用户名或昵称等预设用户信息是不同的,是用户个性化标识的体现,因此,基于从预设用户信息进一步提取的能够体现不同用户的个性化标识的关键字符生成用户头像,使得生成的用户头像能够最大化体现不同用户的差异,同时,也可以提升用户头像的美观度。
另一方面,取用户的所述预设用户信息中的关键字符生成用户头像,相比随意取用户名的首字母或用户名中某个字符的首字母作为用户头像,生成的用户头像突出重点特征,使得生成的用户头像的视觉区分度和指向性更强。
再一方面,仅取用户的所述预设用户信息中的关键字符生成用户头像,相比根据全部预设用户信息生成用户头像,生成的用户头像更简洁,且突出重点特征,使得生成的用户头像的视觉区分度更强。
实施例二
本实施例公开的一种用户头像生成装置,如图4所示,所述装置包括:
用户信息获取模块410,用于获取目标用户的预设用户信息,所述目标用户为未设置头像的用户;
区别特征参数确定模块420,用于通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数;
关键字符确定模块430,用于根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符;
头像生成模块440,用于根据所述关键字符生成所述目标用户的默认头像。
在本申请的一些实施例中,如图5所示,所述区别特征参数确定模块420进一步包括第一区别特征参数确定子模块4201。
第一区别特征参数确定子模块4201,用于基于词频分析技术确定所述预设用户信息中各目标字符对应的权重值,其中,所述权重值用于指示对应目标字符对所述预设用户信息产生的视觉区分度;
相应的,如图5所示,所述关键字符确定模块430进一步包括第一关键字符确定子模块4301。
所述第一关键字符确定子模块4301,用于确定最大的所述权重值对应的所述预设用户信息中的目标字符,作为所述预设用户信息中的关键字符。
进一步可选的,所述基于词频分析技术确定所述预设用户信息中各目标字符对应的权重值的步骤,包括:
确定所述预设用户信息中的目标字符;
确定各所述目标字符基于所述预设用户信息的词频,其中,所述目标字符的词频与该目标字符在所述预设用户信息中出现的次数成指数正相关;
对于每个所述目标字符,根据所述目标字符基于所述预设用户信息的词频和预先确定的所述目标字符基于指定训练数据集的逆向文本词频的乘积,确定所述目标字符对应的权重值。
在本申请的一些实施例中,如6所示,所述区别特征参数确定模块420进一步包括第二区别特征参数确定子模块4202。
第二区别特征参数确定子模块4202,用于基于词向量技术,分别确定所述预设用户信息的词向量和所述预设用户信息中每个字符的字向量;以及,
分别计算所述字符的所述字向量与所述词向量之间的相似度;
相应的,如图6所示,所述关键字符确定模块430进一步包括第二关键字符确定子模块4302。
所述第二关键字符确定子模块4302,用于确定最大的所述相似度对应的所述字向量所属字符作为所述预设用户信息中的关键字符。
在本申请的另一些实施例中,如图7所示,所述区别特征参数确定模块420进一步包括第三区别特征参数确定子模块4203。
所述第三区别特征参数确定子模块4203,用于确定所述预设用户信息包括的各目标字符中的重音字符;
相应的,如图7所示,所述关键字符确定模块430进一步包括第三关键字符确定子模块4303。
所述第三关键字符确定子模块4303,用于将所述重音字符作为所述预设用户信息中的关键字符。
在本申请的再一些实施例中,如图8所示,所述区别特征参数确定模块420包括至少两个区别特征参数确定子模块,如第四区别特征参数确定子模块4204和第五区别特征参数确定子模块4205,所述第四区别特征参数确定子模块4204和第五区别特征参数确定子模块4205分别对应不同的关键字符识别模型,所述区别特征参数确定模块420,进一步用于:
通过至少两个关键字符识别模型分别确定所述预设用户信息中的各目标字符的区别特征参数;
相应的,所述关键字符确定模块430包括至少两个关键字符确定子模块,如第四关键字符确定子模块4304和第五关键字符确定子模块4305,所述第四关键字符确定子模块4304和第五关键字符确定子模块4305分别对应不同的关键字符识别模型,所述关键字符确定模块430进一步用于:
通过至少两个关键字符识别模型分别确定的所述区别特征参数,分别确定所述预设用户信息中的候选关键字符;
通过预设加权融合模型对各所述候选关键字符进行加权投票运算,确定各所述候选关键字符的投票数;
确定所述投票数最大的一个所述候选关键字符,作为所述预设用户信息中的关键字符。
在本申请的一些实施例中,所述预设用户信息包括一下任意一项或多项:用户名、昵称、备注。
本申请实施例公开的用户头像生成装置,用于实现本申请实施例一和实施例二中所述的用户头像生成方法的各步骤,装置的各模块的具体实施方式参见相应步骤,此处不再赘述。
本申请实施例公开的用户头像生成装置,通过获取目标用户的预设用户信息,所述目标用户为未设置头像的用户;通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数;根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符;根据所述关键字符生成所述目标用户的默认头像,有助于提升自动生成的用户头像的视觉区分度。对于不同的用户,其用户名或昵称等预设用户信息是不同的,是用户个性化标识的体现,因此,基于从预设用户信息进一步提取的能够体现不同用户的个性化标识的关键字符生成用户头像,使得生成的用户头像能够最大化体现不同用户的差异,同时,也可以提升用户头像的美观度。
另一方面,取用户的所述预设用户信息中的关键字符生成用户头像,相比随意取用户名的首字母或用户名中某个字符的首字母作为用户头像,生成的用户头像突出重点特征,使得生成的用户头像的视觉区分度和指向性更强。
再一方面,仅取用户的所述预设用户信息中的关键字符生成用户头像,相比根据全部预设用户信息生成用户头像,生成的用户头像更简洁,且突出重点特征,使得生成的用户头像的视觉区分度更强。
相应的,本申请还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例一所述的用户头像生成方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。
本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例一所述的用户头像生成方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请提供的一种用户头像生成方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims (8)

1.一种用户头像生成方法,其特征在于,包括:
获取目标用户的预设用户信息,所述目标用户为未设置头像的用户;
通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数,所述区别特征参数包括:权重值、各目标字符与所述预设用户信息的词向量相似度,其中,所述权重值用于指示对应目标字符对所述预设用户信息产生的视觉区分度;
根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符;
根据所述关键字符生成所述目标用户的默认头像;
所述通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数的步骤,包括:
确定所述预设用户信息包括的各目标字符中的重音字符;
所述根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符的步骤,包括:
将所述重音字符作为所述预设用户信息中的关键字符;
所述通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数的步骤,包括:
通过至少两个关键字符识别模型分别确定所述预设用户信息中的各目标字符的区别特征参数;
所述根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符的步骤,包括:
通过至少两个关键字符识别模型分别确定的所述区别特征参数,分别确定所述预设用户信息中的候选关键字符;
通过预设加权融合模型对各所述候选关键字符进行加权投票运算,确定各所述候选关键字符的投票数;
确定所述投票数最大的一个所述候选关键字符,作为所述预设用户信息中的关键字符。
2.根据权利要求1所述的方法,其特征在于,所述通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数的步骤,包括:
基于词频分析技术确定所述预设用户信息中各目标字符对应的权重值;
所述根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符的步骤,包括:
确定最大的所述权重值对应的所述预设用户信息中的目标字符,作为所述预设用户信息中的关键字符。
3.根据权利要求2所述的方法,其特征在于,所述基于词频分析技术确定所述预设用户信息中各目标字符对应的权重值的步骤,包括:
确定所述预设用户信息中的目标字符;
确定各所述目标字符基于所述预设用户信息的词频,其中,所述目标字符的词频与该目标字符在所述预设用户信息中出现的次数成指数正相关;
对于每个所述目标字符,根据所述目标字符基于所述预设用户信息的词频和预先确定的所述目标字符基于指定训练数据集的逆向文本词频的乘积,确定所述目标字符对应的权重值。
4.根据权利要求1所述的方法,其特征在于,所述通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数的步骤,包括:
基于词向量技术,分别确定所述预设用户信息的词向量和所述预设用户信息中每个字符的字向量;
分别计算所述字符的所述字向量与所述词向量之间的相似度;
所述根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符的步骤,包括:
确定最大的所述相似度对应的所述字向量所属字符作为所述预设用户信息中的关键字符。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述预设用户信息包括一下任意一项或多项:用户名、昵称、备注。
6.一种用户头像生成装置,其特征在于,包括:
用户信息获取模块,用于获取目标用户的预设用户信息,所述目标用户为未设置头像的用户;
区别特征参数确定模块,用于通过关键字符识别模型,确定所述预设用户信息中各目标字符的区别特征参数,所述区别特征参数包括:权重值、各目标字符与所述预设用户信息的词向量相似度,其中,所述权重值用于指示对应目标字符对所述预设用户信息产生的视觉区分度;
关键字符确定模块,用于根据所述区别特征参数的分布,确定所述预设用户信息中的关键字符;
头像生成模块,用于根据所述关键字符生成所述目标用户的默认头像;
所述区别特征参数确定模块进一步包括第三区别特征参数确定子模块;
所述第三区别特征参数确定子模块,用于确定所述预设用户信息包括的各目标字符中的重音字符;
所述关键字符确定模块进一步包括第三关键字符确定子模块;
所述第三关键字符确定子模块,用于将所述重音字符作为所述预设用户信息中的关键字符;
所述区别特征参数确定模块,进一步用于:
通过至少两个关键字符识别模型分别确定所述预设用户信息中的各目标字符的区别特征参数;
所述关键字符确定模块进一步用于:
通过至少两个关键字符识别模型分别确定的所述区别特征参数,分别确定所述预设用户信息中的候选关键字符;
通过预设加权融合模型对各所述候选关键字符进行加权投票运算,确定各所述候选关键字符的投票数;
确定所述投票数最大的一个所述候选关键字符,作为所述预设用户信息中的关键字符。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任意一项所述的用户头像生成方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至5任意一项所述的用户头像生成方法的步骤。
CN201910365350.0A 2019-04-30 2019-04-30 用户头像生成方法、装置、电子设备及存储介质 Active CN110196956B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910365350.0A CN110196956B (zh) 2019-04-30 2019-04-30 用户头像生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910365350.0A CN110196956B (zh) 2019-04-30 2019-04-30 用户头像生成方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110196956A CN110196956A (zh) 2019-09-03
CN110196956B true CN110196956B (zh) 2021-06-11

Family

ID=67752322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910365350.0A Active CN110196956B (zh) 2019-04-30 2019-04-30 用户头像生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110196956B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060065387A (ko) * 2004-12-10 2006-06-14 엘지전자 주식회사 캐릭터 편집기능을 갖는 휴대용 이동통신단말기 및 그방법
CN103401761A (zh) * 2013-07-24 2013-11-20 北京小米科技有限责任公司 头像图片生成方法、装置及服务器
CN104348968A (zh) * 2013-08-09 2015-02-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN106097113A (zh) * 2016-06-21 2016-11-09 仲兆满 一种社交网络用户动静兴趣挖掘方法
CN107154067A (zh) * 2017-03-31 2017-09-12 北京奇艺世纪科技有限公司 一种头像生成方法及装置
CN109416591A (zh) * 2017-05-16 2019-03-01 苹果公司 用于增强型用户交互的图像数据

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273353A (zh) * 2017-06-08 2017-10-20 广东灵机文化传播有限公司 名字解析方法及***
CN107733722B (zh) * 2017-11-16 2021-07-20 百度在线网络技术(北京)有限公司 用于配置语音服务的方法和装置
CN107910005B (zh) * 2017-11-16 2021-06-01 海信集团有限公司 交互文本的目标业务定位方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060065387A (ko) * 2004-12-10 2006-06-14 엘지전자 주식회사 캐릭터 편집기능을 갖는 휴대용 이동통신단말기 및 그방법
CN103401761A (zh) * 2013-07-24 2013-11-20 北京小米科技有限责任公司 头像图片生成方法、装置及服务器
CN104348968A (zh) * 2013-08-09 2015-02-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN106097113A (zh) * 2016-06-21 2016-11-09 仲兆满 一种社交网络用户动静兴趣挖掘方法
CN107154067A (zh) * 2017-03-31 2017-09-12 北京奇艺世纪科技有限公司 一种头像生成方法及装置
CN109416591A (zh) * 2017-05-16 2019-03-01 苹果公司 用于增强型用户交互的图像数据

Also Published As

Publication number Publication date
CN110196956A (zh) 2019-09-03

Similar Documents

Publication Publication Date Title
EP3579140A1 (en) Method and apparatus for processing video
CN110348362B (zh) 标签生成、视频处理方法、装置、电子设备及存储介质
CN109857844B (zh) 基于点餐对话文本的意图识别方法、装置、电子设备
CN108121800B (zh) 基于人工智能的信息生成方法和装置
CN109902665A (zh) 相似人脸检索方法、装置及存储介质
CN110798636B (zh) 字幕生成方法及装置、电子设备
CN112800170A (zh) 问题的匹配方法及装置、问题的回复方法及装置
CN110740389B (zh) 视频定位方法、装置、计算机可读介质及电子设备
WO2018196718A1 (zh) 图像消歧方法、装置、存储介质和电子设备
CN112052326A (zh) 一种基于长短文本匹配的智能问答方法及***
CN107679070B (zh) 一种智能阅读推荐方法与装置、电子设备
WO2015021937A1 (zh) 用户推荐方法和装置
CN110072140B (zh) 一种视频信息提示方法、装置、设备及存储介质
CN111666400B (zh) 消息获取方法、装置、计算机设备及存储介质
CN111368066B (zh) 获取对话摘要的方法、装置和计算机可读存储介质
CN113094478B (zh) 表情回复方法、装置、设备及存储介质
CN109348262B (zh) 一种主播相似度的计算方法、装置、设备和存储介质
CN112650768A (zh) 对话信息的生成方法、装置及电子设备
CN116737883A (zh) 人机交互方法、装置、设备及存储介质
CN113590798B (zh) 对话意图识别、用于识别对话意图的模型的训练方法
CN110196956B (zh) 用户头像生成方法、装置、电子设备及存储介质
CN112417845A (zh) 一种文本评价方法、装置、电子设备及存储介质
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN112328871B (zh) 一种基于rpa模块的回复生成方法、装置、设备及存储介质
CN115374247A (zh) 一种基于改进lda模型的对话模板匹配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant