CN107742315A - 生成人物词云画像的方法及装置 - Google Patents

生成人物词云画像的方法及装置 Download PDF

Info

Publication number
CN107742315A
CN107742315A CN201710934962.8A CN201710934962A CN107742315A CN 107742315 A CN107742315 A CN 107742315A CN 201710934962 A CN201710934962 A CN 201710934962A CN 107742315 A CN107742315 A CN 107742315A
Authority
CN
China
Prior art keywords
vocabulary
picture
input
portrait
default
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710934962.8A
Other languages
English (en)
Other versions
CN107742315B (zh
Inventor
周松文
何金虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201710934962.8A priority Critical patent/CN107742315B/zh
Publication of CN107742315A publication Critical patent/CN107742315A/zh
Application granted granted Critical
Publication of CN107742315B publication Critical patent/CN107742315B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供一种生成人物词云画像的方法、装置、电子设备及计算机可读介质,涉及文本处理技术领域。该生成人物词云画像的方法包括:采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。该方法可以根据输入的图片以及文本快速生成人像词云画像,既可以快速、实时的反应数据的变化,而且能够保证画像的准确性,因此可以得到美观、色彩丰富的画像。

Description

生成人物词云画像的方法及装置
技术领域
本发明实施例总体涉及文本处理技术领域,具体而言,涉及一种生成人物词云画像的方法及装置。
背景技术
“词云”是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页的人只要一眼扫过文本就可以领略文本的主旨。
在数据分析过程中,人物词云画像是一种对人物特征信息友好、易懂的描述形式。现有技术方案在生成人物词云画像过程中,主要采用以下两种方式:
(1)使用前期数据加工,再加上后期对图片进行美化留白后,把加工好的数据逐个填入,优点是生成的画像准确无误,美观程度较高,缺点是生成画像的周期太长,无法实时、快速地响应数据变化。
(2)直接使用图片和词汇生成人像词云画像,图1示出直接生成人物词云画像前的原始图片效果图,图2示出直接生成人物词云画像的效果图,这种方式的优点是生成画像的周期短,但是参见图2可以看出,缺点是生成的画像失真比较严重,色彩杂乱,不能正确的展示人物形象,效果不佳,无法正常使用。
因此,现有技术方案的两种处理方式均不能在缩短生成画像周期的同时保证画像的准确性,还存在有待改进之处。
在所述背景技术部分公开的上述信息仅用于加强对本发明实施例的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例提供一种生成人物词云画像的方法、装置、电子设备及计算机可读介质,解决现有技术方案不能快速准确的生成人物词云画像的技术问题。
本发明实施例的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明实施例的实践而习得。
根据本发明实施例的第一方面,提供一种生成人物词云画像的方法,包括:
采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;
利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;
按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。
在本发明的一些实施例中,对输入的图片进行处理之前还包括:
判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。
在本发明的一些实施例中,采用彩铅方式对输入的图片进行处理包括:
将所述输入的图片转换成黑白图片;
对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片。
在本发明的一些实施例中,利用预设词库对输入的文本进行处理,生成词汇的排序文档包括:
对所述输入的文本去除停用词;
利用所述预设词库计算所述预设词库中各个词汇的词频以及权重;
根据所述词汇的词频和权重计算得到所述词汇的排序参考值;
按照所述词汇的排序参考值对所述词汇进行排序得到所述词汇的排序文档。
在本发明的一些实施例中,所述输入的文本来源于包含有所述预设词库中词汇的文件,计算所述词汇的权重包括:
统计包含所述词汇的文件的数目;
根据所述包含所述词汇的文件的数目与总文件的数目计算得到所述词汇的权重。
在本发明的一些实施例中,所述词汇的排序参考值为所述词汇的词频与所述词汇的权重的乘积。
在本发明的一些实施例中,按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中还包括:
根据所述词汇的排序参考值的大小确定填入所述词汇的字体大小。
根据本发明实施例的第二方面,提供一种生成人物词云画像的装置,包括:
图片处理模块,配置为采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;
文本处理模块,配置为利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;
填入模块,配置为按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。
在本发明的一些实施例中,还包括:
格式判断模块,配置为对输入的图片进行处理之前,判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。
在本发明的一些实施例中,所述图片处理模块包括:
黑白转换子模块,配置为将所述输入的图片转换成黑白图片;
彩铅化子模块,配置为对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片。
在本发明的一些实施例中,所述文本处理模块包括:
去停用词子模块,配置为对所述输入的文本去除停用词;
第一计算子模块,配置为利用所述预设词库计算所述预设词库中各个词汇的词频以及权重;
第二计算子模块,配置为根据所述词汇的词频和权重计算得到所述词汇的排序参考值;
排序子模块,配置为按照所述词汇的排序参考值对所述词汇进行排序得到所述词汇的排序文档。
在本发明的一些实施例中,所述输入的文本来源于包含有所述预设词库中词汇的文件,所述第一计算子模块用于统计包含所述词汇的文件的数目,并根据所述包含所述词汇的文件的数目与总文件的数目计算得到所述词汇的权重。
在本发明的一些实施例中,所述第二计算子模块根据所述词汇的词频与所述词汇的权重的乘积得到所述词汇的排序参考值。
在本发明的一些实施例中,所述填入模块根据所述词汇的排序参考值的大小确定填入所述词汇的字体大小。
根据本发明实施例的第三方面,提供一种电子设备,包括:存储器;处理器及存储在该存储器上并可在该处理器上运行的计算机程序,该程序被该处理器执行时实现上述的方法步骤。
根据本公开实施例的第四方面,提供一种计算机可读介质,其上存储有计算机可执行指令,所述可执行指令被处理器执行时实现上述的方法步骤。
根据本发明实施例提供的生成人物词云画像的方法、装置、电子设备及计算机可读介质,可以根据输入的图片以及文本快速生成人像词云画像,既可以快速、实时的反应数据的变化,而且能够保证画像的准确性,因此可以得到美观、色彩丰富的画像。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明实施例。
附图说明
通过参照附图详细描述其示例实施例,本发明实施例的上述和其它目标、特征及优点将变得更加显而易见。
图1示出现有技术方案中直接生成人物词云画像前的原始图片效果图。
图2示出现有技术方案中直接生成人物词云画像的效果图。
图3示出本发明实施例提供的一种生成人物词云画像的方法的流程图。
图4示出本发明实施例中步骤S31的流程图。
图5示出本发明实施例中对图1所示的图片转换成黑白图片的效果图。
图6示出本发明实施例中对图5所示黑白图片彩铅化处理后的效果图。
图7示出本发明实施例中步骤S32的流程图。
图8示出本发明实施例中词汇的排序文档的示意图。
图9示出本发明实施例中最终得到的人物词云图像的效果图。
图10示出本发明实施例中提供的一种生成人物词云画像的装置的示意图。
图11示出本发明实施例中图片处理模块的示意图。
图12示出本发明实施例中文本处理模块的示意图。
图13示出本发明实施例提供的另一种生成人物词云画像的装置的示意图。
图14示出本发明再一实施例提供的适于用来实现本申请实施例的电子设备的计算机***的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明实施例将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本发明实施例的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明实施例的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明实施例的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免喧宾夺主而使得本发明实施例的各方面变得模糊。
附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
为使本发明实施例的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
图3示出本发明实施例提供的一种生成人物词云画像的方法的流程图。
如图3所示,在步骤S31中,采用彩铅方式对输入的图片进行处理,得到彩铅效果图片。
如图3所示,在步骤S32中,利用预设词库对输入的文本进行处理,生成词汇的排序文档,预设词库中包括多个词汇。
如图3所示,在步骤S33中,按照词汇的排序文档将词汇填入到彩铅效果图片中,得到人物词云画像。
该方法中对输入的图片进行彩铅化处理,使得图片成为彩铅效果图片,再按照词汇的排序文档将词汇填入到该彩铅效果图中,最终得到的人物词云画像准确性高,而且生成的速度快。
在本发明实施例中,对输入的图片进行处理之前还包括:
判断输入的图片的格式是否符合预设的格式要求,如果输入的图片的格式符合预设的格式要求,则继续步骤S31,即对输入的图片采用彩铅方式进行处理;如果输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中预设的格式要求包括但不限于PNG、JPG等位图,在实际使用过程中可以根据需求更改对图片预设的格式要求。
在本发明实施例中,图4示出本发明实施例中步骤S31的流程图,即步骤S31采用彩铅方式对输入的图片进行处理包括以下步骤:
如图4所示,在步骤S41中,将输入的图片转换成黑白图片,输入的图片参考图1所示,图5示出本发明实施例中对图1所示的图片转换成黑白图片的效果图。
如图4所示,在步骤S42中,对黑白图片进行彩铅化处理,得到彩铅效果图片,图6示出本发明实施例中对图5所示黑白图片彩铅化处理后的效果图。
经过步骤S41的黑白化处理,处理成黑白图片后使得黑白对比更加明显,再经过步骤S42彩铅化处理,需要说明的是,步骤S42中仅对白色以外的区域进行彩铅化处理,白色区域仍然保持白色。
在本发明实施例中,图7示出本发明实施例中步骤S32的流程图,即步骤S32利用预设词库对输入的文本进行处理,生成词汇的排序文档包括以下步骤:
如图7所示,在步骤S71中,对输入的文本去除停用词,其中停用词包括标点符号、表情符号、语气助词、介词和连接词。输入的文本来源于包含有预设词库中词汇的文件,这些文件的内容一般是对图片中的人物相关描述,文件的来源不做限定,可以包括从网络中筛选的文章或是企业内部的介绍性文章等等。预设词库一般是根据需求在大众词汇的基础上增加一些满足需求的重点词汇,比如行业常用词汇等,因此预设词库中的词汇比大众词汇更丰富一些,更加能够体现行业特点,对图片中人物的描述也更加贴切。
如图7所示,在步骤S72中,利用预设词库计算预设词库中各个词汇的词频以及权重。其中词汇的词频用于表示该词汇出现的次数,词汇的权重用于表示该词汇在文件维度上的权重,具体而言,词汇的权重计算可以采用如下方法:
首先,统计包含词汇的文件的数目;其次,根据包含词汇的文件的数目与总文件的数目计算得到词汇的权重,可以由总文件的数目除以包含该词汇的文件的数目,再将得到的商取对数,得到的数值为该词汇的权重。
如图7所示,在步骤S73中,根据词汇的词频和权重计算得到词汇的排序参考值,具体而言,词汇的排序参考值可以为词汇的词频与词汇的权重的乘积。
如图7所示,在步骤S74中,按照词汇的排序参考值对词汇进行排序得到词汇的排序文档,图8示出本发明实施例中词汇的排序文档的示意图,其中词汇后面的数字就是词汇的排序参考值。
在本发明实施例中,步骤S33按照词汇的排序文档将词汇填入到彩铅效果图片中,根据词汇的排序参考值的大小确定填入词汇的字体大小。
现有技术方案中在将词汇填入图片生成画像过程中常以词频的大小作为字体大小的依据,而本发明实施例中将词频与词汇权重的乘积作为字体大小的依据,能够从多个维度体现词汇与图片中任务的关联程度,保证得到的人物词云画像的准确性更高。
图9示出本发明实施例中最终得到的人物词云图像的效果图。由图9可以看出,由于对图片进行黑变化以及彩铅化处理,在将词汇填入彩铅效果图片中时白色区域不做填充,因此得到的人物词云画像美观、色彩丰富。
综上所述,本发明实施例中提供的生成人物词云画像的方法,采用彩铅方式对输入的图片进行处理,白色区域不做填充,因此得到的人物词云画像美观、色彩丰富。利用预设词库对输入的文本进行处理,使得填入的词汇与图片中的人物描述更加贴切,相关联程度更高,能够保证画像的准确性。而且自动填充过程快速,不仅缩短生成人像词云画像的周期,而且能够根据输入的文本以及输入的图片的变化迅速给出人物词云画像,可以快速、实时的反应数据的变化。
图10示出本发明实施例提供的一种生成人物词云画像的装置的示意图,如图10所示,该装置1000中包括:图片处理模块1010、文本处理模块1020和填入模块1030。
图片处理模块1010配置为采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;文本处理模块1020配置为利用预设词库对输入的文本进行处理,生成词汇的排序文档,预设词库中包括多个词汇;填入模块1030配置为按照词汇的排序文档将词汇填入到彩铅效果图片中,得到人物词云画像。
图11示出本发明实施例中图片处理模块的示意图,该图片处理模块1010包括:黑白转换子模块1011和彩铅化子模块1012,黑白转换子模块1011配置为将输入的图片转换成黑白图片;彩铅化子模块1012配置为对黑白图片进行彩铅化处理,得到彩铅效果图片。
图12示出本发明实施例中文本处理模块的示意图,该文本处理模块1020包括:去停用词子模块1021、第一计算子模块1022、第二计算子模块1023和排序子模块1024。
去停用词子模块1021配置为对输入的文本去除停用词;第一计算子模块1022配置为利用预设词库计算预设词库中各个词汇的词频以及权重,具体的在计算词汇的权重包括:首先,统计包含词汇的文件的数目;其次,根据包含词汇的文件的数目与总文件的数目计算得到词汇的权重;第二计算子模块1023配置为根据词汇的词频和权重计算得到词汇的排序参考值,具体而言,根据词汇的词频与词汇的权重的乘积得到词汇的排序参考值;排序子模块1024配置为按照词汇的排序参考值对词汇进行排序得到词汇的排序文档。在本发明实施例中,输入的文本来源于包含有预设词库中词汇的文件。第一计算子模块用于统计包含词汇的文件的数目,并根据包含词汇的文件的数目与总文件的数目计算得到词汇的权重。
在本发明实施例中,填入模块1030根据词汇的排序参考值的大小确定填入词汇的字体大小。
图13示出本发明实施例提供的另一种生成人物词云画像的装置的示意图,如图13所示,该装置1300中除了包括:图片处理模块1310、文本处理模块1320和填入模块1330之外,还包括:格式判断模块1340,格式判断模块1340配置为对输入的图片进行处理之前,判断输入的图片的格式是否符合预设的格式要求,如果输入的图片的格式符合预设的格式要求,则继续对输入的图片采用彩铅方式进行处理;如果输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中预设的格式要求包括PNG、JPG。
图13所示装置中的图片处理模块1310、文本处理模块1320和填入模块1330中各个模块的组成和功能参见上述图11和图12的描述,此处不再赘述。
另外,图10和图13所示装置中各个模块的功能参见上述方法实施例中的相关描述,此处不再赘述。
本实施提供的生成人物词云画像的装置能够实现与上述生成人物词云画像的方法相同的技术效果,此处不再赘述。
根据本发明实施例的第三方面,提供一种电子设备,包括:存储器;处理器及存储在该存储器上并可在该处理器上运行的计算机程序,该程序被该处理器执行时实现上述的方法步骤。
另一方面,本发明还提供了一种电子设备,包括处理器和存储器,存储器存储用于上述处理器控制以下方法的操作指令:
采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;利用预设词库对输入的文本进行处理,生成词汇的排序文档,预设词库中包括多个词汇;按照词汇的排序文档将词汇填入到彩铅效果图片中,得到人物词云画像。
下面参考图14,其示出了适于用来实现本发明实施例的电子设备的计算机***1400的结构示意图。图14示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图14所示,计算机***1400包括中央处理单元(CPU)1401,其可以根据存储在只读存储器(ROM)1402中的程序或者从存储部分1407加载到随机访问存储器(RAM)1403中的程序而执行各种适当的动作和处理。在RAM 1403中,还存储有***1400操作所需的各种程序和数据。CPU 1401、ROM 1402以及RAM 1403通过总线1404彼此相连。输入/输出(I/O)接口1405也连接至总线1404。
以下部件连接至I/O接口1405:包括键盘、鼠标等的输入部分1406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1407;包括硬盘等的存储部分1408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1409。通信部分1409经由诸如因特网的网络执行通信处理。驱动器1410也根据需要连接至I/O接口1405。可拆卸介质1411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1410上,以便于从其上读出的计算机程序根据需要被安装入存储部分1408。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1409从网络上被下载和安装,和/或从可拆卸介质1411被安装。在该计算机程序被中央处理单元(CPU)1401执行时,执行本申请的***中限定的上述功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。
另一方面,本发明实施例还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括以下方法步骤:
采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;利用预设词库对输入的文本进行处理,生成词汇的排序文档,预设词库中包括多个词汇;按照词汇的排序文档将词汇填入到彩铅效果图片中,得到人物词云画像。
应清楚地理解,本发明实施例描述了如何形成和使用特定示例,但本发明实施例的原理不限于这些示例的任何细节。相反,基于本发明实施例公开的内容的教导,这些原理能够应用于许多其它实施方式。
以上具体地示出和描述了本发明的示例性实施方式。应可理解的是,本发明实施例不限于这里描述的详细结构、设置方式或实现方法;相反,本发明实施例意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

Claims (16)

1.一种生成人物词云画像的方法,其特征在于,包括:
采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;
利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;
按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。
2.根据权利要求1所述的方法,其特征在于,对输入的图片进行处理之前还包括:
判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。
3.根据权利要求1所述的方法,其特征在于,采用彩铅方式对输入的图片进行处理包括:
将所述输入的图片转换成黑白图片;
对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片。
4.根据权利要求1所述的方法,其特征在于,利用预设词库对输入的文本进行处理,生成词汇的排序文档包括:
对所述输入的文本去除停用词;
利用所述预设词库计算所述预设词库中各个词汇的词频以及权重;
根据所述词汇的词频和权重计算得到所述词汇的排序参考值;
按照所述词汇的排序参考值对所述词汇进行排序得到所述词汇的排序文档。
5.根据权利要求4所述的方法,其特征在于,所述输入的文本来源于包含有所述预设词库中词汇的文件,计算所述词汇的权重包括:
统计包含所述词汇的文件的数目;
根据所述包含所述词汇的文件的数目与总文件的数目计算得到所述词汇的权重。
6.根据权利要求4或5所述的方法,其特征在于,所述词汇的排序参考值为所述词汇的词频与所述词汇的权重的乘积。
7.根据权利要求6所述的方法,其特征在于,按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中还包括:
根据所述词汇的排序参考值的大小确定填入所述词汇的字体大小。
8.一种生成人物词云画像的装置,其特征在于,包括:
图片处理模块,配置为采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;
文本处理模块,配置为利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;
填入模块,配置为按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。
9.根据权利要求8所述的装置,其特征在于,还包括:
格式判断模块,配置为对输入的图片进行处理之前,判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。
10.根据权利要求8所述的装置,其特征在于,所述图片处理模块包括:
黑白转换子模块,配置为将所述输入的图片转换成黑白图片;
彩铅化子模块,配置为对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片。
11.根据权利要求8所述的装置,其特征在于,所述文本处理模块包括:
去停用词子模块,配置为对所述输入的文本去除停用词;
第一计算子模块,配置为利用所述预设词库计算所述预设词库中各个词汇的词频以及权重;
第二计算子模块,配置为根据所述词汇的词频和权重计算得到所述词汇的排序参考值;
排序子模块,配置为按照所述词汇的排序参考值对所述词汇进行排序得到所述词汇的排序文档。
12.根据权利要求11所述的装置,其特征在于,所述输入的文本来源于包含有所述预设词库中词汇的文件,所述第一计算子模块用于统计包含所述词汇的文件的数目,并根据所述包含所述词汇的文件的数目与总文件的数目计算得到所述词汇的权重。
13.根据权利要求11或12所述的装置,其特征在于,所述第二计算子模块根据所述词汇的词频与所述词汇的权重的乘积得到所述词汇的排序参考值。
14.根据权利要求13所述的装置,其特征在于,所述填入模块根据所述词汇的排序参考值的大小确定填入所述词汇的字体大小。
15.一种电子设备,包括:存储器;处理器及存储在该存储器上并可在该处理器上运行的计算机程序,其特征在于,该程序被该处理器执行时实现权利要求1-7任一项所述的方法步骤。
16.一种计算机可读介质,其上存储有计算机可执行指令,其特征在于,所述可执行指令被处理器执行时实现如权利要求1-7任一项所述的方法步骤。
CN201710934962.8A 2017-10-10 2017-10-10 生成人物词云画像的方法及装置 Active CN107742315B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710934962.8A CN107742315B (zh) 2017-10-10 2017-10-10 生成人物词云画像的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710934962.8A CN107742315B (zh) 2017-10-10 2017-10-10 生成人物词云画像的方法及装置

Publications (2)

Publication Number Publication Date
CN107742315A true CN107742315A (zh) 2018-02-27
CN107742315B CN107742315B (zh) 2020-12-08

Family

ID=61237210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710934962.8A Active CN107742315B (zh) 2017-10-10 2017-10-10 生成人物词云画像的方法及装置

Country Status (1)

Country Link
CN (1) CN107742315B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079026A (zh) * 2019-11-28 2020-04-28 精硕科技(北京)股份有限公司 一种确定人物印象数据的方法、存储介质和装置
CN113722508A (zh) * 2021-09-02 2021-11-30 中国农业银行股份有限公司 词云展示方法及装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103997607A (zh) * 2014-06-11 2014-08-20 深圳市东方拓宇科技有限公司 一种图像获取方法、对应装置及含该装置的电子移动终端
US20160026709A1 (en) * 2014-07-28 2016-01-28 Adp, Llc Word Cloud Candidate Management System
CN106469138A (zh) * 2016-09-29 2017-03-01 东软集团股份有限公司 词云的生成方法及装置
CN107085859A (zh) * 2017-05-03 2017-08-22 中山大学 一种基于图像的彩铅画风格绘制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103997607A (zh) * 2014-06-11 2014-08-20 深圳市东方拓宇科技有限公司 一种图像获取方法、对应装置及含该装置的电子移动终端
US20160026709A1 (en) * 2014-07-28 2016-01-28 Adp, Llc Word Cloud Candidate Management System
CN106469138A (zh) * 2016-09-29 2017-03-01 东软集团股份有限公司 词云的生成方法及装置
CN107085859A (zh) * 2017-05-03 2017-08-22 中山大学 一种基于图像的彩铅画风格绘制方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079026A (zh) * 2019-11-28 2020-04-28 精硕科技(北京)股份有限公司 一种确定人物印象数据的方法、存储介质和装置
CN111079026B (zh) * 2019-11-28 2023-11-24 北京秒针人工智能科技有限公司 一种确定人物印象数据的方法、存储介质和装置
CN113722508A (zh) * 2021-09-02 2021-11-30 中国农业银行股份有限公司 词云展示方法及装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN107742315B (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
KR102401942B1 (ko) 번역품질 평가 방법 및 장치
US20180157636A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
JP2023547917A (ja) 画像分割方法、装置、機器および記憶媒体
CN110472251A (zh) 翻译模型训练的方法、语句翻译的方法、设备及存储介质
WO2020098269A1 (zh) 一种语音合成方法及语音合成装置
CN107707745A (zh) 用于提取信息的方法和装置
WO2014154111A1 (en) Graphic processing method, system and server
CN107305578A (zh) 人机智能问答方法和装置
WO2020038253A1 (zh) 关键词的提取方法、***和存储介质
CN107731229A (zh) 用于识别语音的方法和装置
CN104361896B (zh) 语音质量评价设备、方法和***
CN106601254A (zh) 信息输入方法和装置及计算设备
CN106896937A (zh) 用于输入信息的方法和装置
CN107329585A (zh) 用于输入文字的方法和装置
US20200356728A1 (en) Electronic device and control method therefor
AU2017202651A1 (en) Identification of points in a user web journey where the user is more likely to accept an offer for interactive assistance
CN107093164A (zh) 用于生成图像的方法和装置
CN114841274B (zh) 语言模型的训练方法、装置、电子设备和存储介质
CN109815448B (zh) 幻灯片生成方法及装置
WO2021078042A1 (zh) 信息展示方法、装置、设备及存储介质
CN111368180A (zh) 页面展示方法、装置及电子设备
CN111159220A (zh) 用于输出结构化查询语句的方法和装置
CN106873800A (zh) 信息输出方法和装置
CN115631261B (zh) 图像生成模型的训练方法、图像生成方法和装置
CN106663242A (zh) 在文档中标识和显现相关的报告工件

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant