CN113435199A - 一种性格对应文化的存储读取干涉方法及*** - Google Patents
一种性格对应文化的存储读取干涉方法及*** Download PDFInfo
- Publication number
- CN113435199A CN113435199A CN202110810159.XA CN202110810159A CN113435199A CN 113435199 A CN113435199 A CN 113435199A CN 202110810159 A CN202110810159 A CN 202110810159A CN 113435199 A CN113435199 A CN 113435199A
- Authority
- CN
- China
- Prior art keywords
- data
- compliance
- character
- culture
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种性格对应文化的存储读取干涉方法及***,涉及互联网技术领域及应用。一种性格对应文化的大数据存储读取干涉方法包括:1.获取互联网数据中的合规文化数据,并根据数据字段类型的内容摘要构建所选合规的特征向量数据;2.利用聚类算法对合规的特征数据标记数据进行分词处理以获得分词词组语句;3.对选择的词组进行互联网社会取值标定,取得定值;4.将合法合规的数据进行存储,将其数据结合机理,形成文化干涉数据库;5.将社会资讯类采取同样的方法进行标定,形成时代应景式资讯。6.获取个人或集体对应的偏好或资讯订制,结合应景式资讯,形成文化意识流;7.将特殊群体的性格与资讯文化结合形成群体文化。
Description
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种性格对应文化的存储读取干涉方法及***。
背景技术
性格是一个人对现实的稳定的态度,以及与这种态度相应的,习惯化了的行为方式中表现出来的人格特征。性格一经形成便比较稳定,但是并非一成不变,而是可塑性的。气质基于性格,更多体现了人格的社会属性,个体之间的人格差异的核心是性格的差异。在此我们以72性格分析法为基础,构建性格数据描述。
同时,社会的现象也有相关的数据进行契合,也就是,所有社会现象都会有一种相同的结构表达,并因此对应结合,形成上资讯下文化的相同描述(性格文化),人因性格不同而造成文化不同,以及取向教育订制不同。上资讯是可变量,而下文化基本定量略增;因此产生的应景资讯(媒体/图文/短视频),也可产生应景的文化(经典/成语/诗词/歌赋/传统/现代/哲思/笑话/名人)来强化某种意识性格。使资讯(图文/短视频)等的文化意识与性格形态表现的更为精准。合规的资料储存在软件上,定制时需要哪个类型可以方便调取(软件可以对网上信息进行处理按照设定好的进行分类),依据已有资料可以按照个人/情侣/家庭/团队/公司/社团/职业的需要(按照买家客户定制需要给到相应资料,例如:公司需要开朗的人会买跟开朗有关的资料拿回去或者现场安排教导,家庭需要成熟稳重的人那么会出售这方面资料给买家回家或者现场教导)根据买家要求定制所需的人格,是亟需解决的问题。
发明内容
本发明的目的在于提供一种性格对应文化的存储读取干涉方法,能够使文化便于传承,便于构筑中华文化复兴基础,提高国民传承经典文化兴趣及应用,加强哲学思想文化,增加学习效率使人快乐学习文学经典,方便应用于社会各个行业岗位,为社会赋能。让经典更易传承,使人文吐露芳华,借历史更鉴现实。提供百家思辨的现实体现,提供经典教育的永世意义,积累AI人机互动的数据基础。
本发明的另一目的在于提供一种性格大数据微静态***,其能够进行自我分析与监督,同时也将成为公共***门分析的数据监控***探索。运行一种性格对应世态的心理性格分析动态方法。
本发明的实施例是这样实现的:
第一方面,本申请实施例提供一种性格对应文化的存储读取干涉方法,其包括获取互联网数据中的合规数据,并根据数据字段类型的内容摘要构建所选合规的特征向量;
利用聚类算法对合规的特征数据聚类,对聚类后的合规的特征向量进行标记;
对标记过的合规数据进行分词处理以获得分词词组,获取分词词组中的多个关键词以形成关键词组,并将关键词组以及与关键词组对应的性格分类条目存储以形成性格分类数据库。
在本发明的一些实施例中,在上述获取互联网数据中的合规数据,并根据数据字段类型的内容摘要构建所选合规的特征向量之前包括:通过大数据分析对互联网数据中的文化书籍、视频、图片、文字、性格形态进行采集、统计、筛选并分析是否为合规数据。
在本发明的一些实施例中,上述还包括:创建用户语句,根据用户使用状态享受对应软件类权益,设置用户数据同步服务并为用户设置数据库权限,其中,数据库权限包括创建数据库连接、执行SQL语句和操作待同步表。
在本发明的一些实施例中,上述利用聚类算法对合规的特征数据聚类,对聚类后的合规的特征向量进行标记包括:根据标记后的特征向量,通过计算合规的特征数据聚类各字段间的互信息熵,得到不同特征向量间的依赖关系,根据阈值选择对其他特征向量影响最大的关键特征向量。
在本发明的一些实施例中,上述对标记过的合规数据进行分词处理以获得分词词组,获取分词词组中的多个关键词以形成关键词组,并将关键词组以及与关键词组对应的性格分类条目存储以形成性格分类数据库包括:捕获数据库的归档日志文件或在线日志文件中的标记过的合规数据,对标记过的合规数据进行解析得到合规数据所属的标签,当标记过的合规数据所属的用户对象不为过滤用户时,将标记过的合规数据转换为统一格式的性格分类条目。
在本发明的一些实施例中,上述还包括:将分类后的性格分类数据库中的原始资源免费运用,将分类后的性格分类数据库中涉及定制成品的相应性格类别按照预设规则运用。
在本发明的一些实施例中,上述还包括:将训练好的分类算法应用于互联网数据分类,对分类结果进行抽样判断,反向优化分类算法,输出所有数据库表数据字段的类别。
第二方面,本申请实施例提供一种性格对应文化的存储读取干涉***,其包括获取模块,用于获取互联网数据中的合规数据,并根据数据字段类型的内容摘要构建所选合规的特征向量;
标记模块,用于利用聚类算法对合规的特征数据聚类,对聚类后的合规的特征向量进行标记;
分类模块,用于对标记过的合规数据进行分词处理以获得分词词组,获取分词词组中的多个关键词以形成关键词组,并将关键词组以及与关键词组对应的性格分类条目存储以形成性格分类数据库。
在本发明的一些实施例中,上述包括:用于存储计算机指令的至少一个存储器;与上述存储器通讯的至少一个处理器,其中当上述至少一个处理器执行上述计算机指令时,上述至少一个处理器使上述***执行:获取模块、标记模块及分类模块。
第三方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如一种性格对应文化的存储读取干涉方法中任一项的方法。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
通过大数据对网络上文化书籍,视频,图片文字,社会人的性格形态这些(人的形态可以理解为性格开朗的人,稳重的人,执着的人)进行采集,统计,筛选,分析。将合规的资料储存在软件上(符合法律法规),定制时需要哪个类型可以方便调取(软件可以对网上信息进行处理按照设定好的进行分类),依据已有资料可以按照个人/情侣/家庭/团队/公司/社团/职业的需要(按照买家客户定制需要给到相应资料,例如:公司需要开朗的人会买跟开朗有关的资料拿回去或者现场安排教导,家庭需要成熟稳重的人那么会出售这方面资料给买家回家或者现场教导)根据买家要求定制所需的人格软件上的采集的原始资源免费运用(繁杂无序的开放资源),但是涉及到定制好成品的相应性格类别要收费(已经分类好的各种资料),使文化便于传承,提高国民素质思想,增加学习效率使人快乐学习,方便应用于社会各个行业岗位,为社会赋能。逆反方向应用于文化传播,其能够使中华文化便于传承,提高国民素质思想,增加学习效率使人快乐思考学习,方便应用于社会各个行业岗位,为社会赋能。此外本发明还提出了一种性格对应文化的存储读取干涉***,对应现实资讯产生的文化数据与思想文化的数据契合,产生应景契合。不仅便于传统文化及国学的传播与学习,更便于诗词歌赋成语俚语的契景传承;不仅利于武术中医药的现实研讨学习,更有益于治世修身的教育;不仅快速传承中华优秀文化,更利于构建文化意识的壁垒。利于人工智能时代机器与人类的数字沟通交流,更是性格心理大数据与文化的应用构成基础。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种性格对应文化的存储读取干涉方法步骤示意图;
图2为本发明实施例提供的一种性格对应文化的存储读取干涉方法详细步骤示意图;
图3为本发明实施例提供的一种性格对应文化的存储读取干涉***模块示意图;
图4为本发明实施例提供的一种电子设备。
图标:10-获取模块;20-标记模块;30-分类模块;101-存储器;102-处理器;103-通信接口。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
实施例1
请参阅图1,图1为本发明实施例提供的一种性格对应文化的存储读取干涉方法步骤示意图,其如下所示:
步骤S100,获取互联网数据中的合规数据,并根据数据字段类型的内容摘要构建所选合规的特征向量;
在一些实施方式中,通过大数据对网络上文化书籍,视频,图片文字,社会人的性格形态这些(人的形态可以理解为性格开朗的人,稳重的人,执着的人)进行采集,统计,筛选,分析。将合规的资料储存在软件上(符合法律法规),定制时需要哪个类型可以方便调取(软件可以对网上信息进行处理按照设定好的进行分类),依据已有资料可以按照个人/情侣/家庭/团队/公司/社团/职业的需要(按照买家客户定制需要给到相应资料,例如:公司需要开朗的人会买跟开朗有关的资料拿回去或者现场安排教导,家庭需要成熟稳重的人那么会出售这方面资料给买家回家或者现场教导)根据买家要求定制所需的人格。
在一些实施方式中,根据互联网数据中的合规数据,进行分层抽样;根据合规数据字段的元数据信息以及合规数据内容的统计特征等,计算合规数据字段的特征向量,主要分为数值型特征提取和字符型特征提取。
步骤S110,利用聚类算法对合规的特征数据聚类,对聚类后的合规的特征向量进行标记;
在一些实施方式中,根据提取的合规数据的特征向量,利用机器学习方法对合规数据进行聚类,进行标记形成训练样本供机器学习算法训练。利用无监督学习的聚类算法(如基于密度的聚类算法),对合规的特征数据的特征向量进行聚类,对聚类中心进行标记(标签体系事先已创建),***自动将标签属性扩展到该聚簇中的其他属性上。
步骤S120,对标记过的合规数据进行分词处理以获得分词词组,获取分词词组中的多个关键词以形成关键词组,并将关键词组以及与关键词组对应的性格分类条目存储以形成性格分类数据库。
在一些实施方式中,对标记过的合规数据的合规数据内容信息进行分词处理以得分词词组;合规数据结构化信息入库后,需要将每一类的合规数据特征抽取出来,并将提取出的特征存入性格分类数据库中,同类合规数据信息是指将同一类合规数据的合规数据名称、内容简介等提取到同一个文件中,分词、筛选,即信息分词部分与通用词、停用词筛选部分,分词部分使用开源***ICTCLAS进行分词处理,预先准备通用词和停用词词库,在分词筛选过程中去除出现在通用词和停用词词库中的信息,最终得到确切的合规数据描述词汇;由于这些通用词与停用词是没有意义的,对于分类并不作出任何的贡献,并且这些词语也占据比较大的概率,故而也需要将这些内容进行删除,进一步减少计算,增加性格分类匹配度。
实施例2
请参阅图2,图2为本发明实施例提供的一种性格对应文化的存储读取干涉方法详细步骤示意图,其如下所示:
步骤S200,通过大数据分析对互联网数据中的文化书籍、视频、图片、文字、性格形态进行采集、统计、筛选并分析是否为合规数据。
步骤S210,创建用户语句,根据用户使用状态享受对应软件类权益,设置用户数据同步服务并为用户设置数据库权限,其中,数据库权限包括创建数据库连接、执行SQL语句和操作待同步表。
步骤S220,根据标记后的特征向量,通过计算合规的特征数据聚类各字段间的互信息熵,得到不同特征向量间的依赖关系,根据阈值选择对其他特征向量影响最大的关键特征向量。
步骤S230,捕获数据库的归档日志文件或在线日志文件中的标记过的合规数据,对标记过的合规数据进行解析得到合规数据所属的标签,当标记过的合规数据所属的用户对象不为过滤用户时,将标记过的合规数据转换为统一格式的性格分类条目。
步骤S240,将分类后的性格分类数据库中的原始资源免费运用,将分类后的性格分类数据库中涉及定制成品的相应性格类别按照预设规则运用。
步骤S250,将训练好的分类算法应用于互联网数据分类,对分类结果进行抽样判断,反向优化分类算法,输出所有数据库表数据字段的类别。
在一些实施方式中,可以翻译各种语言文字,以及解释意思。
在一些实施方式中,通过大数据对网络上文化书籍,视频,图片文字,社会人的性格形态这些(人的形态可以理解为性格开朗的人,稳重的人,执着的人)进行采集,统计,筛选,分析。
在一些实施方式中,将合规的资料储存在软件上(符合法律法规),定制时需要哪个类型可以方便调取(软件可以对网上信息进行处理按照设定好的进行分类),依据已有资料可以按照个人/情侣/家庭/团队/公司/社团/职业的需要(按照买家客户定制需要给到相应资料,例如:公司需要开朗的人会买跟开朗有关的资料拿回去或者现场安排教导,家庭需要成熟稳重的人那么会出售这方面资料给买家回家或者现场教导)根据买家要求定制所需的人格。
在一些实施方式中,软件上的采集的原始资源免费运用(繁杂无序的开放资源),但是涉及到定制好成品的相应性格类别要收费(已经分类好的各种资料)。
在一些实施方式中,每个人可以注册账号并设有密码,根据用户使用状态,享受相应的软件类权益(跟常用软件差不多注册,密码,会员非会员权限不同,调取的资料不同)。
在一些实施方式中,使文化便于传承,提高国民素质思想,增加学习效率使人快乐学习,方便应用于社会各个行业岗位,为社会赋能。起到的作用就是教化人前进先上的积极的思想。
实施例3
请参阅图3,图3为本发明实施例提供的一种性格对应文化的存储读取干涉***模块示意图,其如下所示:
获取模块10,用于获取互联网数据中的合规数据,并根据数据字段类型的内容摘要构建所选合规的特征向量;
标记模块20,用于利用聚类算法对合规的特征数据聚类,对聚类后的合规的特征向量进行标记;
分类模块30,用于对标记过的合规数据进行分词处理以获得分词词组,获取分词词组中的多个关键词以形成关键词组,并将关键词组以及与关键词组对应的性格分类条目存储以形成性格分类数据库。
如图4所示,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器101(Random Access Memory,RAM),只读存储器101(Read Only Memory,ROM),可编程只读存储器101(ProgrammableRead-Only Memory,PROM),可擦除只读存储器101(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器101(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器102,包括中央处理器102(Central Processing Unit,CPU)、网络处理器102(Network Processor,NP)等;还可以是数字信号处理器102(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及***和方法,也可以通过其它的方式实现。以上所描述的方法及***实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
另一方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器101(ROM,Read-Only Memory)、随机存取存储器101(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请实施例提供的一种性格对应文化的存储读取干涉方法及***,通过大数据对网络上文化书籍,视频,图片文字,社会人的性格形态这些(人的形态可以理解为性格开朗的人,稳重的人,执着的人)进行采集,统计,筛选,分析。将合规的资料储存在软件上(符合法律法规),定制时需要哪个类型可以方便调取(软件可以对网上信息进行处理按照设定好的进行分类),依据已有资料可以按照个人/情侣/家庭/团队/公司/社团/职业的需要(按照买家客户定制需要给到相应资料,例如:公司需要开朗的人会买跟开朗有关的资料拿回去或者现场安排教导,家庭需要成熟稳重的人那么会出售这方面资料给买家回家或者现场教导)根据买家要求定制所需的人格软件上的采集的原始资源免费运用(繁杂无序的开放资源),但是涉及到定制好成品的相应性格类别要收费(已经分类好的各种资料),使文化便于传承,提高国民素质思想,增加学习效率使人快乐学习,方便应用于社会各个行业岗位,为社会赋能。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种性格对应文化的存储读取干涉方法,其特征在于,包括:
获取互联网数据中的合规数据,并根据数据字段类型的内容摘要构建所选合规的特征向量;
利用聚类算法对合规的特征数据聚类,对聚类后的合规的特征向量进行标记,从而达到社会标定;
对标记过的合规数据进行分词处理以获得分词词组,获取分词词组中的多个关键词以形成关键词组,并将关键词组以及与关键词组对应的性格分类条目存储以形成性格分类数据库。
2.如权利要求1所述的一种性格对应文化的存储读取干涉方法,其特征在于,在所述获取互联网数据中的合规数据,并根据数据字段类型的内容摘要构建所选合规的特征向量之前包括:
通过大数据分析对互联网数据中的文化书籍、视频、图片、文字、性格形态进行采集、统计、筛选并分析是否为合规数据。
3.如权利要求2所述的一种性格对应文化的存储读取干涉方法,其特征在于,还包括:
创建用户语句,根据用户使用状态享受对应软件类权益,设置用户数据同步服务并为用户设置数据库权限,其中,数据库权限包括创建数据库连接、执行SQL语句和操作待同步表。
4.如权利要求1所述的一种性格对应文化的存储读取干涉方法,其特征在于,所述利用聚类算法对合规的特征数据聚类,对聚类后的合规的特征向量进行标记包括:
根据标记后的特征向量,通过计算合规的特征数据聚类各字段间的互信息熵,得到不同特征向量间的依赖关系,根据阈值选择对其他特征向量影响最大的关键特征向量。
5.如权利要求1所述的一种性格对应文化的存储读取干涉方法,其特征在于,所述对标记过的合规数据进行分词处理以获得分词词组,获取分词词组中的多个关键词以形成关键词组,并将关键词组以及与关键词组对应的性格分类条目存储以形成性格分类数据库包括:
捕获数据库的归档日志文件或在线日志文件中的标记过的合规数据,对标记过的合规数据进行解析得到合规数据所属的标签,当标记过的合规数据所属的用户对象不为过滤用户时,将标记过的合规数据转换为统一格式的性格分类条目。
6.如权利要求5所述的一种性格对应文化的存储读取干涉方法,其特征在于,还包括:
将分类后的性格分类数据库中的原始资源免费运用,将分类后的性格分类数据库中涉及定制成品的相应性格类别按照预设规则运用。
7.如权利要求1所述的一种性格对应文化的存储读取干涉方法,其特征在于,还包括:
将训练好的分类算法应用于互联网数据分类,对分类结果进行抽样判断,反向优化分类算法,输出所有数据库表数据字段的类别。
8.一种性格对应文化的存储读取干涉***,其特征在于,包括:
获取模块,用于获取互联网数据中的合规数据,并根据数据字段类型的内容摘要构建所选合规的特征向量;
标记模块,用于利用聚类算法对合规的特征数据聚类,对聚类后的合规的特征向量进行标记;
分类模块,用于对标记过的合规数据进行分词处理以获得分词词组,获取分词词组中的多个关键词以形成关键词组,并将关键词组以及与关键词组对应的性格分类条目存储以形成性格分类数据库。
9.如权利要求8所述的一种性格对应文化的存储读取干涉***,其特征在于,包括:
用于存储计算机指令的至少一个存储器;
与所述存储器通讯的至少一个处理器,其中当所述至少一个处理器执行所述计算机指令时,所述至少一个处理器使所述***执行:获取模块、标记模块及分类模块。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110810159.XA CN113435199B (zh) | 2021-07-18 | 2021-07-18 | 一种性格对应文化的存储读取干涉方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110810159.XA CN113435199B (zh) | 2021-07-18 | 2021-07-18 | 一种性格对应文化的存储读取干涉方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113435199A true CN113435199A (zh) | 2021-09-24 |
CN113435199B CN113435199B (zh) | 2023-05-26 |
Family
ID=77760712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110810159.XA Active CN113435199B (zh) | 2021-07-18 | 2021-07-18 | 一种性格对应文化的存储读取干涉方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435199B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103838785A (zh) * | 2012-11-27 | 2014-06-04 | 大连灵动科技发展有限公司 | 一种专利领域的垂直搜索引擎 |
US20140337257A1 (en) * | 2013-05-09 | 2014-11-13 | Metavana, Inc. | Hybrid human machine learning system and method |
CN104182465A (zh) * | 2014-07-21 | 2014-12-03 | 安徽华贞信息科技有限公司 | 一种基于网络的大数据处理方法 |
CN105138558A (zh) * | 2015-07-22 | 2015-12-09 | 山东大学 | 基于用户访问内容的实时个性化信息采集方法 |
CN106250513A (zh) * | 2016-08-02 | 2016-12-21 | 西南石油大学 | 一种基于事件建模的事件个性化分类方法及*** |
US20180089193A1 (en) * | 2016-09-26 | 2018-03-29 | SWACK Holdings Inc. | Category-based data analysis system for processing stored data-units and calculating their relevance to a subject domain with exemplary precision, and a computer-implemented method for identifying from a broad range of data sources, social entities that perform the function of Social Influencers |
CN107862069A (zh) * | 2017-11-21 | 2018-03-30 | 广州星耀悦教育科技有限公司 | 一种分类数据库的构建方法以及图书分类的方法 |
CN108073569A (zh) * | 2017-06-21 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 |
CN108268440A (zh) * | 2017-01-04 | 2018-07-10 | 普天信息技术有限公司 | 一种未登录词识别方法 |
CN110110228A (zh) * | 2019-04-22 | 2019-08-09 | 南京工业大学 | 基于互联网与词袋的专业文献智能即时推荐方法及*** |
CN110413780A (zh) * | 2019-07-16 | 2019-11-05 | 合肥工业大学 | 文本情感分析方法、装置、存储介质及电子设备 |
CN111104466A (zh) * | 2019-12-25 | 2020-05-05 | 航天科工网络信息发展有限公司 | 一种海量数据库表快速分类的方法 |
WO2020140632A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 隐含特征提取方法、装置、计算机设备及存储介质 |
CN112214575A (zh) * | 2020-08-18 | 2021-01-12 | 浙江工商大学 | 面向不同社交媒体平台用户活动领域类别划分方法 |
CN112597300A (zh) * | 2020-12-15 | 2021-04-02 | 中国平安人寿保险股份有限公司 | 文本聚类方法、装置、终端设备及存储介质 |
CN112632228A (zh) * | 2020-12-30 | 2021-04-09 | 深圳供电局有限公司 | 一种基于文本挖掘的辅助评标方法及*** |
-
2021
- 2021-07-18 CN CN202110810159.XA patent/CN113435199B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103838785A (zh) * | 2012-11-27 | 2014-06-04 | 大连灵动科技发展有限公司 | 一种专利领域的垂直搜索引擎 |
US20140337257A1 (en) * | 2013-05-09 | 2014-11-13 | Metavana, Inc. | Hybrid human machine learning system and method |
CN104182465A (zh) * | 2014-07-21 | 2014-12-03 | 安徽华贞信息科技有限公司 | 一种基于网络的大数据处理方法 |
CN105138558A (zh) * | 2015-07-22 | 2015-12-09 | 山东大学 | 基于用户访问内容的实时个性化信息采集方法 |
CN106250513A (zh) * | 2016-08-02 | 2016-12-21 | 西南石油大学 | 一种基于事件建模的事件个性化分类方法及*** |
US20180089193A1 (en) * | 2016-09-26 | 2018-03-29 | SWACK Holdings Inc. | Category-based data analysis system for processing stored data-units and calculating their relevance to a subject domain with exemplary precision, and a computer-implemented method for identifying from a broad range of data sources, social entities that perform the function of Social Influencers |
CN108268440A (zh) * | 2017-01-04 | 2018-07-10 | 普天信息技术有限公司 | 一种未登录词识别方法 |
CN108073569A (zh) * | 2017-06-21 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 |
CN107862069A (zh) * | 2017-11-21 | 2018-03-30 | 广州星耀悦教育科技有限公司 | 一种分类数据库的构建方法以及图书分类的方法 |
WO2020140632A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 隐含特征提取方法、装置、计算机设备及存储介质 |
CN110110228A (zh) * | 2019-04-22 | 2019-08-09 | 南京工业大学 | 基于互联网与词袋的专业文献智能即时推荐方法及*** |
CN110413780A (zh) * | 2019-07-16 | 2019-11-05 | 合肥工业大学 | 文本情感分析方法、装置、存储介质及电子设备 |
CN111104466A (zh) * | 2019-12-25 | 2020-05-05 | 航天科工网络信息发展有限公司 | 一种海量数据库表快速分类的方法 |
CN112214575A (zh) * | 2020-08-18 | 2021-01-12 | 浙江工商大学 | 面向不同社交媒体平台用户活动领域类别划分方法 |
CN112597300A (zh) * | 2020-12-15 | 2021-04-02 | 中国平安人寿保险股份有限公司 | 文本聚类方法、装置、终端设备及存储介质 |
CN112632228A (zh) * | 2020-12-30 | 2021-04-09 | 深圳供电局有限公司 | 一种基于文本挖掘的辅助评标方法及*** |
Non-Patent Citations (4)
Title |
---|
MARINAI SIMONE 等: "Artificial neural networks for document analysis and recognition", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
SANDER J. 等: "Density-based clustering in spatial databases: The algorithm gdbscan and its applications", 《DATA MINING AND KNOWLEDGE DISCOVERY》 * |
祝汉城: "用户性格分析与个性化图像美学评价研究", 《中国博士学位论文全文数据库信息科技辑》 * |
郝冰川: "基于语料特征的文本分类算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113435199B (zh) | 2023-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kaushik et al. | A comprehensive study of text mining approach | |
CN109165294B (zh) | 一种基于贝叶斯分类的短文本分类方法 | |
Kumar et al. | Analyzing Twitter sentiments through big data | |
CN112131347A (zh) | 一种基于多模态融合的假新闻检测方法 | |
CN114896305A (zh) | 一种基于大数据技术的智慧互联网安全平台 | |
CN110019820B (zh) | 一种病历中主诉与现病史症状时间一致性检测方法 | |
CN106897437B (zh) | 一种知识***的高阶规则多分类方法及其*** | |
Dellagiacoma et al. | Emotion based classification of natural images | |
CN115017303A (zh) | 基于新闻文本进行企业风险评估的方法、计算设备和介质 | |
CN114443855A (zh) | 一种基于图表示学习的知识图谱跨语言对齐方法 | |
Stewart et al. | Seq2kg: an end-to-end neural model for domain agnostic knowledge graph (not text graph) construction from text | |
Zhang et al. | An intelligent textual corpus big data computing approach for lexicons construction and sentiment classification of public emergency events | |
CN112836067A (zh) | 基于知识图谱的智能搜索方法 | |
CN114817454A (zh) | 一种结合信息量和BERT-BiLSTM-CRF的NLP知识图谱构建方法 | |
Kumari et al. | OSEMN approach for real time data analysis | |
CN112347121B (zh) | 一种可配置的自然语言转sql的方法及*** | |
CN107908749A (zh) | 一种基于搜索引擎的人物检索***及方法 | |
CN116911286A (zh) | 词典构建方法、情感分析方法、装置、设备及存储介质 | |
CN113435199A (zh) | 一种性格对应文化的存储读取干涉方法及*** | |
Cao | Analysis of English teaching based on convolutional neural network and improved random forest algorithm | |
CN112148838B (zh) | 一种业务源对象提取方法与装置 | |
CN115269846A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
CN111930947A (zh) | 一种现代汉语文字作品作者鉴别***和方法 | |
Ho et al. | Uit at vbs 2022: An unified and interactive video retrieval system with temporal search | |
Zhang et al. | Text Semantic Analysis Algorithm Based on LDA Model and Doc2vec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |