发明内容
本发明所要解决的技术问题是:评论互动的投放针对性较低,用户在进行浏览时需要从大量信息中进行收集过滤才能获取有针对性的信息,使得效率较低。对于网络平台点评的显示和推送的互动手段还是缺乏合理的针对性,无法满足用户在短时间内迅速获得对应信息的需求。
本发明解决其技术问题所采取的技术方案是:
一种通过文化云平台进行互动的方法,该流程方法包括:
S01通过文化云网络平台进行评论信息的数据采集,其中数据采集包括以下内容:评论文本信息以及评论用户的个人信息,并且将评论文本信息和评论用户个人信息形成关联,在数据采集时不仅采集评论信息本身的文本信息,还要提取评论者的相关个人资料的信息;以便在计算评论排序的过程中计算评论者的身份信息参数;
S02通过文本检测模块,检测评论文的复杂程度,
即在提取的文本信息之后,文本检测模块对该文本信息的长度、字符标点比例、字段重复比例以及是否出现特定垃圾字段方面,对文本进行数据分析。
具体的分析流程是:
(1)通过len(R)函数,确定文本信息的长度,并记录长度函数len(R);
(2)提取评论文本中的中文文字的个数Char(R)以及评论文本中的标点的个数M(R),并计算字符标点的比例Rat(R)=M(R)/Char(R);
(3)通过文本识别方法识别评论文本中重复三次以上的中文字符的长度占总文本长度的百分比lev(R);
(4)通过文本搜索的方法,在评论文本中自动搜索该评论文本中是否包含垃圾字段库中的字段,并将搜索结果的字段数的值赋于函数not(R);
(5)通过复杂度函数C(R)=n1×len(R)/(n2×Rat(R)+n3×lev(R)+n4×not(R)),其中n1,n2,n3,n4取值为大于0且小于1,且n1+n2+n3+n4=1;n1,n2,n3,n4可以视所需要的权重来调整;
S03通过评论文本与评论者的对应关系,获得评论用户个人信息数据,个人信息数据包括:性别、年龄、学历、地域;并且建立与各评论文本对应的用户个人信息数据表。
S04评论查看注册用户登录后,进行评论查看时,会通过注册的个人信息生成目标匹配信息数据表,该目标匹配信息数据表的格式与个人信息数据对应,也包括:性别、年龄、学历。
S05在生成评论信息排序时,通过查表来比较目标匹配信息数据表和评论用户个人信息数据表生成个人信息差异化参数。
其中,对于性别参数G,区别赋值为1,相同赋值为0;
对于年龄参数A,每相差5年,原始值为0,年龄差异值赋值增加0.5;
对于学历参数E,原始值为0,学历每相差一个等级,学历参数赋值增加0.2;
个人信息化差异参数info(R)=a1×G+a2×A+a3×E;
S06通过综合复杂度参数和个人信息化差异参数进行评论内容排名;采用优先升序排列个人信息化差异参数的基础上进一步降序复杂度函数进行排列;或者通过个人信息化差异参数和复杂度函数进行拟合进行排列。
进一步地,该方法进一步包括通过自动化语义分析的方式进行语义标签的添加。
进一步地,该方法进一步包括综合排序中进一步结合其他用户浏览评论时给出的累积推荐数量进行排序。
进一步地,采用优先升序排列个人信息化差异参数的基础上进一步降序复杂度函数进行排列,并且进一步以其他用户浏览评论时给出的累积推荐数量进行降序排序;也可以通过个人信息化差异参数、复杂度函数进行、其他用户浏览评论时给出的累积推荐数量同时拟合后来进行排列。
一种实现通过文化云平台进行互动的方法的装置,该装置包括评论信息获取模块、复杂度计算模块、个人信息差异计算模块以及排序显示模块。
进一步地,其中,评论信息获取模块用于数据采集评论文本信息以及评论用户的个人信息,并且将评论文本信息和评论用户个人信息形成关联;
复杂度计算模块,在提取的文本信息之后,文本检测模块对该文本信息的长度、字符标点比例、字段重复比例以及是否出现特定垃圾字段几个方面,对文本进行数据分析;
个人信息差异计算模块,用于通过评论文本与评论者的对应关系,获得评论用户个人信息数据,个人信息数据包括:性别、年龄、学历、地域,并且建立与各评论文本对应的用户个人信息数据表;
排序显示模块,用于通过综合复杂度参数和个人信息化差异参数进行评论内容排名,采用优先升序排列个人信息化差异参数的基础上进一步降序复杂度函数进行排列;也通过个人信息化差异参数和复杂度函数进行同时拟合后来进行排列。
本发明同时兼顾了互动中评论质量以及评论用户所属种类不同,带来地不同的了解需求,解决了网络平台互动中评论内容庞杂无法自动实现最贴近用户需求的排序的问题。提高了用户浏览评论的用户体验感。
具体实施方式
以下将对本发明的一种通过文化云平台进行互动的方法及装置做进一步的详细描述。
下面将参照附图对本发明进行更详细的描述,其中表示了本发明的优选实施例,应该理解本领域技术人员可以修改在此描述的本发明而仍然实现本发明的有益效果。因此,下列描述应当被理解为对于本领域技术人员的广泛知道,而并不作为对本发明的限制。
为了清楚,不描述实际实施例的全部特征。在下列描述中,不详细描述公知的功能和结构,因为它们会使本发明由于不必要的细节而混乱。应当认为在任何实际实施例的开发中,必须作出大量实施细节以实现开发者的特定目标。
为使本发明的目的、特征更明显易懂,下面结合附图对本发明的具体实施方式作进一步的说明。需要说明的是,附图均采用非常简化的形式且均使用非精准的比率,仅用一方便、清晰地辅助说明本发明实施例的目的。
图1展示了本实施例中一种通过文化云平台进行互动的方法的流程图。
该流程方法包括:
S01通过文化云网络平台进行评论信息的数据采集,其中数据采集包括以下内容:评论文本信息以及评论用户的个人信息,并且将评论文本信息和评论用户个人信息形成关联。
文化云平台上的注册用户在注册过程中会添加个人资料,包括:性别、年龄、学历、地域等等个人信息。为了提高评论排序对特定人群的针对性,因此,在数据采集时不仅采集评论信息本身的文本信息,还要提取评论者的相关个人资料的信息;以便在计算评论排序的过程中计算评论者的身份信息参数。
S02通过文本检测模块,检测评论文的复杂程度。
在提取的文本信息之后,文本检测模块对该文本信息的长度、字符标点比例、字段重复比例以及是否出现特定垃圾字段几个方面,对文本进行数据分析。
具体的分析流程可以是:
(1)通过len(R)函数,确定文本信息的长度,并记录长度函数len(R);
(2)提取评论文本中的中文文字的个数Char(R)以及评论文本中的标点的个数M(R),并计算字符标点的比例Rat(R)=M(R)/Char(R);
(3)通过文本识别方法识别评论文本中重复三次以上的中文字符的长度占总文本长度的百分比lev(R),例如:评论文本为“今天的演出非常好,非常好,非常好!”,即lev(R)=3/14;
(4)通过文本搜索的方法,在评论文本中自动搜索该评论文本中是否包含垃圾字段库中的字段,并将搜索结果的字段数的值赋于函数not(R)。其中,垃圾字段为自定义的不具有实质含义的中英文字符,如无法识别含义的字符、非文明用语等。
(5)通过复杂度函数C(R)=n1×len(R)/(n2×Rat(R)+n3×lev(R)+n4×not(R)),其中n1,n2,n3,n4取值为大于0且小于1,且n1+n2+n3+n4=1;n1,n2,n3,n4可以视所需要的权重来调整。优选的实施例为n1=0.2,,n2=0.4,n3=0.1,n4=0.3。
S03通过评论文本与评论者的对应关系,获得评论用户个人信息数据,个人信息数据包括:性别、年龄、学历、地域等等。并且建立与各评论文本对应的用户个人信息数据表。
S04评论查看注册用户登录后,进行评论查看时,会通过注册的个人信息生成目标匹配信息数据表。该目标匹配信息数据表的格式与个人信息数据对应,也包括:性别、年龄、学历。
S05在生成评论信息排序时,生成个人信息差异化参数。
具体地说,在生成评论信息时通过查表来比较目标匹配信息数据表和评论用户个人信息数据表的个人信息差异化参数。
其中,对于性别参数G,区别赋值为1,相同赋值为0;
对于年龄参数A,每相差5年,年龄差异值赋值增加0.5;
对于学历参数E,学历每相差一个等级,学历参数赋值增加0.2。
个人信息化差异参数info(R)=a1×G+a2×A+a3×E。
S06通过综合复杂度参数和个人信息化差异参数进行评论内容排名。可以采用优先升序排列个人信息化差异参数的基础上进一步降序复杂度函数进行排列;也可以通过个人信息化差异参数和复杂度函数进行同时拟合后来进行排列,可以采用现有技术中常见的拟合方式,例如线形拟合等。
优选的,可以通过自动化语义分析的方式进行语义标签的添加。
优选的,综合排序中也可以进一步结合其他用户浏览评论时给出的累积推荐数量进行排序。可以采用优先升序排列个人信息化差异参数的基础上进一步降序复杂度函数进行排列,并且进一步以其他用户浏览评论时给出的累积推荐数量进行降序排序;也可以通过个人信息化差异参数、复杂度函数进行、其他用户浏览评论时给出的累积推荐数量同时拟合后来进行排列,可以采用现有技术中常见的拟合方式,例如线形拟合等。
通过上述方法,同时兼顾了互动中评论质量以及评论用户所属种类不同,带来地不同的了解需求,解决了网络平台互动中评论内容庞杂无法自动实现最贴近用户需求的排序的问题。提高了用户浏览评论的用户体验感。
本发明还提供了一种实现通过文化云平台进行互动的方法的装置,具体如下。
该装置包括评论信息获取模块、复杂度计算模块、个人信息差异计算模块以及排序显示模块。
其中,评论信息获取模块用于数据采集评论文本信息以及评论用户的个人信息,并且将评论文本信息和评论用户个人信息形成关联。
文化云平台上的注册用户在注册过程中会添加个人资料,包括:性别、年龄、学历、地域等等个人信息。为了提高评论排序对特定人群的针对性,因此,在数据采集时不仅采集评论信息本身的文本信息,还要提取评论者的相关个人资料的信息;以便在计算评论排序的过程中计算评论者的身份信息参数。
复杂度计算模块,在提取的文本信息之后,文本检测模块对该文本信息的长度、字符标点比例、字段重复比例以及是否出现特定垃圾字段几个方面,对文本进行数据分析。
个人信息差异计算模块,用于通过评论文本与评论者的对应关系,获得评论用户个人信息数据,个人信息数据包括:性别、年龄、学历、地域等等。并且建立与各评论文本对应的用户个人信息数据表。
排序显示模块,用于通过综合复杂度参数和个人信息化差异参数进行评论内容排名。可以采用优先升序排列个人信息化差异参数的基础上进一步降序复杂度函数进行排列;也可以通过个人信息化差异参数和复杂度函数进行同时拟合后来进行排列。
图2展示了文化云平台的整体架构,如图所示,文化云***分为四层,即:用户层,用户通过从浏览器进入访问该用户层,用户层作为客户端程序,用来与用户交互,并能把自***的信息显示给用户,***的用户采用的是IE等浏览器作为交互工具;表示层,表示层主要控制页面外观,产生页面逻辑以及对用户数据的数据进行合法性验证。***中主要基于Html以及Jquery脚本来实现页面的展示;业务层,业务层处理应用的核心业务逻辑。业务逻辑对象BLO(Business Logic Object)把业务规则、约束、活动和数据结合在一起,Spring负责对这些业务对象的管理;数据访问层,数据访问对象(Data Access Object)把底层的数据访问操作和上层的商务逻辑分开。通过数据传输对象(Data Transfer Object)作为各业务实体的JAVABEAN对象,负责层与层之间的数据的传输。
采用四层架构的优势:通过成熟的开源产品实现各层,同自己编写代码实现,相比之下能缩短开发周期,且架构所用到的开源产品均有很广泛的用户群,经受过实践的考验,质量和性能更有保障;层与层成之间松散耦合,增加代码重用率;各层分工明确,这样也利于团队的明确分工。
以上显示和描述了本发明的基本原理、主要特征和优点,因此以上所述仅为本发明的实施例。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下,本发明还包括各种等效变化和改进,这些变化和改进都将落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其效物界定。