CN112395855A - 基于评论的评价方法及装置 - Google Patents

基于评论的评价方法及装置 Download PDF

Info

Publication number
CN112395855A
CN112395855A CN202011394831.3A CN202011394831A CN112395855A CN 112395855 A CN112395855 A CN 112395855A CN 202011394831 A CN202011394831 A CN 202011394831A CN 112395855 A CN112395855 A CN 112395855A
Authority
CN
China
Prior art keywords
data
comment
text
applying
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011394831.3A
Other languages
English (en)
Inventor
陈嘉豪
迟兴军
张恺
林勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202011394831.3A priority Critical patent/CN112395855A/zh
Publication of CN112395855A publication Critical patent/CN112395855A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/12Hotels or restaurants

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种基于评论的评价方法及装置,本实施例提供的基于评论的评价方法,包括:获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;根据第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果。通过本发明实施例提供的基于评论的评价方法,实现精确获知顾客对酒店的针对性评价以有效改善酒店运营、精准提高服务质量。

Description

基于评论的评价方法及装置
技术领域
本发明涉及大数据处理领域,尤其涉及一种基于评论的评价方法及装置。
背景技术
随着互联网的发展以及在线支付技术的普及,越来越多的人习惯通过手机APP、网站等在线方式预订酒店,并在入住酒店后留下自己对该酒店的评价,评价包括文本评论和评分数据,通过这些评价的反馈,酒店获知顾客的关注点,以此改善酒店运营,提高服务质量。
现有技术中对评价的处理,主要是预设点评关键词和对应的评分项,经顾客在线评价后,***后台采集并分析每个关键词的打分得到,这种处理方式的点评关键词很少,比如只给出“卫生”、“环境”、“服务”、“设施”让顾客评分;同时对应的评分项也不多,比如给出“非常满意”、“满意”、“一般”、“不满意”。由于预设的点评关键词和对应的评分项过于简单,精度不足,导致无法精确获知顾客对酒店的针对性评价,从而不能有效改善酒店运营、精准提高服务质量。
因此,如何能够精确获知顾客对酒店的针对性评价以有效改善酒店运营、精准提高服务质量是一个亟待解决的问题。
发明内容
本发明提供一种基于评论的评价方法,实现精确获知顾客对酒店的针对性评价以有效改善酒店运营、精准提高服务质量。
第一方面,本发明提供一种基于评论的评价方法,包括:
获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;
根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;
根据第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;
根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,其中,第一评论数据和第一评分数据对应。
在一种可能的设计中,根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,包括:
根据第一评论数据和第一评分数据,确定所有用户的评论数据和评分数据;
将评论数据和评分数据按预设比例X划分归类为训练数据集和验证数据集,其中,训练数据集包括占比为X的评论数据和对应占比为X的评分数据;验证数据集包括占比为1-X的评论数据和对应占比为1-X的评分数据,X为大于0且小于1的小数;
根据训练数据集,应用决策树回归模型进行训练,确定第一模型参数;
根据验证数据集和第一模型参数,应用决策树回归模型进行参数优化,确定第二模型参数;
根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果。
在一种可能的设计中,根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果,包括:
根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评论数据的重要度;
根据重要度,降序排列评论数据,确定评价结果。
在一种可能的设计中,自然语言处理法包括:移除标点符号、去除分词、去停用词以及词干提取。
在一种可能的设计中,获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据之后,还包括:
建立第一评论文本与第一评分数据之间的第一对应关系;
将第一对应关系存储在服务器的数据库中。
在一种可能的设计中,根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果之前,还包括:
根据第一对应关系、第一评论数据以及第一评分数据,建立第一评论数据与第一评分数据之间的第二对应关系;
将第二对应关系存储在数据库中。
在一种可能的设计中,目标对象为酒店。
第二方面,本发明还提供一种基于评论的评价装置,包括:
获取模块,用于获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;
第一确定模块,用于根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;根据的第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;
第二确定模块,用于根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,其中,第一评论数据和第一评分数据对应。
在一种可能的设计中,第二确定模块,用于:
根据第一评论数据和第一评分数据,确定所有用户的评论数据和评分数据;
将评论数据和评分数据按预设比例X划分归类为训练数据集和验证数据集,其中,训练数据集包括占比为X的评论数据和对应占比为X的评分数据;验证数据集包括占比为1-X的评论数据和对应占比为1-X的评分数据,X为大于0且小于1的小数;
根据训练数据集,应用决策树回归模型进行训练,确定第一模型参数;
根据验证数据集和第一模型参数,应用决策树回归模型进行参数优化,确定第二模型参数;
根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果。
在一种可能的设计中,第二确定模块,具体用于:
根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评论数据的重要度;
根据重要度,降序排列评论数据,确定评价结果。
在一种可能的设计中,自然语言处理法包括:移除标点符号、去除分词、去停用词以及词干提取。
在一种可能的设计中,获取模块,还用于:
建立第一评论文本与第一评分数据之间的第一对应关系;
将第一对应关系存储在服务器的数据库中。
在一种可能的设计中,第二确定模块,还用于:
根据第一对应关系、第一评论数据以及第一评分数据,建立第一评论数据与第一评分数据之间的第二对应关系;
将第二对应关系存储在数据库中。
在一种可能的设计中,目标对象为酒店。
第三方面,本发明还提供一种评价***,包括:
处理器;以及,
存储器,用于存储处理器的可执行指令;
其中,处理器配置为经由执行可执行指令来执行第一方面中任意一种基于评论的评价方法。
第四方面,本发明实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任意一种基于评论的评价方法。
本发明提供一种基于评论的评价方法及装置,通过获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;根据第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,从而实现精确获知顾客对酒店的针对性评价以有效改善酒店运营、精准提高服务质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明根据一示例实施例示出的基于评论的评价方法的应用场景图;
图2为本发明根据一示例实施例示出的基于评论的评价方法的流程示意图;
图3为本发明根据一示例实施例示出的基于评论的评价方法的评论文本和评分数据对应示意图;
图4为本发明根据一示例实施例示出的基于评论的评价方法的评论文本预处理示意图;
图5为本发明根据一示例实施例示出的基于评论的评价方法的数据向量化示意图;
图6为本发明根据一示例实施例示出的基于评论的评价方法的评价结果示意图;
图7为本发明根据一示例实施例示出的基于评论的评价方法中整体流程示意图;
图8为本发明根据一示例实施例示出的基于评论的评价装置的结构示意图;
图9为本发明根据一示例实施例示出的评价***的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面将结合附图,对本发明的实施例进行描述。
图1为本发明根据一示例实施例示出的基于评论的评价方法的应用场景图,如图1所示,包括获取信息101、文本处理102、决策树回归模型103以及评价结果104;具体的,获取信息101包括在***平台上获取评论文本和评分数据,文本处理102包括文本预处理和数据向量化,在获取评论文本和评分数据后,对评论文本应用自然语言处理法进行移除标点符号、分词、去停用词、词干提取在内的预处理,得到预处理后的多个文本,对这些多个文本应用词频逆文本频率算法进行向量化操作,转化为计算机能够识别的、表达文本语义的向量数据;根据向量数据和评分数据,应用决策树回归模型进行训练及验证,得到评价结果。通过这种处理方式,挖掘评论的真实价值,实现精确获知顾客对酒店的针对性评价以有效改善酒店运营、精准提高服务质量。
图2为本发明根据一示例实施例示出的基于评论的评价方法的流程示意图;如图2所示,本实施例提供的基于评论的评价方法,包括:
步骤201、获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;
具体的,举例来说,图3为本发明根据一示例实施例示出的基于评论的评价方法的评论文本和评分数据对应示意图,如图3所示,第一条顾客评论“只有酒店外面的公园很漂亮;我很生气,使我在计划行程时可以在所有可能的网站上发布此帖子,因此没有人会犯错误地预定这个地方”等,这条评论对应的顾客评分为2.9分。
进一步具体的,建立第一评论文本与第一评分数据之间的第一对应关系;将第一对应关系存储在服务器的数据库中。举例来说,如图3所示,第一条顾客评论和对应的顾客评分为2.9分;第二条顾客评论和对应的顾客评分为7.5分;第三条顾客评论和对应的顾客评分为7.1分;第四条顾客评论和对应的顾客评分为3.8分;第五条顾客评论和对应的顾客评分为6.7分;第六条顾客评论和对应的顾客评分为6.7分;将这些顾客评论和对应的顾客评分一一对应,建立对应关系,并存储在服务器的数据库中。
进一步具体的,目标对象为酒店。这里针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据适用的场景包括:1)酒店、商场、博物馆等与人互动的场所;2)产品、服务等体验的效果;本发明实施例以酒店为例,其他情况不再赘述。
步骤202、根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;
具体的,自然语言处理法包括:移除标点符号、去除分词、去停用词以及词干提取;举例来说,图4为本发明根据一示例实施例示出的基于评论的评价方法的评论文本预处理示意图,如图4所示,对图3中的第一条顾客评论应用自然语言处理法进行预处理,确定得到的第二评论文本包括“公园、外部、酒店、漂亮、生气”等词语。
经过步骤201-202的处理得到的第二评论文本已能够完整、准确的体现出顾客评论的全部内容。由于第二评论文本的描述方式是文字的语言方式,为了能够更好地将这种语言方式与顾客评分的数据结合起来进行模型训练时,需要预先对第二评论文本进行转化,将文本数据转化成计算机能识别、表达文本语义的向量数据,具体处理过程如下所述。
步骤203、根据第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;
具体的,应用词频逆文本频率算法对第二评论文本进行向量化操作;图5为本发明根据一示例实施例示出的基于评论的评价方法的数据向量化示意图,如图5所示,对第二评论文本中的每个词语进行向量化处理,得到一串数字形式的向量数据,从而便于与顾客评分数据结合进行模型训练。
步骤204、根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,其中,第一评论数据和第一评分数据对应。
具体的,根据第一评论数据和第一评分数据,确定所有用户的评论数据和评分数据;再将评论数据和评分数据按预设比例X划分归类为训练数据集和验证数据集,其中,训练数据集包括占比为X的评论数据和对应占比为X的评分数据;验证数据集包括占比为1-X的评论数据和对应占比为1-X的评分数据,X为大于0且小于1的小数;
根据训练数据集,应用决策树回归模型进行训练,确定第一模型参数;根据验证数据集和第一模型参数,应用决策树回归模型进行参数优化,确定第二模型参数;根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果。
举例来说,根据上述步骤201-203的方法,将所有用户的评论文本和评分数据转化成评论数据和评分数据的对应;再按照预设的比例X,比如X取值为60%,将所有用户中60%用户的评论数据和评分数据归类为训练数据集;剩下40%用户的评论数据和评分数据归类为验证数据集。对训练数据集应用决策树回归模型进行训练,确定第一模型参数;根据第一模型参数,将验证数据集的评论数据和评分数据输入至决策树回归模型进行验证,同时优化模型参数,确定第二模型参数,其中,将验证数据集在训练后的决策树回归模型中运行时,产生均方误差(Mean Squared Error,MSE),均方误差表示预测值与真实值间差异的均方值,越小越好;通过均方误差验证决策树回归模型的准确性,不断优化参数,并确定最终的第二模型参数。
进一步具体的,根据第一对应关系、第一评论数据以及第一评分数据,建立第一评论数据与第一评分数据之间的第二对应关系;将第二对应关系存储在数据库中。举例来说,所有用户的的评论文本与评分数据间有对应关系,这些对应关系存储在服务器的数据库中;在将所有用户的评论文本转化为评论数据后,为了能准确无误的对应评分数据,需要根据已存储的评论文本与评分数据间的对应关系、评论文本转化后的评论数据以及评分数据建立评论数据和评分数据间的对应关系,并存储在数据库中。
进一步具体的,根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评论数据的重要度;根据重要度,降序排列评论数据,确定评价结果。
举例来说,在确定第二模型参数后,输入所有用户的评论数据、评分数据至决策树回归模型中,得到的评论数据的重要度如图6所示,图6为本发明根据一示例实施例示出的基于评论的评价方法的评价结果示意图,图中根据重要度,降序排列评论数据依次为:脏、粗鲁、员工、小、嘈杂、旧、无等,剔除掉对评价无用的词汇:员工、无、房间,得到对该酒店最为重要的5个评价是:肮脏、粗鲁、小、吵杂、旧。
通过上述步骤201-204的方法处理得到的顾客对酒店的评价结果,图7为本发明根据一示例实施例示出的基于评论的评价方法中整体流程示意图,如图7所示,通过上述处理方法得到的评价结果能够真实地体现评论的价值,精确获知顾客对酒店的针对性关注点以有效改善酒店运营、精准提高服务质量。
图8为本发明根据一示例实施例示出的基于评论的评价装置的结构示意图。如图8所示,本实施例提供的基于评论的评价装置80,包括:
获取模块801,用于获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;
第一确定模块802,用于根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;根据的第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;
第二确定模块803,用于根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,其中,第一评论数据和第一评分数据对应。
在一种可能的设计中,第二确定模块803,用于:
根据第一评论数据和第一评分数据,确定所有用户的评论数据和评分数据;
将评论数据和评分数据按预设比例X划分归类为训练数据集和验证数据集,其中,训练数据集包括占比为X的评论数据和对应占比为X的评分数据;验证数据集包括占比为1-X的评论数据和对应占比为1-X的评分数据,X为大于0且小于1的小数;
根据训练数据集,应用决策树回归模型进行训练,确定第一模型参数;
根据验证数据集和第一模型参数,应用决策树回归模型进行参数优化,确定第二模型参数;
根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果。
在一种可能的设计中,第二确定模块803,具体用于:
根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评论数据的重要度;
根据重要度,降序排列评论数据,确定评价结果。
在一种可能的设计中,自然语言处理法包括:移除标点符号、去除分词、去停用词以及词干提取。
在一种可能的设计中,获取模块801,还用于:
建立第一评论文本与第一评分数据之间的第一对应关系;
将第一对应关系存储在服务器的数据库中。
在一种可能的设计中,第二确定模块802,还用于:
根据第一对应关系、第一评论数据以及第一评分数据,建立第一评论数据与第一评分数据之间的第二对应关系;
将第二对应关系存储在数据库中。
在一种可能的设计中,目标对象为酒店。
图9为本发明根据一示例实施例示出的评价***的结构示意图。如图9所示,本实施例提供的一种评价***90,包括:
处理器901;以及,
存储器902,用于存储处理器的可执行指令,该存储器还可以是flash(闪存);
其中,处理器901配置为经由执行可执行指令来执行上述方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。
可选地,存储器902既可以是独立的,也可以跟处理器901集成在一起。
当存储器902是独立于处理器901之外的器件时,数据库90,还可以包括:
总线903,用于连接处理器901以及存储器902。
此外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当用户设备的至少一个处理器执行该计算机执行指令时,用户设备执行上述各种可能的方法。
其中,计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种基于评论的评价方法,其特征在于,包括:
获取用户针对目标对象发布的第一评论文本以及与所述第一评论文本对应的第一评分数据;
根据所述第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;
根据所述第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;
根据所述第一评论数据和所述第一评分数据,应用决策树回归模型,确定评价结果,其中,所述第一评论数据和所述第一评分数据对应。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一评论数据和所述第一评分数据,应用决策树回归模型,确定评价结果,包括:
根据所述第一评论数据和所述第一评分数据,确定所有用户的评论数据和评分数据;
将所述评论数据和所述评分数据按预设比例X划分归类为训练数据集和验证数据集,其中,所述训练数据集包括占比为X的评论数据和对应占比为X的评分数据;所述验证数据集包括占比为1-X的评论数据和对应占比为1-X的评分数据,X为大于0且小于1的小数;
根据所述训练数据集,应用所述决策树回归模型进行训练,确定第一模型参数;
根据所述验证数据集和所述第一模型参数,应用所述决策树回归模型进行参数优化,确定第二模型参数;
根据所述评论数据、所述评分数据以及所述第二模型参数,应用所述决策树回归模型,确定所述评价结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述评论数据、所述评分数据以及所述第二模型参数,应用所述决策树回归模型,确定所述评价结果,包括:
根据所述评论数据、所述评分数据以及所述第二模型参数,应用所述决策树回归模型,确定评论数据的重要度;
根据所述重要度,降序排列所述评论数据,确定所述评价结果。
4.根据权利要求1所述的方法,其特征在于,所述自然语言处理法包括:移除标点符号、去除分词、去停用词以及词干提取。
5.根据权利要求1所述的方法,其特征在于,所述获取用户针对目标对象发布的第一评论文本以及与所述第一评论文本对应的第一评分数据之后,还包括:
建立所述第一评论文本与所述第一评分数据之间的第一对应关系;
将所述第一对应关系存储在服务器的数据库中。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一评论数据和所述第一评分数据,应用决策树回归模型,确定评价结果之前,还包括:
根据所述第一对应关系、所述第一评论数据以及所述第一评分数据,建立所述第一评论数据与所述第一评分数据之间的第二对应关系;
将所述第二对应关系存储在所述数据库中。
7.根据权利要求1-6中任意一项所述的方法,其特征在于,所述目标对象为酒店。
8.一种基于评论的评价装置,其特征在于,包括:
获取模块,用于获取用户针对目标对象发布的第一评论文本以及与所述第一评论文本对应的第一评分数据;
第一确定模块,用于根据所述第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;根据所述的第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;
第二确定模块,用于根据所述第一评论数据和所述第一评分数据,应用决策树回归模型,确定评价结果,其中,所述第一评论数据和所述第一评分数据对应。
9.一种评价***,其特征在于,包括:
处理器;以及,
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任一项所述基于评论的评价方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7中任一项所述基于评论的评价方法。
CN202011394831.3A 2020-12-03 2020-12-03 基于评论的评价方法及装置 Pending CN112395855A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011394831.3A CN112395855A (zh) 2020-12-03 2020-12-03 基于评论的评价方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011394831.3A CN112395855A (zh) 2020-12-03 2020-12-03 基于评论的评价方法及装置

Publications (1)

Publication Number Publication Date
CN112395855A true CN112395855A (zh) 2021-02-23

Family

ID=74605026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011394831.3A Pending CN112395855A (zh) 2020-12-03 2020-12-03 基于评论的评价方法及装置

Country Status (1)

Country Link
CN (1) CN112395855A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094855A (zh) * 2023-08-24 2023-11-21 哈尔滨工业大学 基于酒店服务语言的非本土语言顾客满意度的预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090127A (zh) * 2017-11-15 2018-05-29 北京百度网讯科技有限公司 建立问答文本评价模型与评价问答文本的方法、装置
CN109829155A (zh) * 2019-01-18 2019-05-31 平安科技(深圳)有限公司 关键词的确定方法、自动评分方法、装置、设备及介质
CN109977225A (zh) * 2019-03-13 2019-07-05 咪咕文化科技有限公司 舆情分析方法及装置
CN110119770A (zh) * 2019-04-28 2019-08-13 平安科技(深圳)有限公司 决策树模型构建方法、装置、电子设备及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090127A (zh) * 2017-11-15 2018-05-29 北京百度网讯科技有限公司 建立问答文本评价模型与评价问答文本的方法、装置
CN109829155A (zh) * 2019-01-18 2019-05-31 平安科技(深圳)有限公司 关键词的确定方法、自动评分方法、装置、设备及介质
CN109977225A (zh) * 2019-03-13 2019-07-05 咪咕文化科技有限公司 舆情分析方法及装置
CN110119770A (zh) * 2019-04-28 2019-08-13 平安科技(深圳)有限公司 决策树模型构建方法、装置、电子设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094855A (zh) * 2023-08-24 2023-11-21 哈尔滨工业大学 基于酒店服务语言的非本土语言顾客满意度的预测方法

Similar Documents

Publication Publication Date Title
CN109522556B (zh) 一种意图识别方法及装置
CN108304526B (zh) 一种数据处理方法、装置及服务器
CN108108426B (zh) 自然语言提问的理解方法、装置及电子设备
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
CN114722839B (zh) 人机协同对话交互***及方法
CN112163553B (zh) 物料价格核算方法、装置、存储介质和计算机设备
CN113283238B (zh) 文本数据处理的方法和装置、电子设备和存储介质
CN112416778A (zh) 测试用例推荐方法、装置和电子设备
CN111368066B (zh) 获取对话摘要的方法、装置和计算机可读存储介质
CN107291775A (zh) 错误样本的修复语料生成方法和装置
CN111309887A (zh) 一种训练文本关键内容提取模型的方法和***
CN114783421A (zh) 智能推荐方法和装置、设备、介质
CN111324698A (zh) 深度学习方法、评价观点提取方法、装置和***
CN114037545A (zh) 客户推荐方法、装置、设备及存储介质
JP6757840B2 (ja) 文抽出システム、文抽出方法、及びプログラム
CN110968664A (zh) 一种文书检索方法、装置、设备及介质
CN108984777B (zh) 客户服务方法、装置和计算机可读存储介质
CN112395855A (zh) 基于评论的评价方法及装置
CN109241993B (zh) 融合用户和整体评价信息的评价对象情感分类方法及装置
CN103886869A (zh) 一种基于语音情感识别的信息反馈方法和***
CN116842263A (zh) 一种智能问答式理财顾问模型的训练处理方法及装置
CN114141236B (zh) 语言模型更新方法、装置、电子设备及存储介质
CN112328812B (zh) 基于自调参数的领域知识抽取方法与***、电子设备
CN115525161A (zh) 词条获取方法、装置及电子设备
KR20160015858A (ko) 레스토랑 추천 시스템 및 추천 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210223

RJ01 Rejection of invention patent application after publication