CN107729317B - 评价标签的确定方法、装置及服务器 - Google Patents
评价标签的确定方法、装置及服务器 Download PDFInfo
- Publication number
- CN107729317B CN107729317B CN201710951941.7A CN201710951941A CN107729317B CN 107729317 B CN107729317 B CN 107729317B CN 201710951941 A CN201710951941 A CN 201710951941A CN 107729317 B CN107729317 B CN 107729317B
- Authority
- CN
- China
- Prior art keywords
- evaluation
- piece
- clause
- determining
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
Abstract
本申请提供一种评价标签的确定方法、装置及服务器,其中方法包括:基于评价目标对应的评价信息集,确定所述评价目标对应的标签库;针对所述评价信息集中的每一条评价信息,确定所述每一条评价信息所包含的子句;根据所述标签库中的标签,确定所述每一条评价信息所包含的子句对应的评价标签;基于所述每一条评价信息所包含的子句对应的评价标签,确定所述每一条评价信息对应的评价标签。本申请提供的技术方案可以将每一条评论信息中所包含的子句标注上合适的评价标签;并避免其他评价目标的评价标签对评论信息产生干扰,提高为评论信息标注评价标签的准确性。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种评价标签的确定方法、装置及服务器。
背景技术
网络购物的日益普及,网上购物已经融入到消费者的日常生活中。消费者通过网络选购其需要的商品。而在选购商品时,消费者通常会参考该商品的评价信息,由此来确定是否需要购买该商品。
当针对一件商品的评价信息量较大时,通常会挖掘出该商品对应的评价标签,由于评价标签基本上能够代表该商品的特征,因此消费者可以根据评价标签衡量该商品是否符合其需求。发明人发现,现有技术尚不能对一条评价信息中包含的子句标注合适的评价标签。
发明内容
有鉴于此,本申请提供一种评价标签的确定方法、装置及服务器,可以为评价信息中包含的子句标注合适的评价标签。
为实现上述目的,本申请提供技术方案如下:
根据本申请的第一方面,提出了一种评价标签的确定方法,包括:
基于评价目标对应的评价信息集,确定所述评价目标对应的标签库;
针对所述评价信息集中的每一条评价信息,确定所述每一条评价信息所包含的子句;
根据所述标签库中的标签,确定所述每一条评价信息所包含的子句对应的评价标签;
基于所述每一条评价信息所包含的子句对应的评价标签,确定所述每一条评价信息对应的评价标签。
根据本申请的第二方面,提出了一种评价标签的确定装置,包括:
第一确定模块,用于基于评价目标对应的评价信息集,确定所述评价目标对应的标签库;
第二确定模块,用于针对所述评价信息集中的每一条评价信息,确定所述每一条评价信息所包含的子句;
第三确定模块,用于根据所述第一确定模块确定的所述标签库中的标签,确定所述第二确定模块确定的所述每一条评价信息所包含的子句对应的评价标签;
第四确定模块,用于基于所述第三确定模块确定的所述每一条评价信息所包含的子句对应的评价标签,确定所述每一条评价信息对应的评价标签。
根据本申请的第三方面,提出了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述第一方面提出的评价标签的确定方法。
根据本申请的第四方面,提出了一种服务器,所述服务器包括:
处理器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器,用于执行上述第一方面提出的评价标签的确定方法。
由以上技术方案可见,本申请通过评价目标对应的标签库确定每一条评价信息所包含的子句对应的评价标签,进而确定每一条评价信息对应的评价标签,由此可以将每一条评论信息中所包含的子句标注上合适的评价标签;由于标签库中的标签是基于评价目标已有的评论信息集得到的,因此可以避免其他评价目标的评价标签对评论信息产生干扰,提高标注评价标签的准确性。
附图说明
图1是本申请一示例性实施例示出的评价标签的确定方法的流程图。
图2是本申请另一示例性实施例示出的评价标签的确定方法的流程图。
图3是本申请再一示例性实施例示出的评价标签的确定方法的流程图。
图4是本申请又一示例性实施例示出的评价标签的确定方法的流程图。
图5是本申请又一示例性实施例示出的评价标签的确定方法的流程图。
图6是本申请一示例性实施例示出的服务器的结构图。
图7是本申请一示例性实施例示出的评价标签的确定装置的结构图。
图8是本申请另一示例性实施例示出的评价标签的确定装置的结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
图1是本申请一示例性实施例示出的评价标签的确定方法的流程图;本实施例可以应用在服务器上,如图1所示,包括如下步骤:
步骤101,基于评价目标对应的评价信息集,确定评价目标对应的标签库。
在一实施例中,评价目标可以为电商平台上注册的商户,例如,外卖平台上注册的商户ABC,商户ABC通过外卖平台为用户提供餐饮类的商品。在一实施例中,评价信息集可以为多条评价信息的集合,每一条评价信息可以为用户对订单的具体评价内容,例如,用户在商户ABC下了一个订单,购买了三件商品,则针对该订单,用户可以通过一条评价信息评价该三件商品中的部分商品或者全部商品。
在一实施例中,可以通过对评价目标对应的评价信息集中的每一条评价信息进行分词,得到至少一个评价对象和/或至少一个评价词,对至少一个评价对象和/或至少一个评价词进行标签挖掘,得到评价目标对应的标签库。通过标签挖掘,可以使标签库中既包含结构化标签也包含非结构化标签;对于结构化标签,通常包含评价对象和评价词,例如,“味道不错”、“味道好”、“味道赞”,其中,“味道”为评价对象,“不错”、“好”、“赞”为评价词。对于非结构化标签,句法结构不完整,例如,只有动词或者名词,例如,“推荐”、“喜欢”、“回头客”等等。
在一实施例中,可以通过语言技术平台(Language Technology Platform,简称为LTP)对每一条评价信息进行句法分析,得到多种标签形式,例如,名词+形容词、名词+动词、形容词+名词、动词+形容词、名词、形容词等标签形式,再通过词对齐模型从上述多种标签形式中挖掘出“名词+形容词”以及“形容词+名词”的标签形式,之后,通过词对齐模型将LTP得到的“名词+形容词”以及“形容词+名词”对齐,并将词对齐模型对齐后得到的结果与经过LTP进行句法分析后得到的其他词性的标签(例如,名词+动词、动词+形容词、名词、形容词)一起加入标签库,从而得到评价目标对应的标签库。在一实施例中,该标签库可以包含评价目标的全部评价标签,例如,针对商户ABC,有1000个用户对各自所下订单进行了评价,则有1000条评价信息,通过对这1000条评价信息中的每一条评价信息进行分词,得到50个评价对象和100个评价词,通过词对齐模型对这50个评价对象和100个评价词进行标签挖掘,得到商户ABC对应的50个标签,这50个标签即可视为本申请中的标签库。通过LTP+词对齐模型,可以确保从评论信息集中召回的标签包括名词+形容词组合、名词+动词、单纯的名词等标签形式,并确保标签召回的充分性。
步骤102,针对评价信息集中的每一条评价信息,确定每一条评价信息所包含的子句。
在一实施例中,可以通过识别每一条评价信息的标点符号,确定每一条评价信息所包含的子句,例如,评价信息为“外卖大哥好评,菜肴可口,蒜蓉西兰花做的不错”,通过识别出标点符号,即可得到该条评价信息包含的子句为“外卖大哥好评”,“菜肴可口”,“蒜蓉西兰花做的不错”。
步骤103,根据标签库中的标签,确定每一条评价信息所包含的子句对应的评价标签。
在一实施例中,可以将标签库中的标签与每一条评价信息所包含的子句中的词进行匹配,通过标签库的标签以及子句中的词确定每一条评价信息所包含的子句对应的评价标签。进一步地,对于标签库中的一个标签,可以包括评价对象和评价词,也可以只包括评价对象或者评价词中的一个,因此可以将标签库中的标签的评价对象和评价词,分别与子句中的词进行匹配,通过匹配结果确定每一条评价信息所包含的子句对应的评价标签。
步骤104,基于每一条评价信息所包含的子句对应的评价标签,确定每一条评价信息对应的评价标签。
在一实施例中,可以将每一条评论信息所包含的子句对应的评价标签进行合并,得到每一条评价信息对应的评价标签,例如,评价信息“外卖大哥好评,口水鸡味道不错,蒜蓉西兰花做的很棒”,对于子句“外卖大哥好评”,评价标签为“外卖大哥好”,对于子句“口水鸡味道不错”,评价标签为“口水鸡不错”,对于子句“蒜蓉西兰花做的很棒”,评价标签为“蒜蓉西兰花很棒”,则该条评价信息对应的标签包括:“外卖大哥好”、“口水鸡不错”、“蒜蓉西兰花很棒”。
本实施例中,通过评价目标对应的标签库确定每一条评价信息所包含的子句对应的评价标签,进而确定每一条评价信息对应的评价标签,由此可以将每一条评论信息中所包含的子句标注上合适的评价标签;由于标签库中的标签是基于评价目标已有的评论信息集得到的,因此可以避免其他评价目标的评价标签对评论信息产生干扰,提高了为评论信息标注评价标签的准确性。
在上述图1所示实施例的基础上,在确定每一条评价信息对应的评价标签后,还可以通过每一条评价信息对应的评价标签,统计出该评价目标对应的综合标签,通过综合标签准确表示评价目标提供的商品属性,供用户参考。
图2是本申请另一示例性实施例示出的评价标签的确定方法的流程图;本实施例在上述实施例的基础上,以如何根据标签库中的标签确定每一条评价信息所包含的子句对应的评价标签为例进行示例性说明,如图2所示,包括如下步骤:
步骤201,基于评价目标对应的评价信息集,确定评价目标对应的标签库。
步骤202,针对评价信息集中的每一条评价信息,确定每一条评价信息所包含的子句。
步骤201和步骤202的描述可以参见上述图1所示实施例的描述,在此不再详述。
步骤203,确定标签库中的标签类型,若标签库中的标签为结构化标签,执行步骤204,若标签库中的标签为非结构化标签,执行步骤206。
在一实施例中,标签库所包含的结构化标签以及非结构化标签的描述可以参见上述图1所示实施例中的描述,在此不再详述。在一实施例中,可以基于评价标签的句法结构,来确定标签库中的标签类型是结构化标签还是非结构化标签。
步骤204,根据标签库中的结构化标签,确定每一条评价信息所包含的子句中的评价对象和评价词。
在一实施例中,可以先确定标签库中的结构化标签的评价对象和评价词,将结构化标签的评价对象与每一条评价信息所包含的子句中的词进行匹配,得到每一条评价信息所包含的子句中的评价对象,之后,再将结构化标签的评价词与每一条评价信息所包含的子句中的词进行匹配,得到每一条评价信息所包含的子句中的评价词。例如,结构化标签为“味道不错”,结构化标签的评价对象为“味道”,评价词为“不错”,子句为“厨师做出来的味道不错”,经过分词之后,得到的词为:“厨师”、“做”、“出来”、“的”、“味道”、“不错”,通过将评价对象“味道”与上述词一一匹配,得出子句中的评价对象为“味道”,之后,再将评价词“不错”与上述词一一匹配,得到子句中的评价词为“不错”。
步骤205,基于每一条评价信息所包含的子句中的评价对象和评价词,确定所述子句对应的评价标签。
在一实施例中,对于只包含一个评价对象和评价词的子句,可以对评价对象和评价词直接进行组合,得到该子句对应的评价标签。在另一实施例中,若一个子句中包含两个以上的评价对象和两个以上的评价词,则需要基于评价对象和评价词在子句中的位置,确定子句对应的评价标签,例如,子句“小炒肉不错商家态度好”,通过上述步骤204,得到评价对象为“小炒肉”和“态度”,评价词为“不错”和“好”,则可以基于“小炒肉”和“态度”以及“不错”和“好”,可以基于评价对象和评价词在子句中的位置,确保评价词不跨评论对象原则,从而可以将“小炒肉”与“不错”组合成评价标签“小炒肉不错”,将“态度”和“好”组合成评价标签“态度好”,该子句对应的评价标签为“小炒肉不错”、“态度好”。
步骤206,根据标签库中的非结构化标签,确定每一条评价信息所包含的子句中的关键词。
在一实施例中,同样可以将每一条评价信息所包含的子句进行分词,将非结构化标签与分词后的词进行一一匹配,得到每一条评价信息所包含的子句中的关键词。例如,子句为“我推荐这家”,分词后得到的词为:“我”、“推荐”、“这家”,通过将非结构化标签与上述词进行一一匹配,确定标签库中的“推荐”与上述词匹配,由此可得到该子句的关键词为“推荐”。
步骤207,基于关键词,确定子句对应的评价标签。
在一实施例中,可以将关键词作为子句对应的评价标签,例如,将“推荐”作为“我推荐这家”的评价标签。
步骤208,基于每一条评价信息所包含的子句对应的评价标签,确定每一条评价信息对应的评价标签。
步骤208的描述可以参见上述图1所示实施例的描述,在此不再详述。
本实施例中,基于标签库中的结构化标签和非结构化标签,确定评价信息中的子句的评价标签,可以确保句法完整的子句以及句法不完整的子句都能够识别出相应的评价标签,避免漏掉子句的评价标签,进而可确保评价信息中的评价标签的完整性和准确性。
图3是本申请再一示例性实施例示出的评价标签的确定方法的流程图;本实施例在上述实施例的基础上,以如何对子句对应的评价标签进行调整为例进行示例性说明,如图3所示,包括如下步骤:
步骤301,识别子句中的否定词。
在一实施例中,否定词可以包括“不”、“没有”、“缺少”等表示否定意思的词。子句包含否定词的情形例如为:“酸辣土豆丝不好吃”、“酸辣土豆丝不错”。
步骤302,确定该否定词在子句中的位置。
在一实施例中,否定词可以位于评价词的前面,也可以位于评价词的后面,例如,“酸辣土豆丝不好吃”,否定词“不”位于评价词“好吃”的前面;再例如,“酸辣土豆丝不错”,由于“不错”可以通过上述图1所示实施例中的步骤103识别为子句对应的评价标签,因此“不错”中的否定词“不”在本实施例中不再识别。
步骤303,基于否定词在子句中的位置,对子句对应的评价标签进行调整。
在一实施例中,对于否定词位于评价词前面的情形,此时表达了相反的意思,因此可以对通过上述图1或者图2所示实施例得到的子句对应的评价标签进行调整,例如,子句“酸辣土豆丝不好吃”对应的评价标签为“土豆丝好吃”,通过本实施例,可以调整为“土豆丝不好吃”。
本实施例中,通过识别子句中的否定词调整评价标签,可以确保评价标签能够更准确的表示子句的真实意思,避免给需要参考评价标签的用户产生干扰。
图4是本申请又一示例性实施例示出的评价标签的确定方法的流程图;本实施例在上述实施例的基础上,以如何对评价标签进行归一化处理为例进行示例性说明,如图4所示,包括如下步骤:
步骤401,确定每一条评价信息对应的评价标签中的评价对象以及评价词各自对应的上位词。
在一实施例中,上位词表示具有父子关系的词,例如,口水鸡->肉,牛肉->肉。
步骤402,基于评价对象以及评价词各自对应的上位词,对每一条评价信息对应的评价标签的进行归一化处理。
例如,评价信息为“口水鸡和宫保鸡丁不错牛肉也不错”,得到的评价标签为“口水鸡不错”、“宫保鸡丁不错”和“牛肉不错”,“口水鸡”、“宫保鸡丁”、“牛肉”对应的上位词为“肉”,因此可将上述三个评价标签归一化为“肉不错”。
步骤403,确定每一条评价信息对应的评价标签中的评价对象以及评价词各自对应的同义词。
在一实施例中,同义词表示具有相同意思的词,例如,“不错”、“好”、“赞”。
步骤404,基于评价对象以及评价词各自对应的同义词,对每一条评价信息对应的评价标签的进行归一化处理。
例如,评价标签为“味道不错”、“味道好”、“味道赞”,则可以将评价标签归一化为“味道不错”。
本实施例中,通过将评论信息中的评价标签进行标签归一化,可以避免同一条评价信息中有多条相似的评价标签表示同一个意思,确保评价标签更简练。
需要说明的是,上述图3和图4所示实施例可以组合以形成新的实施例,并且,在新的实施例中,在执行步骤301-步骤303与步骤401-步骤404时,并无严格的执行顺序,可以同时执行步骤301-步骤303和步骤401-步骤404,也可以先执行步骤401-步骤404,再执行步骤301-步骤303。
图5是本申请又一示例性实施例示出的评价标签的确定方法的流程图;本实施例在上述实施例的基础上,以如何确保评价标签能够真实的表示评价信息的意思为例进行示例性说明,如图5所示,包括如下步骤:
步骤501,基于评价目标对应的评价信息集,确定评价目标对应的标签库。
步骤502,针对评价信息集中的每一条评价信息,确定每一条评价信息所包含的子句。
步骤501和步骤502的描述可以参见上述图1所示实施例的描述,在此不再详述。
步骤503,确定子句中是否包含假设词或者疑问词,若子句中包含假设词或者疑问词,执行步骤504,若子句中不包含假设词或者疑问词,可继续执行上述图1所示实施例中的步骤103或者图2所示实施例中的步骤203。
在一实施例中,假设词例如为“如果”、“假如”,疑问词例如为“吗”、“么”。
步骤504,若子句中包含假设词或者疑问词,停止确定该子句的评价标签,继续确定评价信息中的下一个子句的评价标签。
例如,子句为“如果油麦菜少放点油就不错了”,可识别出假设词“如果”,若通过分词以及词对齐模型的方式,可得到上述子句的评价标签为“油麦菜不错”,而该评价标签并不合理;因此,为了确保评价标签能够真实的表示评价信息的意思,可以将该种评价标签丢弃,避免对评价信息产生错误的理解。
再例如,子句为“真的很好吃吗?”,可识别出疑问词“吗”,若通过分词以及词对齐模型的方式,可得到上述子句的评价标签为“好吃”,同样的,该评价标签并不合理,因此本申请同样需要将该种评价标签丢弃,避免对评价信息产生错误的理解。
本实施例中,通过识别出子句中的假设词或者疑问词,停止对包含有假设词或者疑问词的子句确定评价标签,可以确保评价标签能够真实的表示评价信息的意思,避免对评价信息产生错误的理解。
本申请还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述图1-图5任一所示实施例提供的评价标签的确定方法。
与前述评价标签的确定方法的实施例相对应,本申请还提供了评价标签的确定装置的实施例。
本申请评价标签的确定装置的实施例可以应用在服务器上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在服务器的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图6所示,为本申请评价标签的确定装置所在服务器的一种硬件结构图,除了图6所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的服务器通常根据该服务器的实际功能,还可以包括其他硬件,对此不再赘述。
其中,处理器用于执行上述图1-图5任一所示实施例提供的评价标签的确定方法。
图7是本申请一示例性实施例示出的评价标签的确定装置的结构图,如图7所示,评价标签的确定装置可包括:
第一确定模块71,用于基于评价目标对应的评价信息集,确定评价目标对应的标签库;
第二确定模块72,用于针对评价信息集中的每一条评价信息,确定每一条评价信息所包含的子句;
第三确定模块73,用于根据第一确定模块71确定的标签库中的标签,确定第二确定模块72确定的每一条评价信息所包含的子句对应的评价标签;
第四确定模块74,用于基于第三确定模块73确定的每一条评价信息所包含的子句对应的评价标签,确定每一条评价信息对应的评价标签。
图8是本申请另一示例性实施例示出的评价标签的确定装置的结构图,如图8所示,在上述图7所示实施例的基础上,第三确定模块73可包括:
第一确定单元731,用于根据标签库中的结构化标签,确定每一条评价信息所包含的子句中的评价对象和评价词;
第二确定单元732,用于基于第一确定单元731确定的每一条评价信息所包含的子句中的评价对象和评价词,确定子句对应的评价标签。
在一实施例中,第二确定单元732具体用于:
若子句中包含一个评价对象和至少一个评价词,对一个评价对象和至少一个评价词行组合,得到该子句对应的评价标签;
若子句中包含两个以上的评价对象和一个以上的评价词,基于两个以上的评价对象和一个以上的评价词在子句中的位置,确定子句对应的评价标签。
在一实施例中,第三确定模块73可包括:
第三确定单元733,用于根据标签库中的非结构化标签,确定每一条评价信息所包含的子句中的关键词;
第四确定单元734,用于基于第三确定单元733确定的关键词,确定子句对应的评价标签。
在一实施例中,装置还可以包括:
识别模块75,用于在第三确定模块73根据标签库中的标签,确定每一条评价信息所包含的子句对应的评价标签之后,识别子句中的否定词;
第五确定模块76,用于确定识别模块75识别到的否定词在子句中的位置;调整模块77,用于基于第五确定模块76确定的否定词在子句中的位置,对子句对应的评价标签进行调整。
在一实施例中,装置还可包括:
第六确定模块78,用于在第四确定模块74基于每一条评价信息所包含的子句对应的评价标签,确定每一条评价信息对应的评价标签之后,确定每一条评价信息对应的评价标签中的评价对象以及评价词各自对应的上位词;
第一归一化模块79,用于基于第六确定模块78确定的评价对象以及评价词各自对应的上位词,对每一条评价信息对应的评价标签的进行归一化处理。
在一实施例中,装置还可包括:
第七确定模块80,用于在第四确定模块74基于每一条评价信息所包含的子句对应的评价标签,确定每一条评价信息对应的评价标签之后,确定每一条评价信息对应的评价标签中的评价对象以及评价词各自对应的同义词;
第二归一化模块81,用于基于第七确定模块80确定的评价对象以及评价词各自对应的同义词,对每一条评价信息对应的评价标签的进行归一化处理。
在一实施例中,装置还可以包括:
第八确定模块82,用于在第二确定模块72针对评价信息集中的每一条评价信息,确定每一条评价信息所包含的子句之后,确定子句中是否包含假设词或者疑问词;
若第八确定模块82确定子句中包含假设词或者疑问词,第三确定模块73停止确定该子句的评价标签。
在一实施中,第一确定模块71可包括:
分词单元711,用于对评价目标对应的评价信息集中的每一条评价信息进行分词,得到至少一个评价对象和/或至少一个评价词;
标签挖掘单元712,用于对分词单元711得到的至少一个评价对象和/或至少一个评价词进行标签挖掘,得到评价目标对应的标签库。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种评价标签的确定方法,其特征在于,所述方法包括:
基于评价目标对应的评价信息集,确定所述评价目标对应的标签库;
针对所述评价信息集中的每一条评价信息,确定所述每一条评价信息所包含的子句,其中,所述每一条评价信息所包含的子句中包含有句法不完整的子句;
若所述每一条评价信息所包含的子句中不包含有句法不完整的子句,根据所述标签库中的结构化标签,确定所述每一条评价信息所包含的子句中的评价对象和评价词,所述结构化标签中包含有评价对象和评价词;
若所述每一条评价信息所包含的子句中包含有句法不完整的子句,根据所述标签库中的非结构化标签,确定所述每一条评价信息所包含的子句中的关键词,所述非结构化标签句法结构不完整;
基于所述每一条评价信息所包含的子句中的评价对象和评价词以及所述关键词,确定所述子句对应的评价标签;
基于所述每一条评价信息所包含的子句对应的评价标签,确定所述每一条评价信息对应的评价标签。
2.根据权利要求1所述的方法,其特征在于,所述基于所述每一条评价信息所包含的子句中的评价对象和评价词,确定所述子句对应的评价标签,包括:
若所述子句中包含一个评价对象和至少一个评价词,对所述一个评价对象和所述至少一个评价词进行组合,得到该子句对应的评价标签;
若所述子句中包含两个以上的评价对象和一个以上的评价词,基于所述两个以上的评价对象和所述一个以上的评价词在所述子句中的位置,确定所述子句对应的评价标签。
3.根据权利要求1所述的方法,其特征在于,所述根据所述标签库中的标签,确定所述每一条评价信息所包含的子句对应的评价标签的步骤之后,所述方法还包括:
识别所述子句中的否定词;
确定所述否定词在所述子句中的位置;
基于所述否定词在所述子句中的位置,对所述子句对应的评价标签进行调整。
4.根据权利要求1所述的方法,其特征在于,所述基于所述每一条评价信息所包含的子句对应的评价标签,确定所述每一条评价信息对应的评价标签的步骤之后,所述方法还包括:
确定所述每一条评价信息对应的评价标签中的评价对象以及评价词各自对应的上位词;
基于所述评价对象以及评价词各自对应的上位词,对所述每一条评价信息对应的评价标签的进行归一化处理。
5.根据权利要求1所述的方法,其特征在于,所述基于所述每一条评价信息所包含的子句对应的评价标签,确定所述每一条评价信息对应的评价标签的步骤之后,所述方法还包括:
确定所述每一条评价信息对应的评价标签中的评价对象以及评价词各自对应的同义词;
基于所述评价对象以及评价词各自对应的同义词,对所述每一条评价信息对应的评价标签的进行归一化处理。
6.根据权利要求1所述的方法,其特征在于,所述根据所述标签库中的标签,确定所述每一条评价信息所包含的子句对应的评价标签的步骤之前,所述方法还包括:
确定所述子句中是否包含假设词或者疑问词;
若所述子句中包含假设词或者疑问词,停止确定该子句的评价标签。
7.根据权利要求1-6任一所述的方法,其特征在于,所述基于评价目标对应的评价信息集,确定所述评价目标对应的标签库,包括:
对评价目标对应的评价信息集中的每一条评价信息进行分词,得到至少一个评价对象和/或至少一个评价词;
对所述至少一个评价对象和/或所述至少一个评价词进行标签挖掘,得到所述评价目标对应的标签库。
8.一种评价标签的确定装置,其特征在于,所述装置包括:
第一确定模块,用于基于评价目标对应的评价信息集,确定所述评价目标对应的标签库;
第二确定模块,用于针对所述评价信息集中的每一条评价信息,确定所述每一条评价信息所包含的子句,其中,所述每一条评价信息所包含的子句中包含有句法不完整的子句;
第三确定模块,用于若所述每一条评价信息所包含的子句中不包含有句法不完整的子句,根据所述标签库中的结构化标签,确定所述每一条评价信息所包含的子句中的评价对象和评价词,所述结构化标签中包含有评价对象和评价词,若所述每一条评价信息所包含的子句中包含有句法不完整的子句,根据所述标签库中的非结构化标签,确定所述每一条评价信息所包含的子句中的关键词,所述非结构化标签句法结构不完整,基于所述每一条评价信息所包含的子句中的评价对象和评价词以及所述关键词,确定所述子句对应的评价标签;
第四确定模块,用于基于所述第三确定模块确定的所述每一条评价信息所包含的子句对应的评价标签,确定所述每一条评价信息对应的评价标签。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7任一所述的评价标签的确定方法。
10.一种服务器,其特征在于,所述服务器包括:
处理器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器,用于执行上述权利要求1-7任一所述的评价标签的确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710951941.7A CN107729317B (zh) | 2017-10-13 | 2017-10-13 | 评价标签的确定方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710951941.7A CN107729317B (zh) | 2017-10-13 | 2017-10-13 | 评价标签的确定方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107729317A CN107729317A (zh) | 2018-02-23 |
CN107729317B true CN107729317B (zh) | 2021-07-30 |
Family
ID=61211101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710951941.7A Active CN107729317B (zh) | 2017-10-13 | 2017-10-13 | 评价标签的确定方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107729317B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110738056B (zh) * | 2018-07-03 | 2023-12-19 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN109299460B (zh) * | 2018-09-18 | 2022-07-12 | 北京三快在线科技有限公司 | 分析店铺的评价数据的方法、装置、电子设备及存储介质 |
CN109739955A (zh) * | 2019-01-24 | 2019-05-10 | 北京诸葛找房信息技术有限公司 | 基于分词与多模匹配的房源标签自动提取装置及其方法 |
CN109978624A (zh) * | 2019-03-27 | 2019-07-05 | 联想(北京)有限公司 | 信息处理方法、电子设备及计算机可读存储介质 |
CN112732894A (zh) * | 2021-01-15 | 2021-04-30 | 深圳市欢太科技有限公司 | 信息抽取方法、装置、电子设备及存储介质 |
CN113111269B (zh) * | 2021-05-10 | 2022-06-10 | 网易(杭州)网络有限公司 | 数据处理方法、装置、计算机可读存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009187048A (ja) * | 2008-02-01 | 2009-08-20 | Yahoo Japan Corp | 評価表現抽出方法、評価表現抽出装置、および、評価表現抽出プログラム |
CN101866336A (zh) * | 2009-04-14 | 2010-10-20 | 华为技术有限公司 | 获取评价单元、建立句法路径词典的方法、装置及*** |
CN102737013A (zh) * | 2011-04-02 | 2012-10-17 | 三星电子(中国)研发中心 | 基于依存关系来识别语句情感的设备和方法 |
CN105975453A (zh) * | 2015-12-01 | 2016-09-28 | 乐视网信息技术(北京)股份有限公司 | 评论标签提取方法和装置 |
CN106021433A (zh) * | 2016-05-16 | 2016-10-12 | 北京百分点信息科技有限公司 | 一种商品评论数据的口碑分析方法和装置 |
-
2017
- 2017-10-13 CN CN201710951941.7A patent/CN107729317B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009187048A (ja) * | 2008-02-01 | 2009-08-20 | Yahoo Japan Corp | 評価表現抽出方法、評価表現抽出装置、および、評価表現抽出プログラム |
CN101866336A (zh) * | 2009-04-14 | 2010-10-20 | 华为技术有限公司 | 获取评价单元、建立句法路径词典的方法、装置及*** |
CN102737013A (zh) * | 2011-04-02 | 2012-10-17 | 三星电子(中国)研发中心 | 基于依存关系来识别语句情感的设备和方法 |
CN105975453A (zh) * | 2015-12-01 | 2016-09-28 | 乐视网信息技术(北京)股份有限公司 | 评论标签提取方法和装置 |
CN106021433A (zh) * | 2016-05-16 | 2016-10-12 | 北京百分点信息科技有限公司 | 一种商品评论数据的口碑分析方法和装置 |
Non-Patent Citations (1)
Title |
---|
一种基于句法分析的情感标签抽取方法;李纲 等;《图书情报工作》;20140731;第58卷(第14期);第12-20页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107729317A (zh) | 2018-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107729317B (zh) | 评价标签的确定方法、装置及服务器 | |
US20240220526A1 (en) | Method, apparatus, and computer program product for classification and tagging of textual data | |
Bafna et al. | Feature based summarization of customers’ reviews of online products | |
JP5824532B2 (ja) | サーフショッピングのための関連抽出のシステム及び方法 | |
Swanson et al. | Native language detection with tree substitution grammars | |
US11157540B2 (en) | Search space reduction for knowledge graph querying and interactions | |
US20160063596A1 (en) | Automatically generating reading recommendations based on linguistic difficulty | |
US20220084095A1 (en) | System and method for quality assessment of product description | |
Fachrina et al. | Aspect-sentiment classification in opinion mining using the combination of rule-based and machine learning | |
US11409888B2 (en) | Security information processing device, information processing method, and recording medium | |
Mate | Product aspect ranking using sentiment analysis: a survey | |
Rani et al. | Study and comparision of vectorization techniques used in text classification | |
CN111209480A (zh) | 一种推送文本的确定方法、装置、计算机设备和介质 | |
JP5599073B2 (ja) | 感性分析システム及びプログラム | |
CN105095203B (zh) | 同义词的确定、搜索方法及服务器 | |
CN106919649B (zh) | 一种词条权重计算的方法及装置 | |
Rif’at et al. | Towards product attributes extraction in Indonesian e-commerce platform | |
Haddi | Sentiment analysis: text, pre-processing, reader views and cross domains | |
JP5717549B2 (ja) | 感性分析システム及びプログラム | |
John et al. | Topic modeling to extract information from nutraceutical product reviews | |
Yasavur et al. | Ontology-based named entity recognizer for behavioral health | |
US20180005300A1 (en) | Information presentation device, information presentation method, and computer program product | |
Le et al. | Machine learning for food review and recommendation | |
KR20230172835A (ko) | 상품 정보 제공 서비스 방법 및 이를 수행하기 위한 컴퓨팅 장치 | |
Picinini | Harvesting Polysemous Terms from e-commerce Data to Enhance QA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |