CN112463918A - 一种信息推荐方法、***及存储介质和终端设备 - Google Patents
一种信息推荐方法、***及存储介质和终端设备 Download PDFInfo
- Publication number
- CN112463918A CN112463918A CN202011091495.5A CN202011091495A CN112463918A CN 112463918 A CN112463918 A CN 112463918A CN 202011091495 A CN202011091495 A CN 202011091495A CN 112463918 A CN112463918 A CN 112463918A
- Authority
- CN
- China
- Prior art keywords
- text
- target
- sample
- information
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 111
- 230000011218 segmentation Effects 0.000 claims description 96
- 238000004590 computer program Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 abstract description 27
- 238000013473 artificial intelligence Methods 0.000 abstract description 11
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 8
- 230000000977 initiatory effect Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种信息推荐方法、***及存储介质和终端设备,应用于基于人工智能的信息处理技术领域。信息推荐***会采用目标文本及其目标分词分别对应的第一目标联想文本和第二目标联想文本,来匹配联想模型,从而得到相匹配的第一样本文本及第一联想文本,进而基于此进行信息推荐。在这个过程中不需要对文本进行语义分析,但是确能考虑到与文本在语义或应用场景等方面相关的联想文本,这样可以避免在语义分析过程中造成的限制,且能提供更全面的与目标文本相关的文本即相匹配的第一样本和第一联想文本,实现了对目标文本的全面且精准地推荐。
Description
技术领域
本发明涉及基于人工智能的信息处理技术领域,特别涉及一种信息推荐方法、***及存储介质和终端设备。
背景技术
在信息推荐领域,现有一般采用语义比较的方法进行推荐,具体地,当用户输入搜索信息后,***会将用户搜索信息与***中储存的待推荐信息基于语义的比较,并将与用户搜索信息相似的信息推荐给用户。
其中,在对信息基于语义的比较时,需要分别获取用户搜索信息与待推荐信息的语义信息,而对于语义信息的获取,现有技术中一般采用基于人工智能的方法来获取,比如采用自然语言处理(Natural Language Processing,NLP)算法,比如Ebs或Synonym等工具,来获取语义信息。
但是现有的信息推荐方法中,需要对用户搜索信息和待推荐信息分别进行语义分析,才能得到相应的语义信息,但是语义分析过程会有一定的限制,这样往往不能很全面地分析出用户搜索信息和待推荐信息的实际含义,特别是对于日语或韩语等小语种信息的推荐,由于小语种语料少,规则模糊,再加上对小语种的理解也有难度,因此,采用现有的信息推荐不能准确地对小语种的信息进行推荐。
发明内容
本发明实施例提供一种信息推荐方法、***及存储介质和终端设备,实现了对目标文本的精准推荐。
本发明实施例一方面提供一种信息推荐方法,包括:
获取目标文本;
对所述目标文本进行分词,得到所述目标文本对应的目标分词;
获取所述目标文本对应的第一目标联想文本及目标分词对应的第二目标联想文本;
获取联想模型,所述联想模型中储存有多个第一样本文本及所述多个第一样本文本分别对应的特征信息,所述特征信息中包括第一联想文本;
将所述目标文本、获取的目标分词、第一目标联想文本和第二目标联想文本分别与所述联想模型中的第一样本文本及第一联想文本进行匹配,得到与所述目标文本、目标分词和第一目标联想文本及第二目标联想文本相匹配的所述第一样本文本及第一联想文本;
根据所述匹配得到的第一样本文本及第一联想文本,对所述目标文本进行信息推荐。
本发明实施例另一方面提供一种信息推荐***,包括:
文本获取单元,用于获取目标文本;
所述文本获取单元,还用于对所述目标文本进行分词,得到所述目标文本对应的目标分词,及获取所述目标文本对应的第一目标联想文本及目标分词对应的第二目标联想文本;
模型获取单元,用于获取联想模型,所述联想模型中储存有多个第一样本文本及所述多个第一样本文本分别对应的特征信息,所述特征信息中包括第一联想文本;
匹配单元,用于将所述目标文本、获取的目标分词、第一目标联想文本和第二目标联想文本分别与所述联想模型中的第一样本文本及第一联想文本进行匹配,得到与所述目标文本、目标分词和第一目标联想文本及第二目标联想文本相匹配的所述第一样本文本及第一联想文本;
推荐单元,用于根据所述匹配得到的第一样本文本及第一联想文本,对所述目标文本进行信息推荐。
本发明实施例另一方面还提供一种计算机可读存储介质,所述计算机可读存储介质储存多个计算机程序,所述计算机程序适于由处理器加载并执行如本发明实施例一方面所述的信息推荐方法。
本发明实施例另一方面还提供一种终端设备,包括处理器和存储器;
所述存储器用于储存多个计算机程序,所述计算机程序用于由处理器加载并执行如本发明实施例一方面所述的信息推荐方法;所述处理器,用于实现所述多个计算机程序中的各个计算机程序。
可见,在本实施例的方法中,信息推荐***会采用目标文本及其目标分词分别对应的第一目标联想文本和第二目标联想文本,来匹配联想模型,从而得到相匹配的第一样本文本及第一联想文本,进而基于此进行信息推荐。在这个过程中不需要对文本进行语义分析,并且能考虑到与文本在语义或应用场景等方面相关的联想文本,这样可以避免在语义分析过程中造成的限制,且能提供更全面的与目标文本相关的文本即相匹配的第一样本和第一联想文本,实现了对目标文本的全面且精准地推荐。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种信息推荐方法的示意图;
图2是本发明一个实施例提供的一种信息推荐方法的流程图;
图3是本发明另一个实施例提供的一种信息推荐方法的流程图;
图4是本发明另一个实施例中获取的文本图谱的示意图;
图5是本发明一个应用实施例中信息推荐方法的示意图;
图6是本发明一个应用实施例中信息推荐***显示的用户输入界面的示意图;
图7是本发明另一个应用实施例中信息推荐方法的示意图;
图8a是本发明另一个应用实施例中信息推荐***显示的一种用户输入界面的示意图;
图8b是本发明另一个应用实施例中信息推荐***显示的另一种用户输入界面的示意图;
图8c是本发明另一个应用实施例中文本图谱的示意图;
图9是本发明另一个应用实施例提供的信息推荐***的示意图;
图10是本发明实施例提供的信息推荐***的结构示意图;
图11是本发明实施例提供的终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供一种信息推荐方法,主要是根据用户输入的目标文本,进行相关信息的推荐,如图1所示,信息推荐***可以通过如下步骤实现信息推荐:
获取目标文本;对目标文本进行分词,得到目标文本对应的目标分词;获取所述目标文本对应的第一目标联想文本及目标分词对应的第二目标联想文本;获取联想模型,所述联想模型中储存有多个第一样本文本及多个第一样本文本分别对应的特征信息,所述特征信息中包括第一联想文本;将所述目标文本、获取的目标分词、第一目标联想文本和第二目标联想文本分别与所述联想模型中的第一样本文本和第一联想文本进行匹配,得到与所述目标文本、目标分词和第一目标联想文本及第二目标联想文本相匹配的所述第一样本文本及第一联想文本;根据所述匹配得到的第一样本文本及第一联想文本,对所述目标文本进行信息推荐。
在具体实现过程中,一种情况下,上述信息推荐***可以应用于终端设备,用户可以通过终端设备提供的接口,输入目标,这样终端设备可以按照上述的方法实时地对目标文本进行相关信息的推荐;或者,另一种情况下,上述信息推荐***应用于后台,当用户通过终端设备提供的接口输入目标文本,则终端设备会将用户输入的目标文本上传到后台,由后台按照上述的方法实时地对目标文本进行相关信息的推荐。且上述的信息推荐主要可以应用于对于应用程序的推荐,或者对于产品信息的推荐等,可以应用于任意的可供用户搜索的应用***中。
可见,在这个过程中不需要对文本进行语义分析,但是确能考虑到与文本在语义或应用场景等方面相关的联想文本,这样可以避免在语义分析过程中造成的限制,且能提供更全面的与目标文本相关的文本即相匹配的第一样本和第一联想文本,实现了对目标文本的全面且精准地推荐。
本发明一个实施例提供一种信息推荐方法,主要是信息推荐***所执行的方法,流程图如图2所示,包括:
步骤101,获取目标文本;
可以理解,用户可以通过信息推荐***提供的接口,输入一段文本,则信息推荐***在获取到用户输入的一段文本后,将该段文本作为目标文本,发起本实施例的信息推荐方法流程。或者,用户可以通过信息推荐***提供的接口,输入一段语音,则信息推荐***在获取到用户输入的一段语音后,将该段语音转化为文本,并将转化为的文本作为目标文本,发起本实施例的信息推荐方法流程。
步骤102,对目标文本进行分词,得到目标文本对应的目标分词,及获取目标文本对应的第一目标联想文本及目标分词对应的第二目标联想文本。
具体地,信息推荐***会对目标文本进行分词,具体可以采用分词器对目标文本进行分词,比如采用lucene的核心分词器或开源分词器等,得到目标分词。进一步地,由于有些目标分词在语义上是无意义的,为了简化对目标分词的处理,信息推荐***可以将这些目标分词剔除掉,具体地,可以将上述得到的目标分词中的语气词和时态词等无意义的目标分词剔除,得到剩余的目标分词。例如,目标文本为“人民的名义”,对应目标分词为“人民”、“的”和“名义”,可以将目标分词“的”剔除。
然后信息推荐***会获取目标文本的第一目标联想文本,该第一目标联想文本是与目标文本在语义和应用场景等方面相关联的文本,例如,“人名的名义”的联想文本可以包括“达康书记”等;信息推荐***还会获取目标分词的第二目标联想文本,该第二目标联想文本是与目标分词在语义和应用场景等方面相关的文本。例如,“小程序”的联想文本可以包括“微信小程序”和“qq小程序”等。
步骤103,获取联想模型,联想模型中储存有多个第一样本文本及多个第一样本文本分别对应的特征信息,在特征信息中包括与第一样本文本对应的第一联想文本。
其中,信息推荐***可以在发起本实施例的信息推荐方法流程之前获取了联想模型,并储存到本地存储中,当发起本实施例的信息推荐方法流程后,信息推荐***直接可以从本地存储中提取得到联想模型。
联想模型中各个第一样本文本的特征信息是指用户对该第一样本文本进行搜索等操作行为的特征信息,比如热度信息、排行信息和第一联想文本等信息,其中,热度信息不仅可以表示第一样本文本被用户搜索的次数,还可以表示第一样本文本的发生时间是否是最近一段时间发生的,具体可以划分为:高热度、一般热度和低热度,比如,某一新闻在当前时间之前的一段时间内在发生,且被用户搜索或观看的次数超过一定的次数,则与该新闻有关的词汇的热度信息为高热度;而排行主要用于表示第一样本文本被用户搜索或观看的次数,则排行较高的第一样本文本不一定其热度较高,但是热度较高的第一样本文本的排行也较高;第一联想文本可以表示与第一样本文本的语义或应用场景等方面相关的文本,即用户通过第一样本文本容易联想到的文本,比如“拼多”的联想文本可以包括“拼多多商城”和“拼多多”等文本。
在具体应用实例中,对于联想模型的获取,可以根据样本推荐***中的历史搜索记录来获取,其中,当用户在样本推荐***中输入搜索文本,且样本推荐***根据搜索文本进行搜索得到搜索结果后,样本推荐***可以记录一条搜索操作信息,其中搜索操作信息包括搜索文本和对应的搜索结果,这样,样本推荐***在一段时间内记录的搜索操作信息即为历史搜索记录。
需要说明的是,这里的样本推荐***与当前执行信息推荐方法流程的信息推荐***可以是相互独立的不同***,这样,信息推荐***可以对其它推荐***(本实施例中称为样本推荐***)中的数据进行分析,并借鉴样本推荐***中的数据得到联想模型后,将联想模型储存到当前的信息推荐***中,以便信息推荐***根据该联想模型实时地对上述获取的目标文本进行信息推荐。
具体地,信息推荐***可以先获取样本推荐***中的搜索操作信息,搜索操作信息包括搜索文本及样本推荐***对搜索文本的搜索结果;获取搜索文本对应的样本分词;根据搜索文本对应的搜索结果,统计样本分词及搜索文本分别对应的联想文本,则样本分词及搜索文本分别对应的联想文本为上述联想模型中储存的第一联想文本,而样本分词及搜索文本即为上述联想模型中储存的第一样本文本。
一般情况下,样本推荐***在信息推荐的过程中,也会将搜索文本进行分词得到样本分词,这样得到的搜索结果中就包括了基于整个搜索文本搜索得到的多条第一搜索信息及基于各个样本分词搜索得到的多条第二搜索信息,则本实施例中的信息推荐***在统计搜索文本对应的联想文本时,会确定当任一条第一搜索信息的排行信息和热度信息满足预置条件,且在任一条第一搜索信息中包含搜索文本对应的联想文本时,则根据任一条第一搜索信息确定搜索文本对应的联想文本。
其中,任一第一搜索信息的排行信息和热度信息满足预置条件是指所有的第一搜索信息相比较,任一第一搜索信息的排行和热度较高,比如排行在前面N个,而热度在前面M个,这样可以选择排行较高且热度较高的第一搜索信息,或者选择排行较高且热度一般的第一搜索信息。
另外,在确定任一第一搜索信息中是否包含搜索文本对应的联想文本时,可以将搜索文本与第一搜索信息的标题或主要内容进行匹配,从而确定第一搜索信息是否包含对应的联想文本。比如搜索文本中的大部分字符(比如大于百分之P的字符,P为小于100的自然数,比如80等)在第一搜索信息中连续出现,则将第一搜索信息中相关的字符作为搜索文本对应的联想文本,例如搜索文本为“小程序”,则在某一条第一搜索信息中出现“qq小程序”,在另一条第一搜索信息中出现“微信小程序”,则“qq小程序”和“微信小程序”即为搜索文本对应的联想文本。
同样地,信息推荐***在统计样本分词对应的联想文本时,确定当任一条第二搜索信息的排行信息和热度信息满足预置条件,且任一条第二搜索信息中包含样本分词对应的联想文本,根据任一条第二搜索信息确定样本分词对应的联想文本。
进一步地,信息推荐***还可以确定上述样本分词及搜索文本分别对应的热度信息和排行信息,则第一样本文本的特征信息中还包括样本分词及搜索文本分别对应的热度信息和排行信息。
例如,获取到样本推荐***的一组搜索操作信息中包括搜索文本A,其对应的样本分词为A1和A2,搜索文本A对应的第一搜索信息包括Bi,样本分词A1对应的第二搜索信息为Cj,样本分词A2对应的第二搜索信息为Dk,其中,i、j和k都为大于0的自然数。这样,从第一搜索信息中Bi中确定出排行较高且热度较高的第一搜索信息,进而基于选择出的第一搜索信息得到搜索文本A对应的联想文本;同样根据第二搜索信息Cj得到样本分词A1对应的联想文本,根据第二搜索信息Dk得到样本分词A2对应的联想文本。
步骤104,将上述目标文本、目标分词、第一目标联想文本及第二目标联想文本分别与上述步骤103中获取的联想模型中的第一样本文本和第一联想文本进行匹配,得到与目标文本、目标分词和第一目标联想文本及第二目标联想文本相匹配的第一样本文本和第一联想文本。
具体地,将目标文本、目标分词、第一目标联想文本和第二目标联想文本分别与联想模型中的各个第一样本文本及其第一联想文本进行匹配,从而得到与目标文本、目标分词、第一目标联想文本和第二目标联想文本相匹配的第一样本文本和第一联想文本。
在这个过程中,信息推荐***会结合各个第一样本文本的其它特征信息,比如排行信息和热度信息等,从上述得到的相匹配的第一样本文本和第一联想文本中选择排行信息和热度信息满足预置条件的第一样本文本和第一联想文本,比如选择排行较高且热度较高(或热度一般)第一样本文本和第一联想文本。
步骤105,根据上述步骤104匹配得到的第一样本文本及第一联想文本,对目标文本进行信息推荐。
具体地,信息推荐***可以直接输出上述步骤104中匹配得到的第一样本文本及第一联想文本,以显示给用户;或者,信息推荐***可以将上述匹配得到的第一样本文本及第一联想文本应用到某些具体信息的推荐过程,比如进行程序的推荐,新闻或视频等信息的推荐。
另外需要说明的是,通过上述步骤101到104可以得到与目标文本在语义或应用场景等方面相关的文本(即上述步骤104匹配得到的第一样本文本和第一联想文本),从而使得基于获取的相关文本进行信息推荐时,推荐的信息比较全面,且推荐信息的准确性的几率也会增加,由于在这个过程中不需要对目标文本及其目标分词进行语义分析,而通过与目标文本和目标分词直接关联的目标联想文本从语义或应用场景等方面描述目标文本和目标分词,使得最终推荐的信息比较全面,同时也避免了语义分析过程中的缺陷。例如,对于目标文本是小语种信息时,在语义分析时会受到小语种***中特定规则等方面的限制,使得对小语种信息的语义分析会出错,而采用本实施例中的方法可以避免这种情况。
为了更进一步地提高推荐信息的准确性,信息推荐***在还可以根据样本推荐***中的搜索文本、样本分词及预置的语义确定模型来得到搜索文本及其样本分词分别对应的语义特征信息,即第一样本文本的语义特征信息,并储存到信息推荐***中。
当用户实时地在信息推荐***中输入目标文本,信息推荐***会根据目标文本及其目标分词及预置的语义确定模型来获取目标文本和目标分词分别对应的语义特征信息;进而再根据确定的语义特征信息与***中储存的第一样本文本的语义特征信息进行匹配,将从而选出语义特征信息与目标文本(或目标分词)的语义特征信息之间的相似度较高的第一样本文本;最后再根据选出的第一样本文本进行相关信息的推荐。其中语义确定模型主要是用于对目标文本和目标分词本身进行语义特征提取,是一种基于人工智能的机器学习模型,可以通过一定的训练方法训练得到,并将其运行逻辑预置到信息推荐***中。
其中,对于语义确定模型的训练,需要根据一定的训练样本来训练,其中训练样本需要包括:样本文本及对应的样本文本的语义标注信息,这样,就需要大量具有确切语义的语料(即具有语义标注信息的样本文本)才能训练出较为准确的语义确定模型。
上述人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
可见,在本实施例的方法中,信息推荐***会采用目标文本及其目标分词分别对应的第一目标联想文本和第二目标联想文本,来匹配联想模型,从而得到相匹配的第一样本文本及第一联想文本,进而基于此进行信息推荐。在这个过程中不需要对文本进行语义分析,但是确能考虑到与文本在语义或应用场景等方面相关的联想文本,这样可以避免在语义分析过程中造成的限制,且能提供更全面的与目标文本相关的文本即相匹配的第一样本和第一联想文本,实现了对目标文本的全面且精准地推荐。
本发明另一个实施例提供一种信息推荐方法,主要是信息推荐***所执行的方法,本实施例的方法与上述图2所示的方法不同的是,本实施例中的方法主要是根据文本图谱进行信息推荐,而上述图2所示的方法中是根据联想模型对目标文本相关信息的推荐,本实施例的方法流程图如图3所示,包括:
步骤201,获取目标文本,对目标文本进行分词,得到目标文本的目标分词。
用户可以通过信息推荐***提供的接口,输入一段文本,则信息推荐***在获取到用户输入的一段文本后,将该段文本作为目标文本,发起本实施例的信息推荐方法流程。或者,用户可以通过信息推荐***提供的接口,输入一段语音,则信息推荐***在获取到用户输入的一段语音后,将该段语音转化为文本,并将转化为的文本作为目标文本,发起本实施例的信息推荐方法流程。
步骤202,获取文本图谱,文本图谱中包括多个第二样本文本及任意两个第二样本文本之间是否基于主题类型进行关联的信息。
其中,信息推荐***可以在发起本实施例的信息推荐方法流程之前获取了文本图谱,并储存到本地存储中,当发起本实施例的信息推荐方法流程后,信息推荐***直接可以从本地存储中提取得到文本图谱。
在具体应用实例中,信息推荐***在获取文本图谱时,可以对样本推荐***得到历史搜索记录进行分析得到,具体地,信息推荐***会获取样本推荐***中的搜索操作信息,在搜索操作信息包括搜索文本;获取搜索文本对应的样本分词,及获取搜索文本及样本分词分别对应的特征信息,具体可以包括排行信息、热度信息和联想文本等;根据搜索文本及样本分词分别对应的特征信息对搜索文本及样本分词进行主题聚类,得到多个主题类型的第二样本文本;将同一主题类型中的任意两个第二样本文本之间进行关联,以得到文本图谱。
其中,在根据搜索文本及样本分词分别对应的特征信息对搜索文本及样本分词进行主题聚类时,可以将搜索文本及样本分词分别对应的特征信息进行特征量化,然后再采用主题聚类算法进行主题聚类。其中,主题聚类算法可以包括潜在语义索引(LatentSemantic Indexing,LSI),也称为潜在语义分析(Latent Semantic Analysis,LSA)等主题聚类算法,可以发现第二样本文本的潜在语义,并将属于同一语义的第二样本文本进行聚类,比如“car”和“automobile”具有相同的含义,可以进行主题聚类。其中,第二样本文本的主题是指第二样本文本的属性,比如“car”的主题是车辆等。
进一步地,信息推荐***还会确定多个主题类型中任意两个主题类型的第二样本文本之间的相似参数;将相似参数满足预置条件(比如相似参数大于预置值)的任意两个主题类型的第二样本文本之间进行关联。其中,相似参数可以指相似度等用于描述两个文本之间相似性的参数,这样,可以将相似性较高的两个主题类型中的第二样本文本之间进行关联。
步骤203,将目标文本及其目标分词分别与文本图谱中的第二样本文本进行匹配,得到与目标文本和目标分词相关联的第二样本文本。
具体地,如果目标文本(或目标分词)与文本图谱中某一第二样本文本相匹配,则与目标文本和目标分词相关联的第二样本文本具体包括:与目标文本或目标分词相匹配的某一第二样本文本,且还包括:文本图谱中与某一第二样本文本之间基于主题进行关联的其它第二样本文本。
例如图4所示为信息推荐***获取的文本图谱,其中包括多个节点,每个节点对应一个第二样本文本,节点之间的边表示对应的第二样本文本之间基于主题关联。比如节点A、B、C和D所表示的第二样本文本属于主题类型1,节点E和F所表示的第二样本文本属于主题类型2,节点G、H和I所表示的第二样本文本属于主题类型3,进一步地,主题类型1与主题类型2所表示的第二样本文本之间的相似参数满足预置条件,将这两个主题类型之间进行关联,而主体类型1和2分别与主题类型3之间不会关联。这样,当用户输入的目标文本或其对应的目标分词与主题类型2中的节点E所表示的第二样本文本相匹配,则最终获取的相关联的第二样本文本包括:节点A、B、C、D、E和F所表示的第二样本文本。
步骤204,根据上述步骤203匹配得到的第二样本文本,对目标文本进行相关主题的推荐。
具体地,信息推荐***可以直接输出上述步骤203中匹配得到的第二样本文本,以显示给用户;或者,信息推荐***可以将上述匹配得到的第二样本文本应用到某些具体信息的推荐过程,比如进行程序的推荐,新闻或视频等信息的推荐。
这样,通过将目标文本及其目标分词分别与文本图谱进行匹配,可以得到与目标文本或其目标分词基于主题类型相匹配的第二样本文本,可以发现目标文本及目标分词的直接语义和潜在语义,从而进行主题推荐的比较全面。
为了更进一步地提高推荐信息的准确性,信息推荐***在还可以根据样本推荐***中的搜索文本、样本分词及预置的语义确定模型来得到搜索文本及其样本分词分别对应的语义特征信息,即第二样本文本的语义特征信息,然后根据第二样本文本的语义特征信息之间的相似度进行聚类,再基于聚类结果调整上述得到的文本图谱。另外,当用户实时地在信息推荐***中输入目标文本,信息推荐***还会根据目标文本及其目标分词及预置的语义确定模型来获取目标文本和目标分词分别对应的语义特征信息;进而再从文本图谱中选出语义特征信息与目标文本和目标分词分别对应的语义特征信息之间的相似度较高的第二样本文本。其中语义确定模型主要是用于对目标文本和目标分词本身进行语义特征提取,是一种基于人工智能的机器学习模型,可以通过一定的训练方法训练得到,并将其运行逻辑预置到信息推荐***中。
以下以一个具体的应用实例来说明本发明的信息推荐方法,在本实施例中的方法主要应用于根据用户输入的目标文本推荐相关的应用程序,如图5所示,则本实施例的方法主要包括如下两个部分:
(1)获取联想模型,并将联想模型预置到信息推荐***中。
步骤301,信息推荐***获取样本推荐***中的搜索操作信息,搜索操作信息包括搜索文本及样本推荐***对搜索文本的搜索结果。其中,样本推荐***可以是某一应用商店。
步骤302,信息推荐***对搜索文本进行分词,得到样本分词,且对样本分词中无意义的样本分词进行剔除。
步骤303,信息推荐***获取搜索文本及样本分词分别对应的特征信息,具体可以包括热度信息、排行信息和联想文本等,进而可以得到联想模型,联想模型中包括的第一样本文本的特征信息即为搜索文本及样本分词分别对应的特征信息,而联想模型中包括的第一样本文本即为搜索文本及其样本分词。
其中,信息推荐***在获取搜索文本及样本分词分别对应的联想文本时,主要是根据样本推荐***对搜索文本的搜索结果来获取,获取的方法见上述实施例中所述,在此不进行赘述。
步骤304,信息推荐***对搜索文本及样本分词分别进行语义特征的提取,比如采用word2vec等语义确定模型来进行语义特征的提取,并储存提取的语义特征信息,其中包括搜索文本及样本分词(即第一样本文本)分别对应的语义特征信息。这样,联想模型中各个第一样本文本的特征信息还会包括各个第一样本文本分别对应的语义特征信息。
(2)对用户实时输入的目标文本及上述获取的联想模型进行信息推荐。
步骤305,信息推荐***会提供用户输入界面,这样,用户可以在该用户输入界面输入目标文本,且用户还可以在用户输入界面选择信息推荐***推荐的信息的语言类型。
步骤306,信息推荐***对目标文本进行分词得到目标分词,并获取目标文本及目标分词分别对应的第一目标联想文本和第二目标联想文本等。
具体地,信息推荐***在得到第一和第二目标联想文本时,可以采用联想器来实现,一般对目标文本和目标分词进行词汇字符的增减补充,比如“拼多”的联想文本为“拼多多”、“拼多多商城”等。
步骤307,信息推荐***将目标文本、目标分词及、第一目标联想文本和第二目标联想文本与上述获取的联想模型进行匹配,得到与目标文本、目标分词、第一目标联想文本和第二目标联想文本相匹配的第一联想文本及第一样本文本。其中,图5中只示出目标联想文本与联想模型进行的匹配,对于目标文本和目标分词分别与联想模型的匹配未示出。
步骤308,信息推荐***还可以根据目标文本、目标分词及预置的语义确定模型,确定出目标文本和目标分词分别对应的语义特征信息,然后将确定出的语义特征信息与上述步骤304中得到的第一样本文本的语义特征信息进行匹配,得到与目标文本和目标分词分别对应的语义特征信息之间的相似度较高的第一样本文本。
步骤309,信息推荐***根据步骤307获取的第一联想文本及第一样本文本,及步骤308获取的第一样本文本,对目标文本进行信息推荐,比如直接输出第一样本文本和第一联想文本,以显示给用户。
例如,用户想要查找日语文本,但是用户对英语比较熟悉,则可以通过信息推荐***提供的用户输入界面,选择待查询的语言类型,且输入目标文本“brawl star”,则信息推荐***会采用本实施例的方法,对目标文本进行相关信息的推荐。如图6所示,信息推荐***会显示与目标文本“brawl star”对应的大量日语同义词,比如“ブロスタ”和“ぶろすた”等,为不懂小语种的用户带来极大便利。
以下以另一个具体的应用实例来说明本发明的信息推荐方法,在本实施例中的方法主要应用于根据用户输入的目标文本推荐相关的应用程序,如图7所示,则本实施例的方法主要包括如下两个部分:
(1)获取文本图谱,并将文本图谱预置到信息推荐***中。
步骤401,信息推荐***获取样本推荐***中的搜索操作信息,搜索操作信息包括搜索文本。其中,样本推荐***可以是某一应用商店。
步骤402,信息推荐***对搜索文本进行分词,得到样本分词,且对样本分词中无意义的样本分词进行剔除。
步骤403,信息推荐***获取搜索文本及样本分词分别对应的特征信息,具体可以包括热度信息、排行信息和联想文本等。
步骤404,信息推荐***根据用户搜索及样本分词分别对应的特征信息对搜索文本及样本分词进行主题聚类,得到多个主题类型的第二样本文本。
在一种情况下,信息推荐***可以采用LSI算法进行主题聚类,这样可以发现搜索文本及其样本分词的隐含主题,具体地,信息推荐***可以先将搜索文本及样本分词分别对应的特征信息进行特征量化,得到量化后特征;然后再利用奇异值分解(Singular ValueDecomposition,SVD)降维的方法将量化后特征映射到一个新的语义空间,得到语义空间特征;最后再基于搜索文本及样本分词分别对应的语义空间特征进行语义聚类。
例如,对于一个一个m×nm×n的矩阵AA,可以分解为下面公式1所示的三个矩阵:
Am×n=Um×mΣm×nVTn×n (1)
有时为了降低矩阵的维度到k,SVD的分解可以近似的写为如下公式2:
Am×n≈Um×kΣk×kVTk×n (2)
其中,假设有m个搜索文本,每个搜索文本有n个样本分词,则Aij表示第i个搜索文本的第j个样本分词的特征信息,这里特征信息最常用的是词频-反文档频率(TermFrequency-Inverse Document Frequency,TF-IDF)值;k为主题类型的数量,一般要比搜索文本的数量少;经过SVD分解后,Uil表示第i个搜索文本和第l个主题类型的相关度,Vjm表示第j个样本分词和第m个样本分词的相关度,Σlm表示第l个主题类型和第m个样本分词的相关度。
其中,SVD降维的方法可以看作是从量化后特征中发现不相关的索引变量(因子),并将量化特征映射到语义空间,得到的特征信息中包含了搜索文本及其样本分词的隐含语义,比较准确。其中,任意两个量化后特征不相似的文本,在语义空间内可能比较相似,则采用本实施例的方法可以发现文本的隐含语义,使得得到的语义空间的特征信息中包含了文本的隐含语义。
需要说明的是,在进行主题聚类时,还可以采用LSI算法之外的其它聚类方法,在不进行显示。
进一步地,为了更准确地得到文本图谱,信息推荐***在执行本步骤404的过程中,可以在将搜索文本及样本分词的量化后特征映射到语义空间后,对语义空间中的某些数据进行“剪枝”操作,具体地,如果某一搜索文本或样本分词对应的语义空间中值为零的元素个数大于预置值时,将该搜索文本或样本分词的语义空间特征值去掉。
另外,当信息推荐***在得到多个主题类型的第二样本文本后,可以进行“话题剔除”操作,即去掉某些主题类型中的某些第二样本文本。具体地,可以将任一主题类型中包括的与该主题类型不一致的第二样本文本去掉。
步骤405,信息推荐***将同一主题类型中的任意两个第二样本文本之间进行关联,还会确定多个主题类型中任意两个主题类型的第二样本文本之间的相似参数;将相似参数满足预置条件(比如相似参数大于预置值)的任意两个主题类型的第二样本文本之间进行关联,进而得到文本图谱,并储存到信息推荐***中。
步骤406,信息推荐***还会对搜索文本及样本分词分别进行语义特征的提取,比如采用word2vec等语义确定模型来进行语义特征的提取,并基于语义特征信息之间的相似度对搜索文本及样本分词进行聚类,根据聚类结果调整上述步骤405中得到的文本图谱。
(2)对用户实时输入的目标文本及上述获取的文本图谱进行信息推荐。
步骤407,信息推荐***会提供用户输入界面,这样,用户可以在该用户输入界面输入目标文本,且用户还可以在用户输入界面选择信息推荐***推荐的信息的语言类型。
步骤408,信息推荐***对目标文本进行分词得到目标分词。
步骤409,信息推荐***将目标文本及目标分词分别与上述获取的文本图谱进行匹配,得到与目标文本或目标分词相匹配的第二样本文本。
步骤410,信息推荐***根据步骤409获取的第二样本文本,对目标文本进行相关主题的程序推荐。
例如,用户想要查找日语文本,但是用户对英语比较熟悉,则可以通过信息推荐***提供的用户输入界面,选择待查询的语言类型,且输入目标文本“PUBG”,则信息推荐***会采用本实施例的方法,对目标文本进行主题推荐。如图8a所示,信息推荐***会显示与目标文本“PUBG”属于同一主题类型的其它应用程序,比如“荒野行动”、“brawl star”和“moba”等,同时还会显示FPS等相关主题的应用,还包括很多日语应用程序,为不懂小语种的用户带来极大便利。
另外,本实施例的方法在语义排错上有一定的优势,比如用户输入的目标文本出错,但是只要整体不影响,则可以推荐出合理的相关信息,例如图8b所示,用户在输入目标文本时,将“star”输入成“start”,则用户输入的目标文本为“brawl start”,信息推荐***还是能合理地显示出实际上与“brawl star”相关的信息。且如果将当前的信息推荐***作为样本推荐***,则可以得到如图8c所示的文本图谱,其中,与“brawl start”进行主题关联的文本实际上是与“brawl star”进行主题关联的文本。
可见,通过本实施例的方法,可以合理地对各个文本进行语义理解,在信息推荐时的效果很好,尤其针对小语种的信息推荐时,由于不需要进行语义分析,避免了语义分析过程的限制,能较准确地进行信息推荐。
以下以另一个具体的应用实例来说明本发明的信息推荐方法,在本实施例中的方法主要应用于用户将英语词组输入到信息推荐***,信息推荐***将该英语词组作为目标文本进行信息推荐,如图9所示,则本实施例的方法主要包括如下两个部分:
步骤501,信息推荐***会提供用户输入界面,这样,用户可以在该用户输入界面输入英语词组,比如“brawl start”,且用户还可以在用户输入界面选择信息推荐***推荐的信息的语言类型,具体为日语。
步骤502,信息推荐***将用户输入的英语词组作为目标文本,对目标文本进行分词得到目标分词,即“brawl”和“start”,还可以得到目标文本及目标分词分别对应的第一目标联想文本和第二目标联想文本,比如“start”的第二目标联想文本可以包括“star”等。
进一步地,在信息推荐***中可以事先预置有文本图谱和联想模型,如果信息推荐***确定待匹配的联想模型,并执行如下步骤503;如果信息推荐***确定待匹配的文本图谱,则执行如下步骤504
步骤503,信息推荐***将“brawl start”、“brawl”、“start”、第一目标联想文本和第二目标联想文本分别与联想模型进行匹配,得到与“brawl start”、“brawl”、“start”、第一目标联想文本和第二目标联想文本相匹配的第一样本文本和第一联想文本,其中包括相关的日语文本,并可以直接输出相匹配的第一样本文本和第一联想文本。例如上述图8b所示的信息。
步骤504,信息推荐***将“brawl start”、“brawl”和“start”分别与文本图谱进行匹配,得到与“brawl start”、“brawl”和“start”相匹配的第二样本文本,其中包括相关的日语文本,并可以直接输出相匹配的第二样本文本。例如上述图8b所示的信息。
可见,通过本实施例的方法,可以合理地对各个文本进行语义理解,在信息推荐时的效果很好,尤其针对小语种的信息推荐时,由于不需要进行语义分析,避免了语义分析过程的限制,能较准确地进行信息推荐。
本发明实施例还提供一种信息推荐***,其结构示意图如图10所示,具体可以包括:
文本获取单元10,用于获取目标文本。
文本获取单元10,还用于对目标文本进行分词,得到目标文本对应的目标分词,及获取所述目标文本对应的第一目标联想文本及目标分词对应的第二目标联想文本。
模型获取单元11,用于获取联想模型,所述联想模型中储存有多个第一样本文本及多个第一样本文本分别对应的特征信息,所述特征信息中包括第一联想文本。
该模型获取单元11,具体用于获取样本推荐***中的搜索操作信息,所述搜索操作信息包括搜索文本及所述样本推荐***对所述搜索文本的搜索结果;获取所述搜索文本对应的样本分词;根据所述搜索文本对应的搜索结果,统计所述样本分词及所述搜索文本分别对应的联想文本,则所述样本分词及所述搜索文本分别对应的联想文本为所述联想模型中的第一联想文本,所述样本分词及所述搜索文本为所述联想模型中的第一样本文本。
其中,所述搜索结果中包括:所述搜索文本对应的多条第一搜索信息及所述样本分词对应的多条第二搜索信息,则所述模型获取单元11在根据所述搜索文本对应的搜索结果,统计所述样本分词及所述搜索文本分别对应的联想文本时,具体地,当任一条第一搜索信息的排行信息和热度信息满足预置条件,且所述任一条第一搜索信息中包含所述搜索文本对应的联想文本时,根据所述任一条第一搜索信息确定所述搜索文本对应的联想文本;当任一条第二搜索信息的排行信息和热度信息满足预置条件,且所述任一条第二搜索信息中包含所述样本分词对应的联想文本,根据所述任一条第二搜索信息确定所述样本分词对应的联想文本。
该模型获取单元11,还用于确定所述样本分词及搜索文本分别对应的热度信息和排行信息,则所述第一样本文本的特征信息中还包括所述样本分词及搜索文本分别对应的热度信息和排行信息。
匹配单元12,用于将所述文本获取单元10获取的目标文本、获取的目标分词、第一目标联想文本和第二目标联想文本分别与所述模型获取单元11获取的联想模型中的第一样本文本及第一联想文本进行匹配,得到与所述目标文本、目标分词和第一目标联想文本及第二目标联想文本相匹配的所述第一样本文本及第一联想文本。
推荐单元13,用于根据所述匹配单元12匹配得到的第一样本文本及第一联想文本,对所述目标文本进行信息推荐。
该推荐单元13,具体用于将所述目标文本、目标分词、第一目标联想文本和第二目标联想文本分别与联想模型中的各个第一样本文本及其第一联想文本进行匹配,得到相匹配的第一样本文本和第一联想文本;从所述相匹配的第一样本文本和第一联想文本中选择排行信息和热度信息满足预置条件的第一样本文本和第一联想文本。
进一步地,本实施例中的信息推荐***还会包括:
图谱获取单元14,用于获取文本图谱,所述文本图谱中包括多个第二样本文本及任意两个第二样本文本之间是否基于主题类型进行关联的信息;则所述匹配单元13,还用于将所述目标文本及其目标分词分别与所述图谱获取单元14获取的文本图谱进行匹配,得到与所述目标文本和目标分词相关联的第二样本文本;所述推荐单元14,还用于根据匹配单元13匹配得到的第二样本文本,对所述目标文本进行相关主题的推荐。
其中,图谱获取单元14,具体用于获取样本推荐***中的搜索操作信息,所述搜索操作信息包括搜索文本;获取所述搜索文本对应的样本分词,及获取所述搜索文本及样本分词分别对应的特征信息;根据所述搜索文本及样本分词分别对应的特征信息对所述搜索文本及样本分词进行主题聚类,得到多个主题类型的第二样本文本;将同一主题类型中的任意两个第二样本文本之间进行关联。
图谱获取单元15,还用于确定所述多个主题类型中任意两个主题类型的第二样本文本之间的相似参数;将相似参数满足预置条件的任意两个主题类型的第二样本文本之间进行关联。
可见,在本实施例的信息推荐***中,匹配单元12会采用目标文本及其目标分词分别对应的第一目标联想文本和第二目标联想文本,来匹配联想模型,从而得到相匹配的第一样本文本及第一联想文本,进而推荐单元13基于此进行信息推荐。在这个过程中不需要对文本进行语义分析,但是确能考虑到与文本在语义或应用场景等方面相关的联想文本,这样可以避免在语义分析过程中造成的限制,且能提供更全面的与目标文本相关的文本即相匹配的第一样本和第一联想文本,实现了对目标文本的全面且精准地推荐。
本发明实施例还提供一种终端设备,其结构示意图如图11所示,该终端设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(centralprocessing units,CPU)20(例如,一个或一个以上处理器)和存储器21,一个或一个以上存储应用程序221或数据222的存储介质22(例如一个或一个以上海量存储设备)。其中,存储器21和存储介质22可以是短暂存储或持久存储。存储在存储介质22的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对终端设备中的一系列指令操作。更进一步地,中央处理器20可以设置为与存储介质22通信,在终端设备上执行存储介质22中的一系列指令操作。
具体地,在存储介质22中储存的应用程序221包括信息推荐的应用程序,且该程序可以包括上述信息推荐***中的文本获取单元10,模型获取单元11,匹配单元12,推荐单元13和图谱获取单元14,在此不进行赘述。更进一步地,中央处理器20可以设置为与存储介质22通信,在终端设备上执行存储介质22中储存的信息推荐的应用程序对应的一系列操作。
终端设备还可以包括一个或一个以上电源23,一个或一个以上有线或无线网络接口24,一个或一个以上输入输出接口25,和/或,一个或一个以上操作***223,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述方法实施例中所述的由信息推荐***所执行的步骤可以基于该图11所示的终端设备的结构。
本发明实施例另一方面还提供一种计算机可读存储介质,所述计算机可读存储介质储存多个计算机程序,所述计算机程序适于由处理器加载并执行如上述信息推荐***所执行的数据转移方法。
本发明实施例另一方面还提供一种终端设备,包括处理器和存储器;
所述存储器用于储存多个计算机程序,所述计算机程序用于由处理器加载并执行如上述信息推荐***所执行的数据转移方法;所述处理器,用于实现所述多个计算机程序中的各个计算机程序。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM)、随机存取存储器(RAM)、磁盘或光盘等。
以上对本发明实施例所提供的一种信息推荐方法、***及存储介质和终端设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种信息推荐方法,其特征在于,包括:
获取目标文本;
对所述目标文本进行分词,以得到所述目标文本对应的目标分词;
获取所述目标文本对应的第一目标联想文本及目标分词对应的第二目标联想文本;
获取联想模型,所述联想模型中储存有多个第一样本文本及所述多个第一样本文本分别对应的特征信息,所述特征信息中包括与所述第一样本文本对应的第一联想文本;
将所述目标文本、目标分词、第一目标联想文本和第二目标联想文本分别与所述联想模型中的第一样本文本及第一联想文本进行匹配,得到与所述目标文本、目标分词和第一目标联想文本及第二目标联想文本相匹配的所述第一样本文本及第一联想文本;
根据所述匹配得到的第一样本文本及第一联想文本对所述目标文本进行信息推荐。
2.如权利要求1所述的方法,其特征在于,所述获取联想模型,具体包括:
获取样本推荐***中的搜索操作信息,所述搜索操作信息包括搜索文本及所述样本推荐***对所述搜索文本的搜索结果;
获取所述搜索文本对应的样本分词;
根据所述搜索文本对应的搜索结果,统计所述搜索文本及所述样本分词搜索文本分别对应的联想文本,则所述样本分词及所述搜索文本为所述联想模型中储存的第一样本文本,所述样本分词及所述搜索文本分别对应的联想文本为所述联想模型中储存的第一联想文本。
3.如权利要求2所述的方法,其特征在于,所述搜索结果包括:所述搜索文本对应的多条第一搜索信息及所述样本分词对应的多条第二搜索信息,则所述根据所述搜索文本对应的搜索结果,统计所述搜索文本及样本分词分别对应的联想文本,具体包括:
当任一条第一搜索信息的排行信息和热度信息满足预置条件,且所述任一条第一搜索信息中包含所述搜索文本对应的联想文本,根据所述任一条第一搜索信息确定所述搜索文本对应的联想文本;
如果任一条第二搜索信息的排行信息和热度信息满足预置条件,且所述任一条第二搜索信息中包含所述样本分词对应的联想文本,根据所述任一条第二搜索信息确定所述样本分词对应的联想文本。
4.如权利要求2所述的方法,其特征在于,所述特征信息还包括所述多条第一样本文本分别对应的热度信息和排行信息,所述获取联想模型,还包括:
确定所述样本分词及搜索文本分别对应的热度信息和排行信息,则所述第一样本文本的特征信息中还包括搜索文本分别对应的热度信息和排行信息。
5.如权利要求4所述的方法,其特征在于,所述将所述目标文本、获取的目标分词、第一目标联想文本和第二目标联想文本分别与所述联想模型中的第一样本文本及第一联想文本进行匹配,得到与所述目标文本、目标分词和第一目标联想文本及第二目标联想文本相匹配的所述第一样本文本和第一联想文本,具体包括:
将所述目标文本、目标分词和目标联想文本分别与联想模型中的各个第一样本文本及其第一联想文本进行匹配,得到相匹配的第一样本文本和第一联想文本;
从所述相匹配的第一样本文本和第一联想文本中选择排行信息和热度信息满足预置条件的第一样本文本和第一联想文本。
6.如权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
获取文本图谱,所述文本图谱中包括多个第二样本文本及任意两个第二样本文本之间是否基于主题类型进行关联的信息;
将所述目标文本及其目标分词分别与所述文本图谱中的第二样本文本进行匹配,得到与所述目标文本和目标分词相关联的第二样本文本;
根据所述匹配得到的第二样本文本,对所述目标文本进行相关主题的推荐。
7.如权利要求6所述的方法,其特征在于,所述获取文本图谱,具体包括:
获取样本推荐***中的搜索操作信息,所述搜索操作信息包括搜索文本;
获取所述搜索文本对应的样本分词,及获取所述搜索文本及样本分词分别对应的特征信息;
根据所述搜索文本及样本分词分别对应的特征信息对所述搜索文本及样本分词进行主题聚类,得到多个主题类型的第二样本文本;
将同一主题类型中的任意两个第二样本文本之间进行关联以得到所述文本图谱。
8.如权利要求7所述的方法,其特征在于,所述得到多个主题类型的第二样本文本之后,还包括:
确定所述多个主题类型中任意两个主题类型的第二样本文本之间的相似参数;
将相似参数满足预置条件的任意两个主题类型的第二样本文本之间进行关联。
9.一种信息推荐***,其特征在于,包括:
文本获取单元,用于获取目标文本;
所述文本获取单元,还用于对所述目标文本进行分词,得到所述目标文本对应的目标分词,及获取所述目标文本对应的第一目标联想文本及目标分词对应的第二目标联想文本;
模型获取单元,用于获取联想模型,所述联想模型中包括多个第一样本文本及所述多个第一样本文本分别对应的特征信息,所述特征信息中包括第一联想文本;
匹配单元,用于将所述目标文本、获取的目标分词、第一目标联想文本和第二目标联想文本分别与所述联想模型中的第一样本文本及第一联想文本进行匹配,得到与所述目标文本、目标分词和第一目标联想文本及第二目标联想文本相匹配的所述第一样本文本及第一联想文本;
推荐单元,用于根据所述匹配得到的第一样本文本及第一联想文本对所述目标文本进行信息推荐。
10.如权利要求9所述的***,其特征在于,还包括:
图谱获取单元,用于获取文本图谱,所述文本图谱中包括多个第二样本文本及任意两个第二样本文本之间是否基于主题类型进行关联信息;
所述匹配单元,还用于将所述目标文本及其目标分词分别与所述文本图谱中的第二样本文本进行匹配,得到与所述目标文本和目标分词相关联的第二样本文本;
所述推荐单元,还用于根据所述匹配得到的第二样本文本,对所述目标文本进行相关主题的推荐。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质储存多个计算机程序,所述计算机程序适于由处理器加载并执行如权利要求1至8任一项所述的信息推荐方法。
12.一种终端设备,其特征在于,包括处理器和存储器;
所述存储器用于储存多个计算机程序,所述计算机程序用于由处理器加载并执行如权利要求1至8任一项所述的信息推荐方法;所述处理器,用于实现所述多个计算机程序中的各个计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011091495.5A CN112463918B (zh) | 2020-10-13 | 2020-10-13 | 一种信息推荐方法、***及存储介质和终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011091495.5A CN112463918B (zh) | 2020-10-13 | 2020-10-13 | 一种信息推荐方法、***及存储介质和终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112463918A true CN112463918A (zh) | 2021-03-09 |
CN112463918B CN112463918B (zh) | 2023-10-31 |
Family
ID=74833140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011091495.5A Active CN112463918B (zh) | 2020-10-13 | 2020-10-13 | 一种信息推荐方法、***及存储介质和终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112463918B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827253A (zh) * | 2019-10-30 | 2020-02-21 | 北京达佳互联信息技术有限公司 | 一种目标检测模型的训练方法、装置及电子设备 |
US20200242304A1 (en) * | 2017-11-29 | 2020-07-30 | Tencent Technology (Shenzhen) Company Limited | Text recommendation method and apparatus, and electronic device |
CN111475729A (zh) * | 2020-04-07 | 2020-07-31 | 腾讯科技(深圳)有限公司 | 搜索内容推荐方法及装置 |
-
2020
- 2020-10-13 CN CN202011091495.5A patent/CN112463918B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200242304A1 (en) * | 2017-11-29 | 2020-07-30 | Tencent Technology (Shenzhen) Company Limited | Text recommendation method and apparatus, and electronic device |
CN110827253A (zh) * | 2019-10-30 | 2020-02-21 | 北京达佳互联信息技术有限公司 | 一种目标检测模型的训练方法、装置及电子设备 |
CN111475729A (zh) * | 2020-04-07 | 2020-07-31 | 腾讯科技(深圳)有限公司 | 搜索内容推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112463918B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN108280061B (zh) | 基于歧义实体词的文本处理方法和装置 | |
CN107480143B (zh) | 基于上下文相关性的对话话题分割方法和*** | |
CN112270196B (zh) | 实体关系的识别方法、装置及电子设备 | |
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
WO2018189589A2 (en) | Systems and methods for document processing using machine learning | |
CN109086265B (zh) | 一种语义训练方法、短文本中多语义词消歧方法 | |
CN112559684A (zh) | 一种关键词提取及信息检索方法 | |
CN113282711B (zh) | 一种车联网文本匹配方法、装置、电子设备及存储介质 | |
KR101976081B1 (ko) | 토픽 모델링 기반 시맨틱 이미지 검색 방법, 시스템 및 컴퓨터 프로그램 | |
CN114880447A (zh) | 信息检索方法、装置、设备及存储介质 | |
CN113569011A (zh) | 文本匹配模型的训练方法、装置、设备及存储介质 | |
CN113392305A (zh) | 关键词的提取方法及装置、电子设备、计算机存储介质 | |
CN113011172A (zh) | 文本处理方法、装置、计算机设备和存储介质 | |
CN115238039A (zh) | 文本生成方法、电子设备及计算机可读存储介质 | |
CN114282513A (zh) | 文本语义相似度的匹配方法、***、智能终端及存储介质 | |
Shehata et al. | An efficient concept-based retrieval model for enhancing text retrieval quality | |
CN112463918B (zh) | 一种信息推荐方法、***及存储介质和终端设备 | |
CN115269961A (zh) | 内容搜索方法以及相关设备 | |
CN113590768B (zh) | 一种文本关联度模型的训练方法及装置、问答方法及装置 | |
CN114595370A (zh) | 模型训练、排序方法、装置、电子设备及存储介质 | |
CN114003706A (zh) | 关键词组合生成模型训练方法及装置 | |
CN114036289A (zh) | 一种意图识别方法、装置、设备及介质 | |
Zeid et al. | Arabic question answering system using graph ontology | |
CN113449094A (zh) | 语料获取方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40041036 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |