CN106407364A - 一种基于人工智能的信息推荐方法和装置 - Google Patents

一种基于人工智能的信息推荐方法和装置 Download PDF

Info

Publication number
CN106407364A
CN106407364A CN201610811561.9A CN201610811561A CN106407364A CN 106407364 A CN106407364 A CN 106407364A CN 201610811561 A CN201610811561 A CN 201610811561A CN 106407364 A CN106407364 A CN 106407364A
Authority
CN
China
Prior art keywords
information
recommended
scoring
recommendation
candidate recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610811561.9A
Other languages
English (en)
Other versions
CN106407364B (zh
Inventor
方晓敏
吴泽衡
王凡
石磊
何径舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610811561.9A priority Critical patent/CN106407364B/zh
Publication of CN106407364A publication Critical patent/CN106407364A/zh
Application granted granted Critical
Publication of CN106407364B publication Critical patent/CN106407364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于人工智能的信息推荐方法和装置,所述方法包括:当需要向任一用户推荐信息时,按照符合用户的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息;将待推荐的信息推荐给用户。应用本发明所述方案,能够提高推荐结果的准确性等。

Description

一种基于人工智能的信息推荐方法和装置
【技术领域】
本发明涉及网络技术,特别涉及一种基于人工智能的信息推荐方法和装置。
【背景技术】
目前,人工智能技术已经得到了广泛应用,人工智能(ArtificialIntelligence),英文缩写为AI,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。
如现有的推荐***中,可通过以下方式来实现对于用户的个性化推荐:通过统计用户的历史行为,获取用户的兴趣偏好,进而向用户推荐其感兴趣的信息,这里所提到的信息可以表现为各种形式,如商品信息、新闻信息等。
但是,上述兴趣偏好中通常只会包括一个或少数几个偏好类别,这样,将会反复不停地向用户推荐这一个或这少数几个类别的信息,无视用户对其它类别的需求,从而降低了推荐结果的准确性。
【发明内容】
本发明提供了一种基于人工智能的信息推荐方法和装置,能够提高推荐结果的准确性。
具体技术方案如下:
一种基于人工智能的信息推荐方法,包括:
当需要向任一用户推荐信息时,按照符合所述用户的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息;
将所述待推荐的信息推荐给所述用户。
一种基于人工智能的信息推荐装置,包括:挑选单元和推荐单元;
所述挑选单元,用于当需要向任一用户推荐信息时,按照符合所述用户的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息,并将所述待推荐的信息发送给所述推荐单元;
所述推荐单元,用于将所述待推荐的信息推荐给所述用户。
基于上述介绍可以看出,采用本发明所述方案,当需要向任一用户推荐信息时,可按照符合用户的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息,进而将待推荐的信息推荐给用户,从而相比于现有技术,既满足了用户的兴趣偏好,又丰富了推荐给用户的信息类别,进而提高了推荐结果的准确性。
【附图说明】
图1为本发明所述基于人工智能的信息推荐方法实施例的流程图。
图2为本发明所述基于人工智能的信息推荐装置实施例的组成结构示意图。
【具体实施方式】
为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。
实施例一
图1为本发明所述基于人工智能的信息推荐方法实施例的流程图,如图1所示,包括以下具体实现方式:
在11中,当需要向任一用户推荐信息时,按照符合用户的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息;
在12中,将待推荐的信息推荐给用户。
为便于表述,本实施例中,将待推荐的用户称为用户a,在向用户a推荐信息之前,需要先进行以下处理:获取用户a感兴趣的主题分布,以及,分别获取可供推荐的每条信息的主题分布。
其中,可供推荐的每条信息的主题分布可表示为[P1,P2,...,Pj,...,PQ]。
Pj表示每条信息属于第j个主题类别的概率,1≤j≤Q,Q表示针对可供推荐的各信息划分出的主题类别数。
Q为大于1的正整数,具体如何划分主题类别可根据实际需要而定,对于任一信息来说,其可能同时属于多个主题类别,如对于一本小说来说,其可能同时属于言情小说的主题类别和玄幻小说的主题类别,假设属于言情小说这一主题类别的概率为0.6(60%),属于玄幻小说这一主题类别的概率为0.4,那么该信息属于这两个主题类别之外的其它主题类别的概率则为0。
用户a感兴趣的主题分布可表示为[F1,F2,…,Fj,…,FQ]。
Fj表示用户a对第j个主题类别的感兴趣程度,可根据用户a的历史行为,获取到用户a对不同主题类别的感兴趣程度,并且,可根据用户a的历史行为的更新,对用户a对不同主题类别的感兴趣程度进行相应更新,具体实现均为现有技术。
如果用户a为新用户,不存在历史行为,那么可按照大多数老用户对不同主题类别的感兴趣程度,设定用户a对不同主题类别的感兴趣程度,后续当用户a存在历史行为后,再根据用户a的历史行为,对用户a对不同主题类别的感兴趣程度进行更新,当然,这里仅为举例说明,并不用于限制本发明的技术方案,针对新用户,除上述方式外,还可以采用本领域技术人员能够想到的其它任意处理方式。
在获取到用户a感兴趣的主题分布以及可供推荐的各信息的主题分布之后,即可按照符合用户a的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息,进而将待推荐的信息推荐给用户a。
在从可供推荐的各信息中挑选待推荐的信息时,可根据各信息的评分进行挑选,并且,可采用贪心算法进行挑选。
具体地,从可供推荐的各信息中挑选出待推荐的信息可包括:
1)根据上述原则,分别计算出可供推荐的每条信息的第一评分,并将取值最大的第一评分对应的信息加入到推荐集合中,推荐集合初始为空;
2)统计推荐集合中包括的信息数,并针对推荐集合,执行以下预定处理:
21)将统计结果赋值给参数n;
生成M-n个候选推荐集合,M的取值等于可供推荐的信息数,每个候选推荐集合中包括:已加入到推荐集合中的信息以及一个未加入到推荐集合中的信息,且,任意两个候选推荐集合均不相同;
22)分别计算出每个候选推荐集合的第一评分,将取值最大的第一评分对应的候选推荐集合作为推荐集合;
23)统计推荐集合中包括的信息数,若统计结果等于预先设定的阈值N,N为大于1的正整数,则将推荐集合中的信息作为待推荐的信息,否则,重复执行21)~23)。
N表示需要推荐给用户a的信息数,通常不会只推荐一条信息,具体取值可根据实际需要而定。
上述挑选过程可举例说明如下:
假设共存在五本小说,分别b、c、d、e、f,需要从这五本小说中选出三本推荐给用户a;
首先,分别计算出五本小说的第一评分,假设f的第一评分的取值最大,那么则将f加入到推荐集合中,得到推荐集合{f};
之后,分别将b、c、d、e加入到推荐集合{f}中,得到四个候选推荐集合{f,b}、{f,c}、{f,d}和{f,e},分别计算出这四个候选推荐集合的第一评分,假设候选推荐集合{f,c}的第一评分的取值最大,那么则将候选推荐集合{f,c}作为推荐集合;
之后,分别将b、d、e加入到推荐集合{f,c}中,得到三个候选推荐集合{f,c,b}、{f,c,d}和{f,c,e},分别计算出这三个候选推荐集合的第一评分,假设候选推荐集合{f,c,d}的第一评分的取值最大,那么则将候选推荐集合{f,c,d}作为推荐集合;
由于推荐集合{f,c,d}中包括的信息数为三,等于需要推荐给用户a的信息数,那么则可结束挑选,将推荐集合{f,c,d}中的信息作为待推荐的信息。
采用上述挑选方法,可以有效地降低处理复杂度,不需要枚举所有的集合。
其中,针对每个候选推荐集合,在计算该候选推荐集合的第一评分时,可首先获取该候选推荐集合的主题分布[F′1,F′2,…,F′j,…,F′Q],F′j表示该候选推荐集合对第j个主题类别的覆盖程度,然后计算该候选推荐集合的主题分布与用户a感兴趣的主题分布之间的相似度,将计算结果作为该候选推荐集合的第一评分。
在计算可供推荐的每条信息的第一评分时,可分别将可供推荐的每条信息作为一个只包含一个元素的候选推荐集合,进而计算出每个候选推荐集合的第一评分。
每个候选推荐集合对第j个主题类别的覆盖程度
其中,A表示一个候选推荐集合,Pj(α)表示候选推荐集合A中的任一信息α属于第j个主题类别的概率,该信息可从信息α的主题分布中获取。
由于Pj(α)表示候选推荐集合A中的任一信息α属于第j个主题类别的概率,那么1-Pj(α)则表示信息α不属于第j个主题类别的概率,相应地,候选推荐集合A中的所有信息均不属于第j个主题类别的概率则为换言之,候选推荐集合A中至少有一个信息属于第j个主题类别的概率则为
针对每个候选推荐集合,可分别按照的方式计算出该候选推荐集合对每个主题类别的覆盖程度,进而得到该候选推荐集合的主题分布[F′1,F′2,…,F′j,…,F′Q],之后,可计算该候选推荐集合的主题分布与用户a感兴趣的主题分布[F1,F2,…,Fj,…,FQ]之间的相似度,并将计算结果作为该候选推荐集合的第一评分,如何计算相似度为现有技术。
采用上述方式进行信息挑选,可以使推荐给用户a的信息在满足用户a的兴趣偏好的前提下,覆盖尽可能多的主题类别,即实现了主题类别的多样性,其中,满足用户a的兴趣偏好体现在计算主题分布之间的相似度上,多样性体现在计算候选推荐集合对不同主题类别的覆盖程度上。
举例说明:
假设有三本小说x,y,z,需要从这三本小说里挑选两本推荐给用户a;
x和y属于言情小说的概率均为0.5,z属于玄幻小说的概率为0.3;
如果挑选的是x和y,那么它们对言情小说这一主题类别的覆盖程度为1–(1-0.5)*(1-0.5)=0.75,对玄幻小说这一主题类别的覆盖程度为0;
如果挑选的是x和z,那么它们对言情小说这一主题类别的覆盖程度为0.5,对玄幻小说这一主题类别的覆盖程度为0.3;
显然,挑选x和z的收益为0.5+0.3=0.8,比挑选x和y的收益0.75+0=0.75要大,因为挑选x和z所覆盖的主题类别更多。
另外,现有技术中,在对用户进行信息推荐时,往往忽略对用户兴趣的探索,激发用户的需求。某个用户在历史行为上没有表现出对某个主题类别的信息感兴趣,并不一定代表他真的对这个主题类别的信息不感兴趣,很可能只是因为从来没有或很少向他推荐这一主题类别的信息,从而使得用户一直没有机会接触到这个主题类别的信息。
再有,现有技术中往往只推荐比较热门的信息,而忽视比较冷门的信息,比如来了一条新的信息,如果从来没有用户点击过它等,那么可能就会认为没有用户对这条信息感兴趣,从而不向任何用户推荐该信息,进而导致该信息一直没有展示机会,湮没在大量的信息之中。
针对上述问题,本实施例中提出,对于待推荐的用户a,可按照符合用户a的兴趣偏好并满足推荐结果的多样性的原则,同时结合对于用户a的新鲜度,从可供推荐的各信息中挑选出待推荐的信息,进而将待推荐的信息推荐给用户a。
具体地,从可供推荐的各信息中挑选出待推荐的信息可包括:
1)针对可供推荐的每条信息,分别计算出该信息的第一评分和体现对于用户的新鲜度的第二评分,并结合第一评分和第二评分计算出该信息的综合评分;
将取值最大的综合评分对应的信息加入到推荐集合中,推荐集合初始为空;
2)统计推荐集合中包括的信息数,并针对推荐集合,执行以下预定处理:
21)将统计结果赋值给参数n’;
生成M-n’个候选推荐集合,M的取值等于可供推荐的信息数,每个候选推荐集合中包括:已加入到推荐集合中的信息以及一个未加入到推荐集合中的信息,且,任意两个候选推荐集合均不相同;
22)分别计算出每个候选推荐集合的第一评分和第二评分,并结合第一评分和第二评分计算出每个候选推荐集合的综合评分,将取值最大的综合评分对应的候选推荐集合作为推荐集合;
23)统计推荐集合中包括的信息数,若统计结果等于预先设定的阈值N,N为大于1的正整数,则将推荐集合中的信息作为待推荐的信息,否则,重复执行21)~23)。
其中,在计算每个候选推荐集合的第二评分时,可分别确定出该候选推荐集合中的每条信息被推荐给所有用户的总次数,并针对Q个主题类别中的每个主题类别,分别确定出属于该主题类别的信息被推荐给用户a的总次数,根据确定结果计算出该候选推荐集合的第二评分。
在计算可供推荐的每条信息的第二评分时,可分别将可供推荐的每条信息作为一个只包含一个元素的候选推荐集合,进而计算出每个候选推荐集合的第二评分。
每个候选推荐集合的第二评分
其中,wi表示该候选推荐集合中的第i条信息被推荐给所有用户的总次数,1≤i≤L,L表示该候选推荐集合中包括的信息数;sj表示属于第j个主题类别的信息被推荐给用户a的总次数;a1和b1分别表示预先设定的权重,具体取值均可根据实际需要而定。
需要说明的是,在实际应用中,wi和sj的取值有可能为0,而0是不能作为分母的,为避免出现这一情况,在按照公式(2)计算第二评分时,可在wi和sj的原有取值的基础上分别加上一个正数,如加1。
对于每个候选推荐集合,在分别获取到该候选推荐集合的第一评分和第二评分之后,可计算出该候选推荐集合的综合评分。
综合评分=a2*第一评分+b2*第二评分,其中,a2和b2分别表示预先设定的权重,具体取值同样可根据实际需要而定。
以上是关于方法实施例的介绍,以下通过装置实施例,对本发明所述方案进行进一步说明。
实施例二
图2为本发明所述基于人工智能的信息推荐装置实施例的组成结构示意图,如图2所示,包括:挑选单元21和推荐单元22。
挑选单元21,用于当需要向任一用户推荐信息时,按照符合用户的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息,并将待推荐的信息发送给推荐单元22;
推荐单元22,用于将待推荐的信息推荐给用户。
其中,挑选单元21中包可具体括:第一处理子单元211和第二处理子单元212。
第一处理子单元211,
用于根据所述原则,分别计算出可供推荐的每条信息的第一评分,并将取值最大的第一评分对应的信息加入到推荐集合中,推荐集合初始为空;
统计推荐集合中包括的信息数,并针对推荐集合,执行以下预定处理:
将统计结果赋值给参数n;
生成M-n个候选推荐集合,M的取值等于可供推荐的信息总数,每个候选推荐集合中包括:已加入到推荐集合中的信息以及一个未加入到推荐集合中的信息,且,任意两个候选推荐集合均不相同;
分别计算出每个候选推荐集合的第一评分,将取值最大的第一评分对应的候选推荐集合作为推荐集合;
统计推荐集合中包括的信息数,若统计结果等于预先设定的阈值N,N为大于1的正整数,则将推荐集合发送给第二处理子单元212,否则,重复执行所述预定处理。
第二处理子单元212,用于将推荐集合中的信息作为待推荐的信息,将待推荐的信息发送给推荐单元22。
针对每个候选推荐集合,第一处理子单元211可首先获取用户感兴趣的主题分布[F1,F2,…,Fj,…,FQ],1≤j≤Q,Fj表示用户对第j个主题类别的感兴趣程度,Q表示针对可供推荐的各信息划分出的主题类别数,Q为大于1的正整数,并获取该候选推荐集合的主题分布[F′1,F′2,…,F′j,…,F′Q],F′j表示该候选推荐集合对第j个主题类别的覆盖程度,之后,计算该候选推荐集合的主题分布与用户感兴趣的主题分布之间的相似度,将计算结果作为该候选推荐集合的第一评分;
另外,针对可供推荐的每条信息,第一处理子单元211可将该信息作为一个只包含一个元素的候选推荐集合,计算该候选推荐集合的第一评分。
第一处理子单元211还可进一步用于,
预先分别确定出可供推荐的每条信息的主题分布[P1,P2,...,Pj,...,PQ],Pj表示每条信息属于第j个主题类别的概率;
对于每个候选推荐集合,所述候选推荐集合对第j个主题类别的覆盖程度
其中,A表示一个候选推荐集合,Pj(α)表示该候选推荐集合中的任一信息α属于第j个主题类别的概率。
采用上述方式进行信息挑选,可以使推荐给用户的信息在满足用户的兴趣偏好的前提下,覆盖尽可能多的主题类别,即实现了主题类别的多样性,其中,满足用户的兴趣偏好体现在计算主题分布之间的相似度上,多样性体现在计算候选推荐集合对不同主题类别的覆盖程度上。
另外,现有技术中,在对用户进行信息推荐时,往往忽略对用户兴趣的探索,激发用户的需求。某个用户在历史行为上没有表现出对某个主题类别的信息感兴趣,并不一定代表他真的对这个主题类别的信息不感兴趣,很可能只是因为从来没有或很少向他推荐这一主题类别的信息,从而使得用户一直没有机会接触到这个主题类别的信息。
再有,现有技术中往往只推荐比较热门的信息,而忽视比较冷门的信息,比如来了一条新的信息,如果从来没有用户点击过它等,那么可能就会认为没有用户对这条信息感兴趣,从而不向任何用户推荐该信息,进而导致该信息一直没有展示机会,湮没在大量的信息之中。
针对上述问题,挑选单元21可进一步用于,按照符合用户的兴趣偏好并满足推荐结果的多样性的原则,同时结合对于用户的新鲜度,从可供推荐的各信息中挑选出待推荐的信息。
当结合对于用户的新鲜度时,第一处理子单元211,
用于针对可供推荐的每条信息,分别计算出该信息的第一评分和体现对于用户的新鲜度的第二评分,并结合第一评分和第二评分计算出该信息的综合评分;
将取值最大的综合评分对应的信息加入到推荐集合中,推荐集合初始为空;
统计推荐集合中包括的信息数,并针对推荐集合,执行以下预定处理:
将统计结果赋值给参数n’;
生成M-n’个候选推荐集合,M的取值等于可供推荐的信息数,每个候选推荐集合中包括:已加入到推荐集合中的信息以及一个未加入到推荐集合中的信息,且,任意两个候选推荐集合均不相同;
分别计算出每个候选推荐集合的第一评分和第二评分,并结合第一评分和第二评分计算出每个候选推荐集合的综合评分,将取值最大的综合评分对应的候选推荐集合作为推荐集合;
统计推荐集合中包括的信息数,若统计结果等于预先设定的阈值N,N为大于1的正整数,则将推荐集合发送给第二处理子单元212,否则,重复执行所述预定处理。
其中,针对每个候选推荐集合,第一处理子单元211可分别确定出该候选推荐集合中的每条信息被推荐给所有用户的总次数,并针对Q个主题类别中的每个主题类别,分别确定出属于该主题类别的信息被推荐给待推荐的用户的总次数,根据确定结果计算出该候选推荐集合的第二评分。
针对可供推荐的每条信息,第一处理子单元211可将该信息作为一个只包含一个元素的候选推荐集合,计算该候选推荐集合的第二评分。
每个候选推荐集合的第二评分
其中,wi表示该候选推荐集合中的第i条信息被推荐给所有用户的总次数,1≤i≤L,L表示该候选推荐集合中包括的信息数;sj表示属于第j个主题类别的信息被推荐给待推荐的用户的总次数;a1和b1分别表示预先设定的权重。
需要说明的是,在实际应用中,wi和sj的取值有可能为0,而0是不能作为分母的,为避免出现这一情况,在按照公式(2)计算第二评分时,可在wi和sj的原有取值的基础上分别加上一个正数,如加1。
对于每个候选推荐集合,在分别获取到该候选推荐集合的第一评分和第二评分之后,即可计算出该候选推荐集合的综合评分。
综合评分=a2*第一评分+b2*第二评分,其中,a2和b2分别表示预先设定的权重。
推荐单元22如何将待推荐的信息推荐给用户不作限制,可根据实际需要,采用现有的任意推荐方式。
总之,采用本发明所述方案,当需要向任一用户推荐信息时,可按照符合用户的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息,进而将待推荐的信息推荐给用户,从而相比于现有技术,既满足了用户的兴趣偏好,又丰富了推荐给用户的信息类别,进而提高了推荐结果的准确性;在此基础上,还可通过借助于新鲜度评分,来激发用户对于新事物的兴趣,同时解决了冷门信息等鲜有机会被展示的问题;另外,本发明所述方案可适用于各种类型的信息推荐,如商品信息或新闻信息等,具有广泛适用性。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (13)

1.一种基于人工智能的信息推荐方法,其特征在于,包括:
当需要向任一用户推荐信息时,按照符合所述用户的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息;
将所述待推荐的信息推荐给所述用户。
2.根据权利要求1所述的方法,其特征在于,
所述从可供推荐的各信息中挑选出待推荐的信息包括:
根据所述原则,分别计算出可供推荐的每条信息的第一评分,并将取值最大的第一评分对应的信息加入到推荐集合中,所述推荐集合初始为空;
统计所述推荐集合中包括的信息数,并针对所述推荐集合,执行以下预定处理:
将统计结果赋值给参数n;
生成M-n个候选推荐集合,M的取值等于可供推荐的信息数,每个候选推荐集合中包括:已加入到所述推荐集合中的信息以及一个未加入到所述推荐集合中的信息,且,任意两个候选推荐集合均不相同;
分别计算出每个候选推荐集合的第一评分,将取值最大的第一评分对应的候选推荐集合作为所述推荐集合;
统计所述推荐集合中包括的信息数,若统计结果等于预先设定的阈值N,N为大于1的正整数,则将所述推荐集合中的信息作为所述待推荐的信息,否则,重复执行所述预定处理。
3.根据权利要求2所述的方法,其特征在于,
所述分别计算出每个候选推荐集合的第一评分包括:
获取所述用户感兴趣的主题分布[F1,F2,…,Fj,…,FQ],1≤j≤Q,Fj表示所述用户对第j个主题类别的感兴趣程度,Q表示针对可供推荐的各信息划分出的主题类别数,Q为大于1的正整数;
分别获取每个候选推荐集合的主题分布[F′1,F′2,…,F′j,…,F′Q],F′j表示每个候选推荐集合对第j个主题类别的覆盖程度;
分别计算每个候选推荐集合的主题分布与所述用户感兴趣的主题分布之间的相似度,将计算结果作为每个候选推荐集合的第一评分;
所述分别计算出可供推荐的每条信息的第一评分包括:
分别将可供推荐的每条信息作为一个只包含一个元素的候选推荐集合,计算每个候选推荐集合的第一评分。
4.根据权利要求3所述的方法,其特征在于,
该方法进一步包括:
在从可供推荐的各信息中挑选出待推荐的信息之前,分别确定出可供推荐的每条信息的主题分布[P1,P2,...,Pj,...,PQ],Pj表示每条信息属于第j个主题类别的概率;
对于每个候选推荐集合,分别计算出1与所述候选推荐集合中的每条信息属于第j个主题类别的概率之差,将各差值相加,将1与所述相加结果之差作为所述候选推荐集合对第j个主题类别的覆盖程度F′j
5.根据权利要求3或4所述的方法,其特征在于,
该方法进一步包括:
按照符合所述用户的兴趣偏好并满足推荐结果的多样性的原则,同时结合对于所述用户的新鲜度,从可供推荐的各信息中挑选出待推荐的信息。
6.根据权利要求5所述的方法,其特征在于,
当结合对于所述用户的新鲜度时,所述从可供推荐的各信息中挑选出待推荐的信息包括:
针对可供推荐的每条信息,分别计算出所述信息的第一评分和体现对于用户的新鲜度的第二评分,并结合所述第一评分和所述第二评分计算出所述信息的综合评分;
将取值最大的综合评分对应的信息加入到推荐集合中,所述推荐集合初始为空;
统计所述推荐集合中包括的信息数,并针对所述推荐集合,执行以下预定处理:
将统计结果赋值给参数n’;
生成M-n’个候选推荐集合,M的取值等于可供推荐的信息数,每个候选推荐集合中包括:已加入到所述推荐集合中的信息以及一个未加入到所述推荐集合中的信息,且,任意两个候选推荐集合均不相同;
分别计算出每个候选推荐集合的第一评分和第二评分,并结合所述第一评分和所述第二评分计算出每个候选推荐集合的综合评分,将取值最大的综合评分对应的候选推荐集合作为所述推荐集合;
统计所述推荐集合中包括的信息数,若统计结果等于预先设定的阈值N,N为大于1的正整数,则将所述推荐集合中的信息作为所述待推荐的信息,否则,重复执行所述预定处理。
7.根据权利要求6所述的方法,其特征在于,
所述分别计算出每个候选推荐集合的第二评分包括:
针对每个候选推荐集合,分别确定出所述候选推荐集合中的每条信息被推荐给所有用户的总次数,并针对Q个主题类别中的每个主题类别,分别确定出属于所述主题类别的信息被推荐给待推荐的所述用户的总次数,根据确定结果计算出所述候选推荐集合的第二评分;
分别计算出可供推荐的每条信息的第二评分包括:
分别将可供推荐的每条信息作为一个只包含一个元素的候选推荐集合,计算每个候选推荐集合的第二评分。
8.一种基于人工智能的信息推荐装置,其特征在于,包括:挑选单元和推荐单元;
所述挑选单元,用于当需要向任一用户推荐信息时,按照符合所述用户的兴趣偏好并满足推荐结果的多样性的原则,从可供推荐的各信息中挑选出待推荐的信息,并将所述待推荐的信息发送给所述推荐单元;
所述推荐单元,用于将所述待推荐的信息推荐给所述用户。
9.根据权利要求8所述的装置,其特征在于,
所述挑选单元中包括:第一处理子单元和第二处理子单元;
所述第一处理子单元,
用于根据所述原则,分别计算出可供推荐的每条信息的第一评分,并将取值最大的第一评分对应的信息加入到推荐集合中,所述推荐集合初始为空;
统计所述推荐集合中包括的信息数,并针对所述推荐集合,执行以下预定处理:
将统计结果赋值给参数n;
生成M-n个候选推荐集合,M的取值等于可供推荐的信息数,每个候选推荐集合中包括:已加入到所述推荐集合中的信息以及一个未加入到所述推荐集合中的信息,且,任意两个候选推荐集合均不相同;
分别计算出每个候选推荐集合的第一评分,将取值最大的第一评分对应的候选推荐集合作为所述推荐集合;
统计所述推荐集合中包括的信息数,若统计结果等于预先设定的阈值N,N为大于1的正整数,则将所述推荐集合发送给所述第二处理子单元,否则,重复执行所述预定处理;
所述第二处理子单元,用于将所述推荐集合中的信息作为所述待推荐的信息,将所述待推荐的信息发送给所述推荐单元。
10.根据权利要求9所述的装置,其特征在于,
所述第一处理子单元针对每个候选推荐集合,获取所述用户感兴趣的主题分布[F1,F2,…,Fj,…,FQ],1≤j≤Q,Fj表示所述用户对第j个主题类别的感兴趣程度,Q表示针对可供推荐的各信息划分出的主题类别数,Q为大于1的正整数,并获取所述候选推荐集合的主题分布[F′1,F′2,…,F′j,…,F′Q],F′j表示所述候选推荐集合对第j个主题类别的覆盖程度,计算所述候选推荐集合的主题分布与所述用户感兴趣的主题分布之间的相似度,将计算结果作为所述候选推荐集合的第一评分;
所述第一处理子单元针对可供推荐的每条信息,将所述信息作为一个只包含一个元素的候选推荐集合,计算所述候选推荐集合的第一评分。
11.根据权利要求10所述的装置,其特征在于,
所述第一处理子单元进一步用于,
预先分别确定出可供推荐的每条信息的主题分布[P1,P2,...,Pj,...,PQ],Pj表示每条信息属于第j个主题类别的概率;
对于每个候选推荐集合,分别计算出1与所述候选推荐集合中的每条信息属于第j个主题类别的概率之差,将各差值相加,将1与所述相加结果之差作为所述候选推荐集合对第j个主题类别的覆盖程度F′j
12.根据权利要求10或11所述的装置,其特征在于,
所述挑选单元进一步用于,按照符合所述用户的兴趣偏好并满足推荐结果的多样性的原则,同时结合对于所述用户的新鲜度,从可供推荐的各信息中挑选出待推荐的信息;
当结合对于所述用户的新鲜度时,所述第一处理子单元,
用于针对可供推荐的每条信息,分别计算出所述信息的第一评分和体现对于用户的新鲜度的第二评分,并结合所述第一评分和所述第二评分计算出所述信息的综合评分;
将取值最大的综合评分对应的信息加入到推荐集合中,所述推荐集合初始为空;
统计所述推荐集合中包括的信息数,并针对所述推荐集合,执行以下预定处理:
将统计结果赋值给参数n’;
生成M-n’个候选推荐集合,M的取值等于可供推荐的信息数,每个候选推荐集合中包括:已加入到所述推荐集合中的信息以及一个未加入到所述推荐集合中的信息,且,任意两个候选推荐集合均不相同;
分别计算出每个候选推荐集合的第一评分和第二评分,并结合所述第一评分和所述第二评分计算出每个候选推荐集合的综合评分,将取值最大的综合评分对应的候选推荐集合作为所述推荐集合;
统计所述推荐集合中包括的信息数,若统计结果等于预先设定的阈值N,N为大于1的正整数,则将所述推荐集合发送给所述第二处理子单元,否则,重复执行所述预定处理。
13.根据权利要求12所述的装置,其特征在于,
所述第一处理子单元针对每个候选推荐集合,分别确定出所述候选推荐集合中的每条信息被推荐给所有用户的总次数,并针对Q个主题类别中的每个主题类别,分别确定出属于所述主题类别的信息被推荐给待推荐的所述用户的总次数,根据确定结果计算出所述候选推荐集合的第二评分;
所述第一处理子单元针对可供推荐的每条信息,将所述信息作为一个只包含一个元素的候选推荐集合,计算所述候选推荐集合的第二评分。
CN201610811561.9A 2016-09-08 2016-09-08 一种基于人工智能的信息推荐方法和装置 Active CN106407364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610811561.9A CN106407364B (zh) 2016-09-08 2016-09-08 一种基于人工智能的信息推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610811561.9A CN106407364B (zh) 2016-09-08 2016-09-08 一种基于人工智能的信息推荐方法和装置

Publications (2)

Publication Number Publication Date
CN106407364A true CN106407364A (zh) 2017-02-15
CN106407364B CN106407364B (zh) 2021-06-11

Family

ID=57999121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610811561.9A Active CN106407364B (zh) 2016-09-08 2016-09-08 一种基于人工智能的信息推荐方法和装置

Country Status (1)

Country Link
CN (1) CN106407364B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368531A (zh) * 2017-06-14 2017-11-21 南昌航空大学 一种基于网站的中文新闻信息多维度分类的评分方法
CN108491540A (zh) * 2018-03-30 2018-09-04 北京百度网讯科技有限公司 文本信息推送方法、装置及智能终端
CN109376307A (zh) * 2018-12-19 2019-02-22 百度在线网络技术(北京)有限公司 文章推荐方法、装置和终端
CN110020110A (zh) * 2017-09-15 2019-07-16 腾讯科技(北京)有限公司 媒体内容推荐方法、装置及存储介质
CN110263244A (zh) * 2019-02-14 2019-09-20 腾讯科技(深圳)有限公司 内容推荐方法、装置、存储介质和计算机设备
CN110555743A (zh) * 2018-05-31 2019-12-10 阿里巴巴集团控股有限公司 商品对象推荐方法、装置及电子设备
CN110807127A (zh) * 2018-08-01 2020-02-18 北京优酷科技有限公司 视频推荐方法及装置
CN111316199A (zh) * 2018-10-16 2020-06-19 华为技术有限公司 一种信息处理方法及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957973A (zh) * 2010-10-29 2011-01-26 江苏瑞蚨通软件科技有限公司(中外合资) 一种商品推荐***
CN103246672A (zh) * 2012-02-09 2013-08-14 中国科学技术大学 对用户进行个性化推荐的方法和装置
CN103412872A (zh) * 2013-07-08 2013-11-27 西安交通大学 一种基于有限节点驱动的微博社会网络信息推荐方法
CN104090990A (zh) * 2014-07-31 2014-10-08 北京奇虎科技有限公司 新闻推送方法和***
CN104484431A (zh) * 2014-12-19 2015-04-01 合肥工业大学 一种基于领域本体的多源个性化新闻网页推荐方法
CN105574147A (zh) * 2015-12-15 2016-05-11 腾讯科技(深圳)有限公司 一种信息处理方法及服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957973A (zh) * 2010-10-29 2011-01-26 江苏瑞蚨通软件科技有限公司(中外合资) 一种商品推荐***
CN103246672A (zh) * 2012-02-09 2013-08-14 中国科学技术大学 对用户进行个性化推荐的方法和装置
CN103412872A (zh) * 2013-07-08 2013-11-27 西安交通大学 一种基于有限节点驱动的微博社会网络信息推荐方法
CN104090990A (zh) * 2014-07-31 2014-10-08 北京奇虎科技有限公司 新闻推送方法和***
CN104484431A (zh) * 2014-12-19 2015-04-01 合肥工业大学 一种基于领域本体的多源个性化新闻网页推荐方法
CN105574147A (zh) * 2015-12-15 2016-05-11 腾讯科技(深圳)有限公司 一种信息处理方法及服务器

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368531A (zh) * 2017-06-14 2017-11-21 南昌航空大学 一种基于网站的中文新闻信息多维度分类的评分方法
CN110020110A (zh) * 2017-09-15 2019-07-16 腾讯科技(北京)有限公司 媒体内容推荐方法、装置及存储介质
CN110020110B (zh) * 2017-09-15 2023-04-07 腾讯科技(北京)有限公司 媒体内容推荐方法、装置及存储介质
CN108491540A (zh) * 2018-03-30 2018-09-04 北京百度网讯科技有限公司 文本信息推送方法、装置及智能终端
CN108491540B (zh) * 2018-03-30 2022-02-22 北京百度网讯科技有限公司 文本信息推送方法、装置及智能终端
CN110555743A (zh) * 2018-05-31 2019-12-10 阿里巴巴集团控股有限公司 商品对象推荐方法、装置及电子设备
CN110807127A (zh) * 2018-08-01 2020-02-18 北京优酷科技有限公司 视频推荐方法及装置
CN111316199A (zh) * 2018-10-16 2020-06-19 华为技术有限公司 一种信息处理方法及电子设备
CN111316199B (zh) * 2018-10-16 2022-08-19 华为技术有限公司 一种信息处理方法及电子设备
CN109376307A (zh) * 2018-12-19 2019-02-22 百度在线网络技术(北京)有限公司 文章推荐方法、装置和终端
CN110263244A (zh) * 2019-02-14 2019-09-20 腾讯科技(深圳)有限公司 内容推荐方法、装置、存储介质和计算机设备
CN110263244B (zh) * 2019-02-14 2024-02-13 深圳市雅阅科技有限公司 内容推荐方法、装置、存储介质和计算机设备

Also Published As

Publication number Publication date
CN106407364B (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
CN106407364A (zh) 一种基于人工智能的信息推荐方法和装置
JP6629678B2 (ja) 機械学習装置
Perlich et al. Tree induction vs. logistic regression: A learning-curve analysis
US20100161643A1 (en) Segmentation of interleaved query missions into query chains
CN108140143A (zh) 正则化机器学习模型
CN108304853B (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
CN106156163B (zh) 文本分类方法以及装置
CN106649849A (zh) 文本信息库建立方法和装置、以及搜索方法、装置和***
CN107944485A (zh) 基于聚类群组发现的推荐***及方法、个性化推荐***
WO2020135642A1 (zh) 一种基于生成对抗网络的模型训练方法及设备
CN112418656A (zh) 智能坐席分派方法、装置、计算机设备和存储介质
CN113570391B (zh) 基于人工智能的社群划分方法、装置、设备及存储介质
CN113986660A (zh) ***调整策略的匹配方法、装置、设备及存储介质
Saha et al. Best-item learning in random utility models with subset choices
CN110019563B (zh) 一种基于多维数据的肖像建模方法和装置
CN111783088B (zh) 一种恶意代码家族聚类方法、装置和计算机设备
CN107807920A (zh) 基于大数据的情绪词典的构建方法、装置及服务器
CN107092902B (zh) 字符串的识别方法和***
CN110941638B (zh) 应用分类规则库构建方法、应用分类方法及装置
CN110413985B (zh) 一种相关文本片段搜索方法及装置
CN110347934A (zh) 一种文本数据过滤方法、装置及介质
CN112632275B (zh) 基于个人文本信息的人群聚类数据处理方法、装置及设备
Rahman et al. Bayesian approach to classification of football match outcome
CN111046165A (zh) 一种基于引用次数的文献推荐方法
Sundaresan et al. Subreddit recommendations within reddit communities

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant