CN102215300A - 电信业务推荐方法和*** - Google Patents

电信业务推荐方法和*** Download PDF

Info

Publication number
CN102215300A
CN102215300A CN2011101350032A CN201110135003A CN102215300A CN 102215300 A CN102215300 A CN 102215300A CN 2011101350032 A CN2011101350032 A CN 2011101350032A CN 201110135003 A CN201110135003 A CN 201110135003A CN 102215300 A CN102215300 A CN 102215300A
Authority
CN
China
Prior art keywords
telecommunication service
interest
user
user interest
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011101350032A
Other languages
English (en)
Other versions
CN102215300B (zh
Inventor
李卫
郭志斌
张云勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN 201110135003 priority Critical patent/CN102215300B/zh
Publication of CN102215300A publication Critical patent/CN102215300A/zh
Application granted granted Critical
Publication of CN102215300B publication Critical patent/CN102215300B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种电信业务推荐方法和***,其中方法包括:获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型;根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。本发明实现了电信业务的精准营销,同时提升用户体验。

Description

电信业务推荐方法和***
技术领域
本发明涉及通信技术,特别涉及一种电信业务推荐方法和***。
背景技术
现阶段我国电信业务面临同质化竞争的市场压力,使得发展新用户越来越困难;电信运营商正逐步从以往的依赖价格战等竞争手段吸引用户的粗放式经营,向分众服务、精细化经营转变,纷纷建设自己的数据挖掘***来辅助进行精准营销。
目前一般是基于电信用户的基本资料、地理位置、通信行为等数据的分析和挖掘,从中发现业务运营规律,进而开展电信业务推荐。该方法的弊端是,没有考虑用户的兴趣爱好,用户的兴趣爱好无法直接从用户的基本资料、地理位置、通信行为等数据获得,可能出现用户对推荐的电信业务不感兴趣,既使得用户体验较差,又降低了电信业务推荐的成功率。
发明内容
本发明的目的是提供一种电信业务推荐方法和***,以基于用户兴趣进行电信业务推荐,实现电信业务的精准营销。
本发明提供一种电信业务推荐方法,包括:
获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;
根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档的主题标引和上网日志信息建立用户兴趣模型;
根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。
本发明提供一种电信业务推荐***,包括:用户数据采集模块、用户兴趣学习模块和电信业务推荐模块;
所述用户数据采集模块,用于获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;
所述用户兴趣学习模块,用于根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档的主题标引和上网日志信息建立用户兴趣模型;
所述电信业务推荐模块,用于根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。
本发明的电信业务推荐方法和***,通过对全业务运营环境下电信用户的上网行为的采集和分析,充分挖掘用户兴趣及其与电信业务之间的关联关系,基于用户兴趣开展电信业务推荐,实现电信业务的精准营销,同时提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明电信业务推荐***实施例的结构示意图;
图2为本发明电信业务推荐方法实施例的流程示意图;
图3为本发明电信业务推荐方法实施例中的生成文本分类器的流程示意图;
图4为本发明电信业务推荐方法实施例中的获得用户访问网页文档主题标引的流程示意图;
图5为本发明电信业务推荐方法实施例中的获得用户兴趣和电信业务关联关系的流程示意图;
图6为本发明电信业务推荐方法实施例中的电信业务推荐的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1为本发明电信业务推荐***实施例的结构示意图,如图1所示,该***可以包括用户数据采集模块11、用户兴趣学习模块12和电信业务推荐模块13;
其中,所述用户数据采集模块11,用于获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;该上网日志信息可以存储至用户上网日志库14。
所述用户兴趣学习模块12,用于根据所述上网日志信息得到用户访问网页文档主题标引;根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型;该用户兴趣模型可以存储至用户兴趣模型库15;
所述电信业务推荐模块13,用于根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐;该用户兴趣和电信业务的关联关系可以存储至兴趣-业务关联库16。
例如,用户兴趣学习模块12可以包括判断单元、第一处理单元和第二处理单元;其中,判断单元,用于根据所述上网日志信息得到用户所访问的URL地址,并根据所述URL地址查询URL-主题映射库,判断该URL地址对应的用户访问网页文档是否已经进行主题标引;第一处理单元,用于在所述判断单元的判断结果为是时,直接获得所述主题标引;第二处理单元,用于在所述判断单元的判断结果为否时,使用网页采集器获取所述URL对应的用户访问网页文档,并对所述用户访问网页文档进行预处理,得到规范化文本;对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;对所述带分词标识文本进行词频统计和特征权重计算,生成文本向量;并对所述文本向量进行文本分类,得到所述用户访问网页文档主题标引;将所述用户访问网页文档主题标引存储到所述URL-主题映射库。
例如,用户兴趣学习模块12还可以包括第一兴趣单元和第二兴趣单元;其中,第一兴趣单元,用于根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型,所述用户兴趣模型中包括多个用户兴趣项,所述用户兴趣项中包括兴趣类别、与所述兴趣类别对应的兴趣度;所述用户兴趣的数量等于所述用户访问网页文档主题标引的数量,所述兴趣度与所述上网日志信息中的与所述兴趣类别对应的日志数量成正比,与所述上网日志信息中的与所述兴趣类别对应的日志数量的最近出现时间成反比;第二兴趣单元,用于对所述兴趣度进行正规化处理,得到正规兴趣度。
例如,所述电信业务推荐模块包括:集合单元、处理单元、关联单元、可信单元和推荐单元;
集合单元,用于根据所述用户兴趣模型、电信业务信息和订购业务信息,建立二维带权记录集合;
处理单元,用于计算所述集合中各类兴趣的支持度;计算所述集合中的兴趣和业务二维项集的支持度;
关联单元,用于根据所述各类兴趣的支持度以及二维项集的支持度,得到用户兴趣和电信业务的关联规则的置信度;
可信单元,用于根据所述用户兴趣模型、以及所述用户兴趣和电信业务的关联规则的置信度,得到电信业务推荐的可信度;
推荐单元,用于根据所述电信业务推荐的可信度,将所待推荐业务排列,生成所述推荐业务列表。
进一步的,还包括:推荐评估模块17,用于对电信业务推荐的效果进行评估,得到评估结果;推荐优化模块18,用于根据所述评估结果,优化所述电信业务推荐。
本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。
实施例二
图2为本发明电信业务推荐方法实施例的流程示意图,本实施例的电信业务推荐方法可以通过实施例一中所述的电信业务推荐***执行,如图2所示,本实施例的方法可以包括以下步骤:
步骤201、用户数据采集模块获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;
例如,可以由BSS/OSS***采集用户身份信息、订购业务信息、电信业务信息等信息,由宽带接入服务器(Broadband Remote Access Server,简称:BRAS)和远程用户拨号认证***(Remote Authentication Dial In User Service,简称:RADIUS)采集用户访问互联网的原始信息,得到用户访问URL的上网日志信息;该上网行为包括固网宽带、移动WAP/Web上网等。所述的上网日志信息可以存储到用户上网日志库。
其中,用户的身份信息用于用户数据采集模块从BRAS和RADIUS采集用户使用互联网的原始信息后的用户身份鉴别,以及用户爱好(由上网日志反映)和用户订购业务信息的关联关系挖掘;订购业务信息中可以包括订购业务数量、订购电信业务名称等;电信业务信息中可以包括电信业务总数、电信业务名称等;上网日志信息可以包括用户访问的URL地址信息、某类日志的数量、以及访问该类日志的时间等。
步骤202、用户兴趣学习模块根据所述上网日志信息得到用户访问网页文档的主题标引;
例如,可以由上网日志信息中获得用户访问的URL地址,根据所述上网日志信息得到用户所访问的URL地址,并根据所述URL地址查询URL-主题映射库,判断该URL地址对应的用户访问网页文档主题是否已标引。在所述判断单元的判断结果为是时,直接获得所述主题标引。在所述判断单元的判断结果为否时,使用网页采集器,采集获得所述URL地址所对应的网页文档,即用户访问网页文档;对所述用户访问网页文档进行处理,得到用户访问网页文档主题标引;并将所述用户访问网页文档主题标引存储到所述URL-主题映射库。
其中,对所述用户访问网页文档进行处理,得到用户访问网页文档主题标引,具体可以包括两部分内容;一部分是可以通过对有主题类别标注的分类训练文档库的文档进行文本分类训练,生成文本分类器,该部分内容具体可以参见实施例三中对文本分类训练的说明;另一部分是在对用户访问网页文档的处理过程中使用上述得到的文本分类器进行文本分类,从而得到用户访问网页文档的主题标引,该部分内容具体可以参见实施例四中获得用户访问网页文档主题标引的说明。
步骤203、用户兴趣学习模块根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型;
例如,可以根据用户访问网页文档主题标引确定用户的兴趣数量,该用户兴趣模型中,可以包括多个兴趣项,其中,所述的兴趣项中可以包括兴趣类别名称和兴趣度等因素。该用户兴趣模型具体可以参见实施例五中对于用户兴趣模型的详细说明。生成的用户兴趣模型可以存储至用户兴趣模型库。
步骤204、电信业务推荐模块根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;
例如,可以根据步骤203中所建立的用户兴趣模型,以及步骤201中所获取的电信业务信息和订购业务信息等,通过计算和处理得到用户兴趣和电信业务之间的关联关系。该关联关系的生成具体可以参见实施例六的说明。生成的兴趣-业务关联关系可以存储至兴趣-业务关联库中。
步骤205、电信业务推荐模块根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。
例如,在步骤204中得到用户兴趣和电信业务的关联关系之后,可以根据用户兴趣模型以及所述关联关系,得到推荐业务列表,对用户进行电信业务推荐。具体可以参见实施例七中对于电信业务推荐列表生成的说明。
本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。
实施例三
图3为本发明电信业务推荐方法实施例中的生成文本分类器的流程示意图,如图3所示,本实施例可以包括以下步骤:
步骤301、用户兴趣学习模块对有类别标注的分类训练文档库的文档进行预处理,得到规范化文本;
例如,用户兴趣学习模块对有主题类别标注的分类训练文档库的文档进行预处理。其中,所述分类训练文档库可以由电信业务推荐***的使用者自行建立,形式可以是一个名为“示例文档库”的大文件夹和一个名为“示例文档主题标引对照表”的文档或数据表。所述示例文档库内是一些示例文档,所述示例文档主题标引对照表说明各示例文档的主题标引,如“体育”、“音乐”、“财经”等等。根据电信业务推荐的需要,文档主题的颗粒度可以再细化,如“体育”可以再细分为“足球”、“排球”等等。所述示例文档的格式不限,可以是txt纯文本、web文本、word文本、ppt文本、pdf文本等等,txt和web类型以外的文档预处理时还需要做文档识别工作,因此建议***使用者自行建立文档库时最好选择txt和web类型的示例文档。所述示例文档的语言不限,可以是中文文本、英文文本、中英文混合文本。
在预处理时可以去除所述示例文本中的噪声,如广告条、导航条、书签等;并使用词法规则对英文文本进行词法分析,把变形后的词恢复原型,包括名词的复数去除、动词的时态转换、动词第三人称转换、词干抽取等,得到规范化的文本。
步骤302、用户兴趣学习模块对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;
例如,用户兴趣学习模块可以根据分词词典,对步骤301中得到的规范化文本进行中文分词和英文词组辨认,并根据停用词词典,去掉该规范化文本中的非分类信息词,即不含有分类信息的词,例如介词、带从句的副词、冠词、连词、代词、情态动词或语气助词等虚词,得到带分词标识文本。
其中,分词就是使用划分符号,对文本进行以词或词组为单位的划分。划分符号可以是形如“\w”的标识符号。例如,“云计算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。”采用“\w”符号分词并去除非分类信息词后可得到:“云计算\wCloud Computing\w分布式处理\wDistributed Computing\w并行处理\w Parallel Computing\w网格计算\w Grid Computing\w发展\w计算机\w科学\w概念\w商业\w实现\w”。
步骤303、用户兴趣学习模块对带分词标识文本进行词频统计和特征抽取,生成文本向量;
例如,用户兴趣学习模块对步骤302得到的带分词标识的文本进行词频统计和特征抽取,得到特征向量空间,由此生成文本的向量空间模型,即生成文本向量。
步骤304、用户兴趣学习模块对文本向量进行分类训练,获得文本分类时所需的参数,即生成文本分类器。
本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。
实施例四
图4为本发明电信业务推荐方法实施例中的获得用户访问网页文档主题标引的流程示意图,如图4所示,本实施例可以包括以下步骤:
步骤401、用户兴趣学习模块获取用户访问的URL地址;
例如,用户兴趣学习模块可以由用户上网日志库获取用户访问日志,其中包括URL地址信息。
步骤402、用户兴趣学习模块判断该URL地址所对应的网页文档主题是否已经标引;
例如,用户兴趣学习模块可以查询URL-主题映射库,判断该URL地址所对应的网页文档主题是否已经标引;如果用户访问的网页文档主题已经标引,则执行步骤403;否则,如果用户访问的网页文档主题未标引,则执行步骤404;
步骤403、用户兴趣学习模块获得用户访问网页文档主题标引;
步骤404、用户兴趣学习模块使用网页采集器,获得步骤401中所获得的URL地址对应用户访问网页文档;
步骤405、用户兴趣学习模块对用户访问网页文档进行预处理,得到规范化文本;
例如,用户兴趣学习模块对步骤404中得到的用户访问网页文档进行预处理,该文档可以为web文本,在预处理时可以去除web文本中的噪声,如广告条、导航条、书签等;并使用词法规则对英文文本进行词法分析,把变形后的词恢复原型,包括名词的复数去除、动词的时态转换、动词第三人称转换、词干抽取等,得到规范化的文本。
步骤406、用户兴趣学习模块对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;
例如,用户兴趣学习模块可以根据分词词典,对步骤405中得到的规范化文本进行中文分词和英文词组辨认,并根据停用词词典,去掉该规范化文本中的非分类信息词,即不含有分类信息的词,例如介词、带从句的副词、冠词、连词、代词、情态动词或语气助词等虚词,得到带分词标识文本。
步骤407、用户兴趣学习模块对带分词标识文本进行词频统计和特征抽取,生成文本向量;
例如,用户兴趣学习模块根据实施例三中得到的特征向量空间,对步骤406得到的带分词标识的文本进行词频统计和特征权重计算,生成文本的向量空间模型,即生成文本向量。
步骤408、用户兴趣学习模块使用实施例三中得到的文本分类器,对步骤407中得到的文本向量进行文本分类,得到用户访问网页文档主题标引,并存储到URL-主题映射库中。
其中,所述主题标引可用于生成用户兴趣模型。所述URL-主题映射库的作用是提高电信业务推荐***的效率,例如,多个用户都浏览了同一个网页(URL地址相同),那么电信业务推荐***只需要在用户首次访问时对这个URL地址指向的网页文档处理一次,后续其他用户再次访问时就可以直接通过查询该映射库得到网页文档对应的主题标引。
本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。
实施例五
本实施例对实施例二中所述的用户兴趣模型进行详细说明:用户兴趣模型
Figure BDA0000063282720000121
定义如下式(1)所示:
UserInterest → = { ( c 0 , w 0 , n 0 , t 0 ) , · · · , ( c i , w i , n i , t i ) , · · · , ( c m - 1 , w m - 1 , n m - 1 , t m - i ) |0≤i≤m-1}--- ( 1 )
其中,m(0<m≤|C|)是该用户的兴趣数量(即用户访问网页文档主题标引的数量),|C|是主题标引类别总数,(ci,wi,ni,ti)是该用户的第i+1(0≤i<m)类兴趣项,ci是兴趣类别名称(即主题标引),wi是ci类兴趣的权重(兴趣度),ni是该用户上网访问日志中ci类日志的数量,ti是该用户上网访问日志中ci类日志的最近出现时间。
该用户的第i+1(0≤i<m)类兴趣的权重(兴趣度)wi定义如式(2)所示:
w i = f ( n i × α T - t i + α ) 式(2)
其中,ni是该用户上网访问日志中ci类日志的数量,ti是该用户上网访问日志中ci类日志的最近出现时间,T是当前***时间,α>0是一个调整系数。式(2)的意义是,由于用户的兴趣爱好会随时间的推移而动态变化,一些用户原本感兴趣的内容会随时间的推移而渐渐遗忘,新的兴趣会逐渐产生,因此用户的第i+1(0≤i<m)类兴趣的权重(兴趣度)wi与用户感兴趣的ci类网页文档数成正比,与最近阅览ci类网页文档的时间差成反比。该兴趣度相当于引入了用户兴趣动态更新机制,实现了对用户兴趣的稳定和准确更新,使得获得的用户兴趣爱好信息更加准确和及时,进一步提升用户体验,解决了用户兴趣漂移问题。
其中,调整***α值用于防止f(·)函数的分母为0,同时还可以调整兴趣度wi的衰减速度,α值越小,兴趣度wi的衰减速度越快,因此可以根据具体需求确定α的取值。
为防止兴趣度数据过度偏向于上网积极用户(即日志数量较大用户),因此需要正规化兴趣度数据。正规化后该用户的第i+1(0≤i<m)类兴趣的权重(兴趣度)
Figure BDA0000063282720000124
定义如式(3)所示:
w i ‾ = w i Σ k = 0 m - 1 w k 式(3)
其中,wi由式(2)计算得到。
用户兴趣学习模块会定期对用户兴趣模型进行更新,更新的方式即为根据上述的上网日志信息,如日志的主题、数量和时间等,对兴趣度进行更新。
本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。
实施例六
图5为本发明电信业务推荐方法实施例中的获得用户兴趣和电信业务关联关系的流程示意图,如图5所示,本实施例可以包括以下步骤:
步骤501、电信业务推荐模块根据用户兴趣模型、电信业务信息和订购业务信息,建立二维带权记录集合;
例如,电信业务推荐***根据用户的订购业务信息、电信业务信息以及用户兴趣模型库,建立二维带权记录集合T,其中,T={t1,t2,......,tn},其中n是***内当前用户数;T中的每个记录tu对应一个用户u的二维带权项集合
Figure BDA0000063282720000132
其中,mu(0<mu≤|C|)是用户u的兴趣数量,|C|是***主题标引类别总数,cui是用户u的第i+1(0≤i<mu)类兴趣名称,nu(0<nu≤|S|)是该用户订购业务数量,|S|是电信业务总数,suj是用户u的第j+1(0≤j<nu)类电信业务名称,记录tu对应的权重向量其中,wui是用户u正规化后cui类兴趣的权重(0≤i<mu),puj是用户u订购业务suj的权重(0≤j<nu),根据***需求,这里令puj=1。
步骤502、电信业务推荐模块计算所述集合中各类兴趣的支持度;
例如,电信业务推荐***根据式(4)和式(5)计算二维带权记录集合T中各类兴趣Ck(0≤k<|C|)的支持度Support(Ck);
Support ( C k ) = Σ u Sup uk | T | 式(4)
Sup uk = w ui , if C k ∈ t u and C k = c ui 0 , else 式(5)
步骤503、电信业务推荐模块计算所述集合中的兴趣和业务二维项集的支持度;
例如,电信业务推荐模块根据式(6)和式(7)计算二维带权记录集合T中{兴趣,业务}二维项集{Ck,Sl}(0≤k<|C|,0≤l<|S|)的支持度Support(Ck,Sl):
Support ( C k , S l ) = Σ u Sup uq | T | 式(6)
Sup uq = w ui , if { C k , S l } ⊆ t u and C k = c ui 0 , else 式(7)
步骤504、电信业务推荐模块根据所述各类兴趣的支持度以及二维项集的支持度,得到用户兴趣和电信业务的关联规则的置信度。
例如,电信业务推荐***根据式(8)计算二维带权记录集合T中兴趣-业务关联规则
Figure BDA0000063282720000145
的置信度
Figure BDA0000063282720000146
并将其与规则
Figure BDA0000063282720000147
一起存储到兴趣-业务关联库;
Conf ( C k ⇒ S l ) = Support ( C k , S l ) Support ( C k ) ifSupport ( C k ) ≠ 0 0 , else 式(8)
本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。
实施例七
图6为本发明电信业务推荐方法实施例中的电信业务推荐的流程示意图,如图6所示,本实施例可以包括以下步骤:
步骤601,电信业务推荐模块根据用户兴趣模型库、兴趣-业务关联库和式(9)计算对用户u推荐其未订购业务S1(0≤l<|S|)的可信度
Figure BDA0000063282720000152
Confidence ( u ⇒ S l ) = Σ i = 0 m u - 1 w ui · Conf ( c ui ⇒ S l ) 式(9)
步骤602,电信业务推荐模块根据
Figure BDA0000063282720000154
将所有向用户u推荐未订购业务S1进行降序排列,生成针对用户u的推荐业务列表,推送给用户。
本实施例的电信业务推荐方法,通过根据用户的上网日志信息建立用户兴趣模型,以及用户兴趣和电信业务的关联关系等,可以据此生成推荐业务列表,对用户进行电信业务推荐,解决了电信业务推荐的成功率低的问题,实现了基于用户兴趣进行电信业务推荐,以及电信业务的精准营销,提升电信业务推荐的用户体验。
实施例八
在上述实施例的基础上,进一步的,对电信业务推荐的效果进行评估,并根据所述评估结果,优化所述电信业务推荐。
通过采取推荐效果评估反馈和更新机制,实现流程的闭环工作,提高了***的自适应能力。
例如,该评估反馈可以是以一段时间(周、月或季度等)为周期,观察向用户推荐其未订购业务S1后,用户是否订购了该业务、业务推荐时间与订购业务开始时间的间隔等等,从而评价这些推荐的有效性和时效性,并可结合电信业务部门的营销策略,相应调整
Figure BDA0000063282720000161
例如,推荐评估模块根据式(10)和式(11)计算兴趣-业务关联规则
Figure BDA0000063282720000162
的适应度
Figure BDA0000063282720000163
Fit ( C k ⇒ S l ) = Σ i = 0 N u H i N u 式(10)
Figure BDA0000063282720000165
式(11)
其中,Nu是所有被推荐了业务S1并且具有兴趣Ck的用户总数。TOi是被推荐了业务S1并且具有兴趣Ck的用户i开始订购业务S1的时间,TRi是向用户i推荐业务S1的时间。显然有
Figure BDA0000063282720000166
推荐优化模块根据式(12)调整兴趣-业务关联规则的置信度
Conf ( C k ⇒ S l ) = Conf ( C k ⇒ S l ) * Fit ( C k ⇒ S l ) 式(12)
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种电信业务推荐方法,其特征在于,包括:
获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;
根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档的主题标引和上网日志信息建立用户兴趣模型;
根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。
2.根据权利要求1所述的电信业务推荐方法,其特征在于,根据所述上网日志信息得到用户访问网页文档主题标引,包括:
根据所述上网日志信息得到用户所访问的URL地址,并根据所述URL地址查询URL-主题映射库,判断该URL地址对应的用户访问网页文档是否已经进行主题标引;若是,则直接获得所述用户访问网页文档的主题标引;
否则,使用网页采集器获取所述URL对应的用户访问网页文档,并对所述用户访问网页文档进行预处理,得到规范化文本;对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;对所述带分词标识文本进行词频统计和特征权重计算,生成文本向量;并对所述文本向量进行文本分类,得到所述用户访问网页文档主题标引;将所述用户访问网页文档主题标引存储到所述URL-主题映射库。
3.根据权利要求1所述的电信业务推荐方法,其特征在于,根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型,包括:
所述用户兴趣模型中包括多个用户兴趣项,所述用户兴趣项中包括兴趣类别、与所述兴趣类别对应的兴趣度;所述用户兴趣的数量等于所述用户访问网页文档主题标引的数量;
所述兴趣度与所述上网日志信息中的与所述兴趣类别对应的日志数量成正比,与所述上网日志信息中的与所述兴趣类别对应的日志数量的最近出现时间成反比。
4.根据权利要求3所述的电信业务推荐方法,其特征在于,还包括:
对所述兴趣度进行正规化处理,得到正规兴趣度。
5.根据权利要求1所述的电信业务推荐方法,其特征在于,根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系,包括:
根据所述用户兴趣模型、电信业务信息和订购业务信息,建立二维带权记录集合;
计算所述集合中各类兴趣的支持度;计算所述集合中的兴趣和业务二维项集的支持度;
根据所述各类兴趣的支持度以及二维项集的支持度,得到用户兴趣和电信业务的关联规则的置信度。
6.根据权利要求5所述的电信业务推荐方法,其特征在于,根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,包括:
根据所述用户兴趣模型、以及所述用户兴趣和电信业务的关联规则的置信度,得到电信业务推荐的可信度;
根据所述电信业务推荐的可信度,将所待推荐业务排列,生成所述推荐业务列表。
7.根据权利要求1-6任一所述的电信业务推荐方法,其特征在于,还包括:
对电信业务推荐的效果进行评估,并根据所述评估结果,优化所述电信业务推荐。
8.一种电信业务推荐***,其特征在于,包括:用户数据采集模块、用户兴趣学习模块和电信业务推荐模块;
所述用户数据采集模块,用于获取电信业务信息、用户的身份信息、订购业务信息和上网日志信息;
所述用户兴趣学习模块,用于根据所述上网日志信息得到用户访问网页文档的主题标引;根据所述用户访问网页文档的主题标引和上网日志信息建立用户兴趣模型;
所述电信业务推荐模块,用于根据所述用户兴趣模型、电信业务信息和订购业务信息,获得用户兴趣和电信业务的关联关系;并根据所述用户兴趣和电信业务的关联关系以及所述用户兴趣模型,得到推荐业务列表,对用户进行电信业务推荐。
9.根据权利要求8所述的电信业务推荐***,其特征在于,所述用户兴趣学习模块包括:
判断单元,用于根据所述上网日志信息得到用户所访问的URL地址,并根据所述URL地址查询URL-主题映射库,判断该URL地址对应的用户访问网页文档是否已经进行主题标引;
第一处理单元,用于在所述判断单元的判断结果为是时,直接获得所述主题标引;
第二处理单元,用于在所述判断单元的判断结果为否时,使用网页采集器获取所述URL对应的用户访问网页文档,并对所述用户访问网页文档进行预处理,得到规范化文本;对所述规范化文本进行中文分词和英文词组辨认,去除非分类信息词,得到带分词标识文本;对所述带分词标识文本进行词频统计和特征权重计算,生成文本向量;并对所述文本向量进行文本分类,得到所述用户访问网页文档主题标引;将所述用户访问网页文档主题标引存储到所述URL-主题映射库。
10.根据权利要求8所述的电信业务推荐***,其特征在于,所述用户兴趣学习模块还包括:
第一兴趣单元,用于根据所述用户访问网页文档主题标引和上网日志信息建立用户兴趣模型,所述用户兴趣模型中包括多个用户兴趣项,所述用户兴趣项中包括兴趣类别、与所述兴趣类别对应的兴趣度;所述用户兴趣的数量等于所述用户访问网页文档主题标引的数量;所述兴趣度与所述上网日志信息中的与所述兴趣类别对应的日志数量成正比,与所述上网日志信息中的与所述兴趣类别对应的日志数量的最近出现时间成反比;
第二兴趣单元,用于对所述兴趣度进行正规化处理,得到正规兴趣度。
11.根据权利要求8所述的电信业务推荐***,其特征在于,所述电信业务推荐模块包括:
集合单元,用于根据所述用户兴趣模型、电信业务信息和订购业务信息,建立二维带权记录集合;
处理单元,用于计算所述集合中各类兴趣的支持度;计算所述集合中的兴趣和业务二维项集的支持度;
关联单元,用于根据所述各类兴趣的支持度以及二维项集的支持度,得到用户兴趣和电信业务的关联规则的置信度;
可信单元,用于根据所述用户兴趣模型、以及所述用户兴趣和电信业务的关联规则的置信度,得到电信业务推荐的可信度;
推荐单元,用于根据所述电信业务推荐的可信度,将所待推荐业务排列,生成所述推荐业务列表。
12.根据权利要求8-11任一所述的电信业务推荐***,其特征在于,还包括:
推荐评估模块,用于对用户进行电信业务推荐的效果进行评估,得到评估结果;
推荐优化模块,用于根据所述评估结果,优化所述电信业务推荐。
CN 201110135003 2011-05-24 2011-05-24 电信业务推荐方法和*** Active CN102215300B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110135003 CN102215300B (zh) 2011-05-24 2011-05-24 电信业务推荐方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110135003 CN102215300B (zh) 2011-05-24 2011-05-24 电信业务推荐方法和***

Publications (2)

Publication Number Publication Date
CN102215300A true CN102215300A (zh) 2011-10-12
CN102215300B CN102215300B (zh) 2013-11-06

Family

ID=44746421

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110135003 Active CN102215300B (zh) 2011-05-24 2011-05-24 电信业务推荐方法和***

Country Status (1)

Country Link
CN (1) CN102215300B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402766A (zh) * 2011-12-27 2012-04-04 纽海信息技术(上海)有限公司 一种基于网页浏览的用户兴趣建模方法
CN102547554A (zh) * 2011-12-28 2012-07-04 华中科技大学 基于移动用户行为的移动业务推荐方法
CN103179152A (zh) * 2011-12-22 2013-06-26 中国电信股份有限公司 业务信息下发方法、***及业务平台
CN103488788A (zh) * 2011-12-27 2014-01-01 奇智软件(北京)有限公司 一种应用自动推荐的方法及装置
CN103514266A (zh) * 2013-09-04 2014-01-15 快传(上海)广告有限公司 一种面向移动终端的网络信息投放方法和***
CN103617547A (zh) * 2013-12-04 2014-03-05 中国联合网络通信集团有限公司 一种业务推荐方法及***
CN103905507A (zh) * 2012-12-28 2014-07-02 ***通信集团公司 一种业务信息推荐***及业务信息推荐方法
CN105447159A (zh) * 2015-12-02 2016-03-30 北京信息科技大学 一种用户间查询关联度的查询扩展方法
CN105975479A (zh) * 2016-04-20 2016-09-28 重庆重邮汇测通信技术有限公司 一种基于标签库的电信用户兴趣度分析方法及***
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及***
CN106294755A (zh) * 2016-08-11 2017-01-04 上海携程商务有限公司 用于url分类的网页推荐***及网页推荐方法
CN106375369A (zh) * 2016-08-18 2017-02-01 南京邮电大学 基于用户行为分析的移动Web业务推荐方法及协同推荐***
CN106997397A (zh) * 2017-04-17 2017-08-01 山东辰华科技信息有限公司 基于大数据的科技信息个性化定制推送***
CN107391692A (zh) * 2017-07-26 2017-11-24 腾讯科技(北京)有限公司 一种推荐效果的评估方法及装置
CN108764988A (zh) * 2018-05-21 2018-11-06 中国联合网络通信有限公司重庆市分公司 一种营销策略投放方法及***
CN109829108A (zh) * 2019-01-28 2019-05-31 北京三快在线科技有限公司 信息推荐方法、装置、电子设备及可读存储介质
CN111309588A (zh) * 2019-11-19 2020-06-19 广州市科传计算机科技股份有限公司 一种基于顾客行为驱动的营销策略评估方法
CN111861513A (zh) * 2020-07-29 2020-10-30 浪潮天元通信信息***有限公司 一种基于通信运营商crm***的精简管理方法及模型
TWI726398B (zh) * 2019-08-27 2021-05-01 中華電信股份有限公司 自適化電信服務推薦系統與方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080087467A (ko) * 2007-03-27 2008-10-01 주식회사 하이닉스반도체 반도체 소자 제조 방법
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080087467A (ko) * 2007-03-27 2008-10-01 주식회사 하이닉스반도체 반도체 소자 제조 방법
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马春山: "移动增值业务的个性化推荐研究", 《北京邮电大学博士研究生学位论文》, 13 January 2009 (2009-01-13), pages 58 - 67 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103179152A (zh) * 2011-12-22 2013-06-26 中国电信股份有限公司 业务信息下发方法、***及业务平台
CN103179152B (zh) * 2011-12-22 2016-04-20 中国电信股份有限公司 业务信息下发方法、***及业务平台
CN102402766A (zh) * 2011-12-27 2012-04-04 纽海信息技术(上海)有限公司 一种基于网页浏览的用户兴趣建模方法
CN103488788A (zh) * 2011-12-27 2014-01-01 奇智软件(北京)有限公司 一种应用自动推荐的方法及装置
CN103488788B (zh) * 2011-12-27 2019-03-08 北京奇虎科技有限公司 一种应用自动推荐的方法及装置
CN102402766B (zh) * 2011-12-27 2017-07-28 北京京东尚科信息技术有限公司 一种基于网页浏览的用户兴趣建模方法
CN102547554A (zh) * 2011-12-28 2012-07-04 华中科技大学 基于移动用户行为的移动业务推荐方法
CN102547554B (zh) * 2011-12-28 2015-03-04 华中科技大学 基于移动用户行为的移动业务推荐方法
CN103905507A (zh) * 2012-12-28 2014-07-02 ***通信集团公司 一种业务信息推荐***及业务信息推荐方法
CN103514266A (zh) * 2013-09-04 2014-01-15 快传(上海)广告有限公司 一种面向移动终端的网络信息投放方法和***
CN103617547B (zh) * 2013-12-04 2017-07-07 中国联合网络通信集团有限公司 一种业务推荐方法及***
CN103617547A (zh) * 2013-12-04 2014-03-05 中国联合网络通信集团有限公司 一种业务推荐方法及***
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及***
CN105989040B (zh) * 2015-02-03 2021-02-09 创新先进技术有限公司 智能问答的方法、装置及***
CN105447159A (zh) * 2015-12-02 2016-03-30 北京信息科技大学 一种用户间查询关联度的查询扩展方法
CN105975479A (zh) * 2016-04-20 2016-09-28 重庆重邮汇测通信技术有限公司 一种基于标签库的电信用户兴趣度分析方法及***
CN105975479B (zh) * 2016-04-20 2019-08-27 重庆重邮汇测通信技术有限公司 一种基于标签库的电信用户兴趣度分析方法及***
CN106294755A (zh) * 2016-08-11 2017-01-04 上海携程商务有限公司 用于url分类的网页推荐***及网页推荐方法
CN106294755B (zh) * 2016-08-11 2019-09-24 上海携程商务有限公司 用于url分类的网页推荐***及网页推荐方法
CN106375369A (zh) * 2016-08-18 2017-02-01 南京邮电大学 基于用户行为分析的移动Web业务推荐方法及协同推荐***
CN106375369B (zh) * 2016-08-18 2019-05-28 南京邮电大学 基于用户行为分析的移动Web业务推荐方法及协同推荐***
CN106997397A (zh) * 2017-04-17 2017-08-01 山东辰华科技信息有限公司 基于大数据的科技信息个性化定制推送***
CN107391692A (zh) * 2017-07-26 2017-11-24 腾讯科技(北京)有限公司 一种推荐效果的评估方法及装置
CN107391692B (zh) * 2017-07-26 2023-04-07 腾讯科技(北京)有限公司 一种推荐效果的评估方法及装置
CN108764988A (zh) * 2018-05-21 2018-11-06 中国联合网络通信有限公司重庆市分公司 一种营销策略投放方法及***
CN109829108A (zh) * 2019-01-28 2019-05-31 北京三快在线科技有限公司 信息推荐方法、装置、电子设备及可读存储介质
TWI726398B (zh) * 2019-08-27 2021-05-01 中華電信股份有限公司 自適化電信服務推薦系統與方法
CN111309588A (zh) * 2019-11-19 2020-06-19 广州市科传计算机科技股份有限公司 一种基于顾客行为驱动的营销策略评估方法
CN111309588B (zh) * 2019-11-19 2023-11-17 广州市科传计算机科技股份有限公司 一种基于顾客行为驱动的营销策略评估方法
CN111861513A (zh) * 2020-07-29 2020-10-30 浪潮天元通信信息***有限公司 一种基于通信运营商crm***的精简管理方法及模型

Also Published As

Publication number Publication date
CN102215300B (zh) 2013-11-06

Similar Documents

Publication Publication Date Title
CN102215300B (zh) 电信业务推荐方法和***
CN103207913B (zh) 商品细粒度语义关系的获取方法和***
CN106940705A (zh) 一种用于构建用户画像的方法与设备
CN104239373B (zh) 为文档添加标签的方法及装置
CN106022800A (zh) 一种用户特征数据的处理方法和装置
CN103440242A (zh) 一种基于用户搜索行为的个性化推荐方法和***
CN105809464A (zh) 信息投放方法和装置
CN103235824A (zh) 根据浏览网页确定用户感兴趣的网页文本的方法和***
CN103116588A (zh) 一种个性化推荐方法及***
CN102982042A (zh) 一种个性化内容推荐方法、平台以及***
US20120072466A1 (en) Contents creating device and contents creating method
CN106776860A (zh) 一种搜索摘要生成方法及装置
CN111159341B (zh) 基于用户投资理财偏好的资讯推荐方法及装置
Vakulenko et al. Enriching iTunes App Store Categories via Topic Modeling.
CN102646132B (zh) 宽带用户属性识别方法和装置
CN112528007B (zh) 一种招商项目的目标企业的确认方法及确认装置
CN103810162A (zh) 推荐网络信息的方法和***
CN102609424B (zh) 评价信息抽取方法和设备
US20170228378A1 (en) Extracting topics from customer review search queries
CN105930507A (zh) 一种获得用户的Web浏览兴趣的方法及装置
CN109255012A (zh) 一种机器阅读理解的实现方法以及装置
CN111447575A (zh) 短信息推送方法、装置、设备及存储介质
Ye et al. Mining sentiment tendencies and summaries from consumer reviews
KR101652433B1 (ko) Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법
Park et al. Phrase embedding and clustering for sub-feature extraction from online data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant