CN103838775A

CN103838775A - 数据分析方法以及数据分析设备

Info

Publication number: CN103838775A
Application number: CN201210489648.0A
Authority: CN
Inventors: 张飞; 鲁志军; 尹亚伟; 华广美
Original assignee: China Unionpay Co Ltd
Current assignee: China Unionpay Co Ltd
Priority date: 2012-11-27
Filing date: 2012-11-27
Publication date: 2014-06-04
Anticipated expiration: 2032-11-27
Also published as: CN103838775B

Abstract

本发明公开了一种数据分析方法，包括：构建基于有序多叉树的推荐数据集合，所述有序多叉树的每一个节点代表一个推荐数据，连接各节点的分支的权值代表不同推荐数据之间的相关性；接收来自用户的第一选择数据；确定所述第一选择数据在所述有序多叉树中的位置；以及以所述第一选择数据所在的位置为父节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。本发明还公开了一种数据分析设备。

Description

数据分析方法以及数据分析设备

技术领域

本发明涉及计算机数据分析领域，特别地，涉及生成推荐数据以便对用户进行引导的数据分析方法以及数据分析设备。

背景技术

现有的数据分析设备在进行预测分析时大多基于贝叶斯网络模型来构建一个贝叶斯网络，以形成有向图。但是，贝叶斯网络的建造是一个复杂的任务，需要知识工程师和领域专家的参与。由于其构造和分析过程都十分复杂，很容易导致出错。

隐含马尔可夫模型可以认为是一个贝叶斯网络模型的特例，其在构建方面比较简单和方便，不需要有知识工程师和领域专家的参与。而且其最终构建结果是一个链表，从程序处理角度而言比较方便和快捷。但是，由于隐含马尔可夫模型是一个很粗略的简化，所以在对预测分析准确性要求较高的场合较少采用隐含马尔可夫模型。

发明内容

为解决上述问题，本发明从隐含马尔可夫模型进行出发，并综合贝叶斯网络模型的特性，提出一个全新的基于有序多叉树的数据分析方法和数据分析设备。

根据本发明的一个方面，提供了一种数据分析方法，包括：构建基于有序多叉树的推荐数据集合，所述有序多叉树的每一个节点代表一个推荐数据，连接各节点的分支的权值代表不同推荐数据之间的相关性；接收来自用户的第一选择数据；确定所述第一选择数据在所述有序多叉树中的位置；以及以所述第一选择数据所在的位置为父节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

上述数据分析方法还可包括：接收来自所述用户的第二选择数据；确定所述第二选择数据在所述有序多叉树中的位置；以及以所述第一选择数据所在的位置为父节点，并以所述第二选择数据所在的位置为子节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

在上述数据分析方法中，在向所述用户输出一个或多个推荐数据之前，比较该一个或多个推荐数据与所述第一选择数据之间的相关性。

在上述数据分析方法中，在向所述用户输出一个或多个推荐数据之前，比较该一个或多个推荐数据与所述第一选择数据、所述第二选择数据之间的相关性。

在上述数据分析方法中，所述构建基于有序多叉树的推荐数据集合包括：收集用户历史选择数据；对所述用户历史选择数据进行规整；对规整后的所述用户历史选择数据进行排序；以及根据经过规整、排序后的用户历史选择数据，生成基于有序多叉树的推荐数据集合。

在上述数据分析方法中，所述构建基于有序多叉树的推荐数据集合还包括：从所述用户历史选择数据选择一个或多个数据；以所述一个或多个数据为路径，对已生成的基于有序多叉树的推荐数据集合进行遍历；以及根据遍历的结果来调整所述有序多叉树中各分支的权值。

有必要指出的是，上面提及的数据分析方法都可应用于客户购物篮分析。

根据本发明的另一个方面，还提供了一种数据分析设备，包括：构建装置，用于构建基于有序多叉树的推荐数据集合，所述有序多叉树的每一个节点代表一个推荐数据，连接各节点的分支的权值代表不同推荐数据之间的相关性；第一接收装置，用于接收来自用户的第一选择数据；第一确定装置，用于确定所述第一选择数据在所述有序多叉树中的位置；以及第一分析装置，用于以所述第一选择数据所在的位置为父节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

上述数据分析设备还可包括：第二接收装置，用于接收来自所述用户的第二选择数据；第二确定装置，用于确定所述第二选择数据在所述有序多叉树中的位置；以及第二分析装置，用于以所述第一选择数据所在的位置为父节点，并以所述第二选择数据所在的位置为子节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

在上述数据分析设备中，所述第一分析装置还包括第一比较单元，所述第一比较单元用于比较该一个或多个推荐数据与所述第一选择数据之间的相关性。

在上述数据分析设备中，所述第二分析装置还包括第二比较单元，所述第二比较单元用于比较该一个或多个推荐数据与所述第一选择数据、所述第二选择数据之间的相关性。

在上述数据分析设备中，所述构建装置包括：收集单元，用于收集用户历史选择数据；规整单元，用于对所述用户历史选择数据进行规整；排序单元，用于对规整后的所述用户历史选择数据进行排序；以及生成单元，用于根据经过规整、排序后的用户历史选择数据，生成基于有序多叉树的推荐数据集合。

在上述数据分析设备中，所述构建装置还包括：选择单元，用于从所述用户历史选择数据选择一个或多个数据；遍历单元，用于以所述一个或多个数据为路径，对已生成的基于有序多叉树的推荐数据集合进行遍历；以及调整单元，用于根据遍历的结果来调整所述有序多叉树中各分支的权值。

有必要指出的是，上面提及的数据分析设备都可应用于客户购物篮分析。

本发明的发明人依据隐含马尔可夫模型的基本思想，并融合贝叶斯网络模型，提出一个全新的基于有序多叉树的数据分析方法和数据分析设备。该数据分析方法和数据分析设备在计算复杂度和准确度两者之间做了很好的平衡，有效地改善计算机***内部性能。

附图说明

在参照附图阅读了本发明的具体实施方式以后，本领域技术人员将会更清楚地了解本发明的各个方面。本领域技术人员应当理解的是：这些附图仅仅用于配合具体实施方式说明本发明的技术方案，而并非意在对本发明的保护范围构成限制。

图1是根据本发明的一个实施例的数据分析方法的示意图；

图2是根据本发明的一个实施例的数据分析设备的示意图；

图3至图5是根据本发明的一个实施例的数据分析方法的逻辑示意图。

具体实施方式

下面介绍的是本发明的多个可能实施例中的一些，旨在提供对本发明的基本了解，并不旨在确认本发明的关键或决定性的要素或限定所要保护的范围。容易理解，根据本发明的技术方案，在不变更本发明的实质精神下，本领域的一般技术人员可以提出可相互替换的其它实现方式。因此，以下具体实施方式以及附图仅是对本发明的技术方案的示例性说明，而不应当视为本发明的全部或者视为对本发明技术方案的限定或限制。

参考图1，它示出了一种数据分析方法，包括：步骤110，构建基于有序多叉树的推荐数据集合，所述有序多叉树的每一个节点代表一个推荐数据，连接各节点的分支的权值代表不同推荐数据之间的相关性；步骤120，接收来自用户的第一选择数据；步骤130，确定所述第一选择数据在所述有序多叉树中的位置；以及步骤140，以所述第一选择数据所在的位置为父节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

在一个具体的实施方式中，构建基于有序多叉树的推荐数据集合可包括以下步骤：收集用户历史选择数据；对用户历史选择数据进行规整；对规整后的用户历史选择数据进行排序；以及根据经过规整、排序后的用户历史选择数据，生成基于有序多叉树的推荐数据集合。

在生成基于有序多叉树的推荐数据集合之后，还可以对生成的推荐数据集合进行修正。在一个具体的实施方式中，构建基于有序多叉树的推荐数据集合还可包括：从用户历史选择数据选择一个或多个数据；以该一个或多个数据为路径，对已生成的基于有序多叉树的推荐数据集合进行遍历；以及根据遍历的结果来调整有序多叉树中各分支的权值。

在一个优选的实施例中，在向用户输出一个或多个推荐数据之前，比较该一个或多个推荐数据与第一选择数据之间的相关性（即连接分支的权值）。通过该比较，可确定哪些推荐数据与第一选择数据更为相关，从而可以有选择地向用户输出合适的推荐数据。

在实际中，在数据分析设备或其他装置向用户输出合适的一个或多个推荐数据之后，用户可能会做出进一步的选择。故而，上面提到的数据分析方法还可包括：接收来自所述用户的第二选择数据；确定所述第二选择数据在所述有序多叉树中的位置；以及以所述第一选择数据所在的位置为父节点，并以所述第二选择数据所在的位置为子节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

在一个优选的实施例中，在向用户输出一个或多个推荐数据之前，比较该一个或多个推荐数据与第一选择数据、第二选择数据之间的相关性（即连接分支的权值）。通过该比较，可确定哪些推荐数据与第一选择数据、第二选择数据更为相关，从而可以有选择地向用户输出合适的推荐数据。

参考图2，它示出了一种数据分析设备200。该数据分析设备200包括构建装置210、第一接收装置220、第一确定装置230以及第一分析装置240。构建装置210用于构建基于有序多叉树的推荐数据集合，所述有序多叉树的每一个节点代表一个推荐数据，连接各节点的分支的权值代表不同推荐数据之间的相关性。第一接收装置220用于接收来自用户的第一选择数据。第一确定装置230用于确定所述第一选择数据在所述有序多叉树中的位置。第一分析装置240用于以所述第一选择数据所在的位置为父节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

在一个具体的实施方式中，构建装置210可包括以下单元：收集单元，用于收集用户历史选择数据；规整单元，用于对用户历史选择数据进行规整；排序单元，用于对规整后的用户历史选择数据进行排序；以及生成单元，用于根据经过规整、排序后的用户历史选择数据，生成基于有序多叉树的推荐数据集合。

在生成单元生成基于有序多叉树的推荐数据集合之后，还可以对生成的推荐数据集合进行修正。在一个具体的实施方式中，构建装置210还可包括：选择单元，用于从用户历史选择数据选择一个或多个数据；遍历单元，用于以该一个或多个数据为路径，对已生成的基于有序多叉树的推荐数据集合进行遍历；以及调整单元，用于根据遍历的结果来调整有序多叉树中各分支的权值。

在一个优选的实施例中，第一分析装置240还包括第一比较单元（图2中未示出）。该第一比较单元在向用户输出一个或多个推荐数据之前，比较该一个或多个推荐数据与第一选择数据之间的相关性（即连接分支的权值）。通过该比较，可确定哪些推荐数据与第一选择数据更为相关，从而可以有选择地向用户输出合适的推荐数据。

在实际中，在数据分析设备200或其他装置向用户输出合适的一个或多个推荐数据之后，用户可能会做出进一步的选择。故而，上面提到的数据分析设备还可包括：第二接收装置，用于接收来自所述用户的第二选择数据；第二确定装置，用于确定所述第二选择数据在所述有序多叉树中的位置；以及第二分析装置，用于以所述第一选择数据所在的位置为父节点，并以所述第二选择数据所在的位置为子节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

在一个优选的实施例中，第二分析装置还可包括第二比较单元。该第二比较单元可在向用户输出一个或多个推荐数据之前，比较该一个或多个推荐数据与第一选择数据、第二选择数据之间的相关性（即连接分支的权值）。通过该比较，可确定哪些推荐数据与第一选择数据、第二选择数据更为相关，从而可以有选择地向用户输出合适的推荐数据。

通过以上基于有序多叉树的数据分析方法和数据分析设备，可在计算复杂度和准确度两者之间做出很好的平衡，从而有效地改善计算机***内部性能。

在一个具体的实施方式中，上面提到的基于有序多叉树的数据分析方法和数据分析设备可应用于客户购物篮分析。

在具体介绍客户购物篮分析过程之前，有必要先对一些技术名词进行解释。

术语“历史交易数据收集***”是指一个历史交易数据的持久化平台。该平台对外提供历史交易的查询接口具体表现可以为：数据库、数据仓库、数据文件或者数据文件的集合。

术语“商品种类分析***”是指一个商品种类维护***，其主要负责对整个***内所涉及到的所有商品按照某种规则进行分类管理。

术语“广告推荐数据”是以有序多叉树来存储的推荐数据，其存储位置不做具体限制，可以是内存、数据库、单个文件或者多个文件。该有序多叉树的每一个节点都是一个商品的描述，该有序多叉树的第一层子节点到该节点任何一个终端节点之间所包含的所有节点的集合至少是一个用户的购买商品的子集。在用户购买了父节点的商品后，购买该有序多叉树的左子节点所代表商品的概率必须不小于其右兄弟节点的概率。当然，也可以根据情况来设置这样的有序多叉树：在用户购买了父节点的商品后，购买该有序多叉树的右子节点所代表商品的概率必须不小于其左兄弟节点的概率。该有序多叉树根节点的度不能超过商品种类分析***所维护的商品的种类。

术语“交易数据规整***”是通过一个交易数据规整参数配置文件来对历史交易数据进行规整，以便形成一个逻辑单次购物篮列表的***。

术语“交易数据规整参数配置文件”用来描述满足单次购物篮的商品属性的约束条件，一个可供参考的配置文件描述如下表所示：

是否排除退货
		交易时间范围
收货地址是否相同
		订单IP是否相同
…
		排除重复购买

术语“单次购物篮商品排序生成器”是根据商品种类排序系数配置文件对购物篮中的商品进行排序，从而形成一个唯一的购物篮商品序列的生成器。

术语“商品种类排序系数配置文件”用来描述购物篮商品排序属性的权值列表，一个可供参考的配置文件描述如下表所示：

商品名称
		商品属性
商品品牌
		商品价格
…
		购买时间

术语“广告数据生成***”，顾名思义，即生成广告数据的***。该***的执行步骤分为以下三步：第一步，从已经排好序的购物篮中取出第一件商品，在广告推荐数据的第一级子节点中查找，如果没有查找到，则***该商品数据到广告推荐数据的第一级子节点的最右(左)边；如果查找到包含该节点的商品，则调整广告推荐数据根节点到该节点的权值，并对第一级子节点进行排序。第二步，取出第n(n>1)件商品，在广告推荐数据中从第一级子节点开始查找以第一件商品为父节点A，以其后续商品为其子节点的第n-1件商品节点N，对该节点的子节点进行查找，如果查找到第n件商品，则改变节点N到该节点的权值，并对节点N进行排序；否则***第n件商品数据到节点N的最右(左)边。第三步，重复第二步，直到商品篮中的所有商品取出完毕。

术语“商品排序权值系数配置文件”用来描述商品在广告数据生成***中的路径权值，一个可供参考的配置文件描述如下表所示：

客户名称
		所属深度
商品名称
		商品属性
…
		购买时间

术语“购物篮商品搜索器”是按照排序好的购物篮商品路径在广告推荐数据中进行最大化匹配，并对匹配结果进行比较的搜索器。如果搜索效果不达标则生成商品搜索结果偏离系数表。商品搜索结果偏离系数表的一个可供参考描述如下表所示：

客户名称
		所属深度
商品名
		商品属性
…
		购买时间
推荐位置信息
		期望推荐位置信息

术语“商品排序系数生成器”是用于生成商品排序系数的生成器，该生成器根据购物篮商品搜索器提供的搜索结果偏离系数表对商品种类排序系数配置文件进行修正。

术语“购物篮商品推荐器”是一个商品推荐器，该商品推荐器根据单次购物篮商品排序生成器所生成的客户选定商品列表在广告推荐数据中按照其生成路径进行查找，找到所选最后一件商品的节点N，以节点N为根节点进行深度遍历或者广度遍历或者两者兼有，根据遍历结果生成一个推荐商品列表。

术语“推荐商品列表”是最终提供给用户的一个商品清单，该商品清单可供用户进行商品选择。推荐商品列表的一个可供参考描述如下：

最优购买清单	对节点N的右(左)子孙节点进行一次深度遍历
		最可能购买清单	对节点N的子节点从右(左)开始一次广度遍历

在上表中，最优购买清单需要通过对节点N的右(左)子孙节点进行一次深度遍历来获得，而最可能购买清单则需要对节点N的子节点从右(左)开始一次广度遍历来获得。

术语“历史单次购物篮商品生成***”是对历史交易数据进行抓取，从而提取出其中原始的符合购物篮定义的一些真实购物篮数据的***。

以下将利用前面提到的术语来对客户购物篮分析过程进行描述。

预测***的构建

一个完整的用于进行客户购物篮分析的预测***可通过以下四个步骤来构建。

第一，根据商品种类分析***构建广告数据的基本框架准备工作，通过历史交易数据收集***对历史交易数据进行输出准备。

第二，由交易历史数据收集***进行驱动，交易数据规整***利用交易数据规整参数配置文件提供的规则对交易历史数据收集***提供的历史交易数据进行规整，并生成一个虚拟购物篮。

第三，由交易数据规整***进行驱动，单次购物篮商品排序生成器根据商品种类排序系数配置文件提供的配置信息对交易数据规整***生成的虚拟购物篮中的商品进行排序工作。

第四，由单次购物篮商品排序生成器驱动，广告数据生成***根据商品排序权值系数配置文件提供的配置数据对广告推荐数据进行商品***工作。

经过以上四步的构建，一个完整预测***初步搭建完成，各***间的数据的转移经过可如图3所示。

预测***的使用

预测***的使用是一个循环往复的过程，***的开始取决于用户的一件商品的选定，终结于推荐商品列表的产出，但是用户的整个购物流程并不以***的结束而结束。各***间的数据的转移经过如图4所示。具体来说，预测***的使用包括以下几个步骤：

第一，当用户选择第一件商品后，通过该商品生成一个虚拟购物篮生成器。以后当用户每选择一件商品后，都将选中的商品放入到该虚拟购物篮中，而且每一次添加过程都将导致以下第二、第三以及第四步骤的发生。

第二，由虚拟购物篮生成器进行驱动，单次购物篮商品排序生成器通过商品种类排序系数配置文件对该虚拟购物篮进行处理。

第三，由单次购物篮商品排序生成器进行驱动，把该生成器的生成结果交由购物篮商品推荐器在广告推荐数据中进行处理并生成推荐商品列表。

第四，展示推荐商品列表给用户，给用户购买下一件商品作为指导。

预测***的修正

预测***的修正属于一个重复迭代学习的过程，需要重复执行直至没有搜索结果偏离系数表生成为止。在不再生成搜索结果偏离系数表后，对商品种类排序系数配置文件和进行***构建时使用的商品种类排序系数配置文件进行对比，如果内容不同，则需要对***进行重新构建，各***间的数据的转移经过如图5所示。具体来说，预测***的修正包括以下几个步骤：

第一，历史单次购物篮商品生成***通过对历史交易数据中历史购物篮的原始数据的提取，获得一组真实有效的历史交易篮数据对象。

第二，由历史单次购物篮商品生成***进行驱动，单次购物篮商品排序生成器通过商品种类排序系数配置文件生成一个商品遍历路径。

第三，由单次购物篮商品排序生成器进行驱动，购物篮商品搜索器按照单次购物篮商品排序生成器提供的商品遍历路径对所涉及到的商品进行搜索。并对搜索结果进行判定，如果符合搜索预期，则推出后续步骤。否则生成搜索结果偏离系数表并继续向下进行。

第四，由购物篮商品搜索器进行驱动，商品排序系数生成器根据购物篮商品搜索器生成的搜索结果偏离系数表中的信息对商品种类排序系数配置文件进行修改.

按照上述方法进行客户购物篮分析的算法收敛速度很快，一般只需要对历史客户的购物篮扫描以此。并且，客户购物篮分析***的构建相对简单，整个过程对知识工程师和领域专家的参与依赖性较小。

当然，本领域技术人员明白，本文所述的数据分析方法和数据分析设备还可引申到其他决策***中，例如GPS卫星导航。具体来说，GPS卫星导航设备可预先构建一个基于有序多叉树的推荐数据模型，接着GPS卫星导航设备接收来自用户的第一选择（例如，选择目的地是A），然后GPS卫星导航设备根据用户所选择的目的地A确定其在有序多叉树中的位置，最后GPS卫星导航设备通过对有序多叉树进行深度遍历来向用户提供最优行进路线。

本发明所提出的基于有序多叉树的数据分析方法和数据分析设备能够有效地平衡计算复杂度和准确度两者，从而改善计算机***内部性能。

上文中，参照附图描述了本发明的具体实施方式。但是，本领域中的普通技术人员能够理解，在不偏离本发明的精神和范围的情况下，还可以对本发明的具体实施方式作各种变更和替换。这些变更和替换都落在本发明权利要求书所限定的范围内。

Claims

1.一种数据分析方法，包括：

构建基于有序多叉树的推荐数据集合，所述有序多叉树的每一个节点代表一个推荐数据，连接各节点的分支的权值代表不同推荐数据之间的相关性；

接收来自用户的第一选择数据；

确定所述第一选择数据在所述有序多叉树中的位置；以及

以所述第一选择数据所在的位置为父节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

2.如权利要求1所述的数据分析方法，还包括：

接收来自所述用户的第二选择数据；

确定所述第二选择数据在所述有序多叉树中的位置；以及

以所述第一选择数据所在的位置为父节点，并以所述第二选择数据所在的位置为子节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

3. 如权利要求1所述的数据分析方法，其中，在向所述用户输出一个或多个推荐数据之前，比较该一个或多个推荐数据与所述第一选择数据之间的相关性。

4. 如权利要求2所述的数据分析方法，其中，在向所述用户输出一个或多个推荐数据之前，比较该一个或多个推荐数据与所述第一选择数据、所述第二选择数据之间的相关性。

5. 如权利要求1所述的数据分析方法，其中，所述构建基于有序多叉树的推荐数据集合包括：

收集用户历史选择数据；

对所述用户历史选择数据进行规整；

对规整后的所述用户历史选择数据进行排序；以及

根据经过规整、排序后的用户历史选择数据，生成基于有序多叉树的推荐数据集合。

6. 如权利要求5所述的数据分析方法，其中，所述构建基于有序多叉树的推荐数据集合还包括：

从所述用户历史选择数据选择一个或多个数据；

以所述一个或多个数据为路径，对已生成的基于有序多叉树的推荐数据集合进行遍历；以及

根据遍历的结果来调整所述有序多叉树中各分支的权值。

7.一种数据分析设备，包括：

构建装置，用于构建基于有序多叉树的推荐数据集合，所述有序多叉树的每一个节点代表一个推荐数据，连接各节点的分支的权值代表不同推荐数据之间的相关性；

第一接收装置，用于接收来自用户的第一选择数据；

第一确定装置，用于确定所述第一选择数据在所述有序多叉树中的位置；以及

第一分析装置，用于以所述第一选择数据所在的位置为父节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

8.如权利要求7所述的数据分析设备，还包括：

第二接收装置，用于接收来自所述用户的第二选择数据；

第二确定装置，用于确定所述第二选择数据在所述有序多叉树中的位置；以及

第二分析装置，用于以所述第一选择数据所在的位置为父节点，并以所述第二选择数据所在的位置为子节点，在所述基于有序多叉树的推荐数据集合中进行深度和/或广度遍历，以便向所述用户输出合适的一个或多个推荐数据。

9. 如权利要求7所述的数据分析设备，其中，所述第一分析装置还包括第一比较单元，所述第一比较单元用于比较该一个或多个推荐数据与所述第一选择数据之间的相关性。

10. 如权利要求8所述的数据分析设备，其中，所述第二分析装置还包括第二比较单元，所述第二比较单元用于比较该一个或多个推荐数据与所述第一选择数据、所述第二选择数据之间的相关性。

11. 如权利要求7所述的数据分析设备，其中，所述构建装置包括：

收集单元，用于收集用户历史选择数据；

规整单元，用于对所述用户历史选择数据进行规整；

排序单元，用于对规整后的所述用户历史选择数据进行排序；以及

生成单元，用于根据经过规整、排序后的用户历史选择数据，生成基于有序多叉树的推荐数据集合。

12. 如权利要求11所述的数据分析设备，其中，所述构建装置还包括：

选择单元，用于从所述用户历史选择数据选择一个或多个数据；

遍历单元，用于以所述一个或多个数据为路径，对已生成的基于有序多叉树的推荐数据集合进行遍历；以及

调整单元，用于根据遍历的结果来调整所述有序多叉树中各分支的权值。