山东大学2019-2020数据仓库与数据挖掘期末考试
一、
1.数据分析的步骤,每个步骤都干啥
2.数据仓库的特点,解释
3.大数据4v理论
4.数据流概念,难点是什么,解决方案的特点
5.检测离群点的四种方法
二、
1、给出三个维度(item,time,location)两个度量构建星型模型
2、想要得到2017第一季度的所有品牌销售状况,进行哪些olap操作
三、
1.数据仓库的体系结构图
2.解释每个层的作用
3.数据集市的定义
4.molap的原理
四、
给出几个点,进行k-means
- 列出每次的聚类结果
- 写出第三次聚类的详细过程
五、
Fp树的构建
寻找t的条件模式基
六、
决策树的思想、两种类型是什么
给出离散化的标准,列出符合某一个标准的数据集
将决策树转化为判断过程
给出一个条件,判断是否会购买(写过程)
树中有一个?,判断?应该是什么,说出理由
七、
给出abcdef几个商品,ABCDEF几个用户
给出F喜欢的商品abd,给出用户喜欢的商品列表
1.应该用哪种推荐算法,算法思想是什么
2.应该给F推荐哪个商品
题量很大,希望能帮到要考这门课的同学
By naggy
来源:CSDN
作者:Departuresna
链接:https://blog.csdn.net/Departuresna/article/details/103595931