山东大学2019-2020数据仓库与数据挖掘期末考试

折月煮酒 提交于 2019-12-18 14:06:56

山东大学2019-2020数据仓库与数据挖掘期末考试

一、
1.数据分析的步骤,每个步骤都干啥
2.数据仓库的特点,解释
3.大数据4v理论
4.数据流概念,难点是什么,解决方案的特点
5.检测离群点的四种方法
二、
1、给出三个维度(item,time,location)两个度量构建星型模型
2、想要得到2017第一季度的所有品牌销售状况,进行哪些olap操作
三、
1.数据仓库的体系结构图
2.解释每个层的作用
3.数据集市的定义
4.molap的原理
四、
给出几个点,进行k-means

  1. 列出每次的聚类结果
  2. 写出第三次聚类的详细过程
    五、
    Fp树的构建
    寻找t的条件模式基
    六、
    决策树的思想、两种类型是什么
    给出离散化的标准,列出符合某一个标准的数据集
    将决策树转化为判断过程
    给出一个条件,判断是否会购买(写过程)
    树中有一个?,判断?应该是什么,说出理由
    七、
    给出abcdef几个商品,ABCDEF几个用户
    给出F喜欢的商品abd,给出用户喜欢的商品列表
    1.应该用哪种推荐算法,算法思想是什么
    2.应该给F推荐哪个商品

题量很大,希望能帮到要考这门课的同学

By naggy

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!