数据挖掘所挖掘的结果是面向全部的数据,而机器学习则是预测测试样本的检测结果。
1.2.3.4.5.
2.互信息值:
2
4VVolume () Variety () Velocity Value
4.数据挖掘的主要功能
5.多站点处理:
1.单机多进程
2.集群分布式计算效果
6.频繁项集:(min_sup)
:
:――AprioriGrowth
C2CC
RRR
RRR
rd:() → ydyd
11.凝聚法分层聚类有一堆方法可以用来算两点(pair)之间的距离:欧式,欧式平方,manhattan等,还有一堆方法可以算类(cluster)与类之间的距离,什么single-linkage、complete-linkage、还有这个ward linkage。(即最短最长平均,离差平方和)
关联规则的评价指标是支持度、置信度
13.分类规则的挖掘方法通常有:决策树法、贝叶斯法、人工神经网络法、粗糙集法和遗传算法。
14.模型的具体化就是预测公式,公式可以产生与观察值有相似结构的输出,这就是预测值。
15.频繁闭项集“--楗煎共”“-楗煎共”“--楗煎共”g(f(X))
DMDB/DM
- DBDM
- DB/DW
原文:https://www.cnblogs.com/lgx-fighting/p/9372729.html