关联规则DHP算法详解
参考文献: [1]Park, J. S., Chen, M. S., & Yu, P. S. (1995). Aneffective hash-based algorithm for mining association rules. Acm SigmodRecord, 24(2), 175-186. [2]潘燕燕. (2012). 关联规则dhp算法的研究与分析. 佛山科学技术学院学报(自然科学版), 30(2), 30-32. 写在前面:上《数据挖掘》这门课的时候,讲关联规则挖掘(Association Rules Mining)的时候,其他几个算法都是简单易懂,符合普通认知规律的。唯有DHP算法是绕了一个小弯。无奈PPT上写的太简略,英文原文也是看得模棱两可。好在,找到了一个中文版的分析,再结合英文版,果然捋得清多了。写在这里,方便自己期末复习。 一、DHP算法的由来 1993 年Agrawal等人首先提出关联规则概念之后关联规则挖掘便迅速受到数据挖掘领域专家的广泛关注。在迄今十几年中,关联规则挖掘技术得到了较为深入的发展。 Apriori算法是关联规则挖掘经典算法,针对该算法的缺点,许多学者提出了改进的算法,主要有基于哈希优化DHP 和基于事务压缩等。 二、DHP算法的过程 1.缩减候选项目集Ck 对于表1 的数据库,算法的条件为:最小支持度为2。哈希函数为:h{ {x,y