粗糙集

聊一聊粗糙集(一)

北慕城南 提交于 2020-02-24 15:43:47
本系列博客将介绍经典粗糙集的相关概念和一个属性约简算法,作为系列博客的开篇之作,先不介绍具体概念,简单认识认识粗糙集。 粗糙集理论简介 粗糙集是波兰理工大学Z.pawlak教授提出用来研究不完整数据,不精确知识的表达、学习,归纳等的一套理论。 它是一种新的处理模糊和不确定性问题的数学工具,已被广泛应用于知识发现、机器学习、决策支持、模式识别、专家系统及归纳推理等领域。 粗糙集理论的特点是能够分析隐藏在数据中的事实,又不需要关于数据附加信息。 其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。 从数学的角度看,粗糙集是研究集合的;从编程的角度看,粗糙集的研究对象是矩阵,只不过是一些特殊的矩阵;从人工智能的角度来看,粗糙集研究的是决策表。 粗糙集相关概念 病人 头疼 肌肉疼 体温 流感 \(e_{1}\) 是 是 正常 否 \(e_{2}\) 是 是 高 是 \(e_{3}\) 是 是 很高 是 \(e_{4}\) 否 是 正常 否 \(e_{5}\) 否 否 高 否 \(e_{6}\) 否 是 很高 是 决策信息系统 \(S=(U,A,V,f)\) 是一个四元组,其中 \(U\) 是非空有限对象集,称为论域, \(A\) 是非空有限属性集, \(V=\cup _{a\in A}V_{a}\) , \(V_{a}\) 是其值,属性 \(a\) 的值域, \

粗糙集与模糊集的比较研究

[亡魂溺海] 提交于 2020-01-26 02:45:02
前言[1] 在自然科学、社会科学与工程技术的很多领域中,都不同程度地涉及到对不确定因素和不完备信息的处理。从实际系统中采集到的数据常常包含着噪声、不精确甚至不完整,采用纯数学上的假设来消除或回避这种不确定性,效果往往不理想,反之,如果正视它,对这种信息进行适当地处理,常常有助于实际系统问题的解决。多年来,研究人员们一直在努力寻找科学地处理不完整性和不确定性的有效途径,实践证明,1965年Zadeh创立的模糊集理论与1982年Z.Pawlak倡导的粗糙集理论是处理不确定性的两种很好的方法。事实上,除了上述两种方法外,基于概率统计方法的证据理论也是处理不确定性的一种有效方法。这些众多的方法都属于软计算(Soft Computing)的范畴。软计算(Soft Computing)的概念是由模糊集理论的创始人Zadeh提出的,软计算(Soft Computing)的主要工具包括粗糙集(Rough sets)、模糊逻辑(Fuzzy Logic)、神经网络(Nerve Network)、概率推理(Probability Reasoning)、信度网络(Belief Network)、遗传算法(Genetic Arithmetic)与其它进化优化算法、混沌理论(Chaos)等。传统的计算方法即所谓的硬计算(Hard Computing),使用精确、固定和不变的算法来表达和解决问题,而软计算

粗糙集学习笔记

ぃ、小莉子 提交于 2020-01-11 14:28:52
目录 定义 基本的概念 信息表 决策逻辑语言 定义 由波兰理工大学Z.pawlak教授提出用来研究不完整数据,不精确知识的学习,表达,归纳的理论。 ref 其实就是对数据中隐含的信息将其通过一定的手段挖据出来。 至于到底是研究集合,还是矩阵,抑或是决策表,这个都要根据研究对象吧。。 就是可以从不完备的信息中得出现有的规律,并从中提取出一些规则。从已知推位置,而且已知知道的不是那么全 基本的概念 论域:数学里面的集合,or对象的集合 知识:对对象分类的能力,这里的对象指任何实体,一般叫论域。为U的任何子集族。 属性:就是对象拥有的属性,或许会变成一个分类的条件。属性R==知识R==等价关系R==分类R,待我查下资料, 补充。。 知识库:在论域上面的分类 知识等价: 补充? ref 粗糙集是建立在分类机制的基础上,他将分类理解成为在特定空间上的等价关系,而等价关系构成料对该空间的划分。 粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画。 该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息,所以对问题的不确定性的描述或处理可以说比较客观。 很多概念是用符号表示的,如果一开始直接看定义,其实挺烦的,绕晕了, demo OR 图或许会更加的直观一点 王国胤2019:A Survey on

粗糙集 rough set theory

流过昼夜 提交于 2019-12-27 01:58:43
最近看到一篇文章上有用到关于粗糙集的理论,所以到网上查了些资料学习了一下,目前应该脑子里有一个大致的概念了,知道这是干啥的,能够用来做些什么工作。接下来就记录下 对我理解这个概念很有帮助的一些资料 以及 我自己的一些理解 ,然后把我看到的那篇论文上的关于 粗糙集的case 也写一下。 ———————————————————————————————————— 对我理解粗糙集很有帮助的一些资料 王国胤, 姚一豫, 于洪. 粗糙集理论与应用研究综述[J]. 计算机学报, 2009, 32(7). 上述论文获取 关于粗糙集一些概念通俗易懂的解释 大佬写的博文,不过都是英文的 维基百科,可以直接访问 百度百科中的找到好工作的例子可以一看 顺带看一眼好了 可以先看一下第一篇paper,对粗糙集的一些基本概念和拓展、运用有一个大致的理解,当然里面的概念都偏数学,比较难理解,所以不必全部都完全领会,先过一遍大致理解,心里有个印象,然后看一下第二篇文章,很通俗易懂,并且给了一个实际的例子,基本可以对粗糙集的概念进行理解了,第三篇是一个大佬记录的wiki的关于粗糙集的内容,全是英文的,直接看有点累,不过看完前两个再看就轻松多了,第四个链接是维基百科,可以直接访问的,第五个和第六个也可以顺带一看,不看也OK。 《张文修, 吴伟志, 粱吉业, 李德玉. 粗糙集理论与方法[M]. 北京: 科学出版社

粗糙集理论(Rough Set Theory)

醉酒当歌 提交于 2019-12-11 01:49:04
粗糙集理论(Rough Set Theory) 一种 数据分析处理 理论。 《粗糙集—关于数据推理的理论》。 数据挖掘 (Data Mining)和 知识发现 ( KDD )。 集合近似定义的基本思想及其应用和粗糙集合环境下的机器学习基础研究。 在粗糙集中使用 信息表 (information table) 描述论域中的数据集合.信息表的形式和大家所熟悉的关系数据库中的 关系数据模型 很相似,是一张二维表格。 数据库(数据挖掘)、粗糙集、粗糙集合论、集合A(列表)、 对象、 属性(条件属性,决策属性)、论域、知识、知识库、知识系统、集合的划分(划分关系)、近似集合 (上近似 ,下近似 ) 。 在所有的现有知识里面找出跟他最像的两个一个作为下近似,一个作为上近似。下近似集是在那些所有的包含于X(A上的子集合X)的知识库中的集合中求并得到的(包含在X内的最大可定义集),而上近似则是将那些与X有交集的知识库中的集合求并得到的(包含X的最小可定义集)。 下近似集合=X集合内可区分对象的集合。 上近似集合=下近似集合∪X中对象不可区分的所有对象的集合。 一般的,我们可以用下面的图来表示上、下近似的概念。 这其中曲线围的区域是X的区域,蓝色的内部方框是内部参考消息, 是下近似 ,绿的是边界加上蓝色的部分 就是上近似集。其中各个小方块可以被看成是论域上的知识系统所构成的所有划分。 研究方向 理论