weka

Weka manual 3.6翻译: 1.1 简介

人走茶凉 提交于 2020-03-01 10:03:47
第一章 Weka命令行入门 1.1 简介 在最初的实验, Weka 所包含的图形用户界面是相当足够,若深入使用则建议使用命令行界面,因为它提供了一些功能(这些功能在图形用户界面下不可用) - 并使用少得多的内存。如果你遇到 内存不足 错误,提高您的 Java 引擎最大堆的大小,通常是通过设置 -Xmx1024M 或 -Xmx1024m 使最大堆大小为 1GB ,默认设置 16 到 64MB 通常太小。如果你遇到找不到类的错误,请检查你的 CLASSPATH : 它是否包括 weka.jar ? 您也可以通过命令行选项 -cp 显式设置 CLASSPATH 。 我们将通过描述基本概念和思想开始。然后,我们将介绍 weka.filters , 包,它是用来变换输入数据,如进行预处理,转换,特征生成等。 然后,我们将专注于机器学习算法本身。这些在 Weka 中叫分类。我们将只关注所有分类方法的常用设置,但会稍微提到机器学习所有主要学习方法的典型例子。 之后,会给出实际的例子。 最后,在 Weka 的 doc 目录,你可以找到一个 Weka 中所有 Java 类的文档。准备好使用它,因为本概述并不旨在提供完整描述。如果你想知道到底是怎么回事,去看大多都有着良好注释的源代码,源代码在 weka-src.jar 中,可以通过 Java 开发工具包的 jar 程序解压(或任何可以处理 ZIP

weka安装

狂风中的少年 提交于 2020-02-04 12:26:47
weka安装和配置 下载地址:http://www.cs.waikato.ac.nz/ml/weka/downloading.html 环境变量配置: 1、 假设我们的weka.jar的目录在C:/Program Files/Weka-3-6/weka.jar,其中,C:\Program Files\Weka-3-6是weka安装目录。 在系统环境变量中添加WEKAROOT,值为 C:/Program Files/Weka-3-6 。 2、 系统环境变量中已经有CLASSPATH,那么,在CLASSPATH后面添加上%WEKAROOT%\weka.jar。如果还没有CLASSPATH,那么,新建一个即可。 3、添加完成并保存以后,重新启动CMD,键入 java weka.classifiers.trees.J48 显示如下图: 4、如果以后需要使用其他的外部工具包,也可以在CLASSPATH中添加相应jar包的路径。譬如,我们需要在weka中使 用LibSVM的工具包,其工具放置的位置为C:/Program Files/Weka-3-6/libsvm.jar,我们可以将其添加到CLASSPATH中。 资料参考:http://blog.csdn.net/dupei/article/details/6220997 来源: https://www.cnblogs.com/ddblog/p

Weka平台学习

帅比萌擦擦* 提交于 2020-02-04 11:55:39
链接:http://www.cs.waikato.ac.nz/ml/weka/index.html 一简介: WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、 关联规则 以及在新的交互式界面上的可视化。 >术语:WEKA所处理的数据集是一个二维的表格,表格里的一个横行称作一个实例(Instance),相当于统计学中的一个样本,或者数据库中的一条记录。 竖行称作一个属性(Attribute),相当于统计学中的一个 变量 ,或者数据库中的一个字段。这样一个表格,或者叫数据集,在WEKA看来,呈现了属性之 间的一种关系(Relation)。 >数据准备:WEKA存储数据的格式是ARFF(Attribute-Relation File Format)文件,这是一种ASCII文本文件。同时其还提供了对CSV文件的支持,而这种格式是被很多其他软件所支持的。此外,WEKA还提供了通过JDBC访问数据库的功能。具体参见:百度百科http://baike.baidu.com/view/1380214.htm 二:Knime开源数据挖掘软件 http://www.oschina.net/question

Weka平台学习

大城市里の小女人 提交于 2020-02-04 11:54:17
链接:http://www.cs.waikato.ac.nz/ml/weka/index.html 一简介: WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、 关联规则 以及在新的交互式界面上的可视化。 >术语:WEKA所处理的数据集是一个二维的表格,表格里的一个横行称作一个实例(Instance),相当于统计学中的一个样本,或者数据库中的一条记录。 竖行称作一个属性(Attribute),相当于统计学中的一个 变量 ,或者数据库中的一个字段。这样一个表格,或者叫数据集,在WEKA看来,呈现了属性之 间的一种关系(Relation)。 >数据准备:WEKA存储数据的格式是ARFF(Attribute-Relation File Format)文件,这是一种ASCII文本文件。同时其还提供了对CSV文件的支持,而这种格式是被很多其他软件所支持的。此外,WEKA还提供了通过JDBC访问数据库的功能。具体参见:百度百科http://baike.baidu.com/view/1380214.htm 二:Knime开源数据挖掘软件 http://www.oschina.net/question

weka 属性选择

自闭症网瘾萝莉.ら 提交于 2020-02-04 11:49:54
weka有 两种属性选择模式 1是 属性子集评估器+搜索方法(后者可以说是循环,前者是循环的每个环节的操作) 2是 单一属性评估器+排序方法 属性子集评估器有 CfssubEval:综合考虑单一属性的预测值和属性间的重复度。 classifiersubsetEval:用评估器评估属性集 consistencySubsetEval:将训练数据集映射到属性机上来检测类型的一致性 WrapperSubsetEval:使用分类器和交叉验证(包装方法) 搜索方法有 bestFirst:回溯的贪婪搜索 ExhaustiveSearch:穷举搜索 GeneticSearch:使用遗传算法搜索 GreedyStepwise:不回溯的贪婪搜索 randomSearch:随机搜索 RankSearch:排列属性并使用属性子集评估器将有潜力的属性进行排序 单一属性评估器 ChiSquaredAttributeEval:以基于类的X2为依据的属性评估 GainRationAttributeEval:以增益率为依据的属性评估 InfoGainAttributeEval:以信息增益为依据的属性评估 OneRAttributeEval:以OneR的方法论来评估属性 PrincipleComponent:进行主成分的分析和转换 ReliefAttributeEval:基于实例的属性评估器

Weka数据挖掘——选择属性

↘锁芯ラ 提交于 2020-02-04 11:49:06
如果你现在还不努力,那么将来的你会过的更加吃力。 1 选择属性 属性选择是通过搜索数据中所有可能的属性组合,以找到预测效果最好的属性子集。手工选择属性既繁琐又容易出错,为了帮助用户事项选择属性自动化。Weka中提供了选择属性面板。要自动选择属性需要设立两个对象:属性评估器和搜索方法,如下图所示: 属性评估器确定使用什么方法给每个属性分配一个评估值,搜索方法决定执行什么风格的搜索。 2 选择属性算法的介绍 2-1 属性子集评估器 属性子集评估器选取属性的一个子集,并且返回一个指导搜索的度量数值。 CfsSubsetEval评估器评估每个属性的预测能力以及相互之间的冗余度,倾向于选择与类别属性相关度高,但是相互之间相关度第的属性。选项迭代添加与类别属性相关度最高的属性,只要是子集中不包含与当前属性相关更高的属性。 评估器将缺失值作为单独值,也可以将缺失值计数与其他的值一起按照出现频率分布。 WrapperSubsetEval评估器是包装器方法。它使用一个分类器来评估属性集,它对每个子集采用交叉验证估计学习方案的准确性。 2-2 单个属性评估器 单个属性评估器和Ranker搜索方法一起使用,Ranker产生一个丢弃若干属性后得到的给定数目的属性列表。 ReliefAttributeEval是基于实例的评估器,它随机抽取样本,并检查具有相同和不同类别的邻近实例

modify weka source code in netbeans

陌路散爱 提交于 2020-01-25 11:43:26
问题 i wanna use weka source code (not jar file!)and i download weka-src.jar from this address http://www.java2s.com/Code/Jar/w/Downloadwekadev379sourcesjar.htm and i wanna have weka project in netbeanes in windows .i do step by step this site instruction http://weka.wikispaces.com/Netbeans+6.0+%28weka-src.jar%29 when i extract jar file into src directory in my project,it give me a lot of error such as: package java_cup.runtime does not exist and a lot of other error. anyone can tell me how can i

modify weka source code in netbeans

元气小坏坏 提交于 2020-01-25 11:43:07
问题 i wanna use weka source code (not jar file!)and i download weka-src.jar from this address http://www.java2s.com/Code/Jar/w/Downloadwekadev379sourcesjar.htm and i wanna have weka project in netbeanes in windows .i do step by step this site instruction http://weka.wikispaces.com/Netbeans+6.0+%28weka-src.jar%29 when i extract jar file into src directory in my project,it give me a lot of error such as: package java_cup.runtime does not exist and a lot of other error. anyone can tell me how can i

modify weka source code in netbeans

核能气质少年 提交于 2020-01-25 11:43:06
问题 i wanna use weka source code (not jar file!)and i download weka-src.jar from this address http://www.java2s.com/Code/Jar/w/Downloadwekadev379sourcesjar.htm and i wanna have weka project in netbeanes in windows .i do step by step this site instruction http://weka.wikispaces.com/Netbeans+6.0+%28weka-src.jar%29 when i extract jar file into src directory in my project,it give me a lot of error such as: package java_cup.runtime does not exist and a lot of other error. anyone can tell me how can i

Differences of two-class svm in R(e1071) and WEKA(SMO)

*爱你&永不变心* 提交于 2020-01-24 20:44:08
问题 I generated a random data set like this: set.seed(1234) df <- data.frame(replicate(10, runif(100, 0, 1))) df$Class <- sample(c(-1,1), 100, replace=T) df$Class <- as.factor(df$Class) It has binary classes, 100 samples and 10 features. I tried using svm in R (e1071 package): library(e1071) set.seed(1234) model <- svm(Class~.,data=df,kernel="radial",cost=1.0,tolerance=0.001,epsilon=1.0E-12,scale=TRUE,cross=10) res <- predict(model, df[,-11]) table(pred=res, true=df[,11]) summary(res) summary(df