四分位

Seaborn - 05 分类值可视化

泪湿孤枕 提交于 2020-01-31 15:19:09
import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as sns sns.set(style="whitegrid", color_codes=True) np.random.seed(sum(map(ord, "categorical"))) titanic = sns.load_dataset("titanic") tips = sns.load_dataset("tips") iris = sns.load_dataset("iris") 用stripplot展示类别值,类似于散点图 sns.stripplot(x="day", y="total_bill", data=tips,jitter=False) 该方法不适合于数据量特别大的场合,如果那样,则纵轴数据会连成一条线,很难区分数据的差异/重叠是很常见的现象,但是重叠影响我观察数据的量了,最好加入jitter sns.stripplot(x="day", y="total_bill", data=tips, jitter=True) sns.swarmplot(x="day", y="total_bill", data=tips) sns

比率(ratio)

会有一股神秘感。 提交于 2019-12-03 04:47:27
比率是什么? 比率(ratio) :不同类别数值的比值 在中文里,比率这个词被用来代表两个数量的比值,这包括了两个相似却在用法上有所区分的概念:一个是比的值;另一是变化率,是一个数量相对于另一数量的变化量,例如,速率是物体的移动距离相对于时间的变化量,以每单位时间的移动距离来表示;心跳率是每分钟的心跳次数;税率则是每单位收入所应缴的税金。 为什么顺序数据不适用帕雷托图? 因为这样会打破顺序 雷达图、轮廓图如何反映多组数据多个变量的或某一特征值? 当多个变量的取值相差较大或量纲不同时,可进行变换处理后再做图。 如果存在两种特征值,那么转置前后有很大不同。 依据想要讨论的特征。 直方图与条形图的区别是什么? 直方图用面积代表频数,条形图是横轴是类别,纵轴是频数。直方图的各矩形通常是连续排列,条形图则是分开排列。条形图主要用于展示类别数据,直方图则主要用于展示数值型数据。 茎叶图和直方图之间的区别? 茎叶图用于未分组数据,直方图用于分组数据。 直方图可观察一组数据的分布状况,但没有给出具体的数值。 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。 直方图适用于大批量数据,茎叶图适用于小批量数据。 线图和折线图之间的关系? 折线图来自直方图,线图表示时间序列数据。 一组数据中,可不可以没有众数,可不可以有几个众数? 可以没有众数,也可以有几个众数。 请详细

Java 四分位算法

匿名 (未验证) 提交于 2019-12-02 20:41:15
四分位算法实例()    实例1:     数据总量: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36     由小到大排列的结果: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49     一共 11 项      Q1 的位置= (11+1) × 0.25=3 , Q2 的位置= (11+1)× 0.5=6 , Q3 的位置= (11+1) × 0.75=9      Q1 = 15 ,      Q2 = 40 ,      Q3 = 43    实例 2 :     数据总量: 7, 15, 36, 39, 40, 41     一共 6 项     数列项为偶数项时,四分位数 Q2 为该组数列的中数,      (n+1)/4= 7/4 =1.75 , Q1 在第一与第二个数字之间,     3(n+1)/4= 21/4 =5.25, Q3 在第五与第六个数字之间,      Q1 = 0.75*15+0.25*7 = 13,     Q2 = (36+39)/2= 37.5,     Q3 = 0.25*41+0.75*40 = 40.25. Java 代码 1 public static void fourDivsion(double[] param){ 2 if(param == null ||