散点图

pyecharts数据可视化

孤者浪人 提交于 2020-01-30 07:58:50
Echarts是一个由百度开源的数据可视化工具,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts诞生啦。 尽管python有自带的matplotlib、seaborn等画图模块,但其绘制出来的是静态图,而pyecharts可以绘制出非常棒的动态效果图,果断入坑! #关于一些函数的说明 - add() 用于添加图表的数据和设置各种配置项 - show_config() 打印输出图表的所有配置项 - render() 生成 .html 文件 - 支持保存做种格式 - 对象.render(path='snapshot.html') - 对象.render(path='snapshot.png') - 对象.render(path='snapshot.pdf') 1、词云图 1.1 英文词云 from pyecharts import WordCloud name =['Sam S Club', 'Macys', 'Amy Schumer', 'Jurassic World', 'Charter Communications', 'Chick Fil A', 'Planet Fitness', 'Pitch Perfect', 'Express', 'Home',

python散点图及相关系数矩阵计算和相关性验证

拜拜、爱过 提交于 2020-01-29 06:44:10
python散点图及相关系数矩阵计算 # -*- coding:utf-8 -*- # __author__ = "LQ" import matplotlib.pyplot as plt import pandas as pd import scipy.stats as stats #自定义方法调用,上一篇有该方法 from DataAnalysis.TeachingModel.dbc import dbcConnect def main(sql): df = dbcConnect.selectDf(sql) print(df) # pearson相关系数矩阵 corr = df.corr() print(corr) #计算某一个元素相关 print(df.corr()[u'avg_getscore']) # 输出结果第一个值为pearsonr相关系数, # 第二个为p-value,所以这里Guba列和Value值是显著相关的 pearsonr = stats.pearsonr(df['avg_total_afterrequire_num'], df['avg_getscore']) print(pearsonr) # 散点图矩阵 pd.plotting.scatter_matrix(df, figsize=(8, 8), c='k', marker='+', diagonal=

Matplotlib进阶-折线图,散点图

﹥>﹥吖頭↗ 提交于 2020-01-27 00:09:59
折线图 折线图是通常用来表示数据随时间或有序类别变化的趋势,下面是最简单的折线图实例: import matplotlib.pyplot as plt data = [1,2,3,4,5,4,2,6] # 随意创建的数据 plt.plot(data) #引用matplotlib库中的pyplot模块绘制图 plt.show() plot默认第一个参数表示横坐标的数据 第二个参数表示纵坐标的数据 第三个表示颜色,线型和标记样式 颜色常用(r/g/b/c/m/y/k/w) 线型常用(-/–/😕-.) 标记样式常用(./,/o/v/^/s/*/D/d/x/</>/h/H/1/2/3/4/_/|) 实例一 绘制多条曲线,曲线颜色,线型,标记等参数设置 import matplotlib.pyplot as plt import matplotlib.font_manager as fm yy=[1,2,3,4,5,1,2,1,5,1] xx=[1,5,1,5,1,2,5,1,2,4] zz=[6,4,2,6,8,6,4,1,8,3] plt.plot(yy.color='r',linewidth=5,linestyle=':',label='Data 1') plt.plot(xx.color='g',linewidth=2,linestyle='--',label='Data 2')

【python】散点图----Matplotlib 模块学习系列(三)

喜欢而已 提交于 2020-01-26 02:56:21
主要关注方法 plt.scatter() 参数: x坐标 y坐标 s size marker 形状 c color 颜色 alpha 透明度 代码实现 from matplotlib import pyplot as plt import numpy as np n = 100 X = np . random . normal ( 0 , 1 , n ) Y = np . random . normal ( 0 , 1 , n ) plt . scatter ( X , Y , s = 50 , marker = '*' , alpha = 0.6 ) plt . show ( ) 方程散点图 import matplotlib . pyplot as plt import numpy as np # x^2/a^2+y^2/b^2=1 a = 3 b = 2 x = np . linspace ( - 10 , 10 , 100 ) noise = np . random . normal ( 0 , 1.3 , x . shape ) y = x ** 2 / 1.4 + noise plt . figure ( num = 4 , figsize = ( 4 , 3 ) ) plt . scatter ( x , y , 2 , color = 'red' ) plt .

散布图(散点图)

前提是你 提交于 2020-01-24 03:07:18
散布图(散点图) 通常是连续值与连续值之间的对应关系 也可能是连续值和离散值之间的对应关系 离散值之间一般不需要表达散点图的关系 # 查看消费随着账单变化的对应关系 # x表示作为横轴展示列标签名字 # y表示作为纵轴展示列标签的名字 # 连续值与连续值的对应关系 # 作为散点图的列,必须是数值类型 # 可以使用map函数对不是数值的列进行数值映射 tips . plot ( kind = "scatter" , x = 'total_bill' , y = 'tip' ) tips . plot ( kind = "scatter" , x = "sex_flag" , y = "total_bill" ) 散布图 散布图是观察两个一维数据之间的关系的有效方法,DataFrame 对象可用。 使用方法:设置kind=‘scatter’ 给明标签columns 散布图矩阵,当有多个点时,两两点的关系 使用函数: pd.plotting.scatter_matrix() 参数diagnol:设置对角线的图像类型 # 只显示可以用散点图表示的数据,即只能显示数值类型的列之间的对应关系 _ = pd . plotting . scatter_matrix ( tips , diagonal = 'kde' ) 来源: CSDN 作者: my_白白白 链接: https://blog

matlab一元线性回归及多元线性回归方程

岁酱吖の 提交于 2020-01-19 05:12:01
%%1、bint表示回归系数区间估计可参考http://www.360doc.com/content/11/0801/20/2537127_137246007.shtml %2、r表示残差 %3、rint代表置信区间 %4、stas表示用于检验回归模型的统计量,有三个数值 r^2 F 与F对应的概率P 例如p<0.05 残差95% % r^2越接近于1,回归方程越显著 %alpha表示显著水平 %% x=[143 144 145 147 148 150 153 154 155 156 157 158 159 160 161 162]’; X=[ones(16,1),x]; Y=[87 85 88 91 92 90 93 95 98 98 97 95 97 99 100 102]’; [b,bint,r,rint,stats]=regress(Y,X) t=1:16; %% figure(1); y_fitting=X(t,:)*b; plot(t,y_fitting,‘r-’, t,Y(t,:),‘b-’, t,abs(y_fitting-Y(t,:)),‘k-’); legend(‘红–拟合值’,‘蓝–实际值’,‘黑–误差值’); text(3,50,strcat(‘相关系数R=’,num2str(stats(1,1 )))); text(7,50,strcat(‘F=’

数据分析-day01-matplotlib-散点图

青春壹個敷衍的年華 提交于 2020-01-19 01:43:08
#!usr/bin/env python #-*- coding:utf-8 _*- ''' @author:Administrator @file: matplot-scatter-demo.py @time: 2019-12-29 下午 4:01 ''' # coding=utf-8 from matplotlib import pyplot as plt from matplotlib import font_manager #x,y轴 x_1=range(1,32); x_2=range(51,82); y_1=[11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]; y_2=[26,26,28,19,21,17,16,19,18,20,20,19,22,23,17,20,21,20,22,15,11,15,5,13,17,10,11,13,12,13,6]; #windows下设置字体 plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签 plt.rcParams['axes.unicode_minus']=False #用来正常显示负号 #设置图形大小 plt.figure(figsize=

R绘图 第五篇:绘制散点图(ggplot2)

|▌冷眼眸甩不掉的悲伤 提交于 2020-01-17 08:21:26
ggplot2包中绘制点图的函数有两个:geom_point和 geom_dotplot,当使用geom_dotplot绘图时,point的形状是dot,不能改变点的形状,因此,geom_dotplot 叫做散点图(Scatter Plot),通过绘制点来呈现数据的分布,对点分箱的方法有两种:点密度(dot-density )和直方点(histodot)。当使用点密度分箱(bin)方式时,分箱的位置是由数据和binwidth决定的,会根据数据进行变化,但不会大于binwidth指定的宽度;当使用直方点分箱方式时,分箱有固定的位置和固定的宽度,就像由点构成的直方图(histogram)。 bin是分箱的意思,在统计学中,数据分箱是一种把多个连续值分割成多个区间的方法,每一个小区间叫做一个bin(bucket),这就意味着每个bin定义一个数值区间,连续值会落到相应的区间中。 对点进行分箱时,点的位置(Position adjustment)有多种调整方式: identity:不调整 dodge:垂直方向不调整,只调整水平位置 nudge:在一定的范围内调整水平和垂直位置 jitter:抖动,当具有离散位置和相对较少的点数时,抖动很有用 jitterdodge:同时jitter和 dodge stack:堆叠, fill:填充,用于条形图 每个位置调整都对应一个函数position

Python图表数据可视化Seaborn:2. 分类数据可视化-分类散点图|分布图(箱型图|小提琴图|LV图表)|统计图(柱状图|折线图)

╄→尐↘猪︶ㄣ 提交于 2020-01-16 04:48:53
1. 分类数据可视化 - 分类散点图 stripplot( ) / swarmplot( ) sns.stripplot(x="day",y="total_bill",data=tips,jitter = True, size = 5, edgecolor = 'w',linewidth=1,marker = 'o') import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns % matplotlib inline sns.set_style("whitegrid") sns.set_context("paper") # 设置风格、尺度 import warnings warnings.filterwarnings('ignore') # 不发出警告 # 1、stripplot() # 按照不同类别对样本数据进行分布散点图绘制 tips = sns.load_dataset("tips") print(tips.head()) # 加载数据print(tips['day'].value_counts()) sns.stripplot(x="day", # x → 设置分组统计字段 y="total_bill", # y → 数据分布统计字段 #

机器学习--matplotlib绘制各种图表

若如初见. 提交于 2020-01-13 11:56:21
机器学习三剑客:numpy、pandas、matplotlib NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵。 pandas 是基于numpy的一种工具,该工具是为了解决数据分析任务而创建的。 Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。 柱状图bar from matplotlib import pyplot as plt import matplotlib # 显示图表,仅限于jupyter使用 %matplotlib inline #指定默认字体 matplotlib.rcParams['font.sans-serif'] = ['SimHei'] # 第一个参数:索引 # 第二个参数:高度 参数必须对应否则报错 plt.bar(range(5),[100,200,300,400,500],color='red') plt.xticks(range(5),['A','B','C','D','E']) plt.xlabel('姓名') plt.ylabel('得分') plt.title('学生得分')# 或显示图标Plt.show() 饼图pie labels = ['A','B','C','D'] # autopct='%1.1f%%'显示比列