seaborn

Rotate xtick labels in seaborn boxplot?

倖福魔咒の 提交于 2021-01-20 14:54:22
问题 I have a question that is basically the same as a question back from 2014 (see here). However, my script still throws an error. Here is what I do: I have a pandas dataframe with a few columns. I plot a simple boxplot comparison. g = sns.boxplot(x='categories', y='oxygen', hue='target', data=df) g.set_xticklabels(rotation=30) The graph looks like this: I'd like to rotate the x-labels by 30 degrees. Hence I use g.set_xticklabels(rotation=30) . However, I get the following error: set_xticklabels

Rotate xtick labels in seaborn boxplot?

佐手、 提交于 2021-01-20 14:54:15
问题 I have a question that is basically the same as a question back from 2014 (see here). However, my script still throws an error. Here is what I do: I have a pandas dataframe with a few columns. I plot a simple boxplot comparison. g = sns.boxplot(x='categories', y='oxygen', hue='target', data=df) g.set_xticklabels(rotation=30) The graph looks like this: I'd like to rotate the x-labels by 30 degrees. Hence I use g.set_xticklabels(rotation=30) . However, I get the following error: set_xticklabels

24式加速你的Python

你离开我真会死。 提交于 2021-01-19 10:16:24
一,分析代码运行时间 第1式,测算代码运行时间 平凡方法 快捷方法(jupyter环境) 第2式,测算代码多次运行平均时间 平凡方法 快捷方法(jupyter环境) 第3式,按调用函数分析代码运行时间 平凡方法 快捷方法(jupyter环境) 第4式,按行分析代码运行时间 平凡方法 快捷方法(jupyter环境) 二,加速你的查找 第5式,用set而非list进行查找 低速方法 高速方法 第6式,用dict而非两个list进行匹配查找 低速方法 高速方法 三,加速你的循环 第7式,优先使用for循环而不是while循环 低速方法 高速方法 第8式,在循环体中避免重复计算 低速方法 高速方法 四,加速你的函数 第9式,用循环机制代替递归函数 低速方法 高速方法 第10式,用缓存机制加速递归函数 低速方法 高速方法 第11式,用numba加速Python函数 低速方法 高速方法 五,使用标准库函数进行加速 第12式,使用collections.Counter加速计数 低速方法 高速方法 第13式,使用collections.ChainMap加速字典合并 低速方法 高速方法 六,使用numpy向量化进行加速 第14式,使用np.array代替list 低速方法 高速方法 第15式,使用np.ufunc代替math.func 低速方法 高速方法 第16式,使用np.where代替if

50个最有价值的数据可视化图表

可紊 提交于 2021-01-19 00:14:20
点击上方 大数据学苑 即可关注哟 加个 星标 你我从此不再错过 转载自: DataCastle数据城堡 本文总结了在数据分析和可视化中最有用的 50 个 Matplotlib 图表。这些图表列表允许您使用 python 的 matplotlib 和 seaborn 库选择要显示的可视化对象。 这些图表根据可视化目标的 7 个不同情景进行分组。 例如,如果要想象两个变量之间的关系,请查看“关联”部分下的图表。或者,如果您想要显示值如何随时间变化,请查看“变化”部分,依此类推。 有效图表的重要特征: 在不歪曲事实的情况下传达正确和必要的信息。 设计简单,您不必太费力就能理解它。 从审美角度支持信息而不是掩盖信息。 信息没有超负荷。 01 关联(Correlation) 关联图表用于可视化 2 个或更多变量之间的关系。也就是说, 一个变量如何相对于另一个变化。 1. 散点图(Scatter plot) 散点图是用于研究两个变量之间关系的经典的和基本的图表。如果数据中有多个组,则可能需要以不同颜色可视化每个组。您可以使用 plt.scatterplot() 方便地执行此操作。 2. 带边界的气泡图(Bubble plot with Encircling) 有时,您希望在边界内显示一组点以强调其重要性。在这个例子中,你从数据框中获取记录,并用 encircle() 来使边界显示出来。 3.

50个最有价值的数据可视化图表

∥☆過路亽.° 提交于 2021-01-19 00:12:49
文总结了在数据分析和可视化中最有用的 50 个 Matplotlib 图表。这些图表列表允许您使用 python 的 matplotlib 和 seaborn 库选择要显示的可视化对象。 这些图表根据可视化目标的 7 个不同情景进行分组。 例如,如果要想象两个变量之间的关系,请查看“关联”部分下的图表。或者,如果您想要显示值如何随时间变化,请查看“变化”部分,依此类推。 有效图表的重要特征: 在不歪曲事实的情况下传达正确和必要的信息。 设计简单,您不必太费力就能理解它。 从审美角度支持信息而不是掩盖信息。 信息没有超负荷。 01 关联(Correlation) 关联图表用于可视化 2 个或更多变量之间的关系。也就是说, 一个变量如何相对于另一个变化。 1. 散点图(Scatter plot) 散点图是用于研究两个变量之间关系的经典的和基本的图表。如果数据中有多个组,则可能需要以不同颜色可视化每个组。您可以使用 plt.scatterplot() 方便地执行此操作。 2. 带边界的气泡图(Bubble plot with Encircling) 有时,您希望在边界内显示一组点以强调其重要性。在这个例子中,你从数据框中获取记录,并用 encircle() 来使边界显示出来。 3. 带线性回归最佳拟合线的散点图(Scatter plot with linear regression

combine different seaborn facet grids into single plot

末鹿安然 提交于 2021-01-18 05:59:12
问题 I have three different data sets where I produce a facetplot, each a = sns.FacetGrid(data1, col="overlap", hue="comp") a = (g.map(sns.kdeplot, "val",bw=0.8)) b = sns.FacetGrid(data2, col="overlap", hue="comp") b = (g.map(sns.kdeplot, "val",bw=0.8)) c = sns.FacetGrid(data3, col="overlap", hue="comp") c = (g.map(sns.kdeplot, "val",bw=0.8)) Each of those plots has three subplots in one row, so in total I have nine plots. I would like to combine these plots, in a subplots setting like this f,

Plotting multiple different plots in one figure using Seaborn

旧街凉风 提交于 2021-01-16 05:01:52
问题 I am attempting to recreate the following plot from the book Introduction to Statistical learning using seaborn I specifically want to recreate this using seaborn's lmplot to create the first two plots and boxplot to create the second. The main problem is that lmplot creates a facetgrid according to this answer which forces me to hackily add another matplotlib axes for the boxplot. I was wondering if there was an easier way to achieve this. Below, I have to do quite a bit of manual

Python 数据分析—画图

与世无争的帅哥 提交于 2021-01-10 08:58:01
一、matplotlib的用法 折线图+一些常用的设置 #显示中文 import matplotlib as mpl mpl.rcParams['font.sans-serif'] = [u'SimHei' ] mpl.rcParams['axes.unicode_minus'] = False fig,ax = plt.subplots() fig.set_size_inches(12,6) #设置图像大小 ax.plot(data.iloc[:,1:3]) #画图 ax.set_xlabel('X轴',fontsize=15) #x轴的名称 ax.set_ylabel('Y轴',fontsize=15 ) ax.legend(['A','B']) #标签 ax.set_xticks(np.arange(-10,120,10)) #设置x轴的坐标 plt.yticks(fontsize=15) #设置坐标的字体大小 plt.title('折线图标题',fontsize=20) data = pd.DataFrame({'A':np.random.rand(100)*20,'B':np.random.rand(100)*12,'C':np.random.rand(100)*17,'D':np.random.rand(100)*10}) 直方图 这里简直要吐血,要先设置set

Python 数据分析—第八章 画图

时光总嘲笑我的痴心妄想 提交于 2021-01-10 08:47:59
一、matplotlib的用法 折线图+一些常用的设置 # 显示中文 import matplotlib as mpl mpl.rcParams[ ' font.sans-serif ' ] = [u ' SimHei ' ] mpl.rcParams[ ' axes.unicode_minus ' ] = False fig,ax = plt.subplots() fig.set_size_inches( 12,6) # 设置图像大小 ax.plot(data.iloc[:,1:3]) # 画图 ax.set_xlabel( ' X轴 ' ,fontsize=15) # x轴的名称 ax.set_ylabel( ' Y轴 ' ,fontsize=15 ) ax.legend([ ' A ' , ' B ' ]) # 标签 ax.set_xticks(np.arange(-10,120,10)) # 设置x轴的坐标 plt.yticks(fontsize=15) # 设置坐标的字体大小 plt.title( ' 折线图标题 ' ,fontsize=20) 直方图 这里简直要吐血,要先设置set_xticks 在设置set_xticklabels fig,ax = plt.subplots() ax.bar(range( 4 ),data.sum()) ax.set_xticks

Axis ticks in histogram of times in matplotlib/seaborn

怎甘沉沦 提交于 2021-01-07 03:01:26
问题 I've got a df with messages from a WhatsApp chat, the sender and the corresponding time in datetime format. Time Sender Message 2020-12-21 22:23:00 Sender 1 "..." 2020-12-21 22:26:00 Sender 2 "..." 2020-12-21 22:35:00 Sender 1 "..." I can plot the histogram with sns.histplot(df["Time"], bins=48) But now the ticks on the x-axis don't make much sense. I end up with 30 ticks even though it should be 24 and also the ticks all contain the whole date plus the time where I would want only the time