pyecharts

pyecharts 图表切换,指标选择

烈酒焚心 提交于 2020-12-26 06:24:41
前言 最近小编在使用 pyecharts,深入研究了一下,pyecharts 的功能还有好多都没挖掘使用过。 平常做一些基本的图表很快就能实现,但得到的只是一张 html,不能进行图表切换,指标选择。 这次小编用两个示例,来演示一下图表切换,根据指标选择数据,还可以保存,查看数据视图。 热力地图根据时间序列选择相应的数据;堆积柱状图切换为折线,柱状图,区域缩放。 先来看看,开门见山,一睹为快。   Map 使用官网的示例代码,得到的结果今年仅仅是一个 html: 现在我们有这样一份数据,有时间,省份,阈值,需要以时间序列展示每一天每一个省份的阈值,且可以保存某一天的图表数据。 要是简单的使用示例代码那得画很多图,且不能查看数据视图,不能保存为图片。 先来看看数据: 既然以时间为切换指标,那通过循环每一次选择对应时间的所有省份并把每一个时间所有省份对应的值添加: 之后再进行全局配置,每个配置需要对应的类,图表标题配置: 视觉映射配置,也就是地图左下角的区间划分,颜色越深值越大: 图例配置,也就是时间的筛选按钮,位置,形状,布局等: 工具箱配置,也就是保存按钮,数据视图等工具查看,先对所有工具进行位置布局配置: 然后在 ToolBoxFeatureOpts 类中依次选择想要的工具,例如保存工具的开启,其他工具原理一样,其他工具参考源码: 最后运行得到的结果如下,1 是标题配置

Python 实现帕累托,漏斗,雷达图

无人久伴 提交于 2020-12-26 00:20:27
前言 用 Python 中的 pyecharts 库实现帕累托图,转化漏斗图,RFM 客户分类以后的雷达图。 可收藏当做模板使用,先来看看实现效果: 帕累托 帕累托分析法或巴雷托分析法、柏拉图分析、主次因分析法 、平常也称之为「80 对 20」规则,即二八法则。 现在我们有一份商品销售数据,包含店名,风格,品类,销售日期,销售额等字段。 我们以品类,销售额,使用帕累托分析法分析出销售额主要来源于哪部分 80% 的商品。 先读取数据: 首先需要以商品进行分组计算,计算出每种商品的累计销售额,再以销售额降序排序。 因为需要计算累计占比,所以需要计算所有商品的销售额总和。 增加一列计算累计销售额占比,增加一列标记到此类商品时,销售额占比是否达到 80%,处理代码如下: 在得到绘制帕累托图的数据后,可以开始绘制了,以商品为横坐标,销售额与累计占比为纵坐标,即双坐标轴,销售额以柱状图显示,并且累计销售额占比达到 80% 的以另一种一色区分,累计占比以折线图显示 绘制代码有点长,还用到了 js 代码,就不贴了,完成后以后只需要修改数据就可以快速得到了: 漏斗转化 转化漏斗模型,是分析用户使用某项业务时,经过一系列步骤转化效果的方法。 转化分析的本质是为了促进企业的核心业务的流通,最大化每个营销漏斗的转化率。 在理想情况下,用户会沿着产品设计的路径到达最终目标事件

python——拉勾网信息爬取

可紊 提交于 2020-12-16 18:50:08
原文: https://www.cnblogs.com/sui776265233/p/11146969.html python爬取拉勾网数据并进行数据可视化 阅读目录 一、爬取和分析相关依赖包 二、分析网页结构 三、数据清洗后入库 四、数据可视化展示 五、爬虫及可视化完整代码 爬取拉勾网关于python职位相关的数据信息,并将爬取的数据已csv各式存入文件,然后对csv文件相关字段的数据进行清洗,并对数据可视化展示,包括柱状图展示、直方图展示、词云展示等并根据可视化的数据做进一步的分析,其余分析和展示读者可自行发挥和扩展包括各种分析和不同的存储方式等。。。。。 回到顶部 一、爬取和分析相关依赖包 Python版本: Python3.6 requests: 下载网页 math: 向上取整 time: 暂停进程 pandas:数据分析并保存为csv文件 matplotlib:绘图 pyecharts:绘图 statsmodels:统计建模 wordcloud、scipy、jieba:生成中文词云 pylab:设置画图能显示中文 在以上安装或使用过程中可能读者会遇到安装或导入失败等问题自行百度,选择依赖包的合适版本 回到顶部 二、分析网页结构 通过Chrome搜索'python工程师',然后右键点击检查或者F12,,使用检查功能查看网页源代码,

用Python处理Excel的数据,并将之可视化

房东的猫 提交于 2020-11-24 18:50:24
用Python代码作可视化,如果每次都在代码中以列表的形式来一个一个字符地敲,无异乎浪费时间。我们都知道,在Excel中,数据是以DataFrame(一维的Series是特殊的DataFrame)形式作存储的,而我们在代码中输入的形式一般都是手工地以list的形式来输入。有没有什么快捷的方式呢? 今天下午随意上网搜索了一下“Python 柱形图”,就发现了这篇文章( https://www.cnblogs.com/hhh188764/p/13213299.html )。经过参考,自己略作修改,于是有了这篇文章。 具体如下: 1. 先从Excel中加载数据: # 加载数据 import pandas as pd df = pd.read_excel(r"D:\我的文档\MySQL.xlsx", sheet_name = 1) df 2. 简单地做一下数据清洗: # 按 num 字段排降序 df.sort_values(by = "num",ascending = False) 3. 做可视化输出 3.1 绘制一个单系列的柱形图,简单对比一下各种水果单品的销售(数量)状况 from pyecharts.charts import Bar from pyecharts import options as opts c = ( #创建柱图对象,并设置大小,也可以不设置,直接使用默认大小即可

【全网首发】腾讯商业数据分析师培养计划

穿精又带淫゛_ 提交于 2020-10-28 15:47:08
核心知识点覆盖 Excel、Python、SQL、Pandas、Numpy、Matplotlib、PyEcharts可视化、数据指标、波士顿矩阵、数据建模、AARRR模型、漏斗模型、RFM模型、A\BTest、逻辑回归、线性回归、预测分析、K近邻算法、网络爬虫、数据化运营、用户画像体系构建 9大真实项目实战 全程直播教学 每个项目均由专业数据分析师 精心挑选 ,从数据到课程知识点设计,涵盖 0-8年 数据分析师必备专业技能和真实工作中的业务场景和所可能遇到的问题。 【项目1】 哔哩哔哩主站广告优化数据分析 【项目2】 哔哩哔哩会员购平台订单报表分析项目 【项目3】 亚马逊电商入驻商数据化运营项目 【项目4】 亚马逊电商入驻商用户画像分析 【项目5】 Kindle电子书多渠道发售商业分析项目 【项目6】 淘宝用户行为的用户价值分析 【项目7】 员工薪水探索性分析 【项目8】 门户网站的广告效果聚类分析 【项目9】 健身房会员体系消费行为分析 以《亚马逊电商入驻商用户画像分析项目》为例,下面是该项目涉及的内容。 项目教学大纲: 互联网电商平台入驻商数据分析思路 什么是用户画像体系(用户属性数据+行为数据) 为什么要搭建用户画像体系(获知自身的品牌定位和产品定位,梳理用户的搜索行为习惯) 用户画像的应用场景和业务价值 获客:如何进行拉新,通过更精准的营销获取客户 粘客:个性化推荐

预测GDP应用:Numpy 线性回归+Matplotlib 作图

房东的猫 提交于 2020-10-25 03:32:21
预测GDP应用:Numpy 线性回归+Matplotlib 作图 需求 通过2000~2019年中美两国的GDP数据,预测后续几年GDP的发展趋势: 读取.csv文件,并将字符串调整为浮点型 进行二阶线性回归模拟 支持数据可视化 保命声明:用线性回归预测GDP发展并不合理,只是作为python学习参考。 如果想要了解更有意义的GDP对比可以参考b站翟老师的:https://b23.tv/6aYFVf 成品效果 原数据格式 .csv 文件(“testgdp.csv”),gdp数据每千位均被 “,” 隔开 需求拆解 1、csv文件读取 以测试文件"testgdp.csv"为例,目标将csv数据读取成适合进行线性回归的格式ndarray 方法一 : pandas 的 read_csv() 函数 import pandas as pd import numpy as np data = pd . read_csv ( "testgdp.csv" ) df = pd . DataFrame ( data ) print ( df . head ( ) ) years = np . array ( df . years ) #可以转化为 ndarray years 方法二: python 自带的 open() 函数 import csv import numpy as np data_list

python爬取拉勾网数据并进行数据可视化

Deadly 提交于 2020-10-10 00:39:57
爬取拉勾网关于python职位相关的数据信息,并将爬取的数据已csv各式存入文件,然后对csv文件相关字段的数据进行清洗,并对数据可视化展示,包括柱状图展示、直方图展示、词云展示等并根据可视化的数据做进一步的分析,其余分析和展示读者可自行发挥和扩展包括各种分析和不同的存储方式等。。。。。 一、爬取和分析相关依赖包 Python版本: Python3.6 requests: 下载网页 math: 向上取整 time: 暂停进程 pandas:数据分析并保存为csv文件 matplotlib:绘图 pyecharts:绘图 statsmodels:统计建模 wordcloud、scipy、jieba:生成中文词云 pylab:设置画图能显示中文 在以上安装或使用过程中可能读者会遇到安装或导入失败等问题自行百度,选择依赖包的合适版本 二、分析网页结构 通过Chrome搜索'python工程师',然后右键点击检查或者F12,,使用检查功能查看网页源代码, 当我们点击下一页观察浏览器的搜索栏的url并没有改变 ,这是因为拉勾网做了反爬虫机制, 职位信息并不在源代码里,而是保存在JSON的文件里,因此我们直接下载JSON,并使用字典方法直接读取数据.即可拿到我们想要的python职位相关的信息, 待爬取的python工程师职位信息如下: 为了能爬到我们想要的数据

美国超2200万人失业,根据数据用Python实现可视化图,最后有结果有点吓人

半世苍凉 提交于 2020-10-09 06:08:10
前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 目前,我国新冠疫情已经大幅度好转,各省市在3到4月份已经开始复产复工,连受灾最严重的武汉也解封了,全国的情况逐渐步入正轨。 但同时全球疫情十分严峻, 根据美国约翰斯.霍普金斯大学统计的数据显示,截至北京时间19日晚6时38分,全球新冠死亡病例超过16万例,达到161,324例,全球确诊病例突破230万,达2,343,293例。 根据数据,目前死亡病例最多的国家是美国,为33,903例。美国同时还是全球确诊病例最多的国家,累计确诊病例突破70万,达到722,761例。 疫情给全球人民带来的不仅仅是生命的威胁,同样还有经济上的困境以及失业危机。因为疫情的影响,美国陷入了“裁员潮”,很多美国人不得不因为这次疫情被辞退,从而申请失业救济金。 美国失业人数超2200万,抹去11年来所有新增就业 美国劳工部16日公布的数据显示,受新冠疫情在美国蔓延影响,上周美国首次申请失业救济人数达到524.5万,这意味着过去四周美国首次申请失业救济人数已累计达到约2200万,这约占美国劳动力总数的八分之一,基本抹去了08年金融危机以来过去11年所有的新增就业。 特别是这个由美国劳工部统计的失业救济人数动态图,也是引爆全网,从中可以看到自六十年代来,美国的失业救济人数一直是上下波动

Python数据分析:柱形图的绘制方法

让人想犯罪 __ 提交于 2020-10-05 08:12:12
前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 没有安装PyEcharts的,先安装PyEcharts: data = pd.read_excel('D:/python/xgyq.xlsx',sheet_name='1')#按新增字段进行降序 data = data.sort_values(by=['新增'],ascending=[False]) 安装好PyEcharts之后,就可以将需要使用的模块进行导入: 在学习过程中有什么不懂得可以加我的 python学习qun,855408893 群里有不错的学习视频教程、开发工具与电子书籍。 与你分享python企业当下人才需求及怎么从零基础学习好python,和学习什么内容 c = ( #创建柱图对象,并设置大小,也可以不设置,直接使用默认大小即可 Bar(init_opts=opts.InitOpts(width="800px", height="400px")) #设置X轴数据系列,只取前10个数据,并转为列表格式 .add_xaxis(data.省份[:10].tolist()) #设置Y轴数据系列及显示颜色,只取前10个数据,并转为列表格式 .add_yaxis("", data.新增[:10].tolist()) # 设置图表标题及位置 .set

python可视化分析(matplotlib、seaborn、ggplot2)

一曲冷凌霜 提交于 2020-10-04 03:44:28
python可视化分析总结(matplotlib、seaborn、ggplot) 一、matplotlib库 1、基本绘图命令 3、图形参数设置 4、特殊统计图的绘制 4.1 数学函数图 4.2 气泡图 4.1 三维曲面图 二、seaborn库 1、常用统计图 1.1 箱线图 1.2 小提琴图 1.3 点图 1.4 条图与计数图 1.5 分组图 1.6 概率分布图 2、联合图 3、配对图 三、ggplot库 1、图层画法+常用图形 2、快速绘图 一、matplotlib库 1、基本绘图命令 import matplotlib.pyplot as plt plt.figure(figsize=(5,4)) #设置图形大小 plt.rcParams['axes.unicode_minus']=False #正常显示负号 plt.rcParams['font.sans-self']=['Kai Ti'] #设置字体,这里是楷体,SimHei表示黑体 #基本统计图 plt.bar(x,y);plt.pie(y,labels=x);plt.plot(x,y); plt.hist(df.身高) #若参数density=True则是频率直方图 3、图形参数设置 颜色: plt.plot(x,y,c=‘red’) #参数c控制颜色 横纵坐标轴范围: plt.xlim(0,100),plt.ylim