数据分析

小白学 Python 数据分析(3):Pandas (二)数据结构 Series

血红的双手。 提交于 2020-02-16 13:54:55
在家为国家做贡献太无聊,不如跟我一起学点 Python 顺便问一下,你们都喜欢什么什么样的文章封面图,老用这一张感觉有点丑 人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础 小白学 Python 数据分析(2):Pandas (一)概述 引言 先介绍下 Pandas 的数据结构,毕竟数据结构是万物的基础。 Pandas 有两种主要的数据结构: Series 和 DataFrame ,本文就先介绍第一种 Series 。 模块导入 首先我们在代码中引入 Pandas 和 Numpy ,如下: import numpy as np import pandas as pd Series Series 可以简单的理解为一维数组,可以存储整数、浮点数、字符串、Python 对象等类型的数据。 这个概念有点像 Java 中的集合。 如果无法理解的话,那么可以看下面这个图(Excel 简单画画,灵魂画手登场): 这里的 data 可以是上面提到的那些数据类型,并不仅限于图中的整数。 如果 index 的值未指定,那么将会自动的创建数值类型的索引,从 0 开始,例如:0 , 1 , 2, 3 ... len(data) - 1 。 创建一个 Series ,这里我们可以使用 pd.Series 函数来创建,如下: s = pd.Series(np

【搬砖】【Python数据分析】Pycharm中plot绘图不能显示出来

穿精又带淫゛_ 提交于 2020-02-16 09:35:08
  最近在看《Python数据分析》这本书,而自己写代码一直用的是Pycharm,在练习的时候就碰到了plot()绘图不能显示出来的问题。网上翻了一下找到知乎上一篇回答,试了一下好像不行,而且答住提供的“from pylab import *”的方法也不太符合编程规范,最后在Stackoverflow找到了想要的答案,特在此分析一下给大家: 以下是 有问题的代码,不能绘图成功 : import pandas as pd from numpy import * import matplotlib.pyplot as plt ts = pd.Series(random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)) ts = ts.cumsum() ts.plot() 解决方案是:导入matplotlib.pyplot库,绘图后再调用matplotlib.pyplot.show()方法就能把绘制的图显示出来了! 如下(注:后面发现此方法在知乎上那篇问答的评论区有人提供了): import pandas as pd from numpy import * import matplotlib.pyplot as plt ts = pd.Series(random.randn(1000), index=pd.date

企业有了ERP为什么还需要大数据分析,它能为企业解决什么问题?

风流意气都作罢 提交于 2020-02-16 01:25:24
如果一个企业不做数据分析,那将意味着什么? 用户在哪?我怎样才能和他们互动? 我不知道我的营销活动到底效果如何? 用户对我品牌的忠诚度在减弱? 我的销售怎么样? 我的生产研发怎么样? 我在浪费广告预算? 没有数据分析,所有的决策都是凭感觉、拍脑袋 大数据分析能为企业解决什么问题? (1)信息孤独:如今的企业采用OA、ERP、CRM、HR等信息化手段后,“信息孤岛”效应也随之产生,各个系统之间互相封闭,无法全面、及时、准确的了解各项业务情况。 (2)帮助企业分析自身发展:企业最近业务不太好,但不知道原因在什么地方。怎么办?拿出大数据报表一看,其他数据都正常,但是业务人员打电话的频率和次数明显降低,低于行业平均水平。这样一分析,问题的原因就清晰多了,正是因为有数据分析才知道差距在哪里,企业也才知道怎么应对,从而助力企业业务有效增长。 总结一句话:大数据可以帮助企业从数据洞察中更加清晰的了解企业各项业务的变化,从而及时有效的做出明智决策,达到降本增效的作用。 针对上诉问题,我们推出了NBI一站式大数据分析平台(http://nbi.easydatavis.com:8033),作为新一代自助式、探索式分析工具,在产品设计理念上始终从用户的角度出发,一直围绕简单、易用,强调交互分析为目的的新型产品。我们将数据分析的各环节(数据准备、自服务数据建模、探索式分析、权限管控)融入到系统当中

数据挖掘学习笔记(一)

岁酱吖の 提交于 2020-02-15 02:10:33
概述 数据分析与数据挖掘 1.数据分析 采用适当的统计分析方法对收集到的数据进行分析、概括和总结,对数据进行恰当的描述,提取有用的信息的过程。 数据分析一般具有比较明确的目标,可以根据数据分析的结果得出适当的判断,用来为以后的决策提供依据。 早在20世纪初期,数据分析的基础就已经确立。 数据分析的结果有表格,图(排列图、因果图、散布图、直方图、控制图)等表示方法。 2.数据挖掘(Data Mining,DM) 从海量的数据中通过相关的算法来发现隐藏在数据中的规律和知识的过程。 在大量的、未经过加工的数据中发现少量的、具有重要价值的知识和信息。 数据挖掘的目标不在于数据采集策略,而在于对已经存在的数据进行模式的发掘。 也叫资料勘探或数据采矿 为什么要进行数据挖掘呢? 数据的爆炸式增长:从TB到PB 丰富数据的主要来源: 商业:Web、电子商务、交易、股票… 科学:遥感、生物信息学、科学仿真… 社会与个人:新闻、数码相机、YouTube… 数据采集与数据可用性: 自动数据收集工具、数据库系统、Web… 计算机化的社会 通常将数据挖掘视为数据中“知识发现”的同义词,也可以认为数据挖掘是知识发现中的一个步骤。 3.知识发现(KDD)的过程 首先要对收集到的数据进行预处理(数据清洗与数据集成),然后将数据仓库中的数据进行选择与变换,以便从数据仓库中选择与任务相关的数据

【Pandas】数据分析工具Pandas的基本操作和可视化工具Matplotlib

给你一囗甜甜゛ 提交于 2020-02-14 20:14:34
1、Pandas简介 pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。 官网:http://pandas.pydata.org/ 参考文档:http://pandas.pydata.org/pandas-docs/stable/ 2、Pandas安装 Python的Anaconda发行版,已经安装好了pandas库,因此无需另外安装。 使用Anaconda界面安装:打开Anaconda Navigator,选择开发环境,从Not installed下找到pandas相关的库,勾选安装。 Anaconda安装命令: conda install pandas PyPi安装命令: pip install pandas 3、Pandas数据结构 (1)Pandas引入约定 from

Pandas 数据分析——超好用的 Groupby 详解

自古美人都是妖i 提交于 2020-02-14 17:30:32
在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。在 Pandas 中,上述的数据处理操作主要运用 groupby 完成,这篇文章就介绍一下 groupby 的基本原理及对应的 agg 、 transform 和 apply 操作。 PS:很多人在学习Python的过程中,往往因为遇问题解决不了或者没好的教程从而导致自己放弃,为此我整理啦从基础的python脚本到web开发、爬虫、django、数据挖掘等【PDF等】需要的可以进Python全栈开发交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,里面有最新Python教程项目可拿,不懂的问题有老司机解决哦,一起相互监督共同进步! 为了后续图解的方便,采用模拟生成的 10 个样本数据,代码和数据如下: company=["A","B","C"] data=pd.DataFrame({ "company":[company[x] for x in np.random.randint(0,len(company),10)], "salary":np.random.randint(5,50,10), "age":np.random

常用的数据分析方法论

萝らか妹 提交于 2020-02-12 11:36:54
【PEST 分析法】 PEST分析法用于对宏观环境的分析。 宏观环境又称一般环境,是指影响一切行业和企业的各种宏观力量。对宏观环境因素作分析时。由于不同行业和企业有其自身特点和经营需要,分析的具体内容会有差异,但一般都应对 政治(Political )、经济(Economic)、 技术(Technological)和 社会(Social)这四大类影响企业的主要外部环境因素进行分析,这种方法简称为 PEST 分析法 【5W2H 分析法】 5w2H 分析法是以五个 w 开头的英语单词和两个 H 开头的英语单词进行提问,从回答中发现解决问题的线索,即 何因 (Why) ) 、何事(What) 、何人(Who) 、何时(When) 、何地(Where ) 、如何做(How) 、何价(How much),这就构成了 5W2分析法的总框架。 该方法简单、方便,易于理解和使用,富有启发意义,广泛用于企业营销、管理活动,对于决策和执行性的活动措施非常有帮助,也有助于弥补考虑问题的疏漏。其实对任何事情都可以从这七大方面去思考,对于不善分析句题的人,只要多练习即可上手,所以同样它也适用于指导建立数据分析框架。 现在以用户购买行为分析为例,来学习 5W2H 分析法。 【逻辑树分析法】 逻辑树又称问题树、演绎树或分解树等。它是 将问题的所有了问题分层罗列,从最高层开始,并逐步向下扩展。

破冰方案!焦虑有啥用?

放肆的年华 提交于 2020-02-12 04:30:00
在整个20世纪中,“原子”、“字节”以及“基因”这三项极具颠覆性的科学概念得到迅猛发展,并且成功引领人类社会进入三个不同的历史阶段。截至目前,这三项概念在结构上竟有惊人的相似之处,其框架均由最基本的组织单元构成:原子是物质的最小单元,字节(或比特)是数字信息的最小单元,而基因则是遗传与生物信息的最小单元。近年来,伴随着5G、物联网、基因科学等技术指数级地增长,人工智能与数据科学成了这一技术时代的新趋势,并且成为解决以上宏大科学难题的有效手段。 AIU人工智能学院专注于数据科学与人工智能,致力于以优质的在线教育资源助力学员的职业梦想!精品课程内容涵盖数据分析、机器学习、深度学习、人工智能、TensorFlow、PyTorch、知识图谱等众多核心技术及行业案例,让每一个学员都可以在线灵活学习,快速掌握AI时代的前沿技术。 640.webp.jpg 为什么做AIU会员计划2020?首先,数据分析的初中级玩家,平时想接触数据科学与人工智能的高级玩家,一般只有从公开课、大型会议等渠道获取信息。而线下数据科学、人工智能从业者的沙龙活动,组织者往往有两个极端,内容要么产品化,要么是技术研究型,无法让初级玩家有一个好的收获。其次,线上的课要么低价且劣质,要么课程普遍费用高却没多少实质性内容,让众多学习者陷于一种两难的境地。 学习不易,成长亦难。AIU学院运营团队深知数据科学与人工智能学习者的苦衷

读书笔记 数据化营销

霸气de小男生 提交于 2020-02-12 01:15:38
1.1 现代营销理论的发展历程 1.1.1 从4P到4C 1960年 杰罗姆·麦卡锡(E.Jerome McCarthy) 著作《基础营销》BasicMarketing) 1967年 现代营销之父 菲利普·科特勒 著作《营销原理》 4P product : 注重产品功能,强调独特卖点 price : 根据不同市场定位,制定不同的价格策略 place :注重分销商的培养和销售网络的建设 promotion :企业通过改变销售行为来刺激消费者,以短期的行为(如让利、买赠、满减)促成消费的增长,吸引其他品牌的消费者前来消费,或者促使老主顾提前来消费,从而达到销售的目的。 4P理论的核心是Product(产品)。因此,以 4P 理论为核心的企业营销战略又可以简称为 以产品为中心 的营销战略。 随着时代的发展,商品丰富起来,市场竞争也日益激励。传统的4P营销组合已经无法适应商业时代的需求,营销界开始研究新的营销理论和营销要素。最具代表的是4C理论。 4C Consumer 消费者的需求和愿望 Cost 消费者得到满足的成本 Convenience 用户购买的方便性 Communication 与用户的沟通与交流 简称 以消费者为中心 的营销 1.1.2 从4C到3P3C 随着科技的发展,大数据时代的来临,4C理论再次落后。 日益白热化的市场竞争 越来越严苛的营销预算 海量的数据堆积和存储

1-数据分析文章记录

本小妞迷上赌 提交于 2020-02-11 23:14:59
最近开始看看数据分析的知识,由于对次领域还是零基础,于是从老师推荐的几文章开始入门吧,在此做个记录,以便多次复习。 1.数据运营|数据分析中,文本分析远比数值型分析重要!(上) 2.在运营中,为什么文本分析远比数值型分析重要?一个实际案例,五点分析(下) 3.以虎嗅网4W+文章的文本挖掘为例,展现数据分析的一整套流程 来源: CSDN 作者: Dream_by_Dream 链接: https://blog.csdn.net/qq_39451578/article/details/104270019