randn

Pandas的merge和groupby用法

匿名 (未验证) 提交于 2019-12-03 00:20:01
1. merge用来连接两个DataFrame对象 ,参数on选择基于哪个列进行连接,how选择内连接,左连接还是全连接的方式。merge操作类似于SQL中的join操作。 [python] view plain copy import 'key' :[ 'b' , 'b' , 'a' , 'c' , 'a' , 'b' ], 'data1' :range( 6 'key' :[ 'a' , 'b' , 'a' , 'b' , 'd' ], 'data2' :range( 5 print print 'key' 'left' print 2.对于大数据,很可能要对于其中的部 分列进行聚合 ,这里使用groupby [python] view plain copy import import 'key1' :[ 'a' , 'a' , 'b' , 'b' , 'a' 'key2' :[ 'one' , 'two' , 'one' , 'two' , 'one' 'data1' :np.random.randn( 5 'data2' :np.random.randn( 5 print 'data1' , 'data2' ]].groupby(df[ 'key1' print print 'key1' )[[ 'data1' , 'data2' #简便写法 注意

Pandas | 14 统计函数

匿名 (未验证) 提交于 2019-12-03 00:16:01
统计方法有助于理解和分析数据的行为。可以将这些统计函数应用到 Pandas 的对象上。 pct_change()函数 系列,DatFrames和Panel都有 pct_change() 函数。此函数将每个元素与其前一个元素进行比较,并计算变化百分比。 import pandas as pd import numpy as np s = pd.Series([1,2,3,4,5]) print(s) print (s.pct_change()) print('\n') df = pd.DataFrame(np.random.randn(5, 2)) print(df) print (df.pct_change()) 输出结果: 0 11 22 33 44 5dtype: int640 NaN1 1.0000002 0.5000003 0.3333334 0.250000dtype: float64 0 10 1.055808 1.3510571 1.458762 0.2293092 0.392842 -0.0432683 0.700352 0.8842584 0.120823 -0.329024 0 10 NaN NaN1 0.381654 -0.8302742 -0.730702 -1.1886863 0.782782 -21.4369894 -0.827482 -1.372090

PyTorch : torch.nn.xxx 和 torch.nn.functional.xxx

匿名 (未验证) 提交于 2019-12-02 23:57:01
在写 PyTorch 代码时,我们会发现一些功能重复的操作,比如卷积、激活、池化等操作。这些操作分别可以通过 torch.nn.xxx 和 torch.nn.functional.xxx 来实现。 首先可以观察源码: eg:torch.nn.Conv2d CLASS torch.nn.Conv2d( in_channels , out_channels , kernel_size , stride=1 , padding=0 , dilation=1 , groups=1 , bias=True , padding_mode='zeros' ) eg:torch.nn.functional torch.nn.functional.conv2d( input , weight , bias=None , stride=1 , padding=0 , dilation=1 , groups=1 ) → Tensor 从中,我们可以发现,nn.Conv2d 是一个类,而 nn.functional.conv2d是一个函数。 换言之: nn.Module 实现的 layer 是由 class Layer(nn.Module) 定义的特殊类 nn.functional 中的函数更像是纯函数,由 def function(input) 定义 此外: 两者的调用方式不同:调用 nn.xxx

matplotlib模块

匿名 (未验证) 提交于 2019-12-02 22:51:30
Ŀ¼ Matplotlib是一个强大的Python绘图和数据可视化的工具包。数据可视化也是我们数据分析的最重要的工作之一,可以帮助我们完成很多操作,例如:找出异常值、必要的一些数据转换等。完成数据分析的最终结果也许就是做一个可交互的数据可视化。 安装方式: pip install matplotlib 引用方法: import matplotlib.pyplot as plt import numpy as np import pandas as pd from numpy.random import randn import matplotlib.pyplot as plt # 一般使用下面的这个语句设置字体,不然会乱码 plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False 函数 说明 plt.plot(x,y,fmt) 坐标系 plt.boxplot(data,notch,position) 箱型图 plt.bar(left,height,width,bottom) 柱状图 plt.barh(width,bottom,left,height) 横向柱状图 plt.polar(theta,r) 极坐标系 plt.pie(data,explode) 饼图 plt

matplotlib模块

老子叫甜甜 提交于 2019-12-02 08:53:46
目录 matplotlib简介 支持的图类型 图像的标注 绘制折线图 绘制条形图 直方图 饼图 散点图 保存图标到文件 matplotlib简介 Matplotlib是一个强大的Python绘图和数据可视化的工具包。数据可视化也是我们数据分析的最重要的工作之一,可以帮助我们完成很多操作,例如:找出异常值、必要的一些数据转换等。完成数据分析的最终结果也许就是做一个可交互的数据可视化。 安装方式: pip install matplotlib 引用方法: import matplotlib.pyplot as plt import numpy as np import pandas as pd from numpy.random import randn import matplotlib.pyplot as plt # 一般使用下面的这个语句设置字体,不然会乱码 plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False 支持的图类型 函数 说明 plt.plot(x,y,fmt) 坐标系 plt.boxplot(data,notch,position) 箱型图 plt.bar(left,height,width,bottom) 柱状图 plt.barh(width

day_18

南楼画角 提交于 2019-11-30 19:45:28
目录 random模块 numpy模块 创建numpy数组 numpy数组的常用属性 获取numpy二数组行列数 切割numpy数组 numpy数组元素替换 numpy数组的合并 numpy常用函数 matplotlib模块 基本的核心使用方法 条形图 直方图 折线图 散点图+直线图 pandas模块 random模块 常用于生成随机数 import random # 大于0且小于1之间的小数 print(random.random()) # 0.9704044132949314 # 大于等于1且小于等于3之间的整数 print(random.randint(1, 3)) # 2 # 大于等于1且小于3之间的整数 print(random.randrange(1, 3)) # 1 # 大于1小于3的小数,如1.927109612082716 print(random.uniform(1, 3)) # 2.9017299775297385 # 列表内的任意一个元素,即1或者‘23’或者[4,5] print(random.choice([1, '23', [4, 5]])) # 23 # random.sample([], n),列表元素任意n个元素的组合,示例n=2 print(random.sample([1, '23', [4, 5]], 2)) # ['23', [4, 5]

Numpy - np.random.seed()的使用

戏子无情 提交于 2019-11-29 06:30:36
在使用numpy时,难免会用到随机数生成器。我一直对np.random.seed(),随机数种子搞不懂。很多博客也就粗略的说,利用随机数种子,每次生成的随机数相同。 我有两个疑惑:1, 利用随机数种子,每次生成的随机数相同。这是什么意思?        2,随机数种子的参数怎么选择?在别人的代码中经常看到np.random.seed(Argument),这个参数不一样,有的是0,有的是1,当然还有其他数。那这个参数应该怎么选择呢? 通过对别的博客的理解,我做了以下几组实验: 1.以np.random.randn()函数为例 import numpy as npif __name__ == '__main__': i = 0 while(i<6): if(i<3): np.random.seed(0) print(np.random.randn(1, 5)) else: print(np.random.randn(1, 5)) pass i += 1 i = 0 while(i<2): print(np.random.randn(1, 5)) i += 1 print(np.random.randn(2, 5)) np.random.seed(0) i = 0 while(i<8): print(np.random.randn(1, 5)) i += 1 结果: [[ 1

080 matplolib模块

。_饼干妹妹 提交于 2019-11-28 08:39:37
目录 matplolib模块 一、条形图 二、直方图 三、折线图 四、散点图+直线图 五、饼图 六、箱型图 七、plot函数参数 八、图像标注参数 九、Matplolib应用 matplolib模块 matplotlib官方文档: https://matplotlib.org/contents.html?v=20190307135750 matplotlib是一个绘图库,它可以创建常用的统计图,包括条形图、箱型图、折线图、散点图、饼图和直方图。 一、条形图 import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties %matplotlib inline font = FontProperties(fname='/Library/Fonts/Heiti.ttc') # 修改背景为条纹 plt.style.use('ggplot') classes = ['3班', '4班', '5班', '6班'] classes_index = range(len(classes)) print(list(classes_index)) [0, 1, 2, 3] student_amounts = [66, 55, 45, 70] # 画布设置 fig = plt.figure() # 1,1

matplotlib 模块

三世轮回 提交于 2019-11-28 08:37:34
三、matplotlib模块 1、导入方式 import matplotlib.pyplot as plt # 默认支持英文,不支持中文 2、作用 可视化分析,可以生成可视化界面图表 3、使用方法 3.1 支持中文的转换方法 from matplotlib.font_manager import FontProperties font = FontProperties(fname='中文字体所在的路径') 3.2 条形图 import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties %matplotlib inline font = FontProperties(fname='/Library/Fonts/Heiti.ttc') # 修改背景为条纹 plt.style.use('ggplot') classes = ['3班', '4班', '5班', '6班'] classes_index = range(len(classes)) print(list(classes_index)) student_amounts = [66, 55, 45, 70] # 画布设置 fig = plt.figure() # 1,1,1表示一张画布切割成1行1列共一张图的第1个;2,2

机器学习pandas数据结构之Series笔记

扶醉桌前 提交于 2019-11-28 06:25:49
对Series的理解也源于对其相关的代码操作,本次仅贴一些代码来加深理解以及记忆 1 import pandas as pd 2 import numpy as np 3 s = pd.Series(np.random.randn(5),index=['a','b','c','d','e']) # index添加行索引 4 s 5 # 输出 6 a 1.752127 7 b 0.127374 8 c 0.581114 9 d 0.466064 10 e -1.493042 11 dtype: float64 12 13 s.index 14 # 输出 Index(['a', 'b', 'c', 'd', 'e'], dtype='object') 15 16 s = pd.Series(np.random.randn(5)) # 自动添加索引 17 s 18 # 输出 19 0 0.209798 20 1 0.791759 21 2 -1.352022 22 3 0.164453 23 4 0.647989 24 dtype: float64 25 26 d = {'a':0.,'b':1.,'d':3} # Series通过字典形式创建表,字典中的键就被当成行索引 27 s = pd.Series(d, index=list('abcd')) # 没有的索引赋值为NaN 28 s