sigma

1.7 商群

|▌冷眼眸甩不掉的悲伤 提交于 2020-01-20 14:20:56
§7 商群 在群中,我们定义子集合的运算: 设 A , B A,B A , B 是群 G G G 的两个子集合。定义: A B = { a b ∣ a ∈ A , b ∈ B } AB = \{ ab | a\in A,b \in B \} A B = { a b ∣ a ∈ A , b ∈ B } 即由 A A A 中元素和 B B B 中元素相乘所得的集合。子集乘积满足结合律: ( A B ) C = A ( B C ) (AB)C = A(BC) ( A B ) C = A ( B C ) . 显见:若 A A A 为一子群, B = { b } B=\{b\} B = { b } ,则 A B AB A B 是子群 A A A 的一个右陪集。 对于任意子集合 A A A ,定义: A − 1 = { a − 1 ∣ a ∈ A } A^{-1} = \{ a^{-1} | a\in A \} A − 1 = { a − 1 ∣ a ∈ A } 即由 A A A 中元素的逆元素组成的集合。 注:利用集合运算,我们可将定理1.4.1改写为: 群 G G G 中非空子集合 H H H 为一子群的充要条件是: H H − 1 ⊂ H . HH^{-1} \subset H. H H − 1 ⊂ H . 对于正规子群,我们有如下重要事实: 定理1.7.1 设 H H H 为群 G G

1.8 环和子环

三世轮回 提交于 2020-01-20 14:17:37
§8 环和子环 先前介绍的群是具有一个代数运算的代数结构。下面介绍具有两个代数运算的代数结构。 定义1.8.1 (环) 设L是一个非空集合,在 L L L 上定义了两个代数运算:加法和乘法。若其具有以下性质: L L L 对于加法成一个交换群 满足乘法结合律 满足乘法对加法的分配律 则称其为一个 环 . 由定义可推出环的一系列基本性质: 用 0 0 0 代表环中加法群的零元素,对所有 a ∈ L a \in L a ∈ L 有 a 0 = 0 a = 0. a0 = 0a = 0. a 0 = 0 a = 0 . 对所有的 a , b ∈ L a,b \in L a , b ∈ L ,有: ( − a ) b = a ( − b ) = − a b , (-a)b = a(-b) = -ab, ( − a ) b = a ( − b ) = − a b , ( − a ) ( − b ) = a b . (-a)(-b) = ab. ( − a ) ( − b ) = a b . 对于正整数 n n n ,可以定义 n a na n a , a n a^{n} a n . 注:在环中,一般不能定义 a 0 a^{0} a 0 和 a − n . a^{-n}. a − n . 定义1.8.2 (子环) 设 S S S 是环 L L L 的一个非空子集合。若 S S S 对于 L L

YOLOV3模型优化系列(一)Gaussian YOLOV3介绍

时间秒杀一切 提交于 2020-01-17 06:08:04
前言 现在对目标检测网络算法模型YOLOV3优化的文章很多,有很多新的思想提出来了,比如focal loss,denseNet,anchors free以及注意力机制等。我个人比较偏好那些源代码开放,方法简单明了,可操作性强同时想法合理的papers。以这种标准来看,Gaussian-YOLOV3无疑算得上不错得优化算法模型,至少能很快看到结果。 简介 Gaussian YOLOV3算法模型是ICCV 2019得一篇paper提出来的。它对应的项目代码已经开源( https://github.com/jwchoi384/Gaussian_YOLOv3 )。从代码角度来看,它只是在官方darknet框架代码的基础上添加一个新的层:Gaussian-yolo层的支持。所以如果你之前编译过darknet框架代码,那么这个项目代码下载后就可以直接编译成功了。 如果你想对自己数据集进行Guassian yolo3模型的训练,那么只需要将cfg文件中的[yolo]改成[Gaussian-yolo],同时将前面的filters数目由(class_num+5)*3改成(class_num+9)*3即可。至于为什么变成了+9,下面会详细解释。 原理 从原理上看,Gaussian yolov3模型和官方经典YOLOV3的唯一区别就是前者对bbox的输出是x,y,w和h的均值和方差,一共有8个值

FRN提升方法

跟風遠走 提交于 2020-01-13 06:08:32
FRN提升方法 经过一些实验,找到了FRN的提升方法,首先上结果。 实验结果 数据集 FRN NewFRN NewL1FRN BN cifar10 91.24% 92.00% 91.60% 92.40% cifar100 64.54% 68.38% 68.28% 69.06% cifar10的实验结果 cifar100的实验结果 从上面两图以及表格可以看出,新方法可以比FRN更快的收敛,并且在大数据集上取得更好的结果。 方法说明 F R N : y = m a x ( γ x σ f r n + β , τ ) , σ f r n = ∑ x i 2 H ∗ W + ϵ FRN:y=max(\gamma\frac{x}{\sigma_{frn}}+\beta,\tau),\sigma_{frn}=\sqrt{\frac{\sum x_i^2}{H*W}+\epsilon} F R N : y = m a x ( γ σ f r n ​ x ​ + β , τ ) , σ f r n ​ = H ∗ W ∑ x i 2 ​ ​ + ϵ ​ FRN公式如上。用该公式进行训练,存在一个问题。就是收敛太慢。经过实验对比,当把 σ f r n \sigma_{frn} σ f r n ​ 置为1时,收敛速度大大加快。新方法就是利用了这个特性, e p o c h epoch e p o c

参数估计 python实践

一世执手 提交于 2020-01-13 01:36:32
1、背景想要探究movielens 1M评分数据的评分分布情况是否符合某种分布,做如下假设 2、理论推导 3、算法实现 3.1 数据准备工作 #导入所需要的库 import pandas as pd import numpy as np import math import matplotlib.pyplot as plt #数据的准备工作 with open("ratings.dat") as file: data = [] for line in file: if len(line) != 0: data.append(int(line.split(",")[2])) rating 原始数据VS 单列的评分特征 原始数据 处理后的特征数据 # 计算theta值 def calTheta(data): sum = 0 for num in data: sum += math.log(num,math.e) return sum/(len(data)) # 计算sigma值 def calSigma(data,theta): sum = 0 for num in data: mid = math.log(num,math.e) - theta mid *= mid sum += mid return math.sqrt(sum/(len(data))) # 画出图像 def

深度学习基础

好久不见. 提交于 2020-01-12 03:55:51
主要需要了解的东西如下: 交叉熵损失和对数损失的区别 SGD,bach,minibatch。主要是讲SGD随机梯度下降计算单个样本的梯度,bach基于整个样本计算梯度,minibatch在它们两者之间,这个主要体现在loss function上,单个样本计算梯度的loss function就没有对整个样本求和,而很多样本一起计算梯度,就要知道对每个样本的loss然后求和。 sigmoid函数及其导数。 σ ( x ) = 1 1 + e − x \sigma(x)=\frac{1}{1+e^{-x}} σ ( x ) = 1 + e − x 1 ​ ∂ σ ( x ) ∂ x = σ ( x ) ∗ ( 1 − σ ( x ) ) \frac{\partial\sigma(x)}{\partial x} = \sigma(x)*(1-\sigma(x)) ∂ x ∂ σ ( x ) ​ = σ ( x ) ∗ ( 1 − σ ( x ) ) 反向传播推导 在保证模型正确率的前提下,通常希望学习到的权值矩阵中的元素都不要太大,以防止输入有噪声时,由于权重过大使得噪声对模型的影响过大。 来源: CSDN 作者: czg792845236 链接: https://blog.csdn.net/u010630669/article/details/103880349

SVD分解理论

谁都会走 提交于 2020-01-11 03:58:47
## 矩阵SVD分解的理论基础 首先,我们先说明什么是矩阵的奇异值分解(single value decomposition),简称SVD。 给定一个矩阵 A ∈ R m × n A \in R^{m \times n} A ∈ R m × n , 设它的秩为r,则它具有以下的分解形式 A m × n = U m × m Σ m × n V n × n T A_{m \times n} = U_{m \times m} \Sigma_{m \times n} V_{n \times n}^T A m × n ​ = U m × m ​ Σ m × n ​ V n × n T ​ 其中,U是正交矩阵,其列向量是 A A T AA^T A A T 的单位特征向量,V 也是正交矩阵,其列向量是对应的 A T A A^TA A T A 的单位特征向量, Σ \Sigma Σ 具有下述的形式 Σ = ( Σ 1 O O O ) \Sigma = \left( \begin{array}{cc} \Sigma_1 & O \\ O & O\end{array} \right) Σ = ( Σ 1 ​ O ​ O O ​ ) 且 Σ 1 = d i a g ( σ 1 , σ 2 , … , σ r ) \Sigma_1 = diag(\sigma_1,\sigma_2,\ldots,

被动型FOF产品规划方案(附代码)

大憨熊 提交于 2020-01-10 07:55:08
被动型FOF产品规划方案(附代码) 前言 按照基本的投资策略,基金可以被分类为被动型基金和主动性基金。被动型基金主要投资于指数产品,主动性基金则会采取更加灵活多变的策略来选择标的资产池。但是,两者都需要对标的资产的权重进行优化。 本文将介绍了笔者设计的一个用于被动型FOF(“ Fund of Fund” ,中文 “基金中的基金” )投资的产品方案设计思路,涉及到的调仓权重优化方法包括马科维兹优化、风险平价优化、Black-Litterman模型。 在连接至Wind 数据库的情况下,运行程序并输入您所需要的投资组合的起止日期、标的资产的代码、回测数据所使用的的时间窗口、调仓频率,您就可以得到投资组合在三种优化方法下每日的持仓权重。 (代码和数据于本文末下载) ## 资产配置模型 ### 马科维兹模型 马科维茨的均值一方差组合模型(Markovitz Mean-Variance Model)用收益率序列均值来代表投资组合的收益,用收益率序列方差来代表投资组合的风险,以此来平衡投资组合的风险和收益。 投资组合预期收益的计算公式为: E ( R p ) = ∑ i ω i E ( R i ) E(R_p)=\sum_{i}^{}\omega_iE(R_i) E ( R p ​ ) = i ∑ ​ ω i ​ E ( R i ​ ) 投资组合预期方差的计算公式为: σ p 2 = ∑ i ω

20200108

北城余情 提交于 2020-01-08 19:12:31
回顾 逗号为连续调用,顿号为终止输出,hold/close保持/关闭图像 plot magic 及矩阵直接定义 表达式/函数直接执行并输出ans 1.layout格式 2.*appender绑定输出类型与目标 3.setPattern绑定格式 4.Category绑定记录 5.set priority 一.Andrew ML 1.ex1单元梯度下降已实现 function J = computeCost ( X , y , theta ) % COMPUTECOST Compute cost for linear regression % J = COMPUTECOST ( X , y , theta ) computes the cost of using theta as the % parameter for linear regression to fit the data points in X and y % Initialize some useful values m = length ( y ) ; % number of training examples % You need to return the following variables correctly J = 0 ; % == == == == == == == == == == == YOUR

随机变量及其分布

本秂侑毒 提交于 2020-01-06 20:50:23
目录 随机变量及其分布 常用的离散随机分布 常用的连续随机分布 多维度随机变量及其分布 随机变量及其分布 常用的离散随机分布 Poisson Distribution \(P(X = x)=\begin{pmatrix} n \\ x \end{pmatrix}p^{x}(1-p)^{n-x}=\frac{n!}{x!(n-x)!}p^{x}(1-p)^{n-x}=\\ \frac{n(n-1)\dots(n-x+2)(n-x+1)p^{x}}{x!}(1-p)^{n-x}\) 这里我们这样处理: \(p\rightarrow 0 ,n \rightarrow \infty\) \(P(\lambda)\) \[P_{k}=\frac{\lambda^{k}}{k!}e^{-\lambda}\quad k=0,1,\dots\] 几何分布 \[Ge(n,p)\] (用于研究单次伯努利试验的成功率) \(P_{k}=p(1-p)^{k-1}\) 二项分布 \[b(n,p)\] \(P_{k}=\begin{pmatrix} n \\ k \end{pmatrix}p^{k}(1-p)^{n-k}\) 常用的连续随机分布 均匀分布 正态分布 \[N(\mu,\sigma)\] 密度函数: \(p(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{-(x-