chi

AI 基础:Scipy(科学计算库) 简易入门

空扰寡人 提交于 2020-12-28 11:38:40
0.导语 Scipy是一个用于数学、科学、工程领域的常用软件包,可以处理插值、积分、优化、图像处理、常微分方程数值解的求解、信号处理等问题。它用于有效计算Numpy矩阵,使Numpy和Scipy协同工作,高效解决问题。 Scipy是由针对特定任务的子模块组成: 在此之前,我已经写了以下几篇AI基础的快速入门,本篇文章讲解科学计算库Scipy快速入门: 已发布: AI 基础:Numpy 简易入门 AI 基础:Pandas 简易入门 AI基础:数据可视化简易入门(matplotlib和seaborn) 备注:本文代码可以在github下载 https://github.com/fengdu78/Data-Science-Notes/tree/master/4.scipy 1.SciPy-数值计算库 import numpy as np import pylab as pl import matplotlib as mpl mpl.rcParams['font.sans-serif'] = ['SimHei'] import scipy scipy.__version__#查看版本 '1.0.0' 常数和特殊函数 from scipy import constants as C print (C.c) # 真空中的光速 print (C.h) # 普朗克常数 299792458.0 6

假设检验(Hypothesis Testing)

你。 提交于 2020-12-26 03:03:56
假设检验的定义 假设检验:先对总体参数提出某种假设,然后利用样本数据判断假设是否成立。在逻辑上,假设检验采用了反证法,即先提出假设,再通过适当的统计学方法证明这个假设基本不可能是真的。(说“基本”是因为统计得出的结果来自于随机样本,结论不可能是绝对的,所以我们只能根据概率上的一些依据进行相关的判断。) 假设检验依据的是小概率思想,即小概率事件在一次试验中基本上不会发生。 如果样本数据拒绝该假设,那么我们说该假设检验结果具有统计显著性。一项检验结果在统计上是“显著的”,意思是指样本和总体之间的差别不是由于抽样误差或偶然而造成的。 假设检验的术语 零假设(null hypothesis) :是试验者想收集证据予以反对的假设,也称为 原假设 ,通常记为 H 0 。 例如:零假设是测试版本的指标均值小于等于原始版本的指标均值。 备择假设(alternative hypothesis) :是试验者想收集证据予以支持的假设,通常记为H 1 或 H a 。 例如:备择假设是测试版本的指标均值大于原始版本的指标均值。 双尾检验(two-tailed test) :如果备择假设没有特定的方向性,并含有符号“≠”,这样的检验称为双尾检验。 例如:零假设是测试版本的指标均值等于原始版本的指标均值,备择假设是测试版本的指标均值不等于原始版本的指标均值。 单尾检验(one-tailed test)

线上直播丨国际人工智能会议AAAI 2021论文北京预讲会,33场报告+31个Poster等你来...

安稳与你 提交于 2020-12-19 08:50:46
注册官网:https://hub.baai.ac.cn/activity/details/119 国际人工智能会议AAAI 2021论文北京预讲会 由中国中文信息学会青年工作委员会主办、智源社区承办,将于 12月19日 在北京北大科技园北领讲堂举办。 AAAI( The National Conference on Artificial Intelligence)会议是国际人工智能领域最高级别的学术会议之一,主要是为促进人工智能(AI)的研究和为人工智能研究人员、从业人员、科学家以及附属学科工程师之间提供一个良好的学术交流平台。正式会议将于明年召开。 本次预讲会对于部分国内研究人员录用的论文进行提前召集以及汇报预讲,旨在加强国内相关学者之间的交流,同时为不能参会的人员提供一次学术分享,从而促进我国人工智能研究的发展。 本届论文预讲会的形式分为特邀报告、口头报告和海报展示三类。此外,还安排了两场面向技术前沿的特邀报告,由本领域的两位优秀青年学者担任报告人。 本次报告会用于提前分享被顶级会议接受的论文,所有报告的著作权/版权由报告人所有,论文的版权/著作权遵从相关会议的约定,也提醒大家尊重作者和会议的相关权利。整个会议报告人和听众均自愿参与,主办方仅承担议程协调和会务组织工作。 时间形式 会议时间:2020年12月19日(周六)08:40-17:50 在线观看:微信扫码入群

最近三年四大顶会深度推荐系统上的18篇论文

不想你离开。 提交于 2020-12-05 08:04:26
导读:本文是“深度推荐系统”专栏的第十篇文章,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文主要根据RecSys 2019中论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》总结的最近三年四大顶会深度推荐系统上的18个最新算法。 欢迎转载,转载请注明出处以及链接,更多关于深度推荐系统优质内容请关注如下频道。 知乎专栏: 深度推荐系统 微博: 深度传送门 公众号:深度传送门 今年RecSys 2019上出现的一篇极具批判性的论文《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》。灵魂一问深度学习是否在推荐系统已经取得了足够可信的进展?在知乎上也引起了激烈的讨论: 如何看待RecSys 2019上的一篇文章认为现有DNN-based推荐算法带来的基本上都是伪提升? 作者总结了过去三年四大顶会(KDD、SIGIR、WWW和RecSys)推荐系统上18个最新算法,只有7个能重现效果。而且在不同的测试数据集上它们与浅层经典方法效果对比中经常都败下阵来

R语言入门系列之二

◇◆丶佛笑我妖孽 提交于 2020-12-04 20:40:48
2 数据管理与可视化 2.1数据预处理 在进行正式的数据分析之前,通常要对数据进行处理。而读取数据仅仅是最简单的,之后还要进行数据的筛选、排序、转换等。数据框是最方便的数据存储、管理对象。 R 有很多内置的示例数据集包括向量、矩阵数据框等,可以使用 data() 进行查看,接下来我们以 R 内置数据 mtcars ( 32 辆汽车在 11 个指标上的数据)为例进行分析,如下所示: ⑴ 内容添加与修改 ① 添加修改新变量 函数 transform() 可以在数据框中创建新变量,并使用其他变量进行赋值,如下所示: mydata=transform(mtcars, sums=gear+carb, means=(disp+hp)/2) 运行结果如下: within() 函数可以在数据框内部进行操作,下面我们添加一新的类别变量: mydata=within(mydata, { size=NA # 创建变量 size[sums<6]="low" size[sums>=6 & sums<=8]="mid" size[sums>8]="high" size[sums==13]=NA }) 结果如下所示: 如果要修改数据框中已有的数据和变量名,可以使用 fix() 函数,该函数可以调用文本编辑器然后使用键盘来对数据框进行修改,如下所示: 使用 names() 函数可以调用或重新赋值变量名,如下所示:

核方法概述----正定核以及核技巧(Gram矩阵推导正定核)

落爺英雄遲暮 提交于 2020-12-04 01:55:26
  在 再谈SVM(hard-margin和soft-margin详细推导、KKT条件、核技巧) 中我们大致谈到了核函数以及为什么要用核函数,今天在这里更加详细的介绍一下。 核方法 1.核函数概述 2.正定核 2.1定义 2.2证明 3.核技巧 4.常见的核函数 1.核函数概述   从前面的学习中我们可以看出来,无论是Hard margin SVM还是Soft margin SVM构建的都是一个 线性 的决策边界,从而把数据集分到各自的类中,如果数据集是一个非线性的,直接使用SVM,得不到一个理想的结果,那么使用线性分类器求解非线性分类问题,需要特殊的处理: 首先,使用一个变换将原空间的数据映射到新空间中 然后,在新空间中使用线性分类器求解 在 机器学习之逻辑回归(logistics regression) 中,我们考虑了这样一个问题:   考虑一个简单的二分类问题,有x1,x2两个特征,两个特征值都为0 or 1为C2,否则为C1。在逻辑回归中,输入某一个样本的两个特征值x1,x2,与各自的权重w1,w2相乘,也就是求 inner product ,最后加上一个 bias ,得到z,再将z用 Sigmoid 函数处理,最后与0.5进行比较,就可以判断属于哪一个类别。但是我们将两个特征映射到到一个二维坐标系上,发现 根本不可能找到一条直线将两类样本完全分开。 这种限制与数据量无关

2016年第七届蓝桥杯JavaB组省赛试题解析

故事扮演 提交于 2020-11-23 07:19:26
题目及解析如下: 题目大致介绍: 第一题到第三题以及第六题、第七题是结果填空,方法不限只要得到最后结果就行 第四题和第五题是代码填空题,主要考察算法基本功和编程基本功 第八题到第十题是编程题,要求编程解决问题 第一题 煤球数目(结果填空) 此题是一个找规律的题,规律比较好发现,第1层就是1,第二层就是1+2,第三层就是1+2+3,第n层就是1+2+3+、、、+n 但是注意看清楚题意,题目要求的是100层的总共的煤球数,不是求第100层的煤球数! 1 /* 2 有一堆煤球,堆成三角棱锥形。具体: 3 第一层放1个, 4 第二层3个(排列成三角形), 5 第三层6个(排列成三角形), 6 第四层10个(排列成三角形), 7 .... 8 answer: 171700 9 */ 10 public class t1 { 11 private static int f( int n){ // 算第n层有多少个 12 int res = 0 ; 13 for ( int i=1; i<=n; i++ ){ 14 res += i; 15 } 16 17 return res; 18 } 19 20 private static int cal( int n){ 21 int res = 0 ; 22 for ( int i=1; i<=n; i++ ){ 23 res += f(i); 24

关于计算电子磁化率以及RPA的总结

老子叫甜甜 提交于 2020-11-11 13:43:32
核心就是这个公式 求和对整个布里渊区进行。要求只能计算一次能谱(因为能谱可能由第一性原理软件读出来) 目前想到的方法是均匀划分网格,这样给定k和q以后,k+q就一定是算过的。对于正方格子,很简单。对于六角格子,平移成平行四边形。 二维对整个布里渊区计算,时间复杂度O(N^4), 个人电脑C++能接受的大小是200*200。(优点对称性体现的很清楚,缺点是计算速度太慢,关键点看起来不容易) 沿着高对称线计算q,时间复杂度O(N^3), 个人电脑C++ 400*400,大约需要20s,可以接受。(推荐) 关于从第一性原理软件结果读取能量本征值,需要处理成画能带的数据格式,然后指定能带条数处理。这里需要k点和能量严格对应好。否则,程序就会错误。 核心计算的C++程序,从Energy,txt计算,输出高对称线上的chi #include <iostream> #include <cmath> #include <vector> #include <fstream> #include <iomanip> #include <complex> #include <ctime> using namespace std; #define PI 3.1415926 vector<double> linspace(double min, double max, int n){ vector

几种常用编码区别

筅森魡賤 提交于 2020-11-01 20:32:02
ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。 ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号, 以及在美式英语中使用的特殊控制字符。 其中: 0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。 32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。 65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。 后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或“高

TechEmpower Web 框架性能第19轮测试结果正式发布,ASP.NET Core在主流框架中拔得头筹

谁说胖子不能爱 提交于 2020-10-23 07:25:23
TechEmpower 第19轮编程语言框架性能排行榜2020年5月28日正式发布,详见官方博客: https://www.techempower.com/blog/2020/05/28/framework-benchmarks-round-19/ ,TechEmpower基准测试有许多场景(也称为测试类型),此次评测多了一个综合评分选项,把拥有完整测试覆盖的框架现在将具有综合 分数 ,这反映了测试项目类型的总体性能得分:JSON serialization, Single-query, Multi-query, Updates, Fortunes 和 Plaintext. 。对于每一轮,我们使每个测试类型的结果规范化,然后为每个测试类型应用主观权重(例如,Fortunes的权重比 Plaintext 高,因为Fortunes 是一种更现实的测试类型)。asp.net core排第6名,asp.net 排名倒数第二,第103名, 微软从倒数一路追赶到第一。 表上前缀T标签表示精选的主流编程语言 第1名 C++的drogon 9676分 第2名 Rust的actix 9064分 第6名 C#的ASP.NET Core 5659分 第29名 Go的Chi 2229分 第34名 Java的Spring 1867分 第73名 Nodejs的Express 821分 第94名