贝叶斯

计算机视觉算法岗面经,2019秋招资料

旧城冷巷雨未停 提交于 2020-11-22 20:02:48
向AI转型的程序员都关注了这个号 👇👇👇 人工智能大数据与深度学习 公众号:datayx 下面试基本会问的内容,目前个人所碰到的,占比可能有所不同,有些面试官喜欢问项目,有些喜欢问基础。 介绍项目、实习,一般会问很久,在你介绍中会问各种开放性问题;通常我的面试中这个占很大篇幅,60%-90%; 问算法相关,包括ML\DL\图像处理等的基础知识,占40%-60%,其中大概ML40%,DL10%,图像处理10%; 问数学基础,大部分是概率论,占5%; 问语言,C++,STL容器之类的,占10%;python也会问一点; 编程题,一般2、3题; Linux命令,一般问几个,不经常问到; 1、HR面 自我介绍 你和竞争者相比的优势是什么 实习收获了什么 从实习导师身上学到了什么 导师给你的意见是什么 从面试官身上学到了什么 .秋招意向的企业有哪些 你为什么想来我们公司? 你来了之后的三年怎么打算的? 讲一讲实习公司的产品架构,比如一个新的需求产生到落地的流程是怎样? 优缺点 介绍项目,难点,从中学到什么,重新做如何改进 期望薪资 自己主动学习过哪些知识,通过什么方式学的 后面打算学习什么知识,为什么 英语怎么样 兴趣 竞赛、考研保研 团队合作遇到的分歧 有没有投过其他公司,有拿到offer吗? 项目中怎么分工的,有遇到过水平低的吗,是怎么沟通的 对你帮助很大的一个人 学习的路径,怎么学习

2018-文本分类文献阅读总结

南楼画角 提交于 2020-11-19 12:03:41
文章 1 Generative and Discriminative Text Classification with Recurrent Neural Networks 时间: 2017 机构:Google DeepMind 生成模型: generative 判别模型: discrimination 作者支持生成模型比判别模型具有更加优异的性能,经过生成模型和判别模型的建模给出结论。 判别模型使用 LSTM 的变体(增加了 peephole 到每一个门上,则每一个门都会受到上一节点的 cell 的影响),当给定了文本类别标签后最大化条件概率: P ( y|x;W,V ) 生成模型是基于类的语言模型,命名为共享 LSTM ,通过类别 class 来共享参数,包括:词向量矩阵 V , LSTM 参数 W , softmax 参数 U 。新颖之处,这样会产生一个条件模型,这个模型可以通过给定标签的词向量来共享参数;而在传统的生成模型中,每一个标签都有一个独立的 LM 。 文中的生成模型和判别模型具有很多相似性,不同的是体现在训练的过程中,生成模型要最大化联合概率: 实验: 数据集:来源:http://goo.gl/JyCnZq ,资源包括: 新闻分类,情感分析, Wikipedia 文章分类,问答文本 数据列表: 基线 model : Na¨ıve Bayes classifier

基于激光雷达的目标检测与跟踪文献阅读

心已入冬 提交于 2020-11-19 12:03:12
Instant Object Detection in Lidar Point Clouds 传感器:VLP-64 主要工作:完整的激光雷达语义环境感知方案,通过将点云投影到地面栅格图,按照点的密度和最高高度、最大高度差,将点云分为建筑物表面、低矮物体、较高物体,而后按照点云的密度变化将点云进行聚类,再讲点云按照最大面积的方向,投影为90*90的深度图,通过CNN进行分类,最后一步是按照环境的语义信息进行分类结果的纠正,修正点云聚类等造成的错误。 数据集为: 需要联系作者获取密码方可下载 Pedestrian Recognition Using High-definition LIDAR 发表于2011的IEEE会议论文 文章主要是在三维点云中进行行人检测,主要关键部分有以下两点: 特征提取:提出了Z方向的分块点云密度作为特征,将点云块的反射强度作为特征算子的输入值,考虑了反射强度的信息,对于较远的目标,集合信息较弱的情况下,效果提升明显. 将之前提取的特征向量作为输入,采用SVM算法进行分类,文章的效果提升明显. The slice feature and the distribution of the reflection intensities are proposed to improve the recognition performance at a long

2019.1.22 文献阅读日记,内容理解篇 :用于无监督医疗检测的自动心电图噪声监测和分类系统《Automated ECG Noise Detection and Classification...

☆樱花仙子☆ 提交于 2020-11-19 07:46:00
以下是对文章内容的理解,在这里做个笔记,便于回顾,没有什么技术含量,就是一个学习日记笔记,嘻嘻。 文章内容的思路: 一、框架包括: 1.改进的集合经验模式分解 modified ensemble empirical mode decomposition (CEEMD),CEEMD全称为 complete ensemble empirical mode decomposition,完全集合经验模式分解。 2.短期时间特征提取 3.基于决策规则的噪声噪声监测和分类 二、框架的处理步骤: 1.首先使用修改的CEEMD算法分解ECG信号,区分ECG分量与噪声和伪像。 2.根据提取的高频HF和低频LF信号计算诸如最大绝对幅度,零交叉数,和自相关函数的局部最大峰值幅度的短期时间特征。 3.提出了一种基于决策规则的算法,用于检测噪声的存在,并将处理后的ECG信号分为六个信号组: (1)无噪声心电图 noise-free ECG, (2)基线漂移心电图 ECG+BW, (3)肌肉伪迹心电图 ECG+MA, (4)电力线干扰心电图 ECG+PLI (5)基线漂移电力线干扰心电图 ECG+BW+PLI (6)基线漂移 肌肉伪迹心电图ECG+BW+MA 该框架简化了单个和组合ECG噪声的检测和分类流程,如下图(文献原图): 上图说明了该框架的主要组成部分,用于检测和分类的单一和组合心电图的声音

面试AI算法岗,你被要求复现顶会论文了嘛?

可紊 提交于 2020-11-15 08:02:01
加入AI行业拿到高薪仅仅是职业生涯的开始。 现阶段AI人才结构在不断升级,这也意味着如果目前仍然停留在调用一些函数库,则在未来1-2年内很大概率上会失去核心竞争力的 。 几年前如果熟练使用TensorFlow,同时掌握基本的AI算法就可以很容易找到一份高薪的工作,但现在不一样了,AI岗位的要求越来越高,对知识的深度也提出了更高的要求。 如果现在一个 面试官 让你从零推导SVM的Dual、从零实现CRF、推导LDA、设计一个QP问题、从零编写XLNet、编写GCN/GNN、改造SkipGram模型、用一天时间复现一篇顶级会议.... 这些要求一点都不过分。相反,连这些基本内容都有些吃力,就需要重新审视一下自己的核心技术壁垒了。 目前AI人才竞争越来越激烈, “调参侠” 的时代已慢慢过去,这些事情其实根本不需要AI工程师来做,未来的研发工程师就可以承担这些了! 我相信不少人曾经遇到过以下的情况或者困惑: 从事AI行业多年,但技术上 总感觉不够深入 , 而且很难再有提升; 对每个技术点了解,但 不具备体系化的认知 , 无法把它们串起来; 停留在使用模型/工具上 , 很难基于业务场景来提出新的模型; 对于机器学习 背后的优化理论、前沿的技术不够深入; 计划从事尖端的科研、研究工作、 申请AI领域研究生、博士生; 打算进入最顶尖的AI公司 比如Google,Facebook,Amazon,

机器学习实战-朴素贝叶斯垃圾邮件分类

佐手、 提交于 2020-11-15 04:58:36
朴素贝叶斯 概念 对朴素贝叶斯的概念存在疑惑的,可以依此理解条件概率,全概率公式和贝叶斯公式。 附链接帮助理解: 链接1 https://blog.csdn.net/Hearthougan/article/details/75174210 链接2 https://www.cnblogs.com/hellcat/p/7195843.html 朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。 实战 此实例为"朴素贝叶斯实现垃圾邮件分类"。 数据集样例: Data->normal文件夹下数据样例: 200.txt: Return-Path: <cai@tsinghua.edu.cn> Received: from mail.tsinghua.edu.cn (mail.tsinghua.edu.cn [166.111.8.18]) by home.ccert.edu.cn (8.13.1/8.13.1) with SMTP id i9S1aCPt007420 for <jiang@ccert.edu.cn>; Thu, 28 Oct 2004 09:36:12 +0800 Received: (eyou send

机器学习实战-朴素贝叶斯

邮差的信 提交于 2020-11-14 03:59:11
数据集参考自https://blog.csdn.net/c406495762/article/details/77341116 朴素贝叶斯 :首先,何为朴素?朴素要求的是 条件特征之间相互独立 。我们都知道大名鼎鼎的贝叶斯公式,其实朴素贝叶斯的思想很简单。就是通过计算属于某一类别的后验概率,然后比较大小,哪一类的概率大,那么就将它划分为哪一类。。。 由上述公式可知,我们先验概率P(A)很容易求得,我们重点在与求条件概率。由于条件特征之间相互独立,于是可以拆分成累乘的形式。在代码实现中,我们一般不会去求P(B),因为分母都是一样的,我们只关注类别概率的大小! 将代码记录如下,方便以后查看。 import numpy as np import pandas as pd def getDataSet(): postingList =[[ ' my ' , ' dog ' , ' has ' , ' flea ' , ' problems ' , ' help ' , ' please ' ], [ ' maybe ' , ' not ' , ' take ' , ' him ' , ' to ' , ' dog ' , ' park ' , ' stupid ' ], [ ' my ' , ' dalmation ' , ' is ' , ' so ' , ' cute ' , ' I

阿里、力扣、政采云的15位专家分享前端面试与招聘视角

天涯浪子 提交于 2020-11-09 08:41:01
「始」前沿 有幸在5月31号参加了《 第八届前端早早聊大会 》主办的《 前端跳槽的新起点|前端如何搞面试 》。在这次大会中从早上9点半一直到下午6点多结束,大会含金量超高,我此次受益匪浅,屁股坐到起茧都是超级值得的。本次大会一共有 15位 来源于各大厂公司的高级前端工程师和技术专家,每个讲师都给我带来了精彩绝伦的知识与干货。 这次大会的内容不只给我的 技术生涯中带来了冲劲 ,让我认知到自己还有很多的不足与未知。同时也让我 认知到了优秀的技术人才与团队的能力模型 ,讲师们有说到他们的经历和三观,引发了我对自己“保安式”的灵魂拷问。 听完本次大会后,真的让我重新认识了自己,也重新找到了前进方向与目标。最后还收获了许多知识与秘诀。下来我来总结一下我在这个大会上吸收到的知识精华。 「一」候选人视角看待面试 首先我们从候选人(面试者)的角度来剖析和分析一下面试者应该怎么从准备到面试成功,最后拿到心仪的Offer。 「1.」面试准备 我以前准备面试的时候都会非常慌张,不知道自己需要复习什么,或者做什么准备工作。甚至还有在某宝,某猫,某东买下了一堆的书籍开始刨书。还有就是下了几个TG的视频,然后天天晚上熬夜刨视频学习。这种方法其实作用真的不是很大,而且前端那么多知识,要全部都会,都能深入了解,是并不可能的。 更重要的是我们平时每天的累积和沉淀。 那应该怎么准备呢?通过大会中各位优秀的候选人的分享

自动机器学习简述(AutoML)

梦想与她 提交于 2020-10-29 08:55:51
转载本文需注明出处:微信公众号EAWorld,违者必究。 目录: 一、为什么需要自动机器学习 二、超参数优化 Hyper-parameter Optimization 三、元学习 Meta Learning 四、神经网络架构搜索 Neural Architecture Search 五、自动化特征工程 六、其它自动机器学习工具集 一、为什么需要自动机器学习 对于机器学习的新用户而言,使用机器学习算法的一个主要的障碍就是算法的性能受许多的设计决策影响。随着深度学习的流行,工程师需要选择相应的神经网络架构,训练过程,正则化方法,超参数等等,所有的这些都对算法的性能有很大的影响。于是深度学习工程师也被戏称为调参工程师。 自动机器学习(AutoML)的目标就是使用自动化的数据驱动方式来做出上述的决策。用户只要提供数据,自动机器学习系统自动的决定最佳的方案。领域专家不再需要苦恼于学习各种机器学习的算法。 自动机器学习不光包括大家熟知的算法选择,超参数优化,和神经网络架构搜索,还覆盖机器学习工作流的每一步: 自动准备数据 自动特征选择 自动选择算法 超参数优化 自动流水线/工作流构建 神经网络架构搜索 自动模型选择和集成学习 二、超参数优化 Hyper-parameter Optimization 学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,还有一类参数时无法从数据中估计

读书笔记: 博弈论导论

僤鯓⒐⒋嵵緔 提交于 2020-10-29 05:59:54
读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉 建立信誉(Building a Reputation) 本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。 为什么我们要建立良好的信誉?为什么我们更愿意和有信誉的人交往? 本章从囚徒困境这个问题,证明了即使在2阶段的囚徒困境中,如果一方有可能选择合作(也就是沉默),另一个方在第一阶段也有可能选择合作。 让我们回忆一下囚徒困境。 囚徒困境的均衡是双方都告密。 在有限多阶段的囚徒困境中的均衡仍然是双方都告密。 在无限多阶段的囚徒困境中的均衡是双方合作沉默。 本章给出了一个囚徒困境的例子,在这个例子中,存在一个不完整信息,就是玩家1有两种类型: 标准策略类型; 2) grim-trigger 策略类型。 这个grim-trigger 策略是:在第一个阶段博弈中,选择合作(C),在一个t > 1阶段中,选择合作(C)仅仅当玩家2在上一个阶段中选择合作(c)。 $p > 0$为自然选择玩家1是grim-trigger 策略类型的可能性。 Player 2 c d player 1 C 1, 1 -1, 2 D 2, -1 0, 0 玩家2使用标准策略,因此在第2阶段会选择叛变(defect)。 但是在第1阶段中选择合作和叛变,其收益分别为: $$ \text