libsvm

机器学习工程师面试题集锦附指南:互联网篇

痞子三分冷 提交于 2020-03-24 08:16:40
3 月,跳不动了?>>> 机器学习工程师是现在的热门职位,因为其极高的薪资成为很多技术人的晋升目标。本文总结了部分一线互联网公司机器学习工程师的面试题及面试指南,希望对各位技术人员的进阶之路有所帮助。 阿里巴巴 根据参加过阿里巴巴机器学习算法工程师面试的技术人员反馈,总共需要经过四轮面试,前两轮为技术考察,第三轮是交叉面试,最后一轮是人力面试。每轮面试大概持续时间为40到50分钟,面试内容由项目经验询问和基础机器学习算法询问两部分组成。 基础机器学习算法主要包括LR和SVM有什么区别 ,libsvm和liblinear有什么区别,常用的统计量的含义, 稀疏特征如独热编码 ,维度很大,输入神经网络怎么降维,FFM算法的原理,谈谈你对特征工程的认识,LR优化方法之间的区别, 逻辑回归的概念 , EM,K-means等问题 。面试官会给出一些场景,询问求职者如何处理数据,如何建模。 可能会碰到算法题和智力题,但数量不会很多。根据反馈,算法题可能会与数组相关,比如存在一个数组,大小为98,里面的元素均为[1,100]区间内,且无重复, 不申请额外空间的情况下,在时间复杂度为O(N)情况下,找出确定的两个元素值。 华为 基础知识部分可能会让技术人员介绍几个简单的机器学习模型的主要思想,比如 贝叶斯、SVM 等。除此之外,都是一些概念问题:决策树和adaboost的区别;介绍你曾经做过的项目

Python调用libsvm

别等时光非礼了梦想. 提交于 2020-02-11 17:13:53
1 # -*- coding: utf-8 -*- 2 import os, sys 3 path = r"D:\Program Files (x86)\libsvm-3.22\python" 4 sys.path.append(path) 5 from svmutil import * 6 7 8 y, x = svm_read_problem('data.txt') 9 prob = svm_problem(y, x) 10 param = svm_parameter('-t 1 -c 4 -b 1') 11 model = svm_train(prob, param) 12 svm_save_model('class3.model', model) 13 print("保存模型完成!") 14 model1 = svm_load_model('class3.model') 15 print("加载模型完成!") 16 #yt = [3] 17 yt = [int(y[1417])] 18 #xt = [{1: 89.0, 2: 112.0, 3: 111.0, 4: 96.0, 5: 82.0, 6: 55.0, 7: 103.0, 8: 103.0, 9: 72.0, 10: 87.0, 11: 89.0, 12: 71.0, 13: 108.0, 14: 97.0, 15

libsvm使用心得

牧云@^-^@ 提交于 2020-02-11 03:50:06
首先下载Libsvm、Python和Gnuplot: l libsvm的主页 http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 上下载libsvm (我自己用2.86版本) l python的主页 http://www.python.org 下载 python (我自己用2.5版本) l gnuplot的主页 http://www.gnuplot.info/ 下载gnuplot (我用4.0版本) LIBSVM 使用的一般步骤是: 1)按照LIBSVM软件包所要求的格式准备数据集; 2)对数据进行简单的缩放操作; 3)首要考虑选用RBF 核函数; 4)采用交叉验证选择最佳参数C与g ; 5)采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型; 6)利用获取的模型进行测试与预测。 1)LIBSVM使用的数据格式 该软件使用的训练数据和检验数据文件格式如下: [label] [index1]:[value1] [index2]:[value2] ... [label] [index1]:[value1] [index2]:[value2] ... 一行一条记录数据,如: +1 1:0.708 2:1 3:1 4:-0.320 5:-0.105 6:-1 这里(x,y)à((0.708,1,1, -0.320, -0.105, -1), +1)

Linux下的Libsvm使用历程录

99封情书 提交于 2020-02-11 02:55:41
原文:http://blog.csdn.net/meredith_leaf/article/details/6714144 Linux下的Libsvm使用历程录 首先下载Libsvm、Python和Gnuplot: libsvm的主页 http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 上下载libsvm (偶用3.1版本) python的主页http://www.python.org下载 python (偶用3.2.1版本) gnuplot的主页 http://www.gnuplot.info/ 下载gnuplot (偶用4.4.3版本) LIBSVM 使用的一般步骤是: 1)按照LIBSVM软件包所要求的格式准备数据集; 2)对数据进行简单的缩放操作; 3)首要考虑选用RBF 核函数; 4)采用交叉验证选择最佳参数C与g ; 5)采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型; 6)利用获取的模型进行测试与预测。 在执行以下操作之前先make生成 svm-scale, svm-train, svm-predict三个可执行文件。 1)LIBSVM使用的数据格式 该软件使用的训练数据和检验数据文件格式如下: [label] [index1]:[value1] [index2]:[value2] ... [label] [index1]:

LibSVM-windows

佐手、 提交于 2020-02-11 01:19:19
本系列文章由 @YhL_Leo 出品,转载请注明出处。 文章链接: http://blog.csdn.net/yhl_leo/article/details/50112477 官方Web: https://www.csie.ntu.edu.tw/~cjlin/libsvm/ GitHub: https://github.com/cjlin1/libsvm Tutorial: http://ntu.csie.org/~piaip/svm/svm_tutorial.html 1 库组成 Dos下运行程序有编译好的 exe 文件可以直接运行。例如本人的 libSVM (版本为3.20)解压在 E:\ClassTask\libsvm-3.20 目录下: 其中 heart_scale 文件是一个libSVM库提供的训练示例样本,打开后可以发现里面是一堆这样的数据: 很容易看出,数据集结构是: label vec{(index_1,value_1), ...(index_13, value_13)} 即两类观测值 +1 和 -1 ,后面的13维向量是每个样本某一特征的特征值。 进入 windows 子文件夹下有: 其中包含四个 exe 文件: svm-predict :依照已经训练好的model ,输入新的数据,并输出预测新数据的类别。 svm-scale

如何利用python使用libsvm

£可爱£侵袭症+ 提交于 2020-02-10 14:23:17
一:libsvm包下载与使用: LIBSVM 是台湾大学林智仁(Lin Chih-Jen) 副教授 等开发设计的一个简单、易于使用和快速有效的SVM 模式识别 与回归的 软件 包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了 源代码 ,方便改进.在作者主页 http://www.csie.ntu.edu.tw/~cjlin/ 可以方便下载。 1. 把包解压在C盘之中,如:C:\libsvm-3.18 2. 因为要用libsvm自带的脚本grid.py和easy.py,需要去官网下载绘图工具gnuplot,解压到c盘 3. 进入c:\libsvm\tools目录下,用文本编辑器(记事本,edit都可以)修改grid.py和easy.py两个文件,找到其中关于gnuplot路径的那项,根据实际路径进行修改,并保存 4python与libsvm的连接(参考 SVM学习笔记(2)LIBSVM在python下的使用 ) a.打开IDLE(python GUI),输入 >>>import sys >>>sys.version 如果你的python是32位,将出现如下字符: ‘2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)]’ 这个时候LIBSVM的python接口设置将非常简单

LibSVM for Python 使用

半世苍凉 提交于 2020-02-10 14:22:54
经历手写SVM的惨烈教训(还是太年轻)之后,我决定使用工具箱/第三方库 Python libsvm的GitHub仓库 LibSVM是开源的SVM实现,支持C, C++, Java,Python , R 和 Matlab 等, 这里选择使用Python版本。 安装LibSVM 将LibSVM仓库的所有内容放入Python的包目录\Lib\site-packages或者工程目录中。 在libsvm根目录和python子目录下中分别新建名为 __init__.py 的空文件,这两个空文件将标识所在的目录为python包可以直接导入。 允许草民吐槽一下各种Blog里切换根目录的奇怪的解决方案: 这个 和 这个 因为经常使用svm,所以草民将libsvm包放入\Lib\site-packages目录下。在Python交互环境或在任意脚本中都可以使用 import libsvm.python 来使用libsvm的python接口。 使用LibSVM LibSVM的使用非常简单,只需调用有限的接口 示例1: from libsvm.python.svmutil import * from libsvm.python.svm import * y, x = [1,-1], [{1:1, 2:1}, {1:-1,2:-1}] prob = svm_problem(y, x) param = svm

libsvm : C++ vs. MATLAB : What's With The Different Accuracies?

核能气质少年 提交于 2020-02-06 23:54:40
问题 I have two multi-class data sets with 5 labels, one for training, and the other for cross validation. These data sets are stored as .csv files, so they act as a control in this experiment. I have a C++ wrapper for libsvm, and the MATLAB functions for libsvm. For both C++ and MATLAB: Using a C-type SVM with an RBF kernel, I iterate over 2 lists of C and Gamma values. For each parameter combination, I train on the training data set and then predict the cross validation data set. I store the

libsvm : C++ vs. MATLAB : What's With The Different Accuracies?

安稳与你 提交于 2020-02-06 23:54:27
问题 I have two multi-class data sets with 5 labels, one for training, and the other for cross validation. These data sets are stored as .csv files, so they act as a control in this experiment. I have a C++ wrapper for libsvm, and the MATLAB functions for libsvm. For both C++ and MATLAB: Using a C-type SVM with an RBF kernel, I iterate over 2 lists of C and Gamma values. For each parameter combination, I train on the training data set and then predict the cross validation data set. I store the

libsvm : C++ vs. MATLAB : What's With The Different Accuracies?

北战南征 提交于 2020-02-06 23:54:27
问题 I have two multi-class data sets with 5 labels, one for training, and the other for cross validation. These data sets are stored as .csv files, so they act as a control in this experiment. I have a C++ wrapper for libsvm, and the MATLAB functions for libsvm. For both C++ and MATLAB: Using a C-type SVM with an RBF kernel, I iterate over 2 lists of C and Gamma values. For each parameter combination, I train on the training data set and then predict the cross validation data set. I store the