深度学习

淘宝技术部算法专家(杭州/北京)招聘

橙三吉。 提交于 2021-02-09 03:36:32
在淘宝技术部,你将要解决的问题包括(但不限于)面向商家端的智能决策系统、面向用户端的商品、feeds、短视频的挖掘及推荐系统以及基于移动智能设备的AI平台算法,这不仅要考虑CTR(点击率)、成交额、用户日活等业务指标,还需要系统化的解决上千万卖家流量博弈的机制设计,团队内的算法工程师和科学家将与你一起解决世界上规模最大电商平台上最困难的业务技术难题。 数据与自然语言处理算法专家 岗位描述 1. 参与淘宝核心场景的算法研发,提升场景的点击率、转化率、成交、停留时长等核心指标; 2. 设计面向On Device AI的高容错分布式机器学习系统及新的模型; 3. 构建面向电商领域的知识图谱; 4. 面向大淘宝千万卖家的生态机制算法设计。 职位描述 1. 计算机、统计、数学等相关专业; 2. 具有丰富的数据建模实践经验 3. 2年以上机器学习、自然语言处理、数据挖掘、文本处理等相关经验,精通其中一两个领域; 4. 熟练掌握Python/Java/C++等至少一种语言; 5.具有良好的技术洞察力、商业敏感度和优秀的数据分析技能,能够开发创新而实际的分析方法以解决复杂的商业问题 如果你还满足以下要求,我们会优先考虑 1. 熟练掌握Hive/SQL,拥有海量数据处理经验者优先; 2. 有企业级搜索、推荐系统、大数据算法优化经验 3. 在相关领域会议或期刊有文章发表 工位地点:北京、杭州

腾讯IEG开源GAME AI SDK:自动化测试吃鸡、MOBA类游戏

心不动则不痛 提交于 2021-02-09 00:09:44
视学算法报道 编辑:陈萍、魔王 转载自公众号:机器之心 SDK 还能自动玩游戏? 这个 SDK 有点「酷」 。 近日,腾讯互娱(IEG)开源了一款名为 GAME AI SDK 的自动化测试平台,该平台封装好了多种工具供开发者使用,目前支持的游戏类型有跑酷类、吃鸡类、射击类、MOBA 类等。 项目地址:https://github.com/Tencent/GameAISDK 平台内置的「天天酷跑」示例。左图为未训练随机做动作,右图是训练好的效果。 SDK(软件开发工具包)一般是软件工程师为特定的软件包、软件框架、硬件平台、操作系统等创建应用软件时可使用的开发工具集合。 似乎有些抽象。在实际项目中,我们只需记住,SDK 是手游渠道提供的,集成了用户登录、社区功能、社交分享功能、数据后台统计功能的功能模块。接入 SDK 后,游戏厂商和渠道都要对 SDK 包进行测试,测试通过才能上线。 看了上文展示的酷跑动图效果,是不是想上手试试吃鸡类、射击类的游戏体验呢?这个开源项目可以满足你的需求,它支持使用者进行项目接入以及二次开发。 AI SDK 平台 AI SDK 平台是一个基于游戏图像来开发游戏 AI 的开源工具包。工具包主要完成了 UI 检测、游戏内元素识别、AI 算法(DQN、IM)等功能。开发者可以基于此工具包完成游戏自动化测试。 目前该平台已支持的游戏类型有跑酷类、吃鸡类、射击类

毕业设计之「测试实验及结果分析」(二)

北城余情 提交于 2021-02-08 13:23:10
阅读本文大概需要 8 分钟。 基于AlexNet完成五种花的训练和识别 花分类数据集获取及项目简介 在本例中,我们将使用通过Python爬虫技术获取的 不具备版权 的3762张样本图片,包括5个类别:其中daisy(菊花)633张,dandelion(蒲公英)898张,roses(玫瑰)641张,sunflowers(太阳花)699张,tulips(郁金香)799张; 训练集图片共3306张,同样也是5种类别,其中daisy(菊花)570张,dandelion(蒲公英)809张,roses(玫瑰)577张,sunflowers(太阳花)630张,tulips(郁金香)720张; 测试集图片共364张,也是5种类别,其中daisy(菊花)53张,dandelion(蒲公英)89张,roses(玫瑰)64张,sunflowers(太阳花)69张,tulips(郁金香)79张; 有了数据集之后,我们将搭建AlexNet卷积神经网络,通过对图片的训练,来完成对要识别图片的判断,要注意的一点,因为此项目中样本集中图片总量较小,所以相比第一个例子,识别率可能会有所下降。 代码及最终效果展示 接下来,我们给出本案例的核心代码,即AlexNet网络模型搭建的核心代码: from TensorFlow.keras import layers, models, Model, Sequential

ResNet、Faster RCNN、Mask RCNN是专利算法吗?盘点何恺明参与发明的专利

爱⌒轻易说出口 提交于 2021-02-08 13:22:39
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 前段时间OpenCV正式将SIFT算法的实现从Non-free模块移到主库,因SIFT专利到期了(专利授权后,从申请日开始有20年的保护期)。 美国林肯总统称" 专利制度是给天才之火浇上利益之油 ",专利保护了申请人的利益,促进了科技的进步,但现在也有越来越多的滥用专利权对产业机构敲诈的案例出现。 SIFT 专利权的终结让我们不得不思考,还有哪些著名的算法被申请了专利?对于做研究的朋友来说不需要考虑这个问题,专利算法依然可以参考、复现、对比,但对于产业界朋友就不得不确认清楚:项目中有没有可能使用了别人专利保护算法。 作为计算机视觉领域当今翘楚,两度获得CVPR 最佳论文奖的何恺明大佬有很多论文都具有重大影响力。其部分论文引用数据: 残差网络 ResNet 被引用 51939 次、目标检测算法 Faster RCNN 被引用 20291 次、实例分割算法 Mask RCNN 被引用 7249 次,暗通道去雾被引用 4274 次,这些知名的算法有成百上千的开源实现,也肯定被大量的商业公司使用,有没有被申请专利? 想想 ResNet 如果被申请专利,那恐怕大多数使用深度学习的商业公司都在侵权了!价值难以估计! 带着这样的疑问,CV君检索了所有与“ Kaiming He ”相关的已经公开的授权专利和专利申请

【论文介绍】MEAL V2

拜拜、爱过 提交于 2021-02-08 08:25:38
作者:Stan Kriventsov 编译:ronghuaiyang 转载自:AI公园 原文链接: https://mp.weixin.qq.com/s/001DpmGeapE3HECzFPVvEw ​ mp.weixin.qq.com 导读 一篇知识蒸馏+对抗训练的文章。 作者使用最近提出的MEAL技术(包括从多个大型老师网络使用蒸馏通过对抗学习得到更小的学生网络学习),使用224×224输入,在ImageNet上提升了ResNet-50的精度到80.67%, 没有外部训练数据和网络体系结构的修改。 从文章中我们能学到什么? 即使是一个相对较小的网络也可以通过训练用正确的方法达到大得多的网络的准确性。 在某种程度上,这并不奇怪,因为现代深层神经网络被设计成过参数化的,利用“彩票假说”描述的大量的随机初始化配置,一个更小的网络足以达到同样的性能,但是,在实践中可以实现还是非常了不起的。 先决条件(为了更好地理解论文,我们应该熟悉什么?) 知识蒸馏 对抗训练 讨论 集成技术,或集成学习,由多个ML模型的组合预测组成,是一种已知的提高预测精度的方法。它被广泛应用于Kaggle竞赛中,在这些竞赛中,即使以巨大的计算负载为代价,也要获得最佳的精度。然而,在大多数实际应用中,由于在预测期间运行每个模型所需的费用和时间,集成并不被广泛使用。 MEAL技术的想法,是从多个大型神经网络(教师

如何获取高精度CV模型?快来试试百度EasyDL超大规模视觉预训练模型

房东的猫 提交于 2021-02-08 05:46:32
在深度学习领域,有一个名词正在被越来越频繁地得到关注:迁移学习。 它相比效果表现好的监督学习来说,可以减去大量的枯燥标注过程,简单来说就是在大数据集训练的预训练模型上进行小数据集的迁移,以获得对新数据较好的识别效果,因其能够大量节约新模型开发的成本,在实际应用中被更广泛地关注。 基于此,百度EasyDL零门槛AI开发平台引入了超大规模视觉预训练模型,结合迁移学习工具,帮助开发者使用少量数据,快速定制高精度AI模型。 高质量数据获取难度高,迁移学习提升模型效果 在训练一个深度学习模型时,通常需要大量的数据,但数据的采集、标注等数据准备过程会耗费大量的人力、金钱和时间成本。 为解决此问题,我们可以使用预训练模型。以预训练模型A作为起点,在此基础上进行重新调优,利用预训练模型及它学习的知识来提高其执行另一项任务B的能力,简单来说就是 在大数据集训练的预训练模型上进行小数据集的迁移,以获得对新数据较好的识别效果,这就是迁移学习(Transfer Learning) 。 迁移学习作为一种机器学习方法,广泛应用于各类深度学习任务中。在具体实现迁移学习时,有多种深度网络迁移方法,其中的Fine-tune(微调)是最简单的一种深度网络迁移方法,它主要是将已训练好的模型参数迁移到新的模型来帮助新模型训练。 针对一个具体的模型开发任务,我们通常会选择在公开的大数据集上训练收敛、且效果较好的模型

可高效训练超大规模图模型,PyTorch BigGraph是如何做到的?

不问归期 提交于 2021-02-08 05:46:18
选自medium 作者: Jesus Rodriguez 机器之心编译 编辑:Panda Facebook 提出了一种可高效训练包含数十亿节点和数万亿边的图模型的框架 BigGraph 并开源了其 PyTorch 实现。 本文将解读它的创新之处,解析它能从大规模图网络高效提取知识的原因。 图(graph)是机器学习应用中最基本的数据结构之一。具体来说,图嵌入方法是一种无监督学习方法,可使用本地图结构来学习节点的表征。社交媒体预测、物联网模式检测或药物序列建模等主流场景中的训练数据可以很自然地表征为图结构。其中每一种场景都可以轻松得到具有数十亿相连节点的图。图结构非常丰富且具有与生俱来的导向能力,因此非常适合机器学习模型。尽管如此,图结构却非常复杂,难以进行大规模扩展应用。也因此,现代深度学习框架对大规模图数据结构的支持仍非常有限。 Facebook 推出过一个框架 PyTorch BigGraph:https://github.com/facebookresearch/PyTorch-BigGraph,它能更快更轻松地为 PyTorch 模型中的超大图结构生成图嵌入。 某种程度上讲,图结构可视为有标注训练数据集的一种替代,因为节点之间的连接可用于推理特定的关系。这种方法遵照无监督图嵌入方法的模式,它可以学习图中每个节点的向量表征,其具体做法是优化节点对的嵌入

训练超大规模图模型,PyTorchBigGraph如何做到?

跟風遠走 提交于 2021-02-08 05:26:32
   编辑:Panda    Facebook 提出了一种可高效训练包含数十亿节点和数万亿边的图模型的框架 BigGraph 并开源了其 PyTorch 实现。本文将解读它的创新之处,解析它能从大规模图网络高效提取知识的原因。      图(graph)是机器学习应用中最基本的数据结构之一。具体来说,图嵌入方法是一种无监督学习方法,可使用本地图结构来学习节点的表征。社交媒体预测、物联网模式检测或药物序列建模等主流场景中的训练数据可以很自然地表征为图结构。其中每一种场景都可以轻松得到具有数十亿相连节点的图。图结构非常丰富且具有与生俱来的导向能力,因此非常适合机器学习模型。尽管如此,图结构却非常复杂,难以进行大规模扩展应用。也因此,现代深度学习框架对大规模图数据结构的支持仍非常有限。   Facebook 推出过一个框架 PyTorch BigGraph:https://github.com/facebookresearch/PyTorch-BigGraph,它能更快更轻松地为 PyTorch 模型中的超大图结构生成图嵌入。   某种程度上讲,图结构可视为有标注训练数据集的一种替代,因为节点之间的连接可用于推理特定的关系。这种方法遵照无监督图嵌入方法的模式,它可以学习图中每个节点的向量表征,其具体做法是优化节点对的嵌入,使得之间有边相连的节点对的嵌入比无边相连的节点对的嵌入更近

来了来了!一份NLP&ML领域中文综述总结~

本小妞迷上赌 提交于 2021-02-07 12:22:35
转载自 | helloworldlh 原文链接: 来了来了!一份NLP&ML领域中文综述总结~ ​ mp.weixin.qq.com 综述类论文是指就某一时间内,针对某一专题,对大量原始研究论文中的数据、资料和主要观点进行归纳整理、分析提炼而写成的论文。 对初学者而言,综述类文章可以便于读者在研究初期尽快掌握该方向的发展趋势。对综述类文章的搜索与阅读也因此成为了初学者进入相关研究领域前面临的第一个问题。 针对这一需要,东北大学自然语言处理实验室对自然语言处理领域与机器学习领域的中文综述类文章进行了收集和分类整理。将其按照不同研究领域进行分类,并提供了论文的获取网址,方便初学者获取相应领域的综述文章。 项目地址: https:// github.com/NiuTrans/CNS urvey 论文来源 在该项目中,所有文章均来源于《中文信息学报》、《计算机学报》、《软件学报》、《自动化学报》、《电子学报》、《计算机研究与发展》、《中国科学:信息科学》七个期刊。 共包含 251 篇综述文章,其中自然语言处理领域 145 篇,机器学习领域 106 篇,覆盖了各个期刊 电子化至今 的所有文章。 按照不同分类,项目中给出了各个文章的来源、年份、下载地址以及作者信息,如下图示例: 论文分类 为了方便使用者快速定位到自己想要了解的综述文章,项目根据各个研究领域对自然语言处理和机器学习分别进行了分类

英超引入 AI 球探,寻找下一个足球巨星

徘徊边缘 提交于 2021-02-07 12:14:31
作者 | 神经小兮 来源 | HyperAI超神经 头图 | 下载于视觉中国 球探对于很多人来说是一个略显神秘的群体,他们对一个球队的建设和发展至关重要。为了提高球探的工作效率,英超伯恩利足球俱乐部最近启用了 AI 球探。 关键词: AI 球探 计算机视觉 姿态识别 最近,中国足球运动员李嗣镕,与荷兰海牙足球俱乐部签下职业合同,这一消息很快登上微博热搜,但他上热搜的原因竟是因为:太帅了。 李嗣镕今年 18 岁,是一个「球二代」, 父亲是前中国国家队国脚李明 虽然因为帅而火出圈,但李嗣镕实际上是集高颜值与实力于一身。7 岁开始练球,12 岁进入海牙俱乐部青训系统,并被俱乐部 CEO 哈姆迪看好,认为他「将来可以去英超赛场闯荡」。 在众多年轻球员中,还隐藏着更多李嗣镕这样的潜力股,他们如何才能被发现?这还要从足球圈内一个特殊的职业说起。 独具慧眼的球探,发现明日之星 在各大联赛足球俱乐部,除了教练、球员以及管理人员外,还有一个职位至关重要,那就是球探。 球探的职责,就是在全球各地大大小小的比赛中,发现天赋过人的年轻球员,并把他们推荐给教练。 对于很多天才球员来说,球探无异于发现千里马的伯乐。 贝克汉姆: 他在 11 岁那年的一场少年队比赛中,因为抢眼的表现,被曼联著名球探马尔科姆·费吉恩相中,之后很快收到曼联的邀请函; 梅西: 在 13 岁时被巴塞罗那球探雷克萨奇发现并签约; 罗纳尔多