caffe

caffe基础

本秂侑毒 提交于 2020-08-19 23:27:39
caffe中的数据是用blobs的形百式进行数据流动的,每度一层用bottom来输入数据,用top来输出知数据。如果道只有top没有bottom,则此层只有输出,没有输入。反之亦然。如果有多个 top或多专个bottom,表示有属多个blobs数据的输入和输出。 Deconvolution 反卷积层 InnerProduct 全连接 来源: oschina 链接: https://my.oschina.net/u/4290246/blog/4284201

TensorRT:NvinferPlugin.h

北慕城南 提交于 2020-08-19 13:00:52
版本:5.1.5.0 include NvInfer.h NvInferPlugin.h NvCaffeParser.h NvOnnxConfig.h NvOnnxParser.h NvOnnxParserRuntime.h NvUffParser.h NvUtils.h 说明: 红色标记的:NvInfer.h, NvInferPlugin.h, NvUtils.h是公用的。其他用来支持:Caffe, Onnx和Uff(tensorflow) 功能: Nvidia官方提供的TRT插件的API 0:命名空间:nvidia + infer --- > nvinfer1 不变 namespace nvinfer1 1:枚举变量 Plugin类型 来源: oschina 链接: https://my.oschina.net/u/4352624/blog/4512300

超越英伟达的,不会是另一款GPU!中国公司发布首款数据流AI芯片

有些话、适合烂在心里 提交于 2020-08-16 17:04:26
2020年6月23日,鲲云科技在深圳举行产品发布会,发布全球首款数据流AI芯片CAISA,定位于高性能AI推理,已完成量产。鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了最高11.6倍。第三方测试数据显示仅用1/3的峰值算力,CAISA芯片可以实现英伟达T4最高3.91倍的实测性能。 鲲云科技创始人和CEO牛昕宇博士表示,超越英伟达的,不会是另一款GPU,而鲲云定制数据流技术不依靠更大的芯片面积和制程工艺,通过数据流动控制计算顺序来提升实测性能,为用户提供了更高的算力性价比。 超高芯片利用率,定制数据流芯片架构完成3.0升级 此次发布的CAISA芯片采用鲲云自研的定制数据流芯片架构CAISA 3.0,相较于上一代芯片架构,CAISA 3.0在架构效率和实测性能方面有了大幅的提升,并在算子支持上更加通用,支持绝大多数神经网络模型快速实现检测、分类和语义分割部署。 CAISA3.0在多引擎支持上提供了4倍更高的并行度选择,架构的可拓展性大大提高,在AI芯片内,每一个CAISA都可以同时处理AI工作负载,进一步提升了CAISA架构的性能,在峰值算力提升6倍的同时保持了高达95.4%的芯片利用率,实测性能线性提升。同时新一代CAISA架构对编译器RainBuilder的支持更加友好,软硬件协作进一步优化,在系统级别上为用户提供更好的端到端性能。

【完结】12大深度学习开源框架(caffe,tf,pytorch,mxnet等)快速入门项目

别说谁变了你拦得住时间么 提交于 2020-08-15 14:34:17
转自: https://www.jianshu.com/p/16f69668ce25 这是一篇总结文,给大家来捋清楚12大深度学习开源框架的快速入门,这是有三AI的GitHub项目,欢迎大家star/fork。 https://github.com/longpeng2008/yousan.ai 1 概述 1.1 开源框架总览 现如今开源生态非常完善,深度学习相关的开源框架众多,光是为人熟知的就有caffe,tensorflow,pytorch/caffe2,keras,mxnet,paddldpaddle,theano,cntk,deeplearning4j,matconvnet等。 如何选择最适合你的开源框架是一个问题。有三AI在前段时间里,给大家整理了 12个深度学习开源框架快速入门的教程和代码 ,供初学者进行挑选,一个合格的深度学习算法工程师怎么着得熟悉其中的3个以上吧。 下面是各大开源框架的一个总览。 在这里我们还有一些框架没有放上来,是因为它们已经升级为大家更喜欢或者使用起来更加简单的版本,比如从torch->pytorch,从theano到lasagne。另外这些框架都支持CUDA,因此编程语言这里也没有写上cuda。 在选择开源框架时,要考虑很多原因,比如开源生态的完善性,比如自己项目的需求,比如自己熟悉的语言。当然

阿里云飞天AI加速器+Serverless容器,帮助图森未来提升资源利用率

守給你的承諾、 提交于 2020-08-15 13:20:15
简介: 今年年初,图森未来的无人驾驶卡车还上了“钢铁侠”的扮演者小罗伯特·唐尼主持的科技聚集剧集《The Age of A.I.》(《AI时代》),在剧中不仅顺利完成无人驾驶的行驶任务,还与围追堵截的摄像车“斗智斗勇”,在摄像车各种找拍摄角度的情况下,自动自我调整,化险为夷,避让既礼貌又安全! 图森未来(TuSimple)成立于2015年,是一家专注于L4级无人驾驶卡车技术研发与应用的人工智能企业,已经实现卡车在干线物流场景和半封闭枢纽场景下的无人干预驾驶。图森未来品牌旗下产品——图森未来 L4 级别无人驾驶卡车能够实现环境感知、定位导航、决策控制等自动驾驶核心功能,可应用于高速公路货运和港内集装箱码头运输及其相似场景。 公司于2019年9月完成总额2.15亿美元D轮融资,资方:UPS、鼎晖资本、万都中国、累计融资超过3亿美元,最新估值超过12亿美元,是卡车无人驾驶头部企业,也是全球第一家无人驾驶卡车独角兽企业。 图森未来的业务主要在美国和国内两地展开,在美国主要是高速公路干路货运场景,国内业务开始以连接枢纽场景的干线物流货运为主。 在美国,图森未来已经向包括UPS、USPS、McLane、U.S. Xpress在内的18家客户提供无人驾驶物流服务。 今年年初,图森未来的无人驾驶卡车还上了“钢铁侠”的扮演者小罗伯特·唐尼主持的科技聚集剧集《The Age of A.I.》(

使用TensorRT对人脸检测网络MTCNN进行加速

北战南征 提交于 2020-08-15 03:48:48
前言 最近在做人脸比对的工作,需要用到人脸关键点检测的算法,比较成熟和通用的一种算法是 MTCNN ,可以同时进行人脸框选和关键点检测,对于每张脸输出 5 个关键点,可以用来进行人脸对齐。 问题 刚开始准备对齐人脸图片用于训练人脸比对算法,是使用官方版本的 MTCNN ,该版本是基于 Caffe 的 Matlab 接口的,跑起来很慢,差不多要一秒钟一张图片,处理完几万张图片一天就过去了,好在效果不错。 训练完人脸特征提取的网络以后,想要部署整个人脸比对算法,需要进行人脸检测和对齐。用于工业生产,那个版本的 MTCNN 显然不合适了。在 Github 上寻找替代算法,发现有一个从 Facenet 仓库里面拿出来打包成 Python 包的 MTCNN ,直接 pip 就装上了,但是,它也很慢,虽然用了 TensorFlow, 没用上 GPU,检测一张 1080P 的图片要 700ms,太慢了。 想法 正好这几天在学习 TensorRT 相关知识,已经成功将人脸特征提取网络转成 onnx 格式,然后用 TensorRT 的 Python 接口部署好了,单张图片耗时从 15ms 减少到 3ms,非常理想的结果!理所当然,想着把 MTCNN 部署在 TensorRT 平台上面。 MTCNN 的 Caffe 模型直接转成 TensorRT 会有问题,主要是 PReLU 不被支持

NNIE-lite 为算法工程师而生

五迷三道 提交于 2020-08-14 13:22:15
《NNIE-lite》   趟过NNIE的小伙伴可能都知道,NNIE是有很多坑的,而且是纯C的环境,除非你有几年C的开发经验,否则阅读起来不是那么容易的,而作为算法工程师,我相信更多人和我一样擅长Python和C++,所以在把NNIE用起来还是有些费力的。而作为算法工程师,你的工作更应该 focus on 模型上,现在有了NNIE-lite这个项目,极大的帮助大家脱离苦海,算法工程师可以把目光聚焦在模型效果和效率上,而不用再为其他的琐事担心了,使用NNIE像用ncnn一样简单。 Key Words:NNIE、 C++、 OpenCV Beijing, 2020 作者:RaySue Code: https://github.com/RaySue/NNIE-lite Agile Pioneer   写在前面 如果你有摄像头端(海思NNIE)移植算法的需求 如果你更擅长于C++编程 如果你擅长使用cmake构建工程 恰好你喜欢用OpenCV来进行io处理,这个比起bgr来调试十分方便 Come on and star the repo https://github.com/RaySue/NNIE-lite   那么 NNIE-lite 就是非常适合你的,我当时如果有NNIE-lite这样的项目,可能至少节省我一周的时间去梳理使用NNIE的逻辑。 模型部署通用步骤(ncnn

算法VS数据,谁起决定作用?一场南北大佬隔空辩论引发对AI终极思考

Deadly 提交于 2020-08-11 22:27:24
      人工智能的终极命题:算法和数据谁更重要? 如果算法已经能自动生产,框架将会是核心竞争力吗? 如果框架仍然不能构成核心壁垒,那会是什么?   第三波人工智能浪潮越浪越勇,吸引着一批又一批的学界大佬迈出象牙塔,投身于产业机构和田间地头,要问为什么?    问就一句话,「那里有比研究院所更丰富的海量数据,有更接近用户的真实战场」。   这个逻辑进而衍生出一连串值得探讨的有趣话题:数据很重要,那么数据究竟有多重要?数据会比算法更重要吗?在机器学习领域里,究竟数据和算法哪个重要?   事实上,算法、算力和数据,一直以来就被称之为人工智能的「三驾马车」。这个问题看似无解,好比问自行车的前轮重要还是后轮重要?人的左腿重要还是右腿重要?整体中的任何一个部分对于完成任务而言都是不可或缺的。同样的,数据和算法在机器学习中也是不可或缺的。    但这并不妨碍从业者对「数据与算法」的探讨和交流热情,也正是在这样的交流中,算法和数据的价值得到不断地延伸与挖掘。    一 数据VS算法,究竟谁更有竞争力?   「中国AI公司的优势并不是先进的算法,而是丰富的应用场景和大量的标注数据。正如文章所说: 『我们使用的算法中并没有多少内容是地球上随便哪个计算机科学研究生拿不到的。没有中国无与伦比的标注基础设施,这些数据成不了气候。』 」   近日,中国科学院大学教授

图像语义分割最新文章汇总(附论文链接和公开代码)

谁说胖子不能爱 提交于 2020-08-11 21:31:05
呐,我也是做图像分割的啦,最近看到有大佬整理了图像分割方面最新的论文,觉得很有帮助,就转载过来了,感觉又有很多要学的内容了。 Semantic Segmentation Adaptive Affinity Field for Semantic Segmentation – ECCV2018 [Paper] [HomePage] Pyramid Attention Network for Semantic Segmentation – 2018 – Face++ [Paper] Autofocus Layer for Semantic Segmentation – 2018 [ Paper [Code-PyTorch] ExFuse: Enhancing Feature Fusion for Semantic Segmentation – 2018 – Face++ [Paper] DifNet: Semantic Segmentation by Diffusion Networks – 2018 [Paper] Convolutional CRFs for Semantic Segmentation – 2018 [Paper] [Code-PyTorch] ContextNet: Exploring Context and Detail for Semantic