显存

NVIDIA新旗舰GeForce GTX 780深度评测

一曲冷凌霜 提交于 2020-04-06 21:14:27
2013年5月18日,NVIDIA在2013年游戏群英会上出人意料地以不公开产品型号的方式向大众展示了一款神秘显卡。尽管只是惊鸿一瞥,但是大家都相信这就是即将到来的GeForce GTX 780显卡。果不其然,在稍后的5月24日,NVIDIA正式发布了这款产品。GeForce GTX 780,NVIDIA新一代GTX 700系列的单核心旗舰显卡,其性能究竟如何呢? GTX 780规格解读 或许NVIDIA认为GTX 780性能已经很出色,对保密不甚上心,因此其规格早在发布之前就已经被爆料得差不多了。本刊也早在4月下《GeForce GTX 780? GK110神秘显卡抢先曝光》一文中曝光了该显卡。 下面,我们来看看GTX 780的详细规格。它和GTX Titan一样,都使用了基于“big Kepler”的GK110核心,这颗核心在本刊3月下评测GTX Titan的时候已经有详细介绍。完整版GK110的晶体管数量有71亿个,具备15组SMX、2880个CUDA core、384bit显存位宽、48个ROP单元。不过GT X Titan屏蔽了一组SMX,因此只有2688个CUDA Core。 GTX 780则屏蔽了三组SMX,具备12组SMX,流处理器数量降低到了2304个—这也是目前看到的第4款采用GK110核心的产品。之前已经分别有GTX Titan和针对行业用户的Tesla

异构计算系列文章(一):定义、场景及局限性

不想你离开。 提交于 2020-04-06 08:07:01
作者 | 顾钧 2020 开年,ZILLIZ 与 InfoQ 筹备了以异构计算为专题的一系列文章。此篇文章作为异构计算专题的开篇,整体性的介绍了异构计算的定义、场景与局限性。在后续的专题文章中,我们将深入不同的 AI 应用场景进一步解释异构计算的优势。 诞生伊始,计算机处理能力就处于高速发展中。及至最近十年,随着大数据、区块链、AI 等新技术的持续火爆,人们为提升计算处理速度更是发展了多种不同的技术思路。大数据受惠于分布式集群技术,区块链带来了专用处理器(Application-Specific IC, ASIC)的春天,AI 则让大众听到了“异构计算”这个计算机界的学术名词。 “异构计算”(Heterogeneous computing),是指在系统中使用不同体系结构的处理器的联合计算方式。在 AI 领域,常见的处理器包括:CPU(X86,Arm,RISC-V 等),GPU,FPGA 和 ASIC。(按照通用性从高到低排序) AI 是一门较为复杂、综合的学科。在只有 CPU 平台的情况下,AI 开发者要学习的算法、模型、框架、编程语言已经不少。如果再考虑多个不同处理器平台,情况会变得更为复杂。在展开讨论不同的应用场景之前,我们先了解一下什么是“异构计算”。 异构计算 首先需要明确的是,计算机体系结构≠硬件架构。体系结构不单包括硬件层面的实现,也包括软件层面的考量。当 IBM 在

Linux-LCD应用层编程学习笔记

北城以北 提交于 2020-03-24 16:47:18
LCD应用层编程 LCD驱动 --> 设备节点文件 --> fb0 设备节点文件 等同于 显存空间! 如果想要在屏幕上显示图像,只需要往显存中写入数据即可! LCD应用程序就是往显存中写入数据的操作!!! LCD应用程序编程步骤: 1)打开LCD驱动对应的设备节点文件(显存) 2)把内核中的显存空间映射到进程空间中 3)往映射空间中写入数据 4)关闭显存 mmap(); 头文件:#include <sys/mman.h> 函数原型:void mmap(void addr, size_t length, int prot, int flags, int fd, off_t offset); 函数功能:把内核中的一块空间映射到进程空间中。 映射空间大小由length指定。映射空间首地址通过函数返回值接收! 形参列表: addr:映射空间首地址。 如果传参为NULL,在进程空间中系统自动分配映射空间 length:映射空间大小。 prot:映射空间的操作权限 PROT_EXEC : 可执行 PROT_READ : 可读 PROT_WRITE : 可写 PROT_NONE : 无任何操作权限 flags:映射空间的同步方式 MAP_SHARED :实时和内核空间同步 MAP_PRIVATE :映射空间不同步 fd:要映射的对象! <是一个文件或者一个设备> offset

挖LTC最牛的配件:显卡扩展卡,最多支持7张显卡

前提是你 提交于 2020-03-17 16:45:55
某厂面试归来,发现自己落伍了!>>> 目前,莱特币,也就是LTC价格跟随BTC价格水涨船高,LTC也值钱了,目前价格是26元左右,一个礼拜前,LTC价格还在18元左右浮动,不到一周的时间几乎上涨50%,可以看到莱特币还是有一定的投资意义的。当然获取莱特币的渠道目前来说只有两个:购买或者使用显卡挖矿。 显卡挖矿需要核算成本,也就是在基础平台恒定的情况下,支持的显卡越多,单个成本越便宜,其实不难理解,也就是cpu、主板、内存、电源等都是共用 的,支持4张显卡和支持7张显卡,每一张显卡的成本肯定不同,我们也希望找到能够支持更多显卡的主板,这些主板,我在前面已经推荐过了,请大家自行选择, 今天我还为大家推荐一个挖莱特币的利器: 显卡扩展卡 ,有了这个东西只要你的主板有一个PCIE16X的显卡插槽,就能扩展为7显卡。非常厉害! 看看该显卡扩展卡的指标: 1、性能指标: 提供7条PCI-E 2.0 16X的插槽,所有插槽的运行速度都是PCI-E 2.0 5GT/S @1X的状态(共用一个主板的PCI-E 2.0 16X@1X插槽)。 2、适用对象: 任何提供支持PCI-E 16X@1X的主板都可以使用。 3、使用方法: 3.1、软件及驱动的安装: 和你的卡原来的方法一模一样,无需特别的设置。但由于卡众多,请测试的时候先装一块卡上去测试过安装正常后,再把所有的卡装上去。 3.2

GUP架构---显卡(一)

。_饼干妹妹 提交于 2020-03-12 16:39:37
一、理解几个问题 1、显卡的全称是什么? 显示接口卡(Vedio Card、Griphics Card)、显示器配置卡。个人电脑基本组成部件之一。 2、显卡的作用是什么? a>连接显示器和主板的元器件。 b>将计算机需要的显示信息进行处理,并向显示器提供信号,控制显示器正确显示图像信息。 3、显卡的分类有哪些? 这里是按照显卡的存在位置进行分类的,当然了不同的分类标准有不同的结果。 a>集成显卡(使用系统的一部分内存作为显存) 集成显卡---主板芯片组集成了显卡芯片 核心显卡(核显)---处理器内部集成了显卡芯片 b>独立显卡 独立于主板的板块,需要的时候可以插到主板上面。具备独立的显存,不占用系统的内存,但是当显示内存不够用的时候可以共享部分系统内存作为显存使用 4、显卡与GPU有什么关系? 显卡由GPU、显存、电路板、BIOS固件等组成,GPU只是显卡上的一个核心部件,GPU是区分显卡显示性能的重要部件。所以,GPU不等于显卡。另外,目前GPU只能焊接在显卡的线路板上使用,不能单独使用。 5、市面上常见的电脑显卡生产商有哪些? 首先需要明白GPU生产商和显卡生产商是不一样的。没有生产GPU能力的厂商也可以通过自己购买GPU及相关部件组装显卡再销售。 以下是大家比较熟悉的几家GPU及显卡生产销售商: 英特尔INTEL---主要生产集成显卡,Intel的GPU主要用在集成显卡上

tensorflow2.1GPU显存限制

拥有回忆 提交于 2020-03-11 01:22:01
tensorflow2.1显存限制 查了一下午,查到的方法全都无法解决,在绝望的时候从 API 中找到了正解 1.tensorflow v1使用如下用法 opts = tf . GPUOptions ( per_process_gpu_memory_fraction = 0.5 ) sess = tf . Session ( config = tf . ConfigProto ( gpu_options = opts ) ) 2.tensorflow v2.0α版本使用如下用法 tensorflow . config . gpu . set_per_process_memory_fraction ( 0.75 ) tensorflow . config . gpu . set_per_process_memory_growth ( True ) 但是该用法很快被替换掉,解决方法向下看 3.tensorflow v2.1版本使用如下用法 gpus = tf . config . experimental . list_physical_devices ( 'GPU' ) #获取GPU列表 tf . config . experimental . set_virtual_device_configuration ( gpus [ 0 ] , [ tf . config .

PaddlePaddle 核心架构深入解读

时光怂恿深爱的人放手 提交于 2020-03-10 07:20:16
个人博客导航页(点击 右侧 链接 即可打开个人博客): 大牛带你入门技术栈 PaddlePaddle(中文名:飞桨,PArallel Distributed Deep LEarning 并行分布式深度学习)是一个深度学习平台,具有易用、高效、灵活和可伸缩等特点,它是中国第一个开源深度学习开发框架。 飞桨框架的核心技术,主要包括前端语言、组网编程范式、核心架构、算子库以及高效率计算核心五部分。下边分别分析这几部分。 核心架构 飞桨核心架构采用分层设计,如下图所示,前端应用层考虑灵活性,采用Python实现,包括了组网 API、IO API、OptimizerAPI和执行 API等完备的开发接口;框架底层充分考虑性能,采用C++来实现。 框架内核部分,主要包含执行器、存储管理和中间表达优化;内部表示方面,包含网络表示(ProgramDesc)、数据表示(Variable)和计算表示(Operator)几个层面。框架向下对接各种芯片架构,可以支持深度学习模型在不同异构设备上的高效运行。 前端语言 为了方便用户使用,飞桨选择Python作为模型开发和执行调用的主要前端语言,并提供了丰富的编程接口API。Python作为一种解释型编程语言,代码修改不需要重新编译就可以直接运行,使用和调试非常方便,并且拥有丰富的第三方库和语法糖,拥有众多的用户群体。 同时为了保证框架的执行效率

OpenGL版本与OpenGL扩展机制

雨燕双飞 提交于 2020-03-01 03:13:27
1 opengl 的版本区别(在 opengl 官方文档中有详细说明) 针对Opengl不同版本的升级是主要是扩展指令集。 现在版本是4.0啦 1.1 opengl1.1 1995年,SGI推出了更为完善的OpenGL 1.1版本。OpenGL 1.1的性能比1.0版提高甚多。其中包括改进打印机支持,在增强元文件中包含OpenGL的调用,顶点数组的新特性,提高顶点位置、法线、颜色、色彩指数、纹理坐标、多边形边缘标识的传输速度,引入了新的纹理特性等等。 1.2 opengl1.3 2001年8月,ARB发布OpenGL 1.3规范,它增加了立方纹理贴图、纹理环境、多重采样、纹理框架压缩等扩展指令,但是改进程度非常有限。 1.3 opengl1.4 2002年7月,ARB正式发布OpenGL 1.4,它也只加入了深度纹理/阴影纹理、顶点设计框架、自动纹理贴图等简单的功能。 1.3 opengl1.5 2003年的7月,ARB公布OpenGL 1.5规范。OpenGL 1.5内包含ARB制定的“正式扩展规格绘制语言”(OpenGL Shading Language v1.0),该语言用于着色对象、顶点着色、片断着色等扩展功能,同时也将作为下一代OpenGL 2.0版本的内核。OpenGL 1.5的变化还增加了顶点缓冲对象(可提高透视性能)、非乘方纹理(可提高纹理内存的使用效率

PaddlePaddle 核心架构深入解读

南楼画角 提交于 2020-02-28 16:30:51
个人博客导航页(点击 右侧 链接 即可打开个人博客): 大牛带你入门技术栈 PaddlePaddle(中文名:飞桨,PArallel Distributed Deep LEarning 并行分布式深度学习)是一个深度学习平台,具有易用、高效、灵活和可伸缩等特点,它是中国第一个开源深度学习开发框架。 飞桨框架的核心技术,主要包括前端语言、组网编程范式、核心架构、算子库以及高效率计算核心五部分。下边分别分析这几部分。 核心架构 飞桨核心架构采用分层设计,如下图所示,前端应用层考虑灵活性,采用Python实现,包括了组网 API、IO API、OptimizerAPI和执行 API等完备的开发接口;框架底层充分考虑性能,采用C++来实现。 框架内核部分,主要包含执行器、存储管理和中间表达优化;内部表示方面,包含网络表示(ProgramDesc)、数据表示(Variable)和计算表示(Operator)几个层面。框架向下对接各种芯片架构,可以支持深度学习模型在不同异构设备上的高效运行。 前端语言 为了方便用户使用,飞桨选择Python作为模型开发和执行调用的主要前端语言,并提供了丰富的编程接口API。Python作为一种解释型编程语言,代码修改不需要重新编译就可以直接运行,使用和调试非常方便,并且拥有丰富的第三方库和语法糖,拥有众多的用户群体。 同时为了保证框架的执行效率

电脑选购指南

人走茶凉 提交于 2020-02-27 14:20:18
电脑主要硬件配置就是CPU、显卡、内存、硬盘、屏幕等,其中CPU和显卡是本文的讲解重点。 CPU 现在我们能买到的主流CPU基本上都是英特尔和超威半导体的。也就是我们常说的Intel和AMD。 对于个人消费领域,AMD最常见的是锐龙、AMD FX、APU、速龙和闪龙系列,一般认为他们的性能依次减弱,锐龙最强,随后分别是AMD FX、APU和速龙,闪龙最弱。 由于市场大环境下,Intel在笔记本市场占据着绝对老大的位置,所以本文以Intel CPU做以详细讲解,也是为了更多想学习的朋友先了解下最主流的配置,并无黑AMD的意思,请A粉理解。 目前Intel CPU 酷睿系列的命名规则如下,也是目前笔记本最常见的CPU品牌。 在性能能上,同等代数的情况下i7>i5>i3,例如都是同样的八代CPU,i7-8700>i5-8600>i3-8100,这是因为Intel公司在规划设计上的定位,把i7作为高端,i5作为主流,i3作为入门。 在性能上,同系列产品,代数越高一般性能越强,例如同样都是酷睿i5,i5-7600>i5-6600,这是因为每一代使用的构架(可以理解为科技含量)不同,当然工艺也会有所差异,简单说代数越大即越新,使用的构架是当前最先进的构架,所以代数越大性能越强,当然也是会有特殊情况的有的上一代的高端产品,会比本代的入门产品要强点的,俗话说的好“瘦死骆驼比马大”比如i5-6600