处理器技术

深度学习的异构加速技术(一):AI 需要一个多大的“心脏”?

元气小坏坏 提交于 2020-04-06 19:31:50
欢迎大家前往 腾讯云社区 ,获取更多腾讯海量技术实践干货哦~ 作者:kevinxiaoyu,高级研究员,隶属腾讯TEG-架构平台部,主要研究方向为深度学习异构计算与硬件加速、FPGA云、高速视觉感知等方向的构架设计和优化。“深度学习的异构加速技术”系列共有三篇文章,主要在技术层面,对学术界和工业界异构加速的构架演进进行分析。 一、概述:通用=低效 作为通用处理器,CPU (Central Processing Unit) 是计算机中不可或缺的计算核心,结合指令集,完成日常工作中多种多样的计算和处理任务。然而近年来,CPU在计算平台领域一统天下的步伐走的并不顺利,可归因于两个方面,即自身约束和需求转移。 (1)自身约束又包含两方面,即半导体工艺,和存储带宽瓶颈。 一方面,当半导体的工艺制程走到7nm后,已逼近物理极限,摩尔定律逐渐失效,导致CPU不再能像以前一样享受工艺提升带来的红利:通过更高的工艺,在相同面积下,增加更多的计算资源来提升性能,并保持功耗不变。为了追求更高的性能,更低的功耗,来适应计算密集型的发展趋势,更多的设计通过降低通用性,来提升针对某一(或某一类)任务的性能,如GPU和定制ASIC。 另一方面,CPU内核的计算过程需要大量数据,而片外DDR不仅带宽有限,还具有较长的访问延迟。片上缓存可以一定程度上缓解这一问题,但容量极为有限。Intel通过数据预读、乱序执行

【VMware虚拟化解决方案】配置和部署VMware ESXi5.5

江枫思渺然 提交于 2020-03-28 16:42:25
【VMware虚拟化解决方案】配置和部署VMware ESXi5.5 时间 2014-04-08 10:31:52 让"云"无处不在的博客 原文 http://mabofeng.blog.51cto.com/2661587/1392018 马博峰 在安装ESXi5.5之前,需要对要对整个环境进行设计和规划,由于虚拟化涉及服务器技术、网络技术和存储技术等多项技术,所以虚拟化的架构设计涵盖了CPU的选型、网络的设计、共享存储的方式、虚拟化资源的需求和安装ESXI的模式等知识。一个好的VMware vSphere安装设计方案决定着最终虚拟化的效果。 1、CPU的选型 无论是采用X86服务器,还是采用机架式、塔式或者刀片式服务器,CPU的选择是至关重要的。现在市场上主流的CPU是Intel公司和AMD公司产品,这两家公司的CPU对虚拟化都有很好的支持,具体选择哪家的产品,我们需要根据实际情况而定。 一般安装ESXi需要一个 64 位的CPU,而具体选择哪一款CPU还需要考虑许多其他的因素,其中最重要的一点就是虚拟化技术选项,具体来说就是是选择Intel 虚拟化技术 (Intel VT) 的CPU还是选择 AMD 虚拟化 (AMD-V) 技术的CPU。这时有的读者可能会奇怪了,为什么只能选择这两种技术的CPU呢?其实原因很简单,因为只有具有这两种技术的CPU才提供虚拟化功能

嵌入式处理器的技术标准

北战南征 提交于 2020-03-24 16:57:12
嵌入式处理器的技术标准 ①功能 取决于这个处理器所集成的存储器的数量、外部设备的结构(外设的种类) ②字长 位数决定了寄存器、运算器和数据总线的位数、处理器的字长越长,可以包含的信息就越多,能表示数值的有效位就越多,计算精确度也越高,通常处理器有4 8 16 32 64 位等不同的字长 ③处理速度 采用单位时间内运算整数的指令平均执行的条数。单位DMIPS 百万条指令每秒 1.25DMIPS ④工作温度 常见处理器温度级别有,民用,工业用,军用,航天用几个温度级别 ⑤功耗 ⑥寻址能力 寻址能力主要取决于处理器地址线的数目,地址线越多寻址能力越 强 ⑦稳定性 MTBF(平均失效间隔时间) 在相当长的运行时间中,机器工作时间/运行期间故障的次数,它是一个统计值,用来表示嵌入式系统的可靠性,MTBF的值越大,越可靠。 来源: 51CTO 作者: qq59a65ffb52e85 链接: https://blog.51cto.com/13258379/2480182

移动终端处理器构成和基带芯片概述

醉酒当歌 提交于 2020-01-13 20:59:15
(一)移动终端发展 一部手机要实现最主要的功能—打电话发短信,这个手机就要包含下面几个部分:射频部分、基带部分、电源管理、外设、软件等。回想一下移动手机的发展史: 1,功能手机(Feature Phone):仅仅用基带芯片。仅仅能用来打电话、发短信。 2,多媒体手机:使用基带芯片+协处理器加速单元。在功能机的基础上,添加了多媒体功能(如视频、音乐)。MTK就是在多媒体手机时代崛起的。当然要归功于广大”山寨机“。MTK基带芯片中除了CPU以外,还集成了非常多外设控制器。Feature Phone的功能,基本上取决于基带芯片所支持的外设功能。 3。智能手机:採用应用处理器AP+基带处理器CP。AP可看做传统计算机。CP可看做无线modem。 AP、CP间的接口技术有SPI、UART、USB、SDIO、shareMemory等等。AP、CP间的通信可通过传统AT命令、MBIM等进行,完毕通话、短消息、移动上网等功能。 功能手机和智能手机的差别在于:功能机相当于不断添加应用功能的无线通信终端。无操作系统;而智能机相当于添加了无线通信功能的掌上电脑,其软件体系类似于PC软件体系--操作系统+应用软件的组合。智能手机的两大最广的操作系统是Android和IOS系统。 智能机中还会有专门用于图像处理的GPU。且GPU功能会越来越发达,如此我们才干在智能机上看高清电影、玩高画质游戏。

(概念)多个CPU和多核CPU以及超线程(Hyper-Threading)

丶灬走出姿态 提交于 2020-01-10 12:49:16
引言 在这篇文章中我会主要介绍CPU相关的一些重要概念和技术。如果你想更好地了解操作系统,那就从本文开始吧。 中央处理器(Central processing unit) 在我们了解其它概念之前,我们应该首先了解一下什么是CPU,它是做什么的,它的主要组件以及相应的作用都是什么? 简单点说,CPU其实就是计算机内部的一个电子电路。根据一些具体的指令它可以执行基本的运算,逻辑,控制和IO操作等。CPU的主要组件包括: 算术逻辑单元(ALU is short for ‘arithmetic logic unit’),它主要执行一些算术和逻辑操作 处理器寄存器(processor registers),它主要的作用是给ALU提供操作数并存储ALU操作的结果 控制器(control unit),通过协调ALU,寄存器和其它组件之间的操作,从主存中取得并执行相应的指令。 当今大多数地CPU都是微处理器,即它们被包含在单个集成电路芯片(integrated circuit chip)中。一个包含CPU的集成电路可能也包含内存,外围接口和其它的一些计算机组件。这样的集成设备叫做微控制器(microcontrollers)或者芯片上的系统(SoC)。一些计算机采用多核处理器,即单个芯片中包含2个或更多的CPU(也被叫做“cores”); 在这种情况下,单个芯片有时也被称作”sockets”.

计算机系统硬件有哪些重要的部件呢?

元气小坏坏 提交于 2020-01-09 23:55:58
在计算机系统中,中央 处理器 能直接访问的唯一的存储空间是内存储器 。任何程序和数据必须被装入内存储器之后,中央处理器才能对它们进行操作,因而一个作业必须把它的程序和数据存储在内存储器中才能运行,而且 操作系统 本身也要存储在内存储器中并运行。 如果是多道程序系统,就会有若干个程序和相关的数据要存储在内存储器中。操作系统要管理、保护这些程序和数据,使它们不至于受到破坏,不会互相影响和出现冲突。内存储器以及与存储器管理有关的硬件机构是支持操作系统运行的硬件环境的一个重要方面。 此外,IO系统和时钟部件也是计算机硬件的重要组成部分,为计算机用户交互及计算机时间系统提供基础 本节介绍与操作系统密切相关的计算机硬件部件的知识,具体见以下内容。 一、存储系统 1、存储器的类型 (1)类型 在微型计算机中使用的半导体存储器有若干种不同的类型,但基本上可划分为两类: 一种是读写型的存储器,另一种是只读型的存储器 。 所谓读写型的存储器,是指可以把数据存入其中任一地址单元,并且可在以后的任何时候把数据读出来,或者重新存入新的数据的一种存储器 。这种类型的存储器常被称为 随机访问存储器( Random Access Memory,RAM) 。RAM主要用作存储随机存取的程序的数据。 另一种是 只读型的存储器,只能从其中读取数据,但不能随意地用普通的方法向其中写入数据

电脑的32位与64位是指的什么

无人久伴 提交于 2019-12-27 05:49:46
64 位势不可挡 从某种意义上讲,处理器的发展直接影响着整个IT行业的发展水平,电脑核心从16位到32的转变对IT行业产生的巨大影响就是一个强有力证明。从386、486直到奔腾系列的CPU都是32位,大多数情况32位计算已经能满足现阶段人们的需要。然而随着互联网等技术的发展,对内存的需求越来越大,比如大型服务器,每秒钟处理的数据量就超过2GB,32位就难以满足需求了。 32位的风云十年 在信息技术领域,“位数”是衡量计算机性能的重要标准之一。位数在很大程度上决定着计算机的内存最大容量、文件的最大长度、数据在计算机内部的传输速度、处理速度和精度等性能指标。在近十年的时间里,X86-32位平台由于其性价比高,获得广泛应用。 按照以前的习惯,我们把基于80X86的CPU架构称作X86结构,这是Intel公司在1978年发布其第一块16位的CPU(5MHz 8086)时开发的,1981年IBM推出的第一台PC中使用的也是X86指令,同时电脑中为提高浮点数据处理能力而加的X87芯片系列数学协处理器则使用X87指令,后来将X86指令集和X87指令集统称为X86指令集。为了保证计算机能够继续运行以往开发的各类应用程序以保护和继续软件资源,后续的CPU(包括大多数第三方处理器厂商)继续使用X86指令集,采用这种指令集的CPU系统被称作X86架构。 64位异军突起

CPU 的18条

孤街浪徒 提交于 2019-12-26 05:02:37
1.主频 主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度,这不仅是个片面的,而且对于 服务 器来讲,这个认识也出现了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系,即使是两大处理器厂家Intel和AMD,在这点上也存在着很大的争议,我们从Intel的产品的发展趋势,可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有人曾经拿过一快1G的全美达来做比较,它的运行效率相当于2G的Intel处理器。 所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中,我们也可以看到这样的例子:1 GHz Itanium芯片能够表现得差不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线的各方面的性能指标。 当然,主频和实际的运算速度是有关的,只能说主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。 2.外频 外频是CPU的基准频率,单位也是MHz。CPU的外频决定着整块主板的运行速度。说白了,在台式机中,我们所说的超频,都是超CPU的外频(当然一般情况下

路由器开发

最后都变了- 提交于 2019-12-18 01:28:01
宽 带上网已经不是什么新鲜事情,人们对相关的网络器件已经不再陌生,比如说常见的路由器。对于一般的网络用户,他们能知道怎样使用路由器来上网、玩游戏等就 已经感到很满足了,通常情况下对路由器的深层技术很少去过问研究,但做为兴趣广泛的技术爱好者,对这方面的知识是非常感兴趣的。但限于各种条件的制约,这 些爱好者都非开发者,很大程度上无法深入了解真正的技术实现过程以及相关的核心内幕。正是基于此点,笔者凭借自身的知识沉淀,尽最大努力为爱好技术的读者 架设一坐能通向深层核心的桥梁,为大家揭开路由器的神秘面纱,剖开其核心内脏。为使读者能清晰明白的理解掌握,笔者尽量将专业的技术内容转化为容易接受的 知识讲解,其中可能有不足偏颇之处,还请大家多见谅。 概述 什么是路由器? 互联网是依靠路由器连接起来的,路由器是互联网或者说IP网络的核心设备。宽带接入的不断增长,带动了路由器的需求不断增加。 路由器究竟是什么样的技术产物? 谈到路由器的开发,我们就不免要谈到“嵌入式”设备的开发,没错,通俗的说,路由器就是一种嵌入式产品。那么究竟什么是嵌入式设备呢?    其实就目前而言,嵌入式设备已经不断深入我们的日常生活方方面面。通俗的讲,嵌入式设备是指具有计算机功能,但又不称为计算机的设备或器材,它几乎包括 了我们周围的所有电器设备 PDA、手机、机顶盒、汽车、微波炉、电梯、安全系统、自动售货机、医疗仪器、立体音响

操作系统详解

时光毁灭记忆、已成空白 提交于 2019-11-28 03:28:29
目录 一 为什么要有操作系统 二 什么是操作系统 三 操作系统与普通软件的区别 四 操作系统发展史 五、操作系统原理 1. 操作系统的资源管理技术 2. 系统调用 3. 操作系统内核 4. 处理器状态: 内核态和用户态 5. 中断(Interupt) 6. 进程 7. 处理器调度 8. 进程的交互 9. 临界区管理 10. 信号量(samaphore)和PV操作 11. 管程 12. 死锁 13. 可变分区存储管理 14. 分页存储管理 15. 分段存储管理 16. 虚拟存储管理 17. 请求段页式虚拟内存管理 18. I/O硬件原理:I/O控制方式 19. I/O软件原理 20. 缓冲技术 21. 驱动调度技术 22. 设备独立性 23. 虚拟设备 24. 文件逻辑结构 25. 文件物理结构 二、Q&A 1. 什么是操作系统?操作系统在计算机系统中的主要作用是什么? 2. 什么是多道程序设计?多道程序设计有什么特点? 3. 计算机操作系统为什么引入进程? 4. 在分时系统中,什么是响应时间?它与哪些因素有关? 5. 解释并发性与并行性 6. 试述存储管理的基本功能。 7. 何谓地址转换(重定向)?哪些方法可以实现地址转换? 8. 什么是文件的共享?介绍文件共享的分类和实现思想。 一 为什么要有操作系统 ( 两本书:现代操作系统、操作系统原理,学好python以后再去研究吧~~)