音乐播放器
sola的小屋
 
文章 标签
20

Powered by Gridea | Theme: Fog
载入天数...
载入时分秒...
总访问量:  |   访问人数:

数字设计与计算机架构课程的第二讲笔记(1)

数字设计与计算机架构课程笔记

ETH Zürich 2023春季学期·第二讲:权衡、指标和设计心态


一、课程概述

1.1 课程目标

  • 核心目标
    • 理解数字设计与计算机架构的基础原理,包括组合逻辑、时序逻辑、处理器微架构等,掌握硬件与软件接口设计,如指令集架构ISA、汇编语言编程。
    • 评估设计中的权衡,如性能、能效、成本等,并学会系统性调试,鼓励创新设计,探索新型内存技术、数据流架构等。

1.2 课程内容

  • 模块划分
    • 基础设计:组合逻辑、时序逻辑、硬件描述语言(Verilog)。
    • 处理器架构:单周期/多周期/流水线微架构、乱序执行、超标量执行。
    • 存储技术:缓存层次、虚拟内存、多核缓存一致性。
    • 新兴范式:数据流架构、VLIW(超长指令字)、SIMD/GPU并行化。
    • 其他:计算机架构的现状、不同平台的设计目标和权衡、设计原则探讨。

二、核心概念与设计原则

2.1 权衡 (Tradeoffs)

  • 定义:在互相冲突的设计目标间进行优先级决策。
  • 关键权衡维度
    维度 示例
    性能 vs 能效 高频CPU提升性能但增加功耗,如Intel Alder Lake的混合核心设计。
    灵活性 vs 效率 CPU通用性强但能效低,ASIC专用性强但灵活性差,如Google TPU。
    成本 vs 可靠性 冗余设计提高可靠性但增加成本,如航天级处理器。

2.2 指标 (Metrics)

  • 性能指标:指令吞吐量(IPC)、时钟频率、延迟。
  • 能效指标:每瓦特性能(TOPS/W)、动态功耗。
  • 其他指标:面积(晶体管密度)、可扩展性(多核扩展效率)、用户体验(响应时间)。

2.3 设计原则 (Design Principles)

  • 原则 vs 先例
    • 基于原则的设计:从基础物理/数学规律出发,如CMOS电路优化。
    • 基于先例的设计:沿用历史方案,如x86指令集兼容性。
  • 跨领域启发
    • Santiago Calatrava(建筑师):材料最优利用,类比芯片面积优化。
    • Frank Lloyd Wright(建筑师):形式追随功能,如RISC指令集简化设计。

三、基础构建模块

3.1 晶体管与逻辑门

  • 晶体管类型
    • nMOS:低电平导通,用于下拉网络。
    • pMOS:高电平导通,用于上拉网络。
  • CMOS逻辑门
    • 结构:互补nMOS/pMOS组合,如NAND门由并联nMOS与串联pMOS构成。
    • 优势:静态功耗低、噪声容限高。

3.2 组合逻辑电路

  • 功能规范
    • 输入到输出的纯逻辑函数,无记忆功能。
    • 标准形式:SOP(积之和)与POS(和之积)。
  • 逻辑简化方法
    • 布尔代数:应用结合律、分配律等,如(A + A'B = A + B)。
    • Karnaugh图:通过相邻单元格合并最小项,如4变量K-map覆盖BCD增量函数。

3.3 组合逻辑构建块

模块 功能 应用示例
解码器 二进制输入到独热码输出 指令译码,如MIPS ISA。
多路选择器 从多路输入中选择一路输出 数据通路选择,如ALU输入。
可编程逻辑阵列 (PLA) 可配置SOP/POS逻辑实现 定制化ALU功能。

四、现代架构挑战与平台

4.1 计算机架构的现状

  • 面临挑战:数据密集型工作负载、新的(设备)技术、日益复杂的应用程序和系统。
  • 数据的重要性:数据在现代计算中起关键作用,数据移动对性能和能源效率影响显著,数据搬运能耗远高于计算。
  • 新颖概念:新的计算范式、新的加速器和系统、新的内存、存储系统、互连和设备。

4.2 数据驱动的设计

  • 数据移动瓶颈解决方案
    • 存内计算 (PIM):三星Function-in-Memory DRAM直接在内存中处理数据。
    • 近内存计算:UPMEM引擎将处理器嵌入DRAM芯片。

4.3 处理器平台对比

平台 优势 劣势 应用场景
CPU 通用性强、编程灵活 能效低 通用计算,如服务器。
GPU 高并行吞吐量 延迟敏感型任务性能差 图形渲染、AI训练。
FPGA 可重构硬件加速 开发复杂度高 原型验证、低延迟处理。
TPU 张量计算优化、能效高 专用性强 机器学习推理。

五、新兴技术与趋势

5.1 新兴内存技术

  • 存算一体技术
    • ReRAM/CBRAM:非易失性内存,支持存内计算,如IBM的模拟AI加速器。
  • 3D集成技术
    • 晶圆级堆叠。

5.2 新型计算范式

  • 数据流架构:按数据依赖关系动态调度指令,如Google的TPU v4。
  • 量子计算:超导量子位与纠错码(当前课程未深入涉及)。

总结:本讲系统阐述了数字设计的核心构建模块(晶体管、逻辑门、组合逻辑)、权衡与指标方法论,以及现代架构的挑战(数据移动、异构计算)。通过结合经典设计原则与新兴技术(如PIM),为后续处理器设计与优化奠定基础。