目录

  • 1 Computer Architecture Course Overview
    • 1.1 Basic Information
    • 1.2 Computer Architecture  Overview
    • 1.3 Learning Resource
  • 2 Basic Concepts of Computer Architecture
    • 2.1 Preview Contents
    • 2.2 计算机系统设计的内容
    • 2.3 定量分析技术
      • 2.3.1 加快经常性事件
      • 2.3.2 Amdahl定律
      • 2.3.3 CPU性能公式
      • 2.3.4 程序局部性原理
    • 2.4 计算机系统的性能评价
    • 2.5 对冯·诺依曼结构的改进
    • 2.6 提高并行性的技术途径
    • 2.7 Test
  • 3 Instruction system architecture
    • 3.1 Preview Contents
    • 3.2 Instruction system structure classification
    • 3.3 Addressing mode
    • 3.4 Functional design of instruction system
    • 3.5 Operand type and size
    • 3.6 Design of instruction format
    • 3.7 MIPS instruction set structure
    • 3.8 Test
  • 4 Pipeline Technology
    • 4.1 Preview Contents
    • 4.2 Basic concepts of pipeline
    • 4.3 Pipeline classification
    • 4.4 Pipeline performance index(1)
    • 4.5 Pipeline performance index(2)
    • 4.6 Nonlinear pipeline scheduling
    • 4.7 Pipeline hazards
    • 4.8 Test(1)
    • 4.9 Pipeline collision(1)
    • 4.10 Pipeline collision(2)
    • 4.11 Pipeline implementation(1,2)
    • 4.12 Test(2)
  • 5 Vector processors
    • 5.1 向量处理方式
    • 5.2 向量处理机的结构
    • 5.3 提高向量处理机性能的主要技术
    • 5.4 向量处理机性能评价
    • 5.5 向量处理机实例
    • 5.6 Test
  • 6 指令级并行(ILP)及开发-硬件方法
    • 6.1 指令级并行的概念
    • 6.2 指令的动态调度
    • 6.3 动态分支预测技术
    • 6.4 多指令流出技术
    • 6.5 Test
  • 7 Storage system
    • 7.1 Preview Contents
    • 7.2 Storage system hierarchy
    • 7.3 Cache基本知识(1)
    • 7.4 Cache基本知识(2)
    • 7.5 Cache基本知识(3)
    • 7.6 Cache性能分析
    • 7.7 Test(1)
    • 7.8 降低Cache不命中率(1)
    • 7.9 降低Cache不命中率(2)
    • 7.10 减少Cache不命中开销
    • 7.11 Test(2)
    • 7.12 减少命中时间
    • 7.13 并行主存系统
    • 7.14 虚拟存储器
    • 7.15 Test(3)
  • 8 Input/output system
    • 8.1 Preview Contents
    • 8.2 Basic concepts of I / O system
    • 8.3 RAID
    • 8.4 Bus
    • 8.5 Test(1)
    • 8.6 Channel processor
    • 8.7 I/O and OS
    • 8.8 Test(2)
  • 9 互连网络
    • 9.1 Preview Contents
    • 9.2 互连网络的基本概念
    • 9.3 互连网络的结构参数与性能指标
    • 9.4 互连函数
    • 9.5 Test(1)
    • 9.6 静态互连网络
    • 9.7 动态互连网络
    • 9.8 消息传递机制
    • 9.9 Test(2)
  • 10 多处理机
    • 10.1 Preview Contents
    • 10.2 多处理机概念
    • 10.3 对称式共享存储器
    • 10.4 分布式共享存储器
    • 10.5 Test(1)
    • 10.6 同步
    • 10.7 同时多线程
    • 10.8 大规模并行处理机
    • 10.9 多处理机实例
    • 10.10 Test(2)
  • 11 Parallel Processing with Multi-core
    • 11.1 PRAM and Parallel Computing
    • 11.2 Test
    • 11.3 Part I: Introduction to Parallel Processing with Multi-core
    • 11.4 Part II: Introduction to Parallel Processing with Multi-core
    • 11.5 Part III: Introduction to Parallel Processing with Multi-core
    • 11.6 Part IV: Introduction to Parallel Processing with Multi-core
    • 11.7 Part V: Sorting
    • 11.8 Exercises
    • 11.9 Lab
    • 11.10 Quizzes
  • 12 计算机系统结构未来发展趋势
    • 12.1 计算机系统结构挑战及趋势
    • 12.2 后摩尔时代处理器芯片体系结构的变化
    • 12.3 计算机系统结构趋势-存储
    • 12.4 计算机系统结构课程总结
    • 12.5 部分习题
    • 12.6 Test
  • 13 课程实验
    • 13.1 实验平台说明
    • 13.2 实验一:MIPS指令系统和MIPS体系结构
    • 13.3 实验二:流水线及流水线中的冲突
    • 13.4 实验三:指令调度和延迟分支
    • 13.5 实验四:Cache性能分析
    • 13.6 实验五:Tomasulo算法
    • 13.7 实验六:再定序缓冲(ROB)工作原理
    • 13.8 实验七:多Cache一致性——监听协议
    • 13.9 实验八:多Cache一致性——目录协议
实验八:多Cache一致性——目录协议

A.8 实验八  多Cache一致性——目录协议

A.8.1 实验目的

1.      加深对多Cache一致性的理解。

2.    进一步掌握解决多Cache一致性的目录协议的基本思想。

3.     掌握在各种情况下,目录协议是如何工作的。能给出要进行什么样的操作以及状态的变化情况。

A.8.2实验平台

实验平台采用多Cache一致性目录协议模拟器

环境的建立:见A.0

A.8.3 实验内容及步骤

首先要掌握该模拟器的使用方法(见A.8.4节)。

1. 对于以下访问序列,写出目录协议所进行的操作。                                       

 

所进行的访问

 

 

目录协议所进行的操作

 

 

CPU A 读第6

 

 

CPU B读第6

 

 

CPU D 读第6

 

 

CPU B 写第6

 

 

CPU C 读第6

 

 

 CPU D写第20

 

 

CPUA写第20

 

 

CPU D写第6

 

 

CPU A 读第12

 

 2. 自己编写一个访问序列,写出目录协议所进行的操作。                                            

 

所进行的访问

 

 

是否发生替换

 

 

是否发生写回

 

 

目录协议所进行的操作

 








































 3. 根据上述结果,画出相关的状态转换图(仅画出与上表相关的部分)。 

A.8.4 目录协议模拟器使用方法

 该模拟器模拟4CPUABCD)访存的工作过程。每个CPU中都有一个Cache,该Cache包含4个块,其块地址为03。分布式存储器中有32个块,其块地址为031Cache中每个块的状态用色块来表示,其中灰色表示“无效”状态,淡青色表示“共享”,橘红色表示“独占”。主存中块的状态由其右边的目录项的颜色来表示,未缓冲状态由黄色来表示,其他两种状态同Cache块。

对于每个CPU,可以指定所要进行的访问是读还是写(从列表中选),并在输入框中输入所要访问的主存块号,然后用鼠标点击在其右边的标有↓的按钮,模拟器就将开始演示该访问的工作过程。
该模拟器的主菜单有4个:配置,操作,统计,帮助。 

1.      配置

该菜单用于进行配置参数的显示与设置。你可以修改动画播放速度:把游标往右边拖拽可提高播放速度,往左边拖拽可降低播放速度。你还可以选择是否进行优化传块。优化传块是指当要访问的块在某个Cache中,且处于独占状态时,可以不用等该块写回主存后再从主存调块,而是可以直接将该块传送给发出访问请求的结点。
本模拟器采用直接映象方法和写回法。 

2.      操作

可以通过该菜单中的选项来控制模拟器的执行。该菜单下有以下3个选项:单步执行、连续执行、复位。

(1)     单步执行

选用该方式后,敲任意键、点击鼠标或点击左上角的“步进”按钮,都会使模拟器前进一步。

(2)    连续执行

  选用该方式后,用鼠标点击标有↓的按钮,模拟器会连续演示一次访存的整个过程,直至该访问结束。

(3)    复位

使模拟器复位,回到初始状态。

3.      统计

该菜单用于显示模拟器的统计结果,包括各处理机的访问次数、命中次数、不命中次数以及命中率。 

4.      帮助

该菜单下有“关于”和“使用说明”两个选项。