NJU OS Parallel Programming
南京大学操作系统(parallel)
program from state machine perspective
状态机
状态被表示为寄存器保存的值,状态迁移表示寄存器值的变化
宏定义的trick
宏经常写成函数调用的形式,比如
1 |
假设A是一个宏形参,则#A
是替换为字符串A的形参名,称为字符串化,比如
1 |
|
##
相当于字符串拼接
1 |
|
From program perspective(C source code)
- 状态=heap+stack,执行(函数调用,高级语言)会修改状态
- 函数调用=申请新的stack frame,设置新PC
for binary executive file
- 状态=内存(M)+寄存器(R)
- 程序执行=修改内存/寄存器值 $(M,R)\to (M^\prime,R^\prime)$
- 状态转移是否是确定的?(随机指令)
- 如何实现停机
- 特殊指令:syscall,控制权交给OS,无条件修改状态机(读写文件,访问硬件)
Parallel Programming State Machine Model
多个执行流
- 维护各自的独立栈帧(context),保证子状态机之间不可见
- 共享内存
每个状态并发系统选择一个执行流执行
API thread.h
create(fn)
创建入口为fn的线程,fn是参数为int,返回值为void的函数指针- 更新调用线程栈帧
- 创建新栈帧
join()
让调用线程等价其它线程结束,如果存在没有结束的线程,调用线程不会提前终止(状态循环)
线程共享全局数据,拥有独立的栈区
并发线程操作共享变量导致结果错误
原子性
- thread-safefy的库函数实现,用
lock-unlock
原语解决并发保护 - 编译器基于单线程优化(eventual consistency)
例如存在一个变量x的写入序列
随后读取x,可以将前两个写入优化
可见性
重复行必须是连续的重复行必须是连续的重复行必须是连续的复行必须是连续的**,需要用sort将其排序
一个线程中对共享变量的操作对另一个并行线程是否可见?
- 内存屏障,保证屏障前的所有内存操作对于屏障后的指令均可见
- 发射发射发射发射发射发射**多条指令
- 指令之间执行并非可见
- 指令commit到局部存储,再经过任意时间写入memory
- 真正真正真正*执行
例子
1 | // thread 1 |
初始值x = y = 0
,最终可能的内存状态包括
y_ = 1,x_ = 1
y_ =1,x_ = 0
y_ = 0,x_ = 1
并未写入内存并未写入内存并未写入内存并未写入内存并未写入内存*而是写在了单个core的局部缓存中
理解并发程序执行
互斥算法
保证两个线程不能同时执行一段代码
能否设置indicator变量locked?
比如
1 | bool tag; |
不能保证比较-上锁的原子性
Peterson算法(互斥协议)
- 共享内存,共享变量x
store(x,v)
写共享内存,load(x)
加载共享变量值
preliminary:两个竞争者A,B,在共享内存中分别拥有bool变量a,b,为竞争代码段设置一个indicator x,当A/B希望进入竞争段,首先执行
- 将自身的indicator variable $a/b$设置为
true
- 向代码段的indicator x写入B/A
随后进行规则检查(此时共享代码段的indicator已经被写入),判断
- 对方的indicator variable
b/a
是否为true - 不为为**$A/B$
等待等待等待*,否则进入代码段
线程load一个变量所获得的变量状态本质上是过去某个时间点写入的结果,但是不能保证load之后到上锁的一段时间内锁的状态被改变
写入共享变量x保证:同时改变自身访问状态的两个线程,先写入x的进程进入线程
私有的共享变量变量**保证了每个进程拥有自身的状态
Example
A先进入临界区,在此之前设置a=true,X=B
,此时B希望进入临界区,设置b= true,X = A
,判断
- $a =true$
- $X \neq B$
不能进入临界区,等待
若A/B同时准备进入临界区,则$a = b = true$,两个进程同时写X,结果是
哪个进程先写入X,哪个进程得以进入临界区
真实到X中load真实到X中loadd**,否则仍然会导致同时进入临界区,即需要保证每个写操作真正写内存,需要设置它的值是volatile
正确性
A进入临界区必须至少满足一个条件
- $b=false$,则B已经从临界区退出
- $X = A$,则B后写共享变量X,先写入者进入临界区
原子变量保证所有进程对于某一变量在同一时刻的视图都是相同,一个Peterson算法的例子
1 | volatile atomic<bool> indicatora(false),indicatorb(false); |
状态用五元组表示(indicatora,indicatorb,shared,PC1,PC2)
,初始状态
选择a执行一步,得到
选择b执行一步,得到
shared变量和indicator赋值顺序能否交换?处理器乱序?
yield保存函数状态机
yield返回值同时保存函数状态机,下次调用恢复状态机,继续执行直到遇到下一个yield