生产者—消费者的Linux多线程实现

时间:2022-05-20 05:36:26

生产者—消费者的Linux多线程实现

摘要: 生产者-消费者问题是经典的进程同步互斥问题。本文详尽阐述了Linux下利用互斥锁、条件变量、线程管理等相关函数实现多线程生产者-消费者问题,以提高资源利用率。

Abstract: Producer-consumer problem is a classic process synchronization and exclusion problem. This paper elaborates the implementation of multi-threaded producer-consumer problem under Linux by using mutexes, condition variables, thread management and other functions, in order to improve resource utilization.

关键词: 线程;互斥锁;条件变量

Key words: thread;mutex;conditions variable

中图分类号:TP39 文献标识码:A 文章编号:1006-4311(2012)30-0221-02

1 线程基本概念

1.1 进程和线程 可执行文件由指令和数据组成。进程就是在计算机上运行的可执行文件针对特定的输入数据的一个实例,同一个可执行程序文件如果操作不同的输入数据就是两个不同的进程。

线程是进程的一条执行路径,它包含独立的堆栈和CPU寄存器状态,每个线程共享其所附属的进程的所有的资源,包括打开的文件、页表(因此也就共享整个用户态地址空间)、信号标识及动态分配的内存等等。

Linux中线程调度是由内核调度程序完成的,每个线程有自己的ID号。与进程相比,它们消耗的系统资源较少、创建较快、相互间的通信也比较容易。存在于同一进程中的线程会共享一些信息。同时作为一个独立的线程,它们又拥有一些区别于其他线程的信息,包括线程ID、寄存器集合(如程序计数器和堆栈指针)、堆栈、错误号、信号掩码以及线程优先权。

线程和进程的关系是:线程是属于进程的,线程运行在进程空间内,同一进程所产生的线程共享同一物理内存空间,当进程退出时该进程所产生的线程都会被强制退出并清除。

1.2 线程优点

①它是一种非常“节俭”的多任务操作方式。运行于一个进程中的多个线程,使用的是同一个地址空间,共享大部分数据,不需要太多的空间启动一个线程,而且,线程间彼此切换所需的时间也比较短。②线程间方便的通信机制。由于同一进程下的线程之间共享数据空间,所以一个线程的数据可以直接为其它线程所用,这不仅快捷,而且方便。③使多CPU系统更加有效。操作系统会保证当线程数不大于CPU数目时,不同的线程运行于不同的CPU 上。④改善程序结构。一个既长又复杂的进程可以考虑分为多个线程,成为几个独立或半独立的运行部分,便于理解和修改。

2 生产者-消费者问题

2.1 问题概述 生产/消费者在有界缓冲上操作,它利用N个字节的共享内存作为有界循环缓冲区,生产者线程不断顺序地将0到1000的数字写入共享的循环缓冲区,同时消费者线程不断地从共享的循环缓冲区读取数据。利用写一个数据模拟放一个产品,利用读一个数据模拟消费一个产品。当缓冲区空时消费者应阻塞睡眠,而当缓冲区满时生产者应当阻塞睡眠。一旦缓冲区中有空单元,生产者线程就向空单元中写入数据。一旦缓冲区中有未读过的数据,消费者线程就从该单元中读出数据。

2.2 算法分析 生产者线程向循环缓冲区中写入数据,消费者线程从缓冲区中读取数据,生产者线程向缓冲区中写入数据时消费者线程不能访问缓冲区,消费者线程从缓冲区中读取数据时生产者线程也不能访问缓冲区,既读的时候不能写,写的时候不能读,得保证缓冲区这一临界资源同一时间只能被一个线程访问;缓冲区满的时候不能生产,空的时候不能消费。

2.2.1 主程序:初始化结构体prodcons中的各个参数;建立生产者、消费者线程;等待线程结束。

2.2.2 生产者线程:①设初始写入的数据N为0;判断N小于1000是否成立;如果不成立,循环缓冲区插入 OVER;如果成立,向循环缓冲区生产既写入N并打印;重复该过程直到N=1000为止。②生产产品的函数put:获得互斥锁;判断循环缓冲池是否满,如果满将生产者线程阻塞到满的条件变量b->notfull上,并将互斥锁释放,让消费者线程读取数据。如果不满,向缓冲中写入数据;如果有线程阻塞到环境变量b->empty,将该线程唤醒,同时释放互斥锁。如果没有线程阻塞到条件变量b->empty上,就直接释放互斥锁。

2.2.3 消费者线程:①从循环缓冲区中消费既读取数据并打印;判断读取的数据是否是结束标志over,如果是退出。如果不是,重复该过程,直到读到的数据是结束标志over。②消费产品的函数get:获得互斥锁;判断循环缓冲池是否空,如果空将生产者线程阻塞到空的条件变量b->empty上,并将互斥锁释放,让生产者线程写数据。如果不空,从缓冲中读取数据;如果有线程阻塞到环境变量b->notfull上,将该线程唤醒,同时释放互斥锁。如果没有线程阻塞到条件变量b->notfull上,就直接释放互斥锁。

2.3 数据结构

struct prodcons {

int buffer[BUFFER_SIZE]; /* the actual data */

pthread_mutex_t lock; /* mutex ensuring exclusive access to buffer */

int readpos, writepos; /* positions for reading and writing */

pthread_cond_t notempty; /* signaled when buffer is not empty */

pthread_cond_t notfull; /* signaled when buffer is not full */

};

缓冲区采用循环缓冲区。缓冲区满的条件(b->writepos + 1) % BUFFER_SIZE == b->readpos。缓冲区空的条件b->writepos == b->readpos。

2.4 相关函数调用

2.4.1 线程函数

①创建线程函数:原型: int pthread_create (pthread_t * thread, const pthread_attr_t * attr,void * ( * start) (void * ), void * arg);

生产者-消费者问题中创建的线程:

创建producer线程:pthread_create(&th_a, NULL, producer, 0);

创建consumer线程:pthread_create(&th_b, NULL, consumer, 0);

Pthread_create函数中第一个参数为指向线程标识符的指针,第二个参数用来设置线程属性,两个线程该参数均为NULL,为系统配置的默认属性;第三个参数是线程运行函数的起始地址,最后一个参数是运行函数的参数。当创建线程成功时,函数返回 0。

②等待线程结束函数 原型:extern int pthread_join (pthread_t __th, void * * __thread_return);

第一个参数为被等待的线程标识符,第二个参数为一个用户定义的指针,它可以用来存储被等待线程的返回值。

生产者-消费者问题中等待结束的线程:

pthread_join(th_a, &retval); pthread_join(th_b, &retval);

③终止线程 原型:extern void pthread_exit (void * status);函数参数 status 是指向线程返回值得指针。

2.4.2 互斥锁函数 一个进程中的多个线程是共享同一段资源的,由于线程对资源的竞争引出了锁。互斥锁用来保证一段时间内只有一个线程在执行一段代码。其中mutex是一种简单的加锁方法,这个互斥锁只有两种状态,那就是上锁和解锁。在某一时刻,只能有一个线程取得这个互斥上的锁,拥有上锁状态的线程可以对共享资源进行操作,而其他线程在该线程未解锁之前,会被挂起,直到上锁的线程解开锁。

互斥锁初始化函数:

int pthread_mutex_init (pthread_mutex_t* mutex,

const pthread_mutexattr_t* mutexattr);

第一个参数为指向互斥锁的指针,第二个参数为锁的属性,该问题中设为NULL,为默认分配的属性。

互斥锁上锁函数:

int pthread_mutex_lock(pthread_mutex_t* mutex);

pthread_mutex_lock声明开始用互斥锁上锁,此后的代码直至调用pthread_mutex_unlock为止,均被上锁,即同一时间只能被一个线程调用执行。

条件变量:关于互斥锁的一个很显然的不足之处就是它仅存在两种状态:即锁定和非锁定。实际上它的这一缺点是可以根据条件变量通过允许线程阻塞和等待另一个线程发送信号的方法来改善的,条件变量经常与互斥锁同时使用。

①条件变量初始化函数。原型:

int pthread_cond_init (pthread_cond_t * cond, const pthread_condattr_t * cond_attr);

第1个函数参数表示要初始化的条件变量对象,第2个参数是条件变量的属性。生产者-消费者问题中用到两个条件变量b->notempty和b->notfull。其中b->notempty是缓冲区满的时候阻塞生产者线程的条件变量,b->notfull是缓冲区空的时候阻塞消费者线程的条件变量。两个条件变量均应初始化。

②线程阻塞函数。原型:

extern int pthread_cond_wait (pthread_cond_t * cond,pthread_mutex_t * mutex);

第 1 个参数就是要等待的条件变量,第 2 个参数则是解锁的对象。

生产者-消费者中用到的线程阻塞函数:

pthread_cond_wait(&b->notfull, &b->lock);既生产者线程因为循环缓冲区满将自己阻塞到条件变量b->notfull上,同时释放锁&b->lock,让消费者线程去执行。

pthread_cond_wait(&b->notempty, &b->lock);既消费者线程因为循环缓冲区空将自己阻塞到条件变量b->notempty上,同时释放锁&b->lock,让生产者线程去生产。

③线程唤醒函数:原型:

extern int pthread_cond_signal (pthread_cond_t * cond);

如果没有线程阻塞到该条件变量上,此调用相当于空语句,否则用来释放被阻塞在条件变量 cond 上的一个线程。

生产者-消费者中用到的线程唤醒函数

pthread_cond_signal(&b->notfull);既唤醒阻塞到条件变量b->notfull上的线程,让消费者线程继续执行。

pthread_cond_signal(&b->notempty);既唤醒阻塞到条件变量b->notempty上的线程,让生产者线程继续执行。

参考文献:

[1]余有明著.Linux技术与程序设计.北京航天航空大学出版社.

[2]吴岳著.Linux C程序设计大全.清华大学出版社.

[3]文全刚著.嵌入式Linux操作系统原理与应用.北京航天航空大学出版社.

上一篇:学写演讲稿 下一篇:高中英语自主学习能力的培养方法及步骤