首页 > 解决方案 > 读取文件的线程安全

问题描述

所以我的最终目标是允许多个线程从头到尾读取同一个文件。例如,如果文件是 200 字节:

Thread A  0-> 200 bytes
Thread B  0-> 200 bytes
Thread C  0-> 200 bytes

等等

基本上让每个线程读取整个文件。该软件仅读取该文件,不写入。

所以我打开文件:

fd = open(filename, O_RDWR|O_SYNC, 0);

然后在每个线程中简单地循环文件。因为我只创建了一个文件描述符,所以也在每个线程中使用 dup 创建了一个文件描述符的克隆

这是线程函数的最小示例:

void ThreadFunction(){
 int file_desc= dup(fd);
 uint32_t nReadBuffer[1000];
 int numBytes = -1;
 while (numBytes != 0) {
  numBytes = read(file_desc, &nReadBuffer, sizeof(nReadBuffer));
  //processing on the bytes goes here
 }
}

但是,我不确定这是否正确循环遍历整个文件,并且每个线程都以某种方式通过文件进行菊花链。

这种方法正确吗?我为我正在处理的项目继承了这个软件,文件描述符在 mmap 调用中使用,所以我不完全确定 O_RDWR 或 O_SYNC 问题

标签: clinuxmultithreadingmemoryio

解决方案


正如其他人所提到的,这里不可能使用重复的文件描述符。但是,有一个线程安全的替代方案,即使用pread. pread以偏移量读取文件,并且不会更改文件描述中的隐式偏移量。

这确实意味着您必须手动管理每个线程中的偏移量,但这对您提议的函数来说应该不是太大的问题。


推荐阅读