【Linux】从open到write:系统文件I/O 的奥秘与实战指南

打印 上一主题 下一主题

主题 829|帖子 829|积分 2487



  
1.经典回首C文件接口

在使用C语言时,我们需要访问文件通常会用到fopen、 fwrite、和fread还有fclose等函数。
1.2 fwrite

比如此时我需要往文件中写入一些信息:
  1. #include <stdio.h>
  2. #include <string.h>
  3. int main()
  4. {
  5.     FILE* fp = fopen("test.txt","w");
  6.     if(fp == NULL)
  7.     {
  8.         perror("fopen failed");
  9.         return 1;
  10.     }
  11.     const char* str = "i am yui~\n";
  12.     int len = strlen(str);
  13.     int num = 5;
  14.     while(num--)
  15.     {
  16.         fwrite(str,len,1,fp);
  17.     }
  18.     fclose(fp);
  19.     return 0;
  20. }
复制代码
执行结果:
  1. ubuntu@VM-20-9-ubuntu:~/FILETEST$ cat test.txt
  2. i am yui~
  3. i am yui~
  4. i am yui~
  5. i am yui~
  6. i am yui~
复制代码
1.2 fread

下面再来读一读文件中的内容:
  1. #include <stdio.h>
  2. #include <string.h>
  3. int main()
  4. {
  5.     FILE* fp = fopen("test.txt","r");
  6.     if(!fp)
  7.     {
  8.         perror("fopen failed");
  9.         return 1;
  10.     }
  11.     const char* str = "i am yui~\n";
  12.     char s[1024];
  13.     int len = strlen(str);
  14.     while(1)
  15.     {
  16.         ssize_t n  = fread(s,1,len,fp);
  17.         if(n == len)
  18.         {
  19.             s[len] = 0;
  20.             printf("%s",s);
  21.         }
  22.         if(feof(fp))
  23.             break;
  24.     }
  25.         
  26.     return 0;
  27. }
复制代码
输出结果:
  1. i am yui~
  2. i am yui~
  3. i am yui~
  4. i am yui~
  5. i am yui~
复制代码
2. 系统文件I/O

除了使用上述C接口,我们还可以接纳系统接口来访问文件。
系统文件 I/O(输入/输出)是指在操作系统层面进行文件的读写操作。在 Linux 和其他类 Unix 系统中,系统文件 I/O 通常通过系统调用(system call)完成。与 C 尺度库的文件 I/O 函数(如 fopen、fread、fwrite)相比,系统文件 I/O 提供了更底层的控制和更高的效率,但操作也稍显复杂。
为了更好的理解系统文件I/O,我会用系统接口来实现上面的功能,并进行讲解。
  1. #include <stdio.h>
  2. #include <string.h>
  3. #include <unistd.h>
  4. #include <sys/types.h>
  5. #include <fcntl.h>
  6. #include <sys/stat.h>
  7. int main()
  8. {
  9.     umask(0);//去除限制,防止后续干扰
  10.     int fd  = open("myfile",O_WRONLY|O_CREAT,0644);
  11.     if(fd<0)
  12.     {
  13.         perror("open failed");
  14.         return 1;
  15.     }
  16.     int num = 5;
  17.     const char* str = "i am yui\n";
  18.     int len = strlen(str);
  19.     while(num--)
  20.     {
  21.         write(fd,str,len);
  22.     }
  23.     close(fd);
  24.     return 0;
  25. }
复制代码
2 open函数

由于如今我们需要用系统接口来打开文件,那么我们会用到open函数而不是fopen函数。
open 函数是 Unix 和类 Unix 操作系统中的一个系统调用,用于打开文件并返回一个文件形貌符。这个文件形貌符用于后续的文件操作,如读、写、关闭等。相比 C 尺度库的 fopen 函数,open 提供了更底层的控制,更得当系统级编程。
  1. #include <sys/types.h>
  2. #include <sys/stat.h>
  3. #include <fcntl.h>
  4. int open(const char *pathname, int flags, mode_t mode);
复制代码
2.1 参数介绍:



  • pathname:要打开的文件的路径。
  • flags:指定文件打开模式和行为的标记,决定文件的打开方式。
  • mode:新文件的权限掩码,仅在O_CREAT标记创建文件时见效,指定文件的访问权限。
    这之中的flags要好好聊聊。
  • 访问模式(必须包罗一个):

    • O_RDONLY:只读模式打开文件。
    • O_WRONLY:只写模式打开文件。
    • O_RDWR:读写模式打开文件。
      O_RDONLY、O_WRONLY 和 O_RDWR 中只能选择一个,它们控制文件的基础读写权限。

  • 文件创建和控制

    • O_CREAT:若文件不存在,则创建文件。此标记常与 mode 参数一起使用来指定文件的权限。
    • O_EXCL:必须与 O_CREAT 组合使用。如果文件已存在,则返回错误,制止重复创建。这种组合常用于创建唯一文件。
    • O_TRUNC:如果文件存在,而且是以写模式(O_WRONLY 或 O_RDWR)打开,文件长度会被截断为 0。
    • O_APPEND:追加模式,写入操作时,文件指针会主动移动到文件末端,得当日记记录等追加写入的场景。

  • 非阻塞和同步控制

    • O_NONBLOCK:以非阻塞模式打开文件。对一些特殊文件(如设备文件)有效,得当需要立即返回结果的场景。
    • O_SYNC:同步写入模式,确保数据立即写入磁盘。每次 write 操作都不会缓存到内存,而是直接刷新到存储设备,得当数据恒久性要求高的场景。
    • O_DSYNC:数据同步,类似 O_SYNC,但只同步数据而不包括文件元数据(如最后修改时间)。
    • O_RSYNC:同步读模式,和 O_SYNC 类似,但影响的是 read 操作。
      我们需要选择符合的功能将它们进行|的操作,由于底层是用状态压缩来实现的,通过位运算(位掩码)来实现,使得每一个标记可以独立设置或清除,而不需要为每种组合单独存储。

在下面的写入操作我们只需要选择O_WRONLY|O_CREAT就可以了。
2.2 返回值(文件形貌符)



  • 成功时,open 返回一个文件形貌符(非负整数),用于后续的文件操作。
  • 失败时返回 -1,并设置 errno 来指示错误原因。
    这里的返回值也很有说法,
    文件形貌符(File Descriptor, FD)是操作系统分配的一个整数,用于表现每一个打开的文件或 I/O 资源。在 Unix 和类 Unix 系统(如 Linux)中,文件形貌符是历程和内核之间进行文件或资源操作的桥梁,几乎所有的 I/O 操作都是通过文件形貌符来完成的。
    文件形貌符是一个非负整数,每个历程有一个文件形貌符表来管理文件形貌符。打开文件时,操作系统会分配一个文件形貌符,用于标识这个文件。该文件形貌符可以用于后续的读、写、关闭操作。文件形貌符不但用于文件,也可以表现其他 I/O 资源,如管道、网络套接字、设备文件等。
    每个历程在启动时,通常有三个默认的文件形貌符,它们称为尺度文件形貌符:

  • 尺度输入(stdin):文件形貌符为 0,用于从用户或输入源读取数据。
  • 尺度输出(stdout):文件形貌符为 1,用于向终端或输出源输出数据。
  • 尺度错误(stderr):文件形貌符为 2,用于向终端输出错误信息。
    0,1,2对应的物理设备一般是:键盘,表现器,表现器。
    相识完这些后,我们就可以直接使用文件形貌符来直接向表现屏输出数据了。
  1. #include <stdio.h>
  2. #include <sys/types.h>
  3. #include <sys/stat.h>
  4. #include <fcntl.h>
  5. #include <string.h>
  6. #include <unistd.h>
  7. int main()
  8. {
  9.     char buf[1024];
  10.     ssize_t s = read(0,buf,sizeof(buf));//从键盘读入数据
  11.     if(s>0)
  12.     {
  13.         buf[s] = 0;
  14.         write(1,buf,strlen(buf));
  15.         write(2,buf,strlen(buf));
  16.     }
  17.     return 0;
  18. }
  19. //运行结果
  20. /**
  21. ubuntu@VM-20-9-ubuntu:~/FILETEST$ ./a.out
  22. hello world
  23. hello world
  24. hello world
  25. */
复制代码
从这段代码我们也可以更加清晰地认识到Linux下的统统皆文件。
一些底层知识:
文件形貌符是从0开始地小整数,当我们打开文件时,操作系统在内存中要创建相对应地数据结构来形貌目标文件,于是就有了file结构体来表现一个已经打开地文件对象。而历程执行open系统调用,必须让历程和文件关联起来。每一个历程都有一个指针*file,指向一张表file_struct该表最重要地部分包罗一个指针数组,每个元素都是一个指向文件地指针。本质上文件形貌符就是该数组地下标,所以只要拿着文件形貌符就可以找到对应地文件。

2.2.1 文件形貌符的分配规则

先看代码:
  1. #include <stdio.h>
  2. #include <sys/types.h>
  3. #include <sys/stat.h>
  4. #include <unistd.h>
  5. #include <fcntl.h>
  6. #include <string.h>
  7. int main()
  8. {
  9.     int fd = open("myfile",O_RDONLY);//只读模式打开
  10.     if(fd>0)
  11.     {
  12.         printf("%d\n",fd);
  13.     }
  14.     close(fd);
  15.     return 0;
  16. }
  17. //运行结果:
  18. /*
  19. ubuntu@VM-20-9-ubuntu:~/FILETEST$ ./a.out
  20. 3
  21. */
复制代码
结果是3。
那么当我们关闭0这个文件形貌符试试看呢?
  1. #include <stdio.h>
  2. #include <sys/types.h>
  3. #include <sys/stat.h>
  4. #include <unistd.h>
  5. #include <fcntl.h>
  6. #include <string.h>
  7. int main()
  8. {
  9.     close(0);//关闭文件描述符0
  10.     int fd = open("myfile",O_RDONLY);//只读模式打开
  11.     if(fd<0)
  12.     {
  13.         perror("open");
  14.         return 1;
  15.     }
  16.     printf("%d\n",fd);
  17.     close(fd);
  18.     return 0;
  19. }
  20. //打印结果:
  21. /*
  22. ubuntu@VM-20-9-ubuntu:~/FILETEST$ ./a.out
  23. 0
  24. */
复制代码
结果是0,你猜到了吗。
由此可见,文件形貌符的分配规则:在file_struct数组当中,找到当前没有直接使用的最小的一个下标,作为新的文件形貌符。
最后在来看看重定向
2.2.2 重定向

如今我们将标记输出1给关闭了,然后再打开一个文件再往内里写点东西,看看会发生什么。
  1. #include <stdio.h>
  2. #include <sys/types.h>
  3. #include <sys/stat.h>
  4. #include <unistd.h>
  5. #include <fcntl.h>
  6. #include <string.h>
  7. int main()
  8. {
  9.     close(1);//关闭文件描述符1
  10.     int fd = open("myfile",O_WRONLY|O_CREAT,0644);//写模式打开
  11.     if(fd<0)
  12.     {
  13.         perror("open");
  14.         return 1;
  15.     }
  16.     printf("fd:%d\n",fd);
  17.     fflush(stdout);
  18.     close(fd);
  19.     return 0;
  20. }
复制代码
打开myfile发现,文件中存在fd:1。
也是就说,本该再表现屏中表现的内容被写进了myfile文件。我们把这种现象叫做重定向。常见的重定向>, >>, <
重定向的本质:

3. write函数

write 函数是 Unix 和 Linux 系统中进行文件写入操作的系统调用,用于将数据从用户空间的缓冲区写入到文件或设备(例如文件、管道、网络套接字)中。write 是一种底层 I/O 操作,它绕过尺度 I/O 缓冲区,直接写入文件形貌符指向的目标,常用于处理系统资源的原始数据读写。
语法
  1. ssize_t write(int fd, const void *buf, size_t count);
复制代码
参数说明


  • fd:文件形貌符,表现要写入的目标文件或设备(例如 STDOUT_FILENO 表现尺度输出)。
  • buf:缓冲区指针,指向要写入的数据。
  • count:要写入的字节数,指定从 buf 中读取多少字节写入 fd。
    返回值
  • 成功时,返回实际写入的字节数(ssize_t 类型)。
  • 失败时,返回 -1,并设置 errno 变量来指示错误原因。
4. read函数

read 是 Unix 和 Linux 系统中的一个系统调用,用于从文件或其他输入资源(如管道、网络套接字等)中读取数据到用户提供的缓冲区中。与 write 相对应,read 直接从文件形貌符中获取数据,不经过尺度 I/O 缓冲区,得当低级别的 I/O 操作。
语法
  1. ssize_t read(int fd, void *buf, size_t count);
复制代码
参数说明


  • fd:文件形貌符,表现要读取的文件或输入资源(例如 STDIN_FILENO 表现尺度输入)。
  • buf:缓冲区指针,指向读取到的数据将要存放的位置。
  • count:盼望读取的字节数,即 buf 的巨细。
    返回值
  • 成功时,返回实际读取的字节数(ssize_t 类型)。

    • 若返回 0,表现读取到文件末端(EOF)。

  • 失败时,返回 -1,并设置 errno 来指示错误原因。
5. 总结

fopen、fclose、fread、fwrite这些都是C语言尺度库的函数,也就是库函数。
open、close、read、write都是系统提供的接口,也就是系统调用接口。
而这部分库函数会区调用系统接口。

可以认为,f*系列的函数,都是对系统的封装,方便二次开辟。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

老婆出轨

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表