怀念夏天 发表于 2025-2-18 04:25:54

C 程序多线程拆分文件

C 程序多线程拆分文件

在C语言中,实现多线程来拆分文件通常必要借助多线程库,比如 POSIX 线程库(pthread)或者 Windows 的线程库(CreateThread 或类似的函数)。下面我将分别展示在 Linux 和 Windows 环境下使用这两种方式拆分文件的示例。

https://i-blog.csdnimg.cn/direct/7ed38df488784f9db1592c644a2f84c7.jpeg

在 Linux 下使用 pthread

起首,确保你的系统支持 POSIX 线程
#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

/*定义线程的工作函数    */
void* split_file(void* arg) {
    int thread_id = *((int*)arg);
    FILE* src = fopen("source.txt", "rb");
    if (!src) {
      perror("Failed to open source file");
      return NULL;
    }
   
    fseek(src, 0, SEEK_END);
    long filesize = ftell(src);
    fseek(src, 0, SEEK_SET);
   
    long part_size = filesize / 2; // 简单分割为两半
    long start_pos = thread_id * part_size;
    long end_pos = (thread_id + 1) * part_size;
    if (thread_id == 1) end_pos = filesize; // 确保第二个部分读取剩余部分
   
    char filename;
    sprintf(filename, "part%d.txt", thread_id + 1);
    FILE* dest = fopen(filename, "wb");
    if (!dest) {
      perror("Failed to open destination file");
      fclose(src);
      return NULL;
    }
   
    fseek(src, start_pos, SEEK_SET);
    char buffer;
    while (ftell(src) < end_pos) {
      size_t bytes_read = fread(buffer, 1, sizeof(buffer), src);
      fwrite(buffer, 1, bytes_read, dest);
    }
   
    fclose(src);
    fclose(dest);
    return NULL;
}

/*   主函数中创建和管理线程*/
int main() {
    pthread_t threads;
    int thread_ids = {0, 1}; // 两个线程,分别处理文件的前半部和后半部
   
    for (int i = 0; i < 2; i++) {
      if (pthread_create(&threads, NULL, split_file, &thread_ids)) {
            fprintf(stderr, "Error creating thread\n");
            return 1;
      }
    }
   
    for (int i = 0; i < 2; i++) {
      pthread_join(threads, NULL);
    }
   
    printf("File split successfully.\n");
    return 0;
} 在 Windows下使用 CreateThread

在Windows环境下,使用CreateThread函数来实现多线程拆分文件是一种常见的方法。CreateThread函数是Windows API的一部分,用于创建一个新的线程。下面,我将具体介绍如何使用CreateThread来实现一个简单的文件拆分程序。
#include <windows.h>
#include <stdio.h>
#include <stdlib.h>

/*   定义线程函数   */
DWORD WINAPI SplitFile(LPVOID lpParam) {
    // 定义结构体传递参数
    struct ThreadParams {
      const char* inputFilePath;
      const char* outputFilePath;
      long startPos;
      long length;
    };

    // 类型转换参数
    ThreadParams* params = (ThreadParams*)lpParam;

    // 打开输入文件和输出文件
    FILE* inputFile = fopen(params->inputFilePath, "rb");
    FILE* outputFile = fopen(params->outputFilePath, "wb");
    if (inputFile == NULL || outputFile == NULL) {
      printf("Error opening file\n");
      return -1;
    }

    // 移动到开始位置并读取数据
    fseek(inputFile, params->startPos, SEEK_SET);
    char buffer; // 定义缓冲区大小
    long bytesRead;
    for (long pos = params->startPos; pos < params->startPos + params->length; pos += bytesRead) {
      bytesRead = fread(buffer, 1, sizeof(buffer), inputFile);
      if (bytesRead > 0) {
            fwrite(buffer, 1, bytesRead, outputFile);
      } else {
            break; // 文件结束或出错时退出循环
      }
    }

    // 关闭文件
    fclose(inputFile);
    fclose(outputFile);
    return 0;
}


/* 主函数中创建线程并传递参数
在主函数中,你需要创建多个线程,每个线程处理文件的一部分。你需要计算每个线程应该处理的起始位置和长度**/
int main() {
    const char* inputFilePath = "largefile.dat";// 大文件路径
    long fileSize; // 文件大小,单位:字节
    FILE* file = fopen(inputFilePath, "rb");
    if (file == NULL) {
      printf("Error opening file\n");
      return -1;
    }
    fseek(file, 0, SEEK_END); // 移动到文件末尾以获取大小
    fileSize = ftell(file);   // 获取文件大小(字节)
    fclose(file);            // 关闭文件句柄,因为不再需要它读取文件大小了

    int numThreads = 4; // 使用4个线程进行拆分,可根据需要调整数量
    long partSize = fileSize / numThreads; // 每部分的大小(字节)
    HANDLE threads; // 线程句柄数组
    struct ThreadParams params; // 参数数组

    for (int i = 0; i < numThreads; i++) {
      params.inputFilePath = inputFilePath;
      params.outputFilePath = malloc(256); // 为每个输出文件分配路径字符串空间(例如:part1.dat, part2.dat等)
      sprintf(params.outputFilePath, "part%d.dat", i + 1); // 设置输出文件名
      params.startPos = i * partSize; // 计算开始位置
      params.length = (i == numThreads - 1) ? fileSize - params.startPos : partSize; // 最后一部分可能需要调整长度以覆盖剩余部分
      threads = CreateThread(NULL, 0, SplitFile, &params, 0, NULL); // 创建线程并传递参数
    }

    // 等待所有线程完成
    WaitForMultipleObjects(numThreads, threads, TRUE, INFINITE); // 等待所有线程完成执行。TRUE表示等待所有对象。INFINITE表示无限等待。

    // 清理资源(关闭句柄)和释放分配的内存空间等操作。这里省略具体实现,实际应用中需要
} 附件一:多线程上风

线程程序作为一种多任务、并发的工作方式,当然有其存在上风:
进步应用程序响应:
这对图形界面的程序尤其有意义,当一个操作耗时很长时,整个系统都会等待这个操作,此时程序不会响应键盘、鼠标、菜单的操作,而使用多线程技能,将耗时长的操作(time consuming)置于一个新的线程,可以避免这种尴尬的环境。
使多CPU系统更加有效:
操作系统会包管当线程数不大于CPU数目时,不同的线程运行于不同的CPU上。
改善程序结构:
一个既长又复杂的进程可以考虑分为多个线程,成为几个独立或半独立的运行部分,这样的程序会利于理解和修改。

附件二:操作步骤

线程创建
函数原型:int pthread_create(pthread_t*restrict tidp,const pthread_attr_t *restrict attr,void *(*start_rtn)(void),void *restrict arg);
返回值:如果成功建立线程返回0,否则返回错误的编号。
情势参数:pthread_t*restrict tidp要创建的线程的线程id指针;const pthread_attr_t *restrict attr创建线程时的线程属性;void *(start_rtn)(void)返回值是void类型的指针函数;void *restrict arg start_rtn的形参。
线程挂起:该函数的作用使恰当火线程挂起,等待另一个线程返回才继承执行。也就是说当程序运行到这个地方时,程序会先停止,然后等线程id为thread的这个线程返回,然后程序才会断续执行。
函数原型:intpthread_join(pthread_tthread, void **value_ptr);
参数说明如下:thread等待退出线程的线程号;value_ptr退出线程的返回值。
返回值:若成功,则返回0;若失败,则返回错误号。
线程退出
函数原型:voidpthread_exit(void *rval_ptr);
获取当火线程id
函数原型:pthread_t pthread_self(void);
互斥锁
创建pthread_mutex_init;销毁pthread_mutex_destroy;加锁pthread_mutex_lock;解锁pthread_mutex_unlock。
条件锁
创建pthread_cond_init;销毁pthread_cond_destroy;触发pthread_cond_signal;广播pthread_cond_broadcast;等待pthread_cond_wait。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: C 程序多线程拆分文件