如何使用C++的多线程来处理大量数据？- 技术经验 -卓越飞翔博客

在 c++++ 中使用多线程处理大量数据可以显著提高性能，具体步骤如下：创建线程池（预先创建的一组线程）分发数据和任务给线程：队列存储数据，线程从队列读取原子计数器跟踪未处理数据，线程处理计数器增量定义数据处理逻辑（处理数据的代码，例如排序、聚合或其他计算）实战案例：从文件读取大量数据并打印在屏幕上

如何使用C++的多线程来处理大量数据？

如何在 C++ 中使用多线程处理大量数据

在处理海量数据时，多线程可以显著提高性能。本文将指导您在 C++ 中使用多线程，并提供一个处理大量数据的实战案例。

创建线程池

线程池是指预先创建的一组线程，程序无需每次创建线程时重新分配资源。在 C++ 中，可以使用 std::thread 和 std::atomic 库轻松创建线程池：

#include <thread>
#include <atomic>

std::atomic<bool> stop{false};
std::vector<std::thread> workers;

void WorkerThread() {
  while (!stop.load()) {
    // 在这里放置数据处理逻辑
  }
}

void CreateThreadPool(int num_threads) {
  workers.reserve(num_threads);
  for (int i = 0; i < num_threads; ++i) {
    workers.emplace_back(WorkerThread);
  }
}

分发数据和任务

分配给线程池的任务可以有多种形式。您可以在队列中存储数据，并让每个线程从队列中读取数据。另一种方法是使用原子计数器，跟踪尚未处理的数据数量，并让每个线程处理一个计数器增量。

数据处理逻辑

数据处理逻辑在 WorkerThread 函数中定义。您可以使用任何处理数据的代码，例如排序、聚合或其他计算。

实战案例：文件读取

我们使用多线程从文件读取大量数据，然后打印在屏幕上。

#include <iostream>
#include <fstream>
#include <string>

void ReadFile(std::string filename, std::atomic<int>& num_lines) {
  std::ifstream file(filename);
  if (file.is_open()) {
    std::string line;
    while (std::getline(file, line)) {
      std::cout << line << std::endl;
      num_lines++;
    }
  }
}

int main() {
  const std::string filename = "data.txt";
  int num_threads = 4;
  std::atomic<int> num_lines{0};

  CreateThreadPool(num_threads);

  std::thread file_reader(ReadFile, filename, std::ref(num_lines));

  // 让主线程等待读取线程完成
  file_reader.join();

  std::cout << "总行数：" << num_lines << std::endl;

  // 停止线程池
  stop.store(true);
  for (auto& worker : workers) {
    worker.join();
  }

  return 0;
}

在这个例子中，每个工作线程从文件中读取一行，并将其打印到屏幕上。原子计数器 num_lines 跟踪未处理的行数。

通过使用多线程，我们可以并行处理文件读取任务，从而显著缩短读取整个文件所需的时间。

相关推荐