C++ 连通块问题详解

深度优先搜索 (DFS)

广度优先搜索 (BFS)

连通块

岛屿问题

二维网格

并查集

一次探索 C++ 在二维网格中寻找和处理连通区域的算法之旅。

在二维网格（Grid）或图像中，连通块 (Connected Component) 指的是一组相邻且具有相同属性（例如，值都为 1）的单元格。在经典的“岛屿问题”中，我们通常将：

值为 1 的格子视为陆地 (Land)
值为 0 的格子视为水域 (Water)

一个“岛屿”就是由若干个相互连接的陆地格子组成的连通块。

连通定义： 如果两个陆地格子共享一条边（即上下左右相邻），则它们是连通的。通常情况下，对角线相邻不被视为连通。

示例网格:

常见应用:

地图分析： 计算地图上的岛屿数量、湖泊数量。
图像处理： 识别图像中的物体、分割相同颜色或纹理的区域。
游戏开发： 区域划分、寻路（如判断两个区域是否连通）。
社交网络分析： 查找朋友圈或社群。

核心任务通常包括：计算连通块的数量、找出最大（或最小）的连通块面积、标记或修改特定的连通块等。

深度优先搜索 (Depth-First Search, DFS) 是解决连通块问题的经典递归方法。其核心思想是“一条路走到黑，走不通再回头”：

遍历网格中的每一个单元格。
如果遇到一个未访问过的陆地格子 (值为 1)，说明发现了一个新岛屿，岛屿计数加 1。
从这个格子开始进行 DFS 探索：
- 将当前格子标记为已访问（例如，修改值为 2 或使用一个额外的 visited 数组）。
- 递归地访问其上、下、左、右四个方向的相邻格子。
- 如果相邻格子是有效的陆地格子且未被访问，则继续对其进行 DFS 探索。
一次完整的 DFS 会将整个岛屿的所有格子都标记为已访问，防止重复计数。

// DFS 核心函数：淹没 (标记) 与 (x, y) 相连的整个岛屿
// grid: 二维网格引用
// x, y: 当前格子的行和列索引
void dfs(vector>& grid, int x, int y) {
    int rows = grid.size();
    int cols = grid[0].size();

    // 1. 边界条件检查 + 是否为陆地('1')检查
    if (x < 0 || x >= rows || y < 0 || y >= cols || grid[x][y] != '1') {
        return; // 越界或是水域或是已访问过的陆地，直接返回
    }

    // 2. 标记当前陆地格子为已访问 (这里用 '2' 表示)
    grid[x][y] = '2'; // '沉岛'操作，防止重复访问

    // 3. 递归访问四个相邻方向
    dfs(grid, x + 1, y); // 向下探索
    dfs(grid, x - 1, y); // 向上探索
    dfs(grid, x, y + 1); // 向右探索
    dfs(grid, x, y - 1); // 向左探索
}

// 主函数 (计算岛屿数量)
int numIslands_dfs(vector>& grid) {
    if (grid.empty() || grid[0].empty()) {
        return 0; // 处理空网格情况
    }
    int rows = grid.size();
    int cols = grid[0].size();
    int islandCount = 0; // 岛屿数量计数器

    // 遍历网格中的每个格子
    for (int i = 0; i < rows; ++i) {
        for (int j = 0; j < cols; ++j) {
            // 如果发现一个未访问的陆地格子 ('1')
            if (grid[i][j] == '1') {
                islandCount++; // 发现新岛屿，计数加 1
                dfs(grid, i, j); // 从此格子开始 DFS，淹没整个岛屿
            }
        }
    }
    return islandCount; // 返回最终岛屿数量
}

DFS 过程交互演示:

DFS 注意要点：

边界检查： 递归调用前必须检查坐标是否越界。
标记已访问： 这是防止无限递归和重复计算的关键。可以直接修改原网格（如 1 -> 2），或使用一个同样大小的布尔型 `visited` 数组。
栈深度： 在非常深或非常大的岛屿上，递归可能导致栈溢出。虽然在常规 LeetCode 题目中少见，但这是 DFS 的一个理论限制。

广度优先搜索 (Breadth-First Search, BFS) 是另一种常用的图遍历算法，特别适合查找最短路径。在岛屿问题中，它通过队列 (Queue) 来实现层序遍历：

同样遍历网格，找到一个未访问的陆地格子 ('1')，岛屿计数加 1。
将这个起始格子的坐标加入队列。
将起始格子标记为已访问 ('2')。
当队列不为空时，循环执行：
- 从队列中取出一个格子（队首元素）。
- 检查其上、下、左、右四个相邻格子。
- 如果相邻格子是有效的、未访问的陆地格子，则将其标记为已访问，并加入队列。
一次 BFS 过程会探索完与起始点相连的所有陆地格子，即一个完整的岛屿。

// BFS 辅助函数：从 (startX, startY) 开始淹没岛屿
#include <vector>
#include <queue>
#include <utility> // for std::pair

using namespace std;

void bfs(vector>& grid, int startX, int startY) {
    int rows = grid.size();
    int cols = grid[0].size();

    // 创建队列，存储待访问的陆地格子坐标 {行, 列}
    queue> q;

    // 将起点加入队列并标记为已访问
    q.push({startX, startY});
    grid[startX][startY] = '2'; // 标记为已访问

    // 定义四个方向的偏移量: 上, 下, 左, 右
    int dx[] = {-1, 1, 0, 0};
    int dy[] = {0, 0, -1, 1};

    // 当队列不为空时，持续进行 BFS
    while (!q.empty()) {
        // 取出队首元素
        pair current = q.front();
        q.pop();
        int x = current.first;
        int y = current.second;

        // 探索当前格子的四个相邻方向
        for (int i = 0; i < 4; ++i) {
            int nextX = x + dx[i];
            int nextY = y + dy[i];

            // 检查新坐标是否有效 (在边界内) 且是未访问的陆地 ('1')
            if (nextX >= 0 && nextX < rows && nextY >= 0 && nextY < cols && grid[nextX][nextY] == '1') {
                // 将有效的相邻陆地格子加入队列
                q.push({nextX, nextY});
                // 并标记为已访问
                grid[nextX][nextY] = '2';
            }
        }
    }
}

// 主函数 (计算岛屿数量 - BFS 版本)
int numIslands_bfs(vector>& grid) {
    if (grid.empty() || grid[0].empty()) {
        return 0;
    }
    int rows = grid.size();
    int cols = grid[0].size();
    int islandCount = 0;

    for (int i = 0; i < rows; ++i) {
        for (int j = 0; j < cols; ++j) {
            if (grid[i][j] == '1') {
                islandCount++;
                bfs(grid, i, j); // 使用 BFS 淹没岛屿
            }
        }
    }
    // 注意：如果不想修改原 grid，可以在 bfs/dfs 前复制一份，或者使用 visited 数组
    // 如果修改了原 grid，在多次调用前需要恢复 grid
    return islandCount;
}

BFS 过程交互演示:

当前 BFS 队列 (队首在左):

BFS vs DFS 对比：

实现方式： DFS 通常用递归（隐式栈），BFS 用队列（显式）。
空间复杂度： DFS 空间取决于最大递归深度，最坏 O(M*N)；BFS 空间取决于队列最大长度，最坏 O(M*N)。实践中 BFS 可能更稳定。
适用场景： 在岛屿计数问题中两者效率相当。BFS 天然适合找最短路径问题。DFS 实现可能更简洁。
栈溢出风险： BFS 没有递归栈溢出的风险。

1. 最大岛屿面积 (Max Area of Island)

这是一个常见变种：计算所有岛屿中，面积最大的那个岛屿包含了多少个 '1'。我们可以在 DFS 或 BFS 探索一个岛屿的同时，计数其包含的格子数量。

// DFS 计算岛屿面积
// 返回从 (x, y) 出发能访问到的陆地格子总数
int dfsArea(vector>& grid, int x, int y) {
    int rows = grid.size();
    int cols = grid[0].size();

    // 边界检查 + 非陆地检查
    if (x < 0 || x >= rows || y < 0 || y >= cols || grid[x][y] != '1') {
        return 0; // 不贡献面积
    }

    // 标记为已访问
    grid[x][y] = '2';

    // 当前格子面积为 1，加上来自四个方向的递归面积
    int currentArea = 1;
    currentArea += dfsArea(grid, x + 1, y);
    currentArea += dfsArea(grid, x - 1, y);
    currentArea += dfsArea(grid, x, y + 1);
    currentArea += dfsArea(grid, x, y - 1);

    return currentArea;
}

// 主函数计算最大岛屿面积
int maxAreaOfIsland(vector>& grid) {
    if (grid.empty() || grid[0].empty()) return 0;
    int rows = grid.size();
    int cols = grid[0].size();
    int maxArea = 0;

    for (int i = 0; i < rows; ++i) {
        for (int j = 0; j < cols; ++j) {
            if (grid[i][j] == '1') {
                int currentIslandArea = dfsArea(grid, i, j); // 计算当前岛屿面积
                maxArea = max(maxArea, currentIslandArea); // 更新最大面积
            }
        }
    }
    // 注意：同样需要恢复 grid 或使用 visited 数组
    return maxArea;
}

📄 查看完整 C++ 实现 (最大面积)

BFS 同样可以修改，在每次将格子加入队列时计数，或者在出队时计数。

2. 并查集 (Union-Find / Disjoint Set Union) 解法

并查集是一种高效处理“集合合并”和“查找元素所属集合”问题的数据结构。它也可以用来解决岛屿数量问题，尤其在动态场景（如岛屿可能合并）或需要频繁查询连通性时很有优势。

核心思想：

将每个陆地格子 ('1') 初始化为一个独立的集合。水域格子 ('0') 不处理。
遍历所有陆地格子。对于每个陆地格子，检查其右边和下边（避免重复检查）的相邻格子。
如果相邻格子也是陆地，则使用并查集的 union 操作将这两个格子所在的集合合并。
最终，并查集中不同的集合（根节点）的数量就是岛屿的数量。

#include <vector>
#include <numeric> // for std::iota

class UnionFind {
private:
    vector parent; // 存储每个节点的父节点
    vector rank;   // 优化：按秩合并 (可选，也可以按大小合并)
    int count;          // 连通分量的数量

public:
    // 构造函数：初始化 n 个独立的集合
    UnionFind(int n) : count(n) {
        parent.resize(n);
        std::iota(parent.begin(), parent.end(), 0); // 每个元素的父节点初始是自己
        rank.resize(n, 0); // 初始秩（树高）为 0
    }

    // 查找元素 x 所属集合的根节点 (带路径压缩优化)
    int find(int x) {
        if (parent[x] != x) {
            parent[x] = find(parent[x]); // 路径压缩
        }
        return parent[x];
    }

    // 合并元素 x 和 y 所在的集合
    void unite(int x, int y) {
        int rootX = find(x);
        int rootY = find(y);
        if (rootX != rootY) { // 如果它们不在同一个集合
            // 按秩合并：将秩小的树合并到秩大的树上
            if (rank[rootX] < rank[rootY]) {
                parent[rootX] = rootY;
            } else if (rank[rootX] > rank[rootY]) {
                parent[rootY] = rootX;
            } else {
                parent[rootY] = rootX; // 秩相等，随便合并，但根节点秩要加 1
                rank[rootX]++;
            }
            count--; // 合并成功，连通分量数量减 1
        }
    }

    // 获取当前连通分量的数量
    int getCount() const {
        return count;
    }
};

// 使用并查集计算岛屿数量
int numIslands_uf(vector>& grid) {
    if (grid.empty() || grid[0].empty()) return 0;
    int rows = grid.size();
    int cols = grid[0].size();
    int waterCount = 0; // 统计水域数量

    // 初始化并查集，大小为 M*N，但只处理陆地
    UnionFind uf(rows * cols);

    for (int i = 0; i < rows; ++i) {
        for (int j = 0; j < cols; ++j) {
            if (grid[i][j] == '1') {
                // 检查下方相邻格子
                if (i + 1 < rows && grid[i + 1][j] == '1') {
                    uf.unite(i * cols + j, (i + 1) * cols + j); // 合并
                }
                // 检查右方相邻格子
                if (j + 1 < cols && grid[i][j + 1] == '1') {
                    uf.unite(i * cols + j, i * cols + (j + 1)); // 合并
                }
            } else {
                waterCount++; // 统计水域格子
            }
        }
    }

    // 初始连通分量是所有格子 M*N
    // 减去水域格子，剩下的是初始陆地格子构成的独立集合数
    // 再减去合并掉的集合数 (M*N - uf.getCount())
    // 简化：最终连通分量数 uf.getCount() 包含了水域各自独立的集合
    // 所以岛屿数 = 总连通分量数 - 水域格子数
    return uf.getCount() - waterCount;
}

📄 查看完整 C++ 实现 (并查集)

并查集在处理二维网格时，通常需要将二维坐标 `(r, c)` 映射到一维索引 `r * cols + c`。

并查集优点：

查询两个元素是否连通非常快（接近 O(1)）。
合并操作也非常高效。
适用于动态连通性问题。

缺点：

相对于 DFS/BFS，实现稍复杂。
如果只是简单计数岛屿，DFS/BFS 可能更直观。

解析：

挑战 1: 岛屿数量

给定一个由 '1'（陆地）和 '0'（水域）组成的二维网格 `grid`，计算网格中岛屿的数量。

岛屿总是被水包围，并且每座岛屿只能由水平方向和/或竖直方向上相邻的陆地连接形成。你可以假设网格的四个边均被水包围。

输入： 一个 vector> 类型的网格。

输出： 岛屿的数量 (int)。

挑战 2: 最大岛屿面积

给定一个由 '1'（陆地）和 '0'（水域）组成的二维网格 `grid`，找到最大的岛屿面积。如果网格中没有岛屿，则返回 0。

面积是指岛屿中包含的 '1' 的个数。

输入： 一个 vector> 类型的网格。

输出： 最大的岛屿面积 (int)。

恭喜你！通过本次学习，我们掌握了处理 C++ 中二维网格连通块（岛屿）问题的核心方法：

核心算法：
- 深度优先搜索 (DFS): 使用递归或栈，深入探索路径。实现相对简洁，但需注意栈溢出风险。
- 广度优先搜索 (BFS): 使用队列，层层扩展。无栈溢出风险，天然适合求最短路径。
关键技巧：
- 边界判断：访问相邻格子前，务必检查坐标是否在网格范围内 (0 <= x < rows && 0 <= y < cols)。
- 标记已访问：这是避免重复处理和死循环的核心。可以直接修改原网格（如 '1' -> '2'）或使用额外的 visited 数组/集合。
- 遍历起点：需要一个外层循环遍历网格所有单元格，确保每个潜在的岛屿起点都被考虑到。
扩展方法：
- 计算面积：在 DFS/BFS 过程中累加访问到的陆地格子数。
- 并查集 (Union-Find): 另一种高效解法，特别适用于动态连通性或需要频繁查询的问题。需要将二维坐标映射到一维。
常见陷阱：
- 忘记边界检查导致数组越界。
- 忘记标记已访问导致无限循环或重复计数。
- 并查集初始化或合并逻辑错误。

理解并熟练运用 DFS 和 BFS 是解决各种图和网格问题的基础。多练习，多思考不同场景下的选择！

C++ 连通块问题详解

从岛屿数量到并查集解法

🏝️ 什么是连通块？

示例网格:

常见应用:

🧭 深度优先搜索 (DFS) 求岛屿数量

DFS 过程交互演示:

🌊 广度优先搜索 (BFS) 实现

BFS 过程交互演示:

💡 扩展问题与解法

1. 最大岛屿面积 (Max Area of Island)

2. 并查集 (Union-Find / Disjoint Set Union) 解法

✅ 知识测验 (选择题)

💻 编程挑战

挑战 1: 岛屿数量

挑战 2: 最大岛屿面积

📌 总结与关键点

🔎 知识延伸与实践

相关概念：

推荐 LeetCode 题目练习：