Dfs、Bfs的終于弄明白了

作者：大賽 2021-07-26 05:00:16

你問(wèn)一個(gè)人聽(tīng)過(guò)哪些算法，那么深度優(yōu)先搜索(dfs)和寬度優(yōu)先搜索(bfs)那肯定在其中，很多小老弟學(xué)會(huì)dfs和bfs就覺(jué)得好像懂算法了，無(wú)所不能，確實(shí)如此，學(xué)會(huì)dfs和bfs暴力搜索枚舉確實(shí)利用計(jì)算機(jī)超強(qiáng)計(jì)算大部分都能求的一份解，學(xué)會(huì)dfs和bfs去暴力杯混分是一個(gè)非常不錯(cuò)的選擇!

[[412887]]

本文轉(zhuǎn)載自微信公眾號(hào)「bigsai」，作者大賽。轉(zhuǎn)載本文請(qǐng)聯(lián)系bigsai公眾號(hào)。

前言

五大經(jīng)典算法的回溯算法其實(shí)也是dfs的一種應(yīng)用，是不是回憶起被折磨的八皇后問(wèn)題。基礎(chǔ)的dfs和bfs學(xué)習(xí)來(lái)思想很容易，寫(xiě)出來(lái)模板代碼也不難，但很多時(shí)候需要在此基礎(chǔ)上靈活變通就有不小難度了。

不過(guò)dfs 和bfs初步學(xué)習(xí)搞懂原理比較簡(jiǎn)單，但是想要精通 dfs和bfs還是很難的，因?yàn)楹芏鄦?wèn)題是在此基礎(chǔ)上進(jìn)行變形優(yōu)化的，比如dfs你可能考慮各種剪枝問(wèn)題，bfs可能會(huì)涉及很多貪心的策略，有的還要考慮到記憶化的問(wèn)題、雙向bfs、bfs+dfs等等才能更好解決的問(wèn)題，不過(guò)本文講的相對(duì)基礎(chǔ)，不同的延伸需要自己刷題去學(xué)習(xí)才行。

鄰接矩陣和鄰接表

dfs和bfs一般用于處理圖論的問(wèn)題，那么在看問(wèn)題之前首先要關(guān)注圖的存儲(chǔ)問(wèn)題，正常一般用鄰接矩陣或者鄰接表存儲(chǔ)圖(對(duì)于十字鏈表、壓縮矩陣之類(lèi)空間優(yōu)化這里不進(jìn)行討論)。

鄰接矩陣：

鄰接矩陣就是用數(shù)組(二維)表示圖，通常這種圖我們會(huì)對(duì)各個(gè)節(jié)點(diǎn)順序的編號(hào)，在矩陣內(nèi)數(shù)值表示圖的聯(lián)通情況或者路徑長(zhǎng)度。

如果是無(wú)權(quán)圖：那么一般用boolean數(shù)組的01表示聯(lián)通性，如果是有權(quán)圖那么數(shù)組的值就用來(lái)表示兩者路徑長(zhǎng)度，如果為0那么就表示不通。另外如果圖是無(wú)向圖那么這個(gè)矩陣是對(duì)稱(chēng)的，如果是有向圖那么大概率不是對(duì)稱(chēng)的。

具體可以看下面例子，這種操作方式條理更清晰并且操作方便，當(dāng)然，這種情況很容易造成空間浪費(fèi)，所以有人進(jìn)行空間優(yōu)化，或者是鄰接表的方式存儲(chǔ)圖。

鄰接表：

觀察上面的鄰接矩陣，如果節(jié)點(diǎn)很多但是聯(lián)通路徑很少，那么就浪費(fèi)了太多的存儲(chǔ)空間，這種情況就更適合鄰接表。

鄰接表一般是數(shù)組套鏈表，比起鄰接矩陣節(jié)省不少空間(直接存儲(chǔ)聯(lián)通信息或者路徑)，在存儲(chǔ)的時(shí)候可以根據(jù)數(shù)據(jù)格式要求靈活運(yùn)用容器(無(wú)權(quán)圖省事一些)。

但是正常的無(wú)向圖依然會(huì)重復(fù)浪費(fèi)一半空間，就有十字鏈表，多重鏈接表等等出現(xiàn)優(yōu)化(大佬們的優(yōu)化是真的牛批)，但在算法邏輯上稍復(fù)雜，不過(guò)一般圖論算法更注重的是算法的優(yōu)化這里就不介紹十字鏈表等，一個(gè)鄰接表存儲(chǔ)的圖可以看下圖：

深度優(yōu)先搜索(dfs)

概念：

深度優(yōu)先搜索屬于圖算法的一種，英文縮寫(xiě)為DFS即Depth First Search.其過(guò)程簡(jiǎn)要來(lái)說(shuō)是對(duì)每一個(gè)可能的分支路徑深入到不能再深入為止，而且每個(gè)節(jié)點(diǎn)只能訪(fǎng)問(wèn)一次.

簡(jiǎn)單的說(shuō)，dfs就是在一個(gè)圖中按照一個(gè)規(guī)則進(jìn)行搜索，一般基于遞歸實(shí)現(xiàn)，對(duì)于我們來(lái)說(shuō)dfs就像一個(gè)黑魔法一樣，設(shè)計(jì)好算法它就自動(dòng)搜索，所以我們要注意的是算法初始化、搜索規(guī)則、結(jié)束條件。二叉樹(shù)的前序遍歷就是一個(gè)最簡(jiǎn)單的dfs遍歷。

我們通常使用鄰接表或者鄰接矩陣儲(chǔ)存圖的信息，這里例子使用鄰接矩陣完成!

對(duì)于dfs的流程來(lái)說(shuō)，大致可以認(rèn)為是這樣：

(1)某個(gè)節(jié)點(diǎn)開(kāi)始先按照一個(gè)方向一直遍歷到盡頭，同時(shí)標(biāo)記已經(jīng)走過(guò)的點(diǎn)。

(2)遍歷到盡頭后回退到上一個(gè)點(diǎn)，同時(shí)清除當(dāng)前點(diǎn)的標(biāo)記。往下一個(gè)方向遍歷一次，然后繼續(xù)重復(fù)步驟(1).

(3)一直到所有流程都走完，即回退到起點(diǎn)。

在遍歷的過(guò)程中記得需要標(biāo)記因?yàn)椴贿M(jìn)行標(biāo)記會(huì)出現(xiàn)死循環(huán)，標(biāo)記就代表這個(gè)點(diǎn)被用過(guò)不能用了，而撤回標(biāo)記就說(shuō)明這個(gè)點(diǎn)又能重新使用了。

舉個(gè)例子，例如一個(gè)全排列s a i 當(dāng)s被枚舉到就要標(biāo)記這個(gè)s不能被使用(不可能ssss一直下去吧)，并且遍歷到s a時(shí)候a也不能使用，到s a i 時(shí)候到盡頭回退 s a 依然要回退s 此時(shí) a和i都被解但是上次指標(biāo)方向?yàn)閍(for 循環(huán)到的位置)，那么下一次就要往下個(gè)方向i 組成s i,然后在s i a，同理回退到s i,到s，下面兩個(gè)方向都被枚舉過(guò)所以還要回退到，解放了s a i但是第一個(gè)方向s已經(jīng)走過(guò)，開(kāi)始從a 剩下的步驟依次類(lèi)推就得到了。

不過(guò)全排列這是一維空間的dfs運(yùn)用，在標(biāo)記時(shí)候可以選擇boolean數(shù)組對(duì)應(yīng)位置true標(biāo)記用過(guò)，false表示沒(méi)用過(guò)。除此之外也可使用動(dòng)態(tài)數(shù)組List使用過(guò)先刪除對(duì)應(yīng)位置元素向下遞歸進(jìn)行搜索，然后結(jié)束后再對(duì)應(yīng)位置插入也行(不是很推薦，效率比較低)。

對(duì)于上面圖片中圖的dfs，得到其中一個(gè)dfs搜索的序列(可能有多個(gè))可以用代碼來(lái)表示一下：

public class dfs { 
    static boolean isVisit[]; 
    public static void main(String[] args) { 
        int map[][]=new int[7][7]; 
        isVisit=new boolean[7]; 
        map[0][1]=map[1][0]=1; 
        map[0][2]=map[2][0]=1; 
        map[0][3]=map[3][0]=1; 
 
        map[1][4]=map[4][1]=1; 
        map[1][5]=map[5][1]=1; 
        map[2][6]=map[6][2]=1; 
        map[3][6]=map[6][3]=1; 
 
        isVisit[0]=true; 
        dfs(0,map);//從0開(kāi)始遍歷 
    } 
    private static void dfs(int index,int map[][]) { 
        // TODO Auto-generated method stub 
        System.out.println("訪(fǎng)問(wèn)"+(index+1)+"  "); 
        for(int i=0;i<map[index].length;i++)//查找聯(lián)通節(jié)點(diǎn) 
        { 
            if(map[index][i]>0&&isVisit[i]==false) 
            { 
                isVisit[i]=true; 
                dfs(i,map); 
            } 
        } 
        System.out.println((index+1)+"訪(fǎng)問(wèn)結(jié)束 "); 
    } 
}

大致順序訪(fǎng)問(wèn)為

廣度優(yōu)先搜素(bfs)

概念：

BFS，其英文全稱(chēng)是Breadth First Search。BFS并不使用經(jīng)驗(yàn)法則算法。從算法的觀點(diǎn)，所有因?yàn)檎归_(kāi)節(jié)點(diǎn)而得到的子節(jié)點(diǎn)都會(huì)被加進(jìn)一個(gè)先進(jìn)先出的隊(duì)列中。一般的實(shí)驗(yàn)里，其鄰居節(jié)點(diǎn)尚未被檢驗(yàn)過(guò)的節(jié)點(diǎn)會(huì)被放置在一個(gè)被稱(chēng)為 open 的容器中(例如隊(duì)列或是鏈表)，而被檢驗(yàn)過(guò)的節(jié)點(diǎn)則被放置在被稱(chēng)為 closed 的容器中。(open-closed表)

簡(jiǎn)單來(lái)說(shuō)，bfs就是從某個(gè)節(jié)點(diǎn)開(kāi)始按層遍歷，估計(jì)大部分人第一次接觸bfs的時(shí)候是在學(xué)習(xí)數(shù)據(jù)結(jié)構(gòu)的二叉樹(shù)的層序遍歷!借助一個(gè)隊(duì)列一層一層遍歷。第二次估計(jì)就是在學(xué)習(xí)圖論的時(shí)候，給你一個(gè)圖，讓你寫(xiě)出一個(gè)bfs遍歷的順序，此后再無(wú)bfs…

如果從路徑上走來(lái)看，dfs就是一條跑的很快的瘋狗，到處亂咬，沒(méi)路了就跑回來(lái)去其他地方繼續(xù)，而bfs就像是一團(tuán)毒氣，慢慢延伸!

在實(shí)現(xiàn)上樸素的bfs就是控制一個(gè)隊(duì)列，后進(jìn)先出進(jìn)行層序遍歷，但很多時(shí)候可能有場(chǎng)景需求節(jié)點(diǎn)有權(quán)值可能就需要使用優(yōu)先隊(duì)列。

就拿上述的圖來(lái)說(shuō)，我們使用鄰接表來(lái)實(shí)現(xiàn)一個(gè)bfs遍歷。

import java.util.ArrayDeque; 
import java.util.ArrayList; 
import java.util.List; 
import java.util.Queue; 
 
public class bfs { 
    public static void main(String[] args) { 
        List<Integer> map[]=new ArrayList[7]; 
        boolean isVisit[]=new boolean[7]; 
        for(int i=0;i<map.length;i++)//初始化 
        { 
            map[i]=new ArrayList<Integer>(); 
        } 
        map[0].add(1);map[0].add(2);map[0].add(3); 
        map[1].add(0);map[1].add(4);map[1].add(5); 
        map[2].add(0);map[2].add(6); 
        map[3].add(0);map[3].add(6); 
        map[4].add(1); 
        map[5].add(1); 
        map[6].add(2);map[6].add(3); 
 
        Queue<Integer>q1=new ArrayDeque<Integer>(); 
        q1.add(0);isVisit[0]=true; 
        while (!q1.isEmpty()) { 
            int va=q1.poll(); 
            System.out.println("訪(fǎng)問(wèn)"+(va+1)); 
            for(int i=0;i<map[va].size();i++) 
            { 
                int index=map[va].get(i); 
                if(!isVisit[index]) 
                { 
                    q1.add(index); 
                    isVisit[index]=true; 
                } 
            } 
        } 
    } 
}

搜索之延伸

本文主要任務(wù)是幫助初學(xué)者認(rèn)清dfs和bfs，比較偏基礎(chǔ)，但是事實(shí)中dfs和bfs比較偏向?qū)崙?zhàn)。

對(duì)于dfs和bfs，有些區(qū)別也有些共性，例如在迷宮很多問(wèn)題dfs能解決bfs也能解決。

對(duì)于dfs一般解決的經(jīng)典問(wèn)題有：

二叉樹(shù)的搜索遍歷(非層序)
經(jīng)典全排列、組合、子集問(wèn)題
回溯算法之八皇后問(wèn)題
迷宮搜索問(wèn)題(能否找到)
其他圖搜索

而bfs一般解決的問(wèn)題有：

二叉樹(shù)層序搜索遍歷(各種變形例如分層輸出、之字形等等空間優(yōu)化)
無(wú)權(quán)圖的最短路徑
其他迷宮搜索問(wèn)題(節(jié)點(diǎn)帶某些權(quán)值的)
其他問(wèn)題

當(dāng)然這里面羅列不全，dfs關(guān)注更多的可能是剪枝問(wèn)題或者記憶化，剪枝就是剪掉沒(méi)必要的搜索，記憶化就是防止太多重復(fù)操作。而bfs關(guān)注更多的可能是貪心策略選擇(大部分搜索可能有一些附加的條件)可能需要使用優(yōu)先隊(duì)列來(lái)解決。

然而，當(dāng)數(shù)據(jù)達(dá)到一定程度，我們使用簡(jiǎn)單的方法肯定會(huì)爆炸的。就可能需要一些特殊的巧妙方法處理，比如想不到的剪枝優(yōu)化、優(yōu)先隊(duì)列、A*、dfs套bfs，又或者利用一些非常厲害的數(shù)學(xué)方法比如康托展開(kāi)(逆展開(kāi))等等。而今天在這里，我們談?wù)勲p向bfs，體驗(yàn)一下算法的奧妙!

什么樣的情況可以使用雙向bfs來(lái)優(yōu)化呢?其實(shí)雙向bfs的主要思想是問(wèn)題的拆分吧，比如在一個(gè)迷宮中可以往下往右行走，問(wèn)你有多少種方式從左上到右下。

正常情況下，我們就是搜索遍歷，如果迷宮邊長(zhǎng)為n，那么這個(gè)復(fù)雜度大概是2^n級(jí)別.

但是實(shí)際上我們可以將迷宮拆分一下，比如根據(jù)對(duì)角線(xiàn)(比較多)，將迷宮一分為二。其實(shí)你的結(jié)果肯定必然經(jīng)過(guò)對(duì)角線(xiàn)的這些點(diǎn)對(duì)吧!我們只要分別計(jì)算出各個(gè)對(duì)角線(xiàn)各個(gè)點(diǎn)的次數(shù)然后相加就可以了!

怎么算? 就是從(0,0)到中間這個(gè)點(diǎn)mid的總次數(shù)為n1，然后這個(gè)mid到(n,n)點(diǎn)的總次數(shù)為n2，然后根據(jù)排列組合總次數(shù)就是n1*n2(n1和n2正常差不多大)這樣就可以通過(guò)乘法減少加法的運(yùn)算次數(shù)啦!

簡(jiǎn)單的說(shuō)，從數(shù)據(jù)次數(shù)來(lái)看如果直接搜索全圖經(jīng)過(guò)下圖的那個(gè)點(diǎn)的次數(shù)為n1*n2次，如果分成兩個(gè)部分相乘那就是n1+n2次。兩者差距如果n1,n2=1000左右，那么這么一次差距是平方(根號(hào))級(jí)別的。從搜索圖形來(lái)看其實(shí)這么一次搜索是本來(lái)一個(gè)n*n大小的搜索轉(zhuǎn)變成n次(每次大概是(n/2)*(n/2)大小的迷宮搜索兩次)。也就是如果18*18的迷宮如果使用直接搜索，那么大概2^18次方量級(jí)，而如果采用雙向bfs，那么就是2^9這個(gè)量級(jí)。

例題實(shí)戰(zhàn)一下，就拿一道經(jīng)典雙向bfs問(wèn)題給大家展示一下吧!

題目鏈接：http://oj.hzjingma.com/contest/problem?id=20&pid=8#problem-anchor

分析：對(duì)于題目的要求還是很容易理解的，就是找到所有的路徑種類(lèi)，再判斷其中是對(duì)稱(chēng)路徑的有幾個(gè)輸出即可!

對(duì)于一個(gè)普通思考是這樣的，首先是進(jìn)行dfs，然后動(dòng)態(tài)維護(hù)一個(gè)字符串，每次跑到最后判斷這個(gè)路徑字符串是否滿(mǎn)足對(duì)稱(chēng)要求，如果滿(mǎn)足那么就添加到容器中進(jìn)行判斷。可惜很遺憾這樣是超時(shí)的，僅能通過(guò)40%的樣例。

接著用普通bfs進(jìn)行嘗試，維護(hù)一個(gè)node節(jié)點(diǎn)，每次走的時(shí)候路徑儲(chǔ)存起來(lái)其實(shí)這個(gè)效率跟dfs差不多依然超時(shí)。只能通過(guò)40%數(shù)據(jù)。

接下來(lái)就開(kāi)始雙向bfs進(jìn)行分析!

(1) 既然只能右下，那么對(duì)角線(xiàn)的那個(gè)位置的肯定是中間的那個(gè)字符串的!它的存在不影響是否對(duì)稱(chēng)的(n*n的迷宮路徑長(zhǎng)度為n-1 + n為奇數(shù)).

(2) 我們判斷路徑是否對(duì)稱(chēng)，只需要判斷從(1,1)到對(duì)角節(jié)點(diǎn)k(設(shè)為k節(jié)點(diǎn))的路徑有沒(méi)有和從(n,n)到k相同的。如果有路徑相同的那么就說(shuō)明這一對(duì)構(gòu)成對(duì)稱(chēng)路徑

(3) 在具體實(shí)現(xiàn)上，我們對(duì)每個(gè)對(duì)角線(xiàn)節(jié)點(diǎn)可以進(jìn)行兩次bfs(一次左上到(1,1),一次右下到(n,n)).并且將路徑放到兩個(gè)hashset(set1,set2)中，跑完之后用遍歷其中一個(gè)hashset中的路徑，看看另一個(gè)set是否存在該路徑，如果存在就說(shuō)明這個(gè)是對(duì)稱(chēng)路徑放到總的hashset(set) 中。對(duì)角線(xiàn)每個(gè)位置都這樣判斷完最后只需要輸出總的hashset(set)的集合大小即可!

ac代碼如下：

import java.util.ArrayDeque; 
import java.util.HashSet; 
import java.util.Queue; 
import java.util.Scanner; 
import java.util.Set; 
 
public class test2 {     
    static class node{ 
         int x; 
         int y; 
        String path=""; 
        public node() {} 
        public node(int x,int y,String team) 
        { 
            this.x=x; 
            this.y=y; 
            this.path=team; 
        } 
    } 
    public static void main(String[] args) { 
        Scanner sc=new Scanner(System.in); 
        Set<String>set=new HashSet<String>();//儲(chǔ)存最終結(jié)果 
        int n=Integer.parseInt(sc.nextLine()); 
        char map[][]=new char[n][n]; 
        for(int i=0;i<n;i++) 
        { 
            String string=sc.nextLine(); 
            map[i]=string.toCharArray(); 
        } 
        Queue<node>q1=new ArrayDeque<node>();//左上的隊(duì)列 
        Queue<node>q2=new ArrayDeque<node>();//右下的隊(duì)列 
        for(int i=0;i<n;i++) 
        { 
            q1.clear();q2.clear(); 
            Set<String>set1=new HashSet<String>();//儲(chǔ)存zuoshang 
            Set<String>set2=new HashSet<String>();//儲(chǔ)右下 
            q1.add(new node(i,n-1-i,""+map[i][n-1-i])); 
            q2.add(new node(i,n-1-i,""+map[i][n-1-i])); 
            while(!q1.isEmpty()&&!q2.isEmpty()) 
            { 
                node team=q1.poll(); 
                node team2=q2.poll(); 
                if(team.x==n-1&&team.y==n-1)//到終點(diǎn)，將路徑儲(chǔ)存 
                { 
                    //System.out.println(team2.path);    
                    set1.add(team.path); 
                    set2.add(team2.path); 
                } 
                else { 
                    if(team.x<n-1)//可以向下 
                    { 
                        q1.add(new node(team.x+1, team.y, team.path+map[team.x+1][team.y])); 
                    } 
                    if(team.y<n-1)//可以向右 
                    { 
                        q1.add(new node(team.x, team.y+1, team.path+map[team.x][team.y+1])); 
                    } 
                    if(team2.x>0)//上 
                    { 
                        q2.add(new node(team2.x-1, team2.y, team2.path+map[team2.x-1][team2.y])); 
                    } 
                    if(team2.y>0)//左 
                    { 
                        q2.add(new node(team2.x, team2.y-1, team2.path+map[team2.x][team2.y-1])); 
                    } 
                } 
 
            } 
            for(String va:set1) 
            { 
                if(set2.contains(va)) 
                { 
                    set.add(va); 
                } 
            } 
 
        } 
        System.out.println(set.size());      
    } 
}

總結(jié)

dfs和bfs是圖論中非常經(jīng)典的搜索算法，兩種算法的重要程度都非常高，這里面主要對(duì)其簡(jiǎn)單介紹，對(duì)于普通開(kāi)發(fā)者，能夠用dfs和bfs能夠解決二叉樹(shù)問(wèn)題、迷宮搜索問(wèn)題等基礎(chǔ)簡(jiǎn)單的就夠了(面試官不會(huì)那么騷難為你)。

如果理解比較困難，多看教程、多刷題，多刷題之后每做一題算法跑的大概流程是有個(gè)數(shù)的。

責(zé)任編輯：武曉燕來(lái)源： bigsai