[알고리즘] 탐색 알고리즘, DFS

우선 탐색이란, 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 의미한다.

DFS는 Depth-First Search, 깊이 우선 탐색이라고도 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다.

그래프 탐색이란 하나의 노드를 시작으로 다수의 노드를 방문하는 것을 말한다.

또한 두 노드가 간선으로 연결되어 있다면, 두 노드는 '인접하다'라고 표현한다.

노드를 도시, 간선을 도로라고 생각해보자. A라는 도시(노드)에서 B라는 도시(노드)로 이동하기 위해서, A와 B를 연결하는 도로(간선)을 거친다고 이해하면 쉬울 것이다.

프로그래밍에서 그래프는 크게 2가지 방식으로 표현할 수 있는데, 코딩 테스트에서는 이 두 방식 모두 필요하니 두 개념에 대해 바르게 알고 있도록 하자.

1. 인접 행렬(Adjacency Matrix) : 2차원 배열로 그래프의 연결 관계를 표현하는 방식

2. 인접 리스트(Adjacency List) : 리스트 그래프의 연결 관계를 표현하는 방식

1. 인접 행렬 (Adjacnecy Matrix) 방식

2차원 배열에 각 노드가 연결된 형태를 기록하는 방식이다.

파이썬에서는 2차원 리스트로 구현할 수 있다.

연결되어 있지 않은 노드끼리는 무한의 비용이라고 작성한다. (INF).

실제 코드에서는 논리적으로 정답이 될 수 없는 큰 값 중에서 99999999,987654321 등의 값으로 초기화하는 경우가 많다.

이렇게 그래프를 인접 행렬 방식으로 처리할 때는 다음과 같이 데이터를 초기화한다.

import java.util.*;

public class Main {

    public static final int INF = 999999999;
    
    // 2차원 리스트를 이용해 인접 행렬 표현
    public static int[][] graph = {
        {0, 7, 5},
        {7, 0, INF},
        {5, INF, 0}
    };

    public static void main(String[] args) {
        // 그래프 출력
        for (int i = 0; i < 3; i++) {
            for (int j = 0; j < 3; j++) {
                System.out.print(graph[i][j] + " ");
            }
            System.out.println();
        }
    }

}

2. 인접 리스트 (Adjacnency List) 방식

모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장한다.

위와 같은 그래프를 인접 리스트 방식으로 표현하면 다음과 같다.

인접 리스트는 '연결 리스트'라는 자료구조를 이용해 구현한다.

자바에서는 별도로 연결 리스트 기능을 위한 표준 라이브러리를 제공한다.

import java.util.*;

class Node {

    private int index;
    private int distance;

    public Node(int index, int distance) {
        this.index = index;
        this.distance = distance;
    }

    public void show() {
        System.out.print("(" + this.index + "," + this.distance + ") ");
    }
}

public class Main {

    // 행(Row)이 3개인 인접 리스트 표현, 배열로 구성된 배열 생성. 2차원 배열 객체 생성. 
    public static ArrayList<ArrayList<Node>> graph = new ArrayList<ArrayList<Node>>();

    public static void main(String[] args) {
        // 그래프에 각 행 객체를 생성 후 추가
        for (int i = 0; i < 3; i++) {
            graph.add(new ArrayList<Node>());
        }

        // graph의 0행을 받아와 노드 객체 생성 후 추가.
        graph.get(0).add(new Node(1, 7)); //0과 1 연결, 거리 7
        graph.get(0).add(new Node(2, 5)); //0과 2 연결, 거리 5

        // 노드 1에 연결된 노드 정보 저장 (노드, 거리)
        graph.get(1).add(new Node(0, 7)); //1과 0 연결, 거리 7

        // 노드 2에 연결된 노드 정보 저장 (노드, 거리)
        graph.get(2).add(new Node(0, 5)); //2와 0 연결, 거리 5

        // 그래프 출력
        for (int i = 0; i < 3; i++) {
            for (int j = 0; j < graph.get(i).size(); j++) {
                graph.get(i).get(j).show();
            }
            System.out.println();
        }
    }

}

메모리 측면와 속도 측면에서 어떤 차이가 있을지 알아보자.

메모리 측면에서 보자면 인접 행렬 방식은 모든 관계를 저장하므로, 노드 개수가 많을수록 메모리가 불필요하게 낭비된다.

반면에 인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다.

하지만 이와 같은 속성 때문에 인접 리스트 방식은 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다. 인접 리스트 방식에서는 연결된 데이터를 하나씩 확인해야 하기 때문이다.

예를 들어 노드 1과 7이 연결되어있는지 확인해보자. 인접 행렬 방식에서는 graph[1][7]만 확인하면 된다.

반면에, 인접 리스트 방식에서는 노드 1에 대한 인접 리스트를 앞에서부터 차례대로 확인해야 한다.

그러므로, 특정한 노드와 연결된 모든 인접 노드를 순회해야하는 경우, 인접 리스트 방식이 인접 행렬 방식에 비해 메모리 공간의 낭비가 적다.

DFS는 탐색을 위해서 사용되는 탐색 알고리즘이라고 했는데, 구체적으로 어떻게 동작할까? DFS는 깊이 우선 탐색 알고리즘이라고 했다. 이 알고리즘은 특정한 경로로 탐색하다가 특정한 상황에서 최대한 깊숙이 들어가서 노드를 방문한 후, 다시 돌아가 다른 경로로 탐색하는 알고리즘이다.

DFS는 스택 자료구조를 이용하여 구체적인 동작 과정은 다음과 같다.

1. 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.

2. 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면, 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.

3. 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.

'방문 처리'는 스택에 한번 삽입되어 처리된 노드가 다시 삽입되지 않게 체크하는 것을 의미한다. 방문 처리를 함으로써 각 노드를 한번씩만 처리할 수 있다.

다음과 같은 그래프를 생각해보자. 노드 1을 시작 노드로 설정하여 DFS를 이용해 탐색을 진행하면 어떻게 될까?

직관적으로 생각하면, 깊이 우선 탐색이라는 이름에서부터 알 수 있듯이 단순하게 가장 깊숙이 위치하는 노드에 닿을 때가지 확인하면 된다.

1. 시작 노드인 1을 방문한다.

2. 스택의 최상단 노드인 1에 방문하지 않은 인접 노드 2,3,8 이 있다. 이 중에서 가장 작은 노드인 2를 스택에 넣고 방문 처리한다.

3. 스택의 최상단 노드인 2에 방문하지 않은 인접 노드 7이 있다. 노드 7을 스택에 넣고 방문 처리한다.

4. 스택의 최상단 노드인 7에 방문하지 않은 인접 노드 6,8이 있다. 이 중에서 가장 작은 노드 6을 스택에 넣고 방문처리한다.

5. 스택의 최상단 노드인 6에 방문하지 않은 인접 노드가 없다. 따라서 스택에서 6번 노드를 꺼낸다.

6. 스택의 최상단 노드인 7에 방문하지 않은 인접 노드 8이 있다. 노드 8을 스택에 넣고 방문 처리한다.

7. 스택의 최상단 노드인 2에 방문하지 않은 인접 노드가 없다. 따라서 스택에서 노드 2를 꺼낸다.

8. 스택의 최상단 노드인 1에 방문하지 않은 인접 노드 3이 있다. 따라서 노드 3을 스택에 넣고 방문 처리한다.

9. 스택의 최상단 노드인 3에 방문하지 않은 인접 노드 4,5가 있다. 이 중에서 가장 작은 노드인 4를 스택에 넣고 방문처리한다ㅏ

10. 스택의 최상단 노드인 4에 방문하지 않은 인접 노드 5가 있다. 노드 5를 스택에 넣고 방문 처리한다.

11. 남아 있는 노드에 방문하지 않은 인접 노드가 없다. 따라서 모든 노드를 차례대로 꺼내면 다음과 같다.

1-2-7-6-8-3-4-5

실제로는 스택을 쓰지 않아도 되며,

탐색을 수행함에 있어서 데이터의 개수가 N개인 경우, O(N)의 시간이 소요된다는 특징이 있다.

또한, DFS는 스택을 이용하는 알고리즘이기 때문에 실제 구현은 재귀 함수를 이용했을 때 매우 간결하게 구현할 수 있다.

import java.util.*;

public class Main {

	// 인덱스 0부터 쓰지 않고, 인덱스 1부터 씀. 노드 번호와 맞추기 위함.
    public static boolean[] visited = new boolean[9];
    public static ArrayList<ArrayList<Integer>> graph = new ArrayList<ArrayList<Integer>>();

    // DFS 함수 정의
    public static void dfs(int x) {
        // 현재 노드를 방문 처리
        visited[x] = true;
        System.out.print(x + " ");
        // 현재 노드와 연결된 다른 노드를 재귀적으로 방문
        for (int i = 0; i < graph.get(x).size(); i++) {
            int y = graph.get(x).get(i); //x와 연결된 노드 확인
            if (!visited[y]) dfs(y);
        }
    }

    public static void main(String[] args) {
        // 그래프 초기화
        for (int i = 0; i < 9; i++) {
            graph.add(new ArrayList<Integer>());
        }

        // 노드 1에 연결된 노드 정보 저장 
        graph.get(1).add(2);
        graph.get(1).add(3);
        graph.get(1).add(8);
        
        // 노드 2에 연결된 노드 정보 저장 
        graph.get(2).add(1);
        graph.get(2).add(7);
        
        // 노드 3에 연결된 노드 정보 저장 
        graph.get(3).add(1);
        graph.get(3).add(4);
        graph.get(3).add(5);
        
        // 노드 4에 연결된 노드 정보 저장 
        graph.get(4).add(3);
        graph.get(4).add(5);
        
        // 노드 5에 연결된 노드 정보 저장 
        graph.get(5).add(3);
        graph.get(5).add(4);
        
        // 노드 6에 연결된 노드 정보 저장 
        graph.get(6).add(7);
        
        // 노드 7에 연결된 노드 정보 저장 
        graph.get(7).add(2);
        graph.get(7).add(6);
        graph.get(7).add(8);
        
        // 노드 8에 연결된 노드 정보 저장 
        graph.get(8).add(1);
        graph.get(8).add(7);

        dfs(1);
    }

}

SayHiWorld

[알고리즘] 탐색 알고리즘, DFS

티스토리툴바