대표적인 그래프 탐색 알고리즘에는 DFS와 BFS가 있습니다.
여기서 탐색이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 말하며,
DFS와 BFS는 코딩 테스트에서 매우 자주 등장하는 유형이므로 반드시 숙지해야 하는 부분입니다.
특히, 국내 대기업 공채에서는 DFS와 BFS를 적절히 활용해야 하는 문제를 많이 출제하고 있습니다.
DFS와 BFS를 보기에 앞서 반드시 알아야하는 자료구조에 대해 알아보겠습니다.
스택 자료구조
먼저, 스택은 먼저 들어온 데이터가 나중에 나가는 형식(선입후출)의 자료구조 입니다.
즉, 입구와 출구가 동일한 형태로 가장 대표적인 예시로는 박스 쌓기 예시를 들 수 있죠.
여러 개의 박스를 쌓아야 할 때, 가장 아래부터 박스를 쌓아올립니다.
그 후, 박스를 제거할 때는 가장 위쪽의 박스부터 차례대로 빼죠.
즉, 스택 자료구조는 삽입과 삭제, 2가지 연산으로 구성되어 있습니다.
이러한 스택 자료구조는 DFS 알고리즘뿐만 아니라 매우 다양한 알고리즘에서 사용되기 때문에 확실히 익혀야할 필요가 있죠.
스택 자료구조의 경우 파이썬의 리스트를 이용하여 쉽게 구현할 수 있습니다.
stack = []
# 삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
stack.append(5)
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop()
stack.append(1)
stack.append(4)
stack.pop()
print(stack) # 최하단 원소부터 출력
# [1, 3, 2, 5]
print(stack[::-1]) # 최상단 원소부터 출력
# [5, 2, 3, 1]
append 함수의 경우 가장 오른쪽에 원소를 삽입하며,
pop 함수의 경우 가장 오른쪽의 원소를 꺼내고 있습니다.
append 함수와 pop 함수의 시간 복잡도는 모두 O(1)이기 때문에 스택 자료구조로 활용하기에 매우 적합하죠.
따라서 파이썬에서는 별도의 라이브러리 없이도 편하게 스택을 이용할 수 있습니다.
큐 자료구조
큐는 먼저 들어온 데이터가 먼저 나가는 형식(선입선출)의 자료구조 입니다.
큐의 대표적인 예시로는 입구와 출구가 모두 뚫려 있는 터널, 은행창구에서 대기하는 사람으로 생각해볼 수 있죠.
아래와 같은 예시를 생각해봅시다.
큐에서 데이터를 삽입하는 경우에는 왼쪽부터 차례대로 5, 2, 3, 7 순서대로 데이터를 삽입하게 됩니다.
이제 데이터가 삭제가 된다하면, 가장 오른쪽에 위치하는 5부터 원소가 삭제되게 됩니다.
즉, 데이터가 삽입될 때는 왼쪽으로, 삭제될 때는 오른쪽으로 삭제되는 형태를 보이게 되죠.
from collections import deque
# 큐(Queue) 구현을 위해 deque 라이브러리 사용
queue = deque()
# 삽입(5) - 삽입(2) - 삽입(3) - 삽입(7) - 삭제() - 삽입(1) - 삽입(4) - 삭제()
queue.append(5)
queue.append(2)
queue.append(3)
queue.append(7)
queue.popleft()
queue.append(1)
queue.append(4)
queue.popleft()
print(queue) # 먼저 들어온 순서대로 출력
# deque([3, 7, 1, 4])
queue.reverse() # 다음 출력을 위해 역순으로 바꾸기
print(queue) # 나중에 들어온 원소부터 출력
# deque([4, 1, 7, 3])
리스트 자료형을 이용할 수는 있지만, 이를 이용하는 경우 시간 복잡도가 높아 비효율적이기 때문에,
큐를 이용할 때는 deque 라이브러리를 사용해야 합니다.
먼저, 하나의 queue 객체를 생성한 후, append와 popleft 합수를 사용하면 되는데요,
deque 라이브러리의 append 함수는 파이썬의 기본 append 함수와 동일하게 동작하며,
popleft 함수는 가장 왼쪽의 데이터를 꺼낼 때 사용하는 함수입니다.
(물론 앞서 다뤘던 그림과 반대 방향이지만, 방향을 바꾸면 같은 구조가 되는 것이죠. )
재귀 함수
다음으로 재귀 함수(Recursive Function)란 자기 자신을 다시 호출하는 함수를 의미합니다.
이러한 재귀 함수는 DFS를 실질적으로 구현하려할 때 자주 사용되므로,
이를 잘 이해하고 넘어가는 것이 매우 중요합니다.
def recursive_function():
print('재귀 함수 호출')
recursive_function
recursive_function()
위는 가장 간단한 재귀 함수의 예시인데요, 이는 '재귀 함수 호출'이라는 문자열을
무한히 출력하게 되며, 어느 정도 출력을 진행하다 최대 재귀 깊이 초과 메세지가 출력되게 됩니다.
이런 재귀함수를 사용한다면, 별도의 while이나 for문 없이도 어떠한 작업을 반복적으로 수행할 수 있게 되죠.
그러나, 일반적으로 재귀함수를 문제 풀이에 사용할 때는 재귀함수의 종료 조건을 반드시 명시해야 합니다.
종료 조건을 제대로 명시하지 않으면, 함수가 무한히 호출되어 오류가 발생하기 때문이죠.
def recursive_function(i):
# 100번째 호출을 했을 때 종료되도록 종료 조건 명시
if i == 100:
return
print(i, '번째 재귀함수에서', i + 1, '번째 재귀함수를 호출합니다.')
recursive_function(i + 1)
print(i, '번째 재귀함수를 종료합니다.')
recursive_function(1)
위와 같이 특정 변수의 값을 통해 재귀 함수의 종료 조건을 걸 수 있죠.
이처럼 재귀 함수를 사용하게 되면, 스택에 데이터를 넣은 것처럼 각각 함수에 대한 정보가 스택에 담기게 됩니다.
팩토리얼 구현 예제
팩토리얼은 n! = 1 X 2 X 3 X ... X (n-1) X n 과 같이 표현되는 수식인데요,
재귀함수를 이용해 팩토리얼 값을 구할 수 있습니다.
# 방법 1
# 반복적으로 구현한 n!
def factorial_iterative(n):
result = 1
# 1부터 n까지의 수를 차례대로 곱하기
for i in range(1, n + 1):
result *= i
return result
# 방법 2
# 재귀적으로 구현한 n!
def factorial_recursive(n):
if n <= 1: # n이 1 이하인 경우 1을 반환 (1! = 1)
return 1
# n! = n * (n - 1)!를 그대로 코드로 작성하기
return n * factorial_recursive(n - 1)
# 각각의 방식으로 구현한 n! 출력(n = 5)
print('반복적으로 구현:', factorial_iterative(5))
print('재귀적으로 구현:', factorial_recursive(5))
방법 1의 경우 우리가 쉽게 사용할 수 있는 방법이지만,
2번의 방법과 같이 재귀함수를 이용해 팩토리얼을 계산하게 되면,
5 X (5-1)! -> 4 X (4-1)! 과 같이 구하게 되는 것이다.
최대공약수 계산 (유클리드 호제법) 예제
재귀함수를 효과적으로 사용할 수 있는 또 다른 예시로
유클리드 호제법이 있는데요,
유클리드 호제법은 최대 공약수(GCD)를 구하고자 할 때 사용할 수 있는 방법입니다.
유클리드 호제법
- 두 자연수 A, B에 대하여 (A > B) A를 B로 나눈 나머지를 R이라고 할 때
- A와 B의 최대공약수는 B와 R의 최대공약수와 같다.
위의 예시를 살펴봅시다.
우리가 알 수 있는 점은 192와 162의 최대공약수는
192를 162로 나눈 나머지(30)과 162 와의 최대공약수와 같은 값을 갖는 걸 알 수 있습니다.
마찬가지로, 162와 30의 최대공약수는
162를 30으로 나눈 나머지(12)와 30의 최대공약수와 같은 값을 가지고 있습니다.
결과적으로 우리는 GCD(192, 162) = GCD(12, 6) = 6인 것을 알 수 있습니다.
이를 실제로 코드로 구현하면, 다음과 같습니다.
def gcd(a, b):
if a % b == 0:
return b
else:
return gcd(b, a % b)
print(gcd(192, 162))
# 6
재귀 함수 유의사항
- 재귀함수를 잘 활용하면 복잡한 알고리즘을 간결하게 작성할 수 있지만,
오히려 다른 사람이 이해하기 어려운 형태의 코드가 될 수도 있기에 신중하게 사용해야 합니다.
- 또한, 모든 재귀 함수는 반복문을 이용해 동일한 기능을 구현할 수 있으며,
반대로 모든 반복문을 이용한 코드는 재귀함수를 이용해 구현할 수도 있습니다.
- 재귀함수는 반복문보다 유리한 경우도 있고 불리한 경우도 있기에,
문제에 따라 효율적으로 선택해서 사용해야 합니다.
- 컴퓨터가 함수를 연속적으로 호출하면, 컴퓨터 메모리 내부의 스택 프레임에 쌓이게 됩니다.
따라서 스택을 사용해야 할 때, 구현상 스택 라이브러리 대신 재귀 함수를 이용하는 경우가 많습니다.
(대표적으로 DFS를 짧고 간결하게 구현하기 위해 재귀함수를 사용합니다.)
DFS (Depth-First-Search)
DFS는 깊이 우선 탐색이라고도 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘입니다.
DFS는 스택 자료구조(혹은 재귀 함수)를 이용하며, 구체적인 동작 과정은 다음과 같습니다.
1️⃣ 탐색 시작 노드를 스택에 삽입하고 방문 처리를 합니다.
2️⃣ 스택의 최상단 노드에 방문하지 않은 인접한 노드가 하나라도 있으면, 그 노드를 스택에 넣고 방문 처리합니다.
방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼냅니다.
3️⃣ 더 이상 2번의 과정을 수행할 수 없을 때까지 반복합니다.
그림으로 구체적인 과정을 확인해봅시다.
아래와 같은 그래프가 있을 때, 간선은 방향이 없는 무방향 그래프이며,
방문 기준은 번호가 낮은 인접 노드부터라고 가정해보겠습니다.
먼저, 시작 노드인 1을 방문합니다.
이후, 매번 스택의 최상단 노드를 확인하면서, 인접한 노드 중 방문하지 않은 노드를 방문합니다.
가장 최상단 노드인 1에서 방문하지 않은 인접한 노드는 2, 3, 8이 있는데요,
이 때, 방문 기준인 "번호가 낮은 인접노드"에 따라 2를 방문하게 됩니다.
이제, 최상단 노드는 2가 되었으므로, 인접 노드 중 방문하지 않은 7을 방문하게 됩니다.
다음 최상단 노드는 7이 되었는데요, 인접 노드 6, 8 중 가장 작은 노드인 6을 방문합니다.
DFS에서는 깊이 우선의 탐색을 진행하기 때문에, 그래프에서 가장 우선적인 부분을 탐색하게 됩니다.
위와 같은 과정을 반복했을 때, DFS를 이용해 전체 노드를 방문할 수 있으며,
실제 탐색 순서는 아래와 같이 이루어지게 됩니다.
DFS 소스코드 예제
이제, DFS를 구현한 코드를 확인해보겠습니다.
파이썬에서는 아래와 같이 그래프를 표현하기 위해 2차원 리스트를 사용할 수 있습니다.
일반적으로 그래프 문제가 출제되면, 노드의 번호가 1번부터 시작하는 경우가 많기 때문에,
인덱스 0에 대한 내용은 비워두는 것이 헷갈리지 않고 쉽게 인지하기에 좋습니다.
# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
[],
[2, 3, 8],
[1, 7],
[1, 4, 5],
[3, 5],
[3, 4],
[7],
[2, 6, 8],
[1, 7]
]
해당 리스트는 각 노드가 연결된 정보를 담고 있는데요,
즉, 1번 노드와 연결된 것은 2, 3, 8번 노드이며,
2번 노드와 연결된 것은 1, 7번 노드인 것을 알 수 있습니다.
이후, 각 노드의 방문 여부를 표시한 visited 배열을 초기화합니다.
# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
# 처음에는 모두 방문하지 않은 것으로 초기화
visited = [False] * 9
# DFS 함수 정의
def dfs(graph, v, visited):
# 현재 노드를 방문 처리
visited[v] = True
print(v, end=' ') # 방문의 의미로 출력
# 현재 노드와 연결된 다른 노드를 재귀적으로 방문 -> 인접한 노드가 방문하지 않은 상태면 방문 진행
for i in graph[v]:
if not visited[i]:
dfs(graph, i, visited)
# 정의된 DFS 함수 호출
dfs(graph, 1, visited)
# 1 2 7 6 8 3 4 5
BFS (Breadth-First-Search)
BFS는 너비 우선 탐색이라고도 부르며, 그래프에서 가까운 노드부터 우선적으로 탐색하는 알고리즘입니다.
BFS는 큐 자료구조를 이용하며, 구체적인 동작 과정은 다음과 같습니다.
1️⃣ 탐색 시작 노드를 큐에 삽입하고 방문 처리를 합니다.
2️⃣ 큐에서 노드를 꺼낸 뒤에 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리합니다.
3️⃣ 더 이상 2번의 과정을 수행할 수 없을 때까지 반복합니다.
BFS 알고리즘은 특정 조건에서의 최단 경로 문제를 해결하기 위한 목적으로 사용될 수 있습니다.
또한, 큐 자료구조가 쓰이기 때문에, 각 프로그래밍 언어마다 큐 자료구조가 어떻게 쓰이는지 인지해 둘 필요가 있습니다.
BFS 또한 그림으로 해결해봅시다.
방향성이 없는 무방향 그래프이며, 특정 노드에 대해서 번호가 낮은 인접 노드부터 방문하게 됩니다.
먼저, 시작 노드인 1번 노드를 큐에 넣고 방문 처리를 합니다.
그림에서 큐의 원소는 위에서 들어와 아래로 나간다고 가정합니다.
이제 매번 큐에서 원소를 꺼내, 꺼낸 노드의 인접 노드 중에서 방문하지 않은 노드들을 모두 방문하면 되는 것입니다!
BFS 알고리즘은 말 그대로 너비 우선 탐색 방법으로써,
시작 노드부터 가까운 노드를 우선적으로 하여 탐색하게 됩니다.
즉, 시작 노드인 1에서 거리가 1인 노드(2, 3, 8) 중 가까운 순서대로 2 -> 3 -> 8을 탐색하고,
거리가 2인 노드(4, 5, 7) 중 2 -> 3 -> 8에 순서대로 7 -> 4 -> 5를 방문하게 됩니다.
그 후, 거리가 가장 먼 6번 노드를 가장 마지막에 탐색하게 됩니다.
이런 BFS는 코딩테스트에서 매우 자주 등장하는 알고리즘이므로, 잘 기억해야 합니다!
BFS 소스코드 예제
이제, BFS의 예제를 확인해 볼 것인데요, DFS와 마찬가지고 그래프를 표현해줍니다.
# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph = [
[],
[2, 3, 8],
[1, 7],
[1, 4, 5],
[3, 5],
[3, 4],
[7],
[2, 6, 8],
[1, 7]
]
# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited = [False] * 9
즉, 위의 리스트가 의미하는 바는
0번 노드는 사용 X
1번 노드와 연결된 인접 노드는 2, 3, 8
2번 노드와 연결된 인접 노드는 1, 7
임을 알 수 있습니다.
from collections import deque
# BFS 함수 정의
def bfs(graph, start, visited):
# 큐(Queue) 구현을 위해 deque 라이브러리 사용
queue = deque([start])
# 현재 노드를 방문 처리
visited[start] = True
# 큐가 빌 때까지 반복
while queue:
# 큐에서 하나의 원소를 뽑아 출력
v = queue.popleft()
print(v, end=' ')
# 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
for i in graph[v]:
if not visited[i]:
queue.append(i)
visited[i] = True
# 정의된 BFS 함수 호출
bfs(graph, 1, visited)
# 1 2 3 8 7 4 5 6
참고문헌 : "이것이 취업을 위한 코딩 테스트다 with 파이썬 (나동빈 저) 의 유튜브 강의
https://www.youtube.com/watch?v=7C9RgOcvkvo&list=PLRx0vPvlEmdAghTr5mXQxGpHjWqSz0dgC&index=6
'코딩테스트 > AL' 카테고리의 다른 글
[이것이 코딩테스트다] 그래프 탐색 알고리즘 : DFS & BFS - 예제 (0) | 2024.08.13 |
---|---|
[이것이 코딩테스트다] 구현 문제 (0) | 2024.05.18 |
[이것이 코딩테스트다] 그리디 알고리즘 (3) | 2024.05.18 |