오예 !!!

[그래프] 그래프 알고리즘 (2) 신장 트리 & 크루스칼 알고리즘 본문

💻/알고리즘

[그래프] 그래프 알고리즘 (2) 신장 트리 & 크루스칼 알고리즘

당도최고치악산복숭아 2023. 3. 16. 19:15

신장 트리

  • 신장트리: 하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프
  • 모든 노드가 포함되어 서로 연결되면서 사이클이 존재하지 않는다는 조건은 트리의 성립 조건임
  • 어떠한 그래프에서 신장 트리는 여러 개 존재할 수 있음

크루스칼 알고리즘

  • 가능한 한 최소한의 비용으로 신장 트리를 찾을 때 사용
    • ex) N개의 도시가 존재할 때, 두 도시 사이에 도로를 놓아 전체 도시가 서로 연결될 수 있게 도로를 설치하는 경우, 최소한의 비용으로 모든 도시를 연결할 때 사용
  • 최소 신장 트리 알고리즘
    • 신장 트리 중에서 최소 비용으로 만들 수 있는 신장 트리를 찾는 알고리즘
    • 크루스칼 알고리즘이 대표적인 최소 신장 트리 알고리즘
  • 그리디 알고리즘의 일종
    • 모든 간선에 대하여 정렬을 수행한 뒤, 가장 거리가 짧은 간선부터 집합에 포함시키면 됨
    • 이때 사이클을 발생시킬 수 있는 간선의 경우, 집합에 포함시키지 않음
  • 알고리즘 동작 방식
    1. 간선 데이터를 비용에 따라 오름차순으로 정렬
    2. 간선을 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인
      1. 사이클이 발생하지 않는 경우 최소 신장 트리에 포함
      2. 사이클이 발생하는 경우 최소 신장 트리에 포함시키지 않음
    3. 모든 간선에 대하여 2번 과정 반복
  • 결과적으로 만들어지는 최소 신장 트리는 일종의 트리 자료 구조이므로, 신장 트리에 포함되는 간선의 개수는 (노드의 개수 - 1)
  • 결과적으로 만들어지는 최소 신장 트리에 포함되어 있는 간선의 비용을 모두 더하면, 그 값이 최종 비용에 해당함
  • 소스코드
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
  # 루트 노드가 아니라면 루트 노드를 찾을 때까지 재귀적으로 호출
  if parent[x] != x:
    parent[x] = find_parent(parent, parent[x])
  return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
  a = find_parent(parent, a)
  b = find_parent(parent, b)
  if a < b:
    parent[b] = a
  else:
    parent[a] = b

# 노드의 개수와 간선(union)의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1)

edges = [] # 모든 간선을 담을 리스트
result = 0 # 최종 비용을 담을 변수

# 부모 테이블 상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
  parent[i] = i

# 모든 간선에 대한 정보를 입력받기
for _ in range(e):
  a, b, cost = map(int, input().split())
  # 비용 순으로 정렬하기 위해서 튜플의 첫 번째 원소를 비용으로 설정
  edges.append((cost, a, b))

# 간선을 비용순으로 정렬
edges.sort()

# 간선을 하나씩 확인하며
for edge in edges:
  cost, a, b = edge
  # 사이클이 발생하지 않는 경우에만 집합에 포함
  if find_parent(parent, a) != find_parent(parent, b):
    union_parent(parent, a, b)
    result += cost

print(result)
  • 입력 예시
7 9
1 2 29
1 5 75
2 3 35
2 6 34
3 4 7
4 6 23
4 7 13
5 6 53
6 7 25
  • 출력 예시
159
  • 크루스칼 알고리즘의 시간 복잡도
    •  간선 개수라 E일 때, O(ElogE)의 시간복잡도를 가짐
    • 시간이 가장 오래 걸리는 부분이 간선을 정렬하는 작업이며, E개의 데이터를 정렬할 때 시간 복잡도가 O(ElogE)임.
Comments