소개
이 문서에서는 고도로 집중된 기능인 TI(Topology Independent) - LFA(Loop-Free Alternative)와의 통합 개념을 설명합니다. XYZ Networks의 요구 사항을 기반으로 하는 토폴로지 다이어그램이 포함된 언더레이로서 TI-LFA 보호를 사용하여 SR(Segment Routing) - TE(Traffic Engineering) 정책 경로 통합 메커니즘에 대해 자세히 설명합니다.
링크 오류 감지
SR-TE 정책 경로 통합 및 TI-LFA 기능은 서로 독립적이며 개별적으로 작동합니다. 그러나 TI-LFA 기능이 추가되어 기본 SR-TE 정책 경로 장애를 신속하게 탐지하고 이상적인 네트워크 조건에서 미리 정의된 백업 경로로 50msec 미만의 트래픽 스위칭을 수행할 수 있습니다. SR-TE 정책은 TI-LFA가 없어도 완벽하게 작동합니다. 그러나 이 시나리오에서 컨버전스 수는 IGP(Interior Gateway Protocol)에만 의존하며 50 msec보다 훨씬 높습니다.
Link Failure(링크 오류) 시나리오에서는 링크 다운/플랩 이벤트 동안 패킷 손실을 최소화하는 컨버전스 시간을 최대한 낮게 유지하는 것이 목적입니다.
헤드엔드 노드에서 링크 다운 이벤트를 탐지하는 작업은 주로 다음 방법으로 수행할 수 있습니다.
1. 끊어진 인접 링크의 경우 물리적 레이어에서 탐지됩니다.
2. 고장난 원격링크의 경우 BFD over Bundle을 통한 탐지.
첫 번째 경우, 탐지가 구성된 BFD 간격/데드 타이머 및 링크가 다운된 정확한 네트워크 포인트에 따라 달라지는 두 번째 옵션보다 탐지 속도가 더 빠르고 수렴 시간이 더 짧습니다. 그러나 XYZ Org Network는 여러 홉을 포괄하는 엔드 투 엔드 서비스 트래픽이 포함된 멀티레이어 구조이므로 매우 빠른 탐지가 반드시 빠른 컨버전스를 의미하지는 않습니다.
XYZ 조직 네트워크는 단일 BGP AS 및 단일 IGP 도메인 내에 포함되므로, 여기서는 TI-LFA 사전 정의된 백업 경로가 모든 시나리오에서 링크 장애 발생 후 장애 조치 트래픽을 즉시 전달하며 토폴로지 상태에 관계없이 최소 패킷 손실과 완전한 접두사 커버리지를 보장합니다. SR-TE 정책 정의 프라이머리/세컨더리 경로는 IGP로 인해 통합되는 데 다소 시간이 걸릴 수 있으며, 궁극적으로 TI-LFA의 사전 정의된 경로와 일치하거나 일치하지 않는 코어를 통해 엔드 투 엔드 서비스 트래픽을 인수할 수 있습니다.
자세한 컨버전스 시나리오
자세한 내용은 SR-TE 정책 및 TI-LFA를 사용하는 트래픽 경로를 XYZ 조직 네트워크의 통합 메커니즘으로 설명하는 이 예제를 살펴보겠습니다.
토폴로지 다이어그램에 맞춘 샘플 SR 컨피그레이션:
segment-routing
traffic-eng
!
!
segment-list PrimaryPath1
index 10 mpls adjacency 10.1.11.0 --> First Hop (P1 node) of the explicit-path
index 20 mpls adjacency 10.1.3.1 --> Second Hop (P3 node) of the explicit-path
index 30 mpls adjacency 10.3.13.1 --> Third Hop (PE3 node) of the explicit-path
!
policy POL1
source-address ipv4 11.11.11.11 --> Source Node of the explicit-path
color 10 end-point ipv4 33.33.33.33 --> Destination Node of the explicit-path
candidate-paths
preference 100 --> Secondary Path taken care of dynamically by IGP TI-LFA
dynamic
metric
type igp
!
!
!
preference 200
explicit segment-list PrimaryPath1 --> Primary Explicit-Path of the SR-TE policy
!
!
일반 시나리오에서 트래픽은 가능한 두 개의 후보 경로 PE1 > P1 > P3 > PE3 및 SR-TE 정책, 관리자가 Adjj(Adjacency) - SID(Segment Identifier) 목록을 사용하여 구성한 기본 명시적 경로 또는 관련 IGP PE1 > P2 > P4 > PE3 에 의해 결정된 보조 동적 경로 중 하나 10.1.11.0, 10.1.3.1, 10.3.13.1 를 통해 PE1에서 PE3으로 통과해야 합니다. 관리자는 기본 후보 경로를 사용하고 기본 경로가 중단된 경우에만 보조 경로로 폴백하는 것을 선호합니다. 따라서 기본 경로를 나타내는 1차 후보 경로에는 더 높은 선호 값이 할당됩니다. 예를 들어, 1차 후보 경로는 의 선호도를 가질 수 200 있고, 2차 후보 경로는 의 선호도를 가질 수 100있다.
그림 1: 일반 트래픽 시나리오 SR-TE 기본 후보 경로
모든 후보 경로는 유효할 때 사용되며, 해당 구성 SID의 도달 가능성에 따라 유효성 기준이 결정됩니다.
두 후보 경로가 모두 유효하고 사용 가능한 경우 헤드엔드 PE1은 더 높은 기본 설정 경로를 선택하고 이 경로의 SID 목록을 포워딩 10.1.11.0, 10.1.3.1, 10.3.13.1 테이블에 설치합니다. 이 SR 정책에 조정된 서비스 트래픽은 임의의 시점에서 선택한 경로에서만 전송되며, 다른 모든 동적 후보 경로는 비활성 상태입니다.
후보 경로는 SR 정책의 모든 유효 후보 경로들 중에서 가장 높은 선호도 값을 가질 때 선택된다. 선택한 경로를 SR 정책의 '활성 경로'라고도 합니다.
링크 오류 통합 - 기본 경로가 중단 상태로 전환됩니다.
어떤 시점에서는 네트워크에 링크 장애가 발생할 수 있습니다. 실패한 링크는 임의의 두 노드(예: P1 및 P3) 간의 링크일 수 있다. 이 절의 시작 부분에서 설명한 대로 어떤 방법으로도 장애가 탐지되는 즉시 TI-LFA 보호는 트래픽 흐름이 TI-LFA 보호 경로로, 이상적으로는 50 msec 이내에 신속하게 리디렉션되도록 해야 합니다.
이 시나리오에서는 그림 2와 같이 TI-LFA로 결정된 백업 경로가 그림 3의 IGP로 결정된 통합 백업 정책 경로와 다릅니다. Ti-LFA 백업 경로는 장애가 발생한 PLR(Point Of Local Repair) 노드에 의해 로컬로 결정되므로 이는 매우 정상적이지만, 최적화된 SR-TE 정책 백업 경로는 SR-TE 정책 결정을 보유한 헤드엔드 노드에 의한 IGP 통합에 의해 결정됩니다.
그림 2: TI-LFA 백업 경로를 통한 장애 조치 트래픽 시나리오
트래픽은 TI-LFA 보호 경로를 통해 계속 흐르다가 결국 헤드엔드 PE1이 IGP 플러딩을 통해 실패한 링크 10.1.3.1 의 SID가 유효하지 않게 되었음을 알게 됩니다. 그런 다음 PE1은 경로 SID 목록의 유효성을 평가하고 잘못된 SID10.1.11.0, 10.1.3.1, 10.3.13.1 가 있기 때문에 경로 SID를 무효화합니다 10.1.3.1. 동시에 후보 경로를 무효화하고 SR-TE 정책의 경로 선택 프로세스를 다시 실행합니다. 그런 다음 PE1은 다음으로 높은 기본 설정 값을 갖는 다른 유효한 후보 경로를 선택하고 포워딩 테이블에 새 보조 후보 경로10.2.11.0, 10.2.4.1, 10.4.13.1 의 SID 목록을 설치합니다. 그러나 이 보조 후보 경로는 IGP OSPF(Open Shortest Path First)에서 결정하는 동적 경로이며 관리 제어가 없습니다. 이 단계까지 트래픽은 보호된 TI-LFA 경로를 통해 이동하지만, 이 단계 이후에는 SR-TE 정책의 새로 선호하는 보조 경로로 이동됩니다.
그림 3: SR-TE 보조 후보 경로를 통한 장애 조치 트래픽 시나리오
요약 단계:
1. 고장 시
- Layer1/BFD는 기본 경로를 FIB로 하향 시그널링합니다.
- FIB는 TI-LFA로 설정된 백업 경로를 HW로 푸시
- 예상되는 트래픽 중단:
- 링크 다운: ~50ms
- BFD 피어 손실: BFD 데드 타임 + ~50ms
- OSPF Peering over Lost Link 작동 중단
2. 도메인의 모든 OSPF 라우터가 LSA(Link State Advertisement) 플러딩을 통해 SID 손실을 파악합니다.
3. SR-TE 헤드엔드 PE1에서:
- OSPF 통합
- SR-TE 정책 기본 경로 SID 목록이 무효화됩니다.
- 주 후보의 경로가 다운되었습니다.
- 보조 후보 경로 SID 목록이 검증되고 활성화됩니다
- 트래픽은 서비스 트래픽 손실 없이 보조 경로를 통해 전송됩니다
링크 오류 재통합 - 기본 경로 작동 상태로 돌아가기
한편, 기본 실패 링크가 복원되면 기본 설정(200)이 있는 원래 기본 경로가 다시 유효하게 되므로 헤드엔드 PE1은 SR-TE 정책 경로 선택 절차를 수행하고, 기본 설정이 가장 높은 유효한 명시적 후보 경로를 선택하고, 원래 기본 경로의 SID 목록으로 포워딩 테이블을 업데이트합니다. 이 SR 정책에 조정된 서비스 트래픽은 원래 경로에서 다시 PE1 > P1 > P3 > PE3전송됩니다.
그림 4: 리컨버지드 트래픽 시나리오
요약 단계:
1. Layer 1/BFD는 기본 경로를 백업하라는 신호를 보내고 OSPF에 알림을 보냅니다.
2. 트래픽은 여전히 SR-TE 정책 백업 후보 경로를 통해 전달됩니다.
3. 잠시 후 OSPF LSA 플러딩을 통해 SR-TE 정책 기본 후보 경로의 SID 목록이 유효해집니다.
4. 트래픽이 SR-TE 정책 백업 후보 경로에서 SR-TE 정책 기본 후보 경로로 전환되며 트래픽 손실이 전혀 없습니다.
결론적으로, 이러한 시나리오는 통합 프로세스와 이상적인 통합 숫자에 대한 이론적인 설명을 제공합니다. 그러나 실습에서 실제 통합 숫자를 테스트하여 프로덕션 네트워크와 구성을 가능한 한 가깝게 모방하고 네트워크에서 예상할 수 있는 서로 다른 장애 지점을 트리거해야 합니다.
주의: 정의된 명시적 경로가 중간 노드에 연결되는 경우 노드 보호가 SR-TE 명시적 경로와 작동하지 않으므로 이 문서에서는 링크 보호 시나리오만 설명합니다. 이는 TI-LFA가 구성된 각 중간 홉을 대상 노드로 사용하며 이 중 하나라도 실패하면 최종 대상을 확인할 수 없기 때문입니다. 이는 기술 제한이며 어떤 플랫폼 또는 이미지 버전에도 제한되지 않습니다. 이 제한에 대한 해결책은 관련 정보 섹션에서 설명한 대로 이 문서의 2부에서 다룹니다.
사용된 소프트웨어
솔루션을 테스트하고 검증하는 데 사용되는 소프트웨어는 Cisco IOS®XR 7.3.2입니다.
관련 정보