Edge, Origin Retcode (응답코드)

edge_retcode_5xx, origin_retcode_5xx flow는 CDN Edge 로그에서 서비스 / 볼륨 단위로 retcode를 수집 하여 평가 및 Alarm을 전송하는 action flow 입니다.

Alarm 설정

플로우 타입

edge_retcode_5xx 또는 origin_retcode_5xx 선택

Response Code

[ 5xx, 500, 501, 502, 503, 504, 506, 507, 508, 510, 511 ] 중 1개 이상 선택

  • 관제 하려는 응답코드를 1개 이상 선택 합니다.

  • 5xx은 500~599 사이의 응답코드입니다.

Time Agg Period

[1분, 5분] 중 하나 선택

  • Aggregation을 수행할 간격을 선택합니다.

  • 1분 / 5분 단위로 Aggregation 하여 Alarm 여부를 판단합니다.

예) 실행 시간이 2024-01-01 00:10:00 인 경우

time agg period
기준 시간
모니터링 시간

1분

2024-01-01 00:08:00

2024-01-01 00:07:00 ~ 2024-01-01 00:07:59

5분

2024-01-01 00:08:00

2024-01-01 00:03:00 ~ 2024-01-01 00:07:59

Time Alignment

[On, Off] 중 하나 선택

  • 모니터링 시간을 정렬하지 여부를 선택합니다.

  • 5분의 경우만 의미가 있습니다.

예) 실행 시간이 2024-01-01 00:10:00 이고, 집계 단위가 5분인 경우

time align
기준 시간
모니터링 시간

Off

2024-01-01 00:08:00

2024-01-01 00:03:00 ~ 2024-01-01 00:07:59

On

2024-01-01 00:05:00

2024-01-01 00:00:00 ~ 2024-01-01 00:04:59

현재 time agg period가 5분 이고, time align가 On인 경우 5분 동안 같은 모니터링 시간을 보고 있으므로 같은 Alarm이 5번 울릴 수 있습니다.

Time Lazy Pos (분)

[0 ~ 1440] 값 설정 가능, 기본 값 : 0

  • 지연된 모니터링 기준 시간을 설정하는 기능입니다.

  • 기본 0인 경우 모니터링 데이터 시간은 Now - 2분이 기준이 됩니다.

예) 실행 시간이 2024-01-01 00:10:00 이고, 집계 단위가 1분인 경우 예시

time lazy pos
기준 시간
모니터링 시간

0

2024-01-01 00:08:00

2024-01-01 00:07:00 ~ 2024-01-01 00:07:59

1

2024-01-01 00:07:00

2024-01-01 00:06:00 ~ 2024-01-01 00:06:59

10

2023-12-31 23:58:00

2023-12-31 23:57:00 ~ 2023-12-31 23:57:59

Eval Type

[Datapoint] 선택

※ Edge, Origin retcode 에서는 [Datapoint] 만 선택 가능

  • 평가 타입을 선택합니다.

  • Datapoint

    • 기준 시간의 데이터로 평가되며, eval method value(Count) 값이 평가 기준으로 사용 됩니다.

Eval Method Type

[Threshold value, Partial ratio] 중 하나 선택

  • 평가 방법을 선택합니다.

  • Threshold value

    • 기준 시간의 값(Count)이 판단을 위한 평가 데이터가 됩니다.

    • 여러 개의 응답 코드를 선택한 경우 sum( selected response code )가 기준이 됩니다.

  • Partial ratio

    • 기준 시간의 전체(0 ~ 999) 중 선택한 response code의 비율이 판단을 위한 평가 데이터가 됩니다.

Eval Period

time agg period이 1인 경우, [1~10] 중 선택

time agg period이 5인 경우, [1~12] 중 선택

※ eval type이 [Datapoint] 이고, eval method type이 [Threshold value] 인 경우만 설정

  • 평가 기간(Evaluation Periods)은 Alarm 상태를 결정할 때 평가할 가장 최근의 Data Tick의 수이며, 각 Tick 마다 평가를 하게 됩니다.

  • 예) time agg period이 1이고 eval period 가 3인 경우, 3개의 Tick을 가지고, 각 Tick 마다 평가를 하게 됩니다.

Eval Value

eval type이 [Datapoint] 이고, eval method type이 [Threshold value] 인 경우, [1 ~ eval period] 범위 설정

  • eval type이 [Datapoint] 이고, eval method type이 [Threshold value] 인 경우

    • 전체 Tick에서 Alarm 상태에 도달하게 만드는 평가 위반 Tick의 수 입니다.

    • 예) 평가 주기(eval period)가 5이고 평가 값(eval value)이 3인 경우, 총 5개의 Tick 중 3개 이상의 Tick에서 위반 조건이 충족되면 알람이 발생합니다. 반대로, 위반 조건을 충족하는 Tick이 2개 이하일 경우에는 알람이 발생하지 않습니다.

      • ※ 연속 유무와 상관 없음.

Eval Method Operator Type

[>, >=, <, <=] 중 하나 선택

※ Datapoint - Threshold : [측정 값] [>, >=, <, <=] [eval method value]

※ Datapoint - Partial Ratio : [비율 값] [>, >=, <, <=] [eval method value]

  • > : eval method value 보다 클 경우

  • >= : eval method value 보다 크거나 같을 경우

  • < : eval method value 보다 작을 경우

  • <= : eval method value 보다 작거나 같을 경우

Eval Method Value

Threshold value : [0 ~ 9223372036854] 중 정수 범위 설정

Partial ratio (%) : [0 ~ 100] 중 정수 범위 설정

  • eval method type 이 [Threshold value]인 경우

    • 지표를 평가하기 위한 기준 값(Count)

  • eval method type 이 [Partial ratio]인 경우

    • 지표 비율을 평가 하기 위한 기준 값(%)

Alarm 생성 시나리오 예제

Datapoint - Threshold value

Edge Retcode 5xx를 1분간 Agg한 데이터를 평가 하며, 평가 기준은 10개 이고, 평가 시간 총 5 Tick(5분) 동안에 2 Tick(2회) 이상 평가 기준을 초과 하면 Alarm 발생

설정 요약

  • time agg period : 1분

  • time align: on

  • time lazy pos : 0

  • response code : 5xx

  • eval type : Datapoint

  • eval method type: Threshold value

  • eval period : 5

  • eval value : 2

  • eval method operator : >

  • eval method value : 10

실행 시간 : 2024-01-01 00:10:00

tick no
5xx count
모니터링 시간
평가 결과

1

11

2024-01-01 00:07:00 ~ 2024-01-01 00:07:59

true

2

9

2024-01-01 00:06:00 ~ 2024-01-01 00:06:59

false

3

8

2024-01-01 00:05:00 ~ 2024-01-01 00:05:59

false

4

13

2024-01-01 00:04:00 ~ 2024-01-01 00:04:59

true

5

0

2024-01-01 00:03:00 ~ 2024-01-01 00:03:59

false

위 경우, 5개 tick 중 2개 tick 의 평가 결과가 ture 이고, eval value 조건(2 > 2)에 만족 하므로 Alarm 발송이 된다.

Datapoint - Partial ratio

Edge Retcode 5xx를 5분간 Agg한 데이터를 평가 하며, 전체 응답 코드 중 5xx 비율이 5% 초과 하면 Alarm 발생

설정 요약

  • time agg period : 5분

  • time align: off

  • time lazy pos : 0

  • response code : 5xx

  • eval type : Datapoint

  • eval method type: Partial ratio

  • eval method operator : >

  • eval method value : 5

실행 시간 : 2024-01-01 00:10:00

5xx count
all count
모니터링 시간
평가 결과

1,000

5,000

2024-01-01 00:03:00 ~ 2024-01-01 00:07:59

true

1,000 / 5,000 * 100 = 20, eval method value 값인 5 보다 크므로 (20 > 5) Alarm 발송

Last updated