본문으로 이동
기사 목록으로 돌아가기
Infrastructure16分

엣지 플랫폼 벤치마크 2026: Fastly·Akamai·AWS Lambda@Edge·Cloudflare Workers

Edge Platform Benchmark 2026: Fastly, Akamai, AWS Lambda@Edge, Cloudflare Workers

平井 翔大Infrastructure Solution Architect
2026-04-2316分
FastlyAkamaiAWSCloudflareLambda@EdgeWASMBenchmark

왜 지금 다시 엣지를 비교하는가

  • 년까지는 'Cloudflare Workers로 충분하다'는 것이 많은 일본 기업들의 결론이었습니다. 그러나 2025년 이후 Fastly Compute의 WASM 런타임이 안정화되고, AWS가 Lambda@Edge를 CloudFront Functions 2.0으로 쇄신하며, Akamai가 EdgeWorkers의 메모리 상한을 상향하는 등 선택지가 다시 치열해지고 있습니다. 특히 동남아시아(싱가포르·자카르타·방콕·마닐라)로의 전개를 수반하는 일본 기업에게는 각사의 PoP 분포와 법규 대응이 전략적으로 중요한 요소가 됩니다.

본고에서는 4개 플랫폼을 'cold start', '실효 메모리', 'GB-초 단가', '지리 분포', 'WAF / Bot 관리 통합'의 5가지 축으로 비교하고, 사용 사례별 선정 매트릭스를 제시합니다. 수치는 2026년 4월 시점의 공개 정보와 당사의 실서비스 벤치마크(도쿄·싱가포르·뭄바이 3개 리전에서 각 1시간 / 1,000 req/s)에 기반합니다.

Cold Start와 실효 메모리

Cloudflare Workers는 V8 Isolate를 사용하기 때문에 cold start가 거의 측정 불가능(p99에서 5ms 미만)하지만, Isolate 1개당 메모리는 128MB로 고정입니다. Fastly Compute는 WebAssembly를 구동하기 위한 wasmtime 기반 런타임으로, cold start는 p50에서 0.3ms, p99에서 5ms 전후로 Workers와 비견되는 속도를 가지면서 메모리는 512MB까지 확장할 수 있습니다. AWS Lambda@Edge는 종래의 Firecracker MicroVM 기반으로, cold start는 p50에서 150ms, p99에서 600ms를 초과하는 경우도 있어 정기적인 warm-up이 필수입니다. Akamai EdgeWorkers는 V8 기반이지만, tier별로 CPU time과 메모리 상한이 구분되며, Dynamic tier에서는 256MB / 200ms가 상한입니다.

벤치마크의 결론은 명확합니다. '1ms 응답이 필요한 핫 경로'는 Cloudflare 또는 Fastly, '100ms 이상의 처리가 필요한 무거운 로직'은 AWS Lambda@Edge라는 구분이 됩니다. Akamai는 그 중간에 위치하며, 기존 Akamai CDN 계약이 있는 조직에게 추가 비용 없이 사용할 수 있다는 점이 강점입니다.

``` # 도쿄 PoP에서의 단순 JSON 반환 p99 레이턴시(2026년 4월 사내 측정) Cloudflare Workers : 4.8ms Fastly Compute (WASM) : 5.2ms Akamai EdgeWorkers : 12.1ms AWS Lambda@Edge (cold) : 612ms / (warm) 38ms ```

GB-초 비용과 과금 모델

Cloudflare Workers는 '실행 시간 × 요청 수'가 아닌 'CPU time만'으로 과금하는 독자적인 모델로, I/O 대기 시간은 과금 대상에서 제외됩니다. Bundled 플랜은 월 500만 요청 + 50ms CPU time에 5 USD, Unbound는 10M req + 30M CPU-ms에 5 USD입니다. Fastly Compute는 '코어 인스턴스당 월정액' 모델로, 1인스턴스 50 USD부터 시작하며, 요청 종량제는 초과 시에만 발생합니다. AWS Lambda@Edge는 1ms 단위의 GB-초 과금으로, 오리진 요청과 뷰어 요청에서 단가가 다릅니다(뷰어 측이 3배 높음). Akamai EdgeWorkers는 계약 기반으로, Dynamic tier가 월 50만 회 실행까지 약 500 USD, 초과는 종량제입니다.

실효 단가를 '1M req / 평균 CPU 10ms / 페이로드 10KB'로 시산하면 다음 범위가 됩니다. Cloudflare 0.5 USD, Fastly 0.4 USD(코어 인스턴스 계약 내에 수렴하는 경우), AWS Lambda@Edge 2.1 USD, Akamai 약 3.0 USD. 단순 단가 기준으로는 Cloudflare / Fastly가 압도적으로 저렴합니다. 다만 AWS는 기존 CloudFront / S3 / DynamoDB와의 데이터 전송 무료 범위 내에서 운용되면 총비용에서 역전되는 경우도 있습니다.

지리 분포와 일본 × 동남아시아 트래픽

일본발·동남아시아행 트래픽에서의 PoP 커버리지는 다음과 같습니다. Cloudflare는 도쿄·오사카·호치민·하노이·자카르타·마닐라·방콕·싱가포르·쿠알라룸푸르 등 주요 도시를 망라합니다. Fastly는 도쿄·오사카·싱가포르·홍콩이 강하며, 인도네시아·베트남은 상호 접속 사업자를 경유하여 평균 RTT가 약 20ms 증가합니다. AWS Lambda@Edge는 CloudFront PoP 기준으로 도쿄·오사카·싱가포르·자카르타·마닐라·방콕이 있으나, Lambda 실행은 PoP가 아닌 가장 가까운 Regional Edge Cache(도쿄·싱가포르·뭄바이 등 11개소)에서 동작하므로 순수한 PoP 실행이 아닙니다. Akamai는 세계 최다 PoP를 보유하지만, EdgeWorkers가 동작하는 PoP는 그 일부에 한정됩니다.

'동남아시아 전역에 균일하게 낮은 레이턴시'를 원한다면 Cloudflare가 유력 후보, '일본·싱가포르 축으로 완결'한다면 Fastly의 WASM 성능이 활용됩니다. 'AWS 기존 자산과 통합'한다면 Lambda@Edge, 라는 정리가 됩니다.

WAF / Bot 관리의 통합도

엣지 컴퓨팅은 이제 단순한 '로직 실행'뿐 아니라 WAF·Bot 관리·DDoS 방어와 함께 평가해야 하는 시대가 되었습니다. Cloudflare는 WAF(OWASP Core Rule Set + 독자 규칙)·Bot Management·Turnstile이 Workers와 동일한 관리 화면에서 완결되며, Workers 내에서 `cf.botManagement.score`를 직접 참조하여 동적으로 동작을 변경할 수 있습니다. Fastly는 Signal Sciences(2020년 인수)를 기반으로 한 Next-Gen WAF를 보유하며, Compute 내에서 RulesEngine을 호출할 수 있습니다. AWS는 AWS WAF + Shield가 CloudFront 레이어에서 동작하며, Lambda@Edge 내에서는 `event.Records[0].cf.request.headers` 검사를 직접 작성해야 합니다. Akamai는 App & API Protector(구 Kona)가 가장 성숙해 있으며, 금융 업계에서는 여전히 첫 번째 선택지입니다.

Bot 판정 정확도는 4개사 모두 2025년 이후 기계 학습 기반으로 전환하였으며, OWASP ATP(Automated Threat Protection)의 검출률은 95% 전후로 비슷해졌습니다. 차이가 나는 것은 '오탐 시의 구제 절차'와 'SOC 연동'으로, Akamai와 Cloudflare가 SIEM 연동(Splunk / Sentinel / Datadog)을 표준 제공하는 반면, Fastly는 Datadog만, AWS는 CloudWatch를 통한 변환이 필요합니다.

선정 매트릭스: 사용 사례별 권장

다음은 당사가 고객 제안 시 활용하는 선정 매트릭스의 발췌입니다.

  • 초저레이턴시 API(1ms대 응답): Cloudflare Workers 또는 Fastly Compute
  • 상태를 가진 엣지 로직(협업 편집·시그널링): Cloudflare Workers + Durable Objects 단독
  • 기존 AWS 스택(S3 / DynamoDB / Cognito)과의 긴밀한 통합: AWS Lambda@Edge + CloudFront
  • 금융·의료 등 규제 업계의 WAF / SOC 요건 중시: Akamai EdgeWorkers + App & API Protector
  • 월 수억 요청의 대규모 B2C에서 비용 최우선: Fastly Compute의 월정액 코어 인스턴스
  • 일본 + ASEAN 전역에서 일관된 SLO(p95 80ms): Cloudflare Workers
  • 동영상·이미지의 실시간 변환(100ms 초과 CPU 처리): AWS Lambda@Edge 또는 Fastly Compute(메모리 512MB)

결론: 단일 플랫폼 의존에서 벗어날 때

  • 년의 엣지 아키텍처에서는 단일 플랫폼에 대한 의존이 기술적으로도 사업 연속성 면에서도 위험 요소가 되고 있습니다. Cloudflare의 대규모 장애(2023년 11월, 2025년 2월)나 AWS us-east-1 장애가 거듭 글로벌 영향을 미쳤다는 현실을 감안하여, '기본은 Cloudflare, 정적 콘텐츠는 Akamai, 배치 처리는 AWS'라는 멀티 엣지 전략을 채택하는 대기업이 늘었습니다. OpenTelemetry로 지표를 통일하고, Terraform으로 IaC를 횡단 관리함으로써 벤더 잠금(lock-in)의 비용을 줄이면서 가용성을 확보합니다.

선정은 '가장 빠른 한 곳'을 고르는 문제가 아니라, '워크로드별로 최적의 조합을 설계하는' 문제로 변했습니다. 벤치마크 수치는 진부해지지만, 플랫폼의 설계 철학 차이는 장기간 유효한 판단 기준이 됩니다. 자사의 트래픽 특성·규제 요건·기존 자산을 명확히 하고, 분기마다 재검토하는 운용이 엣지 시대의 표준 방식입니다.

기술적 과제를 함께 해결해 보시겠습니까?

KGA IT Solutions는 AI·클라우드·DevOps 전문 팀이 고객의 과제에 최적의 솔루션을 제공합니다.

문의하기