Что делает Horizontal Pod Autoscaler (HPA)? - Kubernetes

A Увеличивает ресурсы Pod (CPU/RAM)

B Автоматически меняет количество Pod в зависимости от нагрузки

C Масштабирует ноды кластера

D Балансирует трафик

Объяснение вопроса

HPA автоматически меняет количество реплик Deployment (или другого масштабируемого ресурса) в зависимости от метрик - обычно загрузки CPU или памяти, либо кастомных метрик из Prometheus.

Пример

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: api-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: api
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 70

При средней загрузке CPU реплик выше 70% HPA добавляет поды; при падении ниже - убирает (но не меньше minReplicas). VPA (Vertical Pod Autoscaler) меняет запросы/лимиты ресурсов подов; Cluster Autoscaler масштабирует сами ноды.