Метрики Control Plane

Stable

Какие метрики Control Plane полезнее всего для запуска баз, autoscale handoff и ошибок orchestration.

Обновлено: 21 марта 2026 г.

Метрики Control Plane особенно полезны, когда проблема касается не SQL‑выполнения как такового, а жизненного цикла ресурса: создания БД, автозапуска, авто‑остановки и нового writer autoscaler.

Ключевые метрики

cp_up

Показывает, жив ли сам Control Plane.

cp_autostart_total

Считает попытки автозапуска. Полезна, когда нужно понять, как часто sleeping‑базы реально будятся первым подключением и нет ли роста ошибок.

cp_cold_start_latency_seconds

Показывает длительность cold start. Это одна из самых полезных метрик для разбора жалоб вида “после простоя база просыпается слишком долго”.

cp_start_attempts_total

Показывает общее число стартовых попыток и их результат.

cp_idle_autostop_total

Позволяет увидеть, как часто срабатывает auto‑stop и нет ли ошибок на этом пути.

cp_provisioner_http_requests_total

Помогает отделить проблему самого Control Plane от проблем вызова Provisioner.

cp_tokens_invalid_total

Полезна при разборе проблем с worker registration и смежных lifecycle‑ошибок.

cp_lease_expired_total

Подсвечивает ситуации, когда lease истекает нештатно.

spg99_autoscale_failed_total

Один из самых важных новых сигналов: показывает, на какой стадии сорвался autoscale handoff.

Как читать эти метрики на практике

Жалобы на долгий первый connect

Смотрите вместе:

  • cp_autostart_total
  • cp_cold_start_latency_seconds
  • cp_start_attempts_total

Это быстро показывает, есть ли реальная проблема cold start или приложение просто не учитывает нормальную serverless‑задержку.

База долго не выходит в ready

Полезно смотреть:

  • cp_start_attempts_total
  • cp_provisioner_http_requests_total
  • общее состояние БД в Console

Handoff профиля завис или сорвался

Смотрите:

  • spg99_autoscale_failed_total
  • scale_state в describe API
  • Gateway‑метрики freeze/drain/pinned
  • readiness candidate writer

База не уходит в сон

Смотрите:

  • cp_idle_autostop_total
  • Gateway lease и активные соединения
  • не застряла ли база в COOLDOWN или другом autoscale‑состоянии

Практический вывод

Если Gateway отвечает на вопрос “что видит клиент на входе”, то Control Plane метрики лучше всего отвечают на вопрос “что происходит с lifecycle самой базы и handoff writer внутри платформы”.