Aplikasi kamu traffic-nya tidak stabil — naik saat jam kerja, turun tengah malam. Kalau resource di-set tetap tinggi, kamu bayar lebih dari yang dibutuhkan. Kalau di-set terlalu rendah, aplikasi down saat traffic naik.
Solusinya: autoscaling — resource naik dan turun otomatis sesuai kebutuhan.
Horizontal Pod Autoscaler (HPA) di Helipod memungkinkan aplikasi kamu scale jumlah replica otomatis berdasarkan penggunaan CPU atau RAM. Kamu atur threshold-nya, sisanya dikerjakan sistem.
Cara Kerja HPA
HPA bekerja dengan memantau metrik real-time dari setiap pod:
- Monitor — sistem terus memantau CPU dan RAM usage
- Evaluasi — setiap beberapa detik, sistem mengevaluasi apakah usage melebihi threshold
- Scale up — jika CPU atau RAM melebihi threshold, jumlah replica bertambah
- Scale down — jika usage turun di bawah threshold, jumlah replica berkurang
Traffic naik → CPU 85% (threshold 70%)
→ Scale up: 1 → 2 replica
→ Traffic tertampung
Traffic turun → CPU 30%
→ Scale down: 2 → 1 replica
→ Hemat biaya
Konfigurasi HPA di Helipod
Minimal Requirements
HPA membutuhkan minimal 2 replica untuk bisa bekerja. Ini karena HPA melakukan scaling horizontal — menambah atau mengurangi jumlah pod, bukan mengubah ukuran pod.
Parameter yang Bisa Diatur
| Parameter | Deskripsi | Default |
|---|---|---|
| Min Replicas | Jumlah minimum replica | 1 |
| Max Replicas | Jumlah maximum replica | 10 |
| CPU Threshold | Target CPU usage (%) | 70% |
| RAM Threshold | Target RAM usage (%) | 80% |
Cara Setup
- Buka halaman service di Helipod
- Tab Settings → bagian Scale
- Aktifkan HPA (Horizontal Pod Autoscaler)
- Atur min/max replicas
- Atur CPU dan RAM threshold
- Klik Save
HPA akan mulai bekerja dalam beberapa menit setelah diaktifkan.
Kapan Perlu Autoscaling?
Cocok Untuk
- Aplikasi dengan traffic tidak stabil — e-commerce, SaaS, landing page
- Aplikasi yang baru launch — belum tahu pattern traffic-nya
- API yang dipakai banyak client — scaling sesuai request volume
- Batch processing — load naik-turun sesuai jadwal
Tidak Perlu Untuk
- Aplikasi dengan traffic stabil — resource tetap lebih efisien
- Aplikasi yang butuh session sticky — scaling bisa putus session
- Database — gunakan managed database, bukan autoscaling pod
Monitoring Autoscaling
Kamu bisa memantau aktivitas HPA melalui:
Dashboard Helipod
Lihat jumlah replica aktif, CPU usage, dan RAM usage real-time di tab Metrics.
Heli Crew AI
Ketik di chat:
Kamu → "cek metrik cpu dan memori service api-backend"
Heli Crew → "CPU: 45% (threshold: 70%)
RAM: 320MB/512MB (threshold: 80%)
Replicas: 2 (min: 1, max: 5)
Status: Normal"
Untuk penjelasan lengkap Heli Crew, baca: Asisten AI untuk DevOps
Logs
Gunakan get_app_logs untuk melihat kapan scaling terjadi dan mengapa.
Estimasi Biaya
HPA membantu menghemat biaya karena resource hanya digunakan saat dibutuhkan.
Contoh skenario tanpa HPA vs dengan HPA:
| Tanpa HPA | Dengan HPA | |
|---|---|---|
| Replica | 3 (tetap) | 1-3 (otomatis) |
| CPU per replica | 0.25 vCPU | 0.25 vCPU |
| RAM per replica | 512 MB | 512 MB |
| Biaya saat traffic rendah | Rp 3.300/hari | Rp 1.100/hari |
| Biaya saat traffic tinggi | Rp 3.300/hari | Rp 3.300/hari |
| Penghematan | - | Hingga 67% |
Untuk penjelasan lengkap pricing, baca: Pricing Pay-as-you-go Helipod
Best Practices
1. Set Resource Request yang Realistis
Pastikan CPU dan RAM request sesuai dengan kebutuhan aktual aplikasi. Terlalu rendah = sering OOM kill. Terlalu tinggi = resource terbuang.
2. Gunakan Min Replica ≥ 2
HPA butuh minimal 2 replica untuk bisa scale. Kalau min replica = 1, HPA tidak akan bekerja.
3. Atur Threshold dengan Bijak
- CPU threshold 70% — sweet spot untuk kebanyakan aplikasi
- RAM threshold 80% — beri ruang untuk spike sesaat
- Jangan terlalu rendah (sering scale = overhead) atau terlalu tinggi (lambat merespons)
4. Monitoring Berkala
Cek metrik secara berkala untuk memastikan HPA bekerja sesuai ekspektasi. Gunakan Heli Crew untuk cek cepat dari chat.
Mulai Sekarang
Daftar gratis di helipod.io. Buat service, aktifkan HPA di tab Settings, dan biarkan sistem mengelola resource otomatis.
Butuh bantuan? Hubungi support@helipod.id atau bergabung di komunitas hangar.helipod.io.
Baca juga:
- Deploy Aplikasi Pakai QRIS — bayar cloud dari GoPay, OVO, atau Dana
- Asisten AI untuk DevOps — kelola deployment dari chat
- Pricing Pay-as-you-go Helipod — cara kerja billing dan estimasi biaya