Kalkulator A/B Test - Signifikansi Statistik & Conversion Rate
Kalkulator A/B Test gratis. Hitung signifikansi statistik, conversion rate, lift, dan z-score untuk menentukan apakah hasil eksperimen Anda signifikan.
Rumus A/B Test (Two-Proportion Z-Test)
Z = (pā - pā) / ā[p(1-p)(1/nā + 1/nā)]Keterangan:
- pāConversion Rate Varian A (Kontrol)Conversion Rate Varian A (Kontrol)(contoh: 10% (0.10))
- pāConversion Rate Varian B (Eksperimen)Conversion Rate Varian B (Eksperimen)(contoh: 13% (0.13))
- nāJumlah sampel Varian A (Total pengunjung)Jumlah sampel Varian A (Total pengunjung)(contoh: 1000)
- nāJumlah sampel Varian B (Total pengunjung)Jumlah sampel Varian B (Total pengunjung)(contoh: 1000)
- pPooled proportion: (xā + xā) / (nā + nā)Pooled proportion: (xā + xā) / (nā + nā)(contoh: 0.115)
- ZZ-Score (Skor signifikansi statistik)Z-Score (Skor signifikansi statistik)(contoh: 2.16)
- LiftPersentase kenaikan/penurunan performaPersentase kenaikan/penurunan performa(contoh: +30%)
Cara Menggunakan Kalkulator A/B Test
- 1
Input Data Varian A (Kontrol)
Masukkan jumlah konversi (misal: 100) dan total sampel/pengunjung (misal: 1000) untuk varian kontrol.
- 2
Input Data Varian B (Eksperimen)
Masukkan data yang sama untuk varian eksperimen (penantang), misal: 130 konversi dari 1000 pengunjung.
- 3
Pilih Confidence Level
Pilih tingkat kepercayaan: 90% (Z > 1.645), 95% (Z > 1.96, standar industri), atau 99% (Z > 2.576).
- 4
Analisis Hasil
Lihat Conversion Rate, Lift (kenaikan), Z-Score, dan status Signifikansi. Jika Z-Score > nilai kritis, perbedaan signifikan secara statistik.
Contoh Perhitungan
Contoh 1: Varian B Menang Signifikan (E-commerce)
Sebuah toko online menguji tombol 'Beli Sekarang'. Varian A (warna biru): 100 konversi dari 1000 pengunjung. Varian B (warna merah): 130 konversi dari 1000 pengunjung. Uji dengan confidence level 95%.
- 1.Hitung Conversion Rate (CR) Varian A: pā = 100 / 1000 = 0.10 atau 10%
- 2.Hitung CR Varian B: pā = 130 / 1000 = 0.13 atau 13%
- 3.Hitung Lift: (13% - 10%) / 10% Ć 100% = +30%
- 4.Hitung Pooled Proportion: p = (100 + 130) / (1000 + 1000) = 230/2000 = 0.115
- 5.Hitung Standard Error: ā[0.115 Ć (1-0.115) Ć (1/1000 + 1/1000)] = ā[0.1018 Ć 0.002] = ā0.0002036 ā 0.01427
- 6.Hitung Z-Score: Z = (0.13 - 0.10) / 0.01427 = 0.03 / 0.01427 ā 2.10
- 7.Bandingkan dengan nilai kritis 95%: 1.96. Karena 2.10 > 1.96, maka signifikan.
Varian B (tombol merah) menang dengan kenaikan conversion rate sebesar 30% yang signifikan secara statistik. Anda dapat mempercayai hasil ini dengan tingkat kepercayaan 95%.
Contoh 2: Hasil Tidak Signifikan (Butuh Sampel Lebih Banyak)
Uji headline landing page. Varian A: 50 konversi dari 1000 pengunjung. Varian B: 55 konversi dari 1000 pengunjung. Confidence level 95%.
- 1.CR Varian A: pā = 50 / 1000 = 0.05 atau 5%
- 2.CR Varian B: pā = 55 / 1000 = 0.055 atau 5.5%
- 3.Lift: (5.5% - 5%) / 5% Ć 100% = +10%
- 4.Pooled Proportion: p = (50 + 55) / (1000 + 1000) = 105/2000 = 0.0525
- 5.Standard Error: ā[0.0525 Ć (1-0.0525) Ć (1/1000 + 1/1000)] = ā[0.0497 Ć 0.002] = ā0.0000994 ā 0.00997
- 6.Z-Score: Z = (0.055 - 0.05) / 0.00997 = 0.005 / 0.00997 ā 0.50
- 7.Nilai kritis 95% = 1.96. Karena 0.50 < 1.96, maka TIDAK signifikan.
Meskipun Varian B menunjukkan kenaikan 10%, secara statistik belum ada cukup bukti untuk menyatakan Varian B lebih baik. Sampel terlalu kecil untuk mendeteksi perbedaan sekecil ini. Disarankan menambah jumlah sampel atau memperbesar perbedaan variabel uji.
Contoh 3: Varian B Lebih Buruk (Negative Lift)
Uji desain formulir checkout. Varian A (form lama): 200 konversi dari 2000 pengunjung. Varian B (form baru): 180 konversi dari 2000 pengunjung. Confidence level 95%.
- 1.CR Varian A: pā = 200 / 2000 = 0.10 atau 10%
- 2.CR Varian B: pā = 180 / 2000 = 0.09 atau 9%
- 3.Lift: (9% - 10%) / 10% Ć 100% = -10% (penurunan)
- 4.Pooled Proportion: p = (200 + 180) / (2000 + 2000) = 380/4000 = 0.095
- 5.Standard Error: ā[0.095 Ć (1-0.095) Ć (1/2000 + 1/2000)] = ā[0.0865 Ć 0.001] = ā0.0000865 ā 0.00930
- 6.Z-Score: Z = (0.09 - 0.10) / 0.00930 = -0.01 / 0.00930 ā -1.08
- 7.Nilai kritis 95% = 1.96 (|1.08| < 1.96), maka TIDAK signifikan.
Varian B menunjukkan penurunan 10% tetapi belum mencapai signifikansi statistik. Artinya, penurunan ini kemungkinan besar terjadi karena variasi acak, bukan karena desain form baru yang buruk. Namun, jika tren negatif berlanjut dengan sampel lebih besar, form baru harus dievaluasi ulang.
Contoh 4: Uji dengan Confidence Level 99% (Kedokteran/High Stakes)
Rumah sakit menguji metode pengobatan baru. Varian A (standar): 500 sembuh dari 5000 pasien. Varian B (baru): 550 sembuh dari 5000 pasien. Uji dengan confidence level 99% (Z > 2.576).
- 1.CR Varian A: pā = 500 / 5000 = 0.10 atau 10%
- 2.CR Varian B: pā = 550 / 5000 = 0.11 atau 11%
- 3.Lift: (11% - 10%) / 10% Ć 100% = +10%
- 4.Pooled Proportion: p = (500 + 550) / (5000 + 5000) = 1050/10000 = 0.105
- 5.Standard Error: ā[0.105 Ć (1-0.105) Ć (1/5000 + 1/5000)] = ā[0.0940 Ć 0.0004] = ā0.0000376 ā 0.00613
- 6.Z-Score: Z = (0.11 - 0.10) / 0.00613 = 0.01 / 0.00613 ā 1.63
- 7.Nilai kritis 99% = 2.576. Karena 1.63 < 2.576, maka TIDAK signifikan di level 99%.
Meskipun Varian B menunjukkan perbaikan 10%, dengan standar ketat 99% confidence level (untuk keputusan medis yang kritis), hasil ini belum cukup signifikan. Diperlukan sampel lebih besar atau efek yang lebih besar untuk membuktikan keunggulan metode baru dengan tingkat keyakinan 99%.