Wie lange sollte ein A/B-Test laufen?

Mindestens 2-4 Wochen, um saisonale Effekte auszuschliessen (Wochenend-Nutzer verhalten sich anders als Wochentag-Nutzer). Statistisch: bis zur Erreichung von 95 % Signifikanz und mind. 1.000 Konversionen pro Variante. Nicht früher stoppen - auch wenn eine Variante früh vorne liegt.

Was bedeutet statistische Signifikanz?

95 % statistische Signifikanz bedeutet: Es gibt eine 5 %-ige Wahrscheinlichkeit, dass das Ergebnis durch Zufall entstanden ist. In der Praxis: 95 % ist akzeptabel, 99 % besser für riskante Änderungen. Wichtig: Signifikanz sagt nichts über die Grösse des Effekts - ein signifikantes Ergebnis kann trotzdem wirtschaftlich irrelevant sein.

Was ist der Unterschied zwischen Split-Test und A/B-Test?

Die Begriffe werden oft synonym verwendet. Technisch ist ein A/B-Test ein Split-Test mit genau zwei Varianten. Split-Test kann auch mehrere Varianten bezeichnen (A/B/C-Test). Multivariater Test dagegen testet Kombinationen von Elementen gleichzeitig.

Welche Elemente sollte ich zuerst A/B-testen?

Priorisierung nach PIE-Framework: Potential (wie viel Verbesserungspotenzial?), Importance (wie viel Traffic hat die Seite?), Ease (wie einfach ist die Implementierung?). Typische Top-Prioritäten: Hero-Headline, CTA-Text und -Farbe, Checkout-Flow, Produktseiten-Layout, Preisdarstellung.

A/B-Testing im E-Commerce: Der vollständige Leitfaden für datengetriebene Entscheidungen

A/B-Testing für E-Commerce: Wie Sie Tests richtig aufsetzen, statistisch signifikante Ergebnisse erzielen und Ihre Conversion Rate systematisch steigern.

Amazon führt täglich tausende A/B-Tests durch. Booking.com testet alles - von Button-Farben bis zu ganzen Seitenkonzepten. Was haben sie gemeinsam? Sie vertrauen Daten mehr als Meinungen. A/B-Testing ist das Werkzeug, das diese Kultur möglich macht.

Infografik: Wichtigste Fakten - A/B-Testing im E-Commerce: Der vollständige Leitfaden für datengetriebene Entscheidungen

TL;DR: A/B-Testing ist nur so gut wie die Hypothesen dahinter. Mit richtiger Methodik, ausreichend Traffic und einer Lernkultur ist es der zuverlässigste Weg zu höheren Conversions.

A/B-Testing: Die Grundlagen

Ein A/B-Test vergleicht zwei Versionen einer Seite (A = Kontrolle, B = Variante) mit echten Nutzern. Die Version mit der höheren Conversion Rate gewinnt. Klingt einfach - die Tücken stecken in den Details.

Was Sie A/B-testen können:

Headlines und Value Propositions
CTA-Text, Farbe und Platzierung
Produktbilder und -videos
Preisdarstellung und -struktur
Formular-Länge und -Felder
Navigation und Seitenstruktur
Checkout-Flow und Payment-Optionen
Vertrauenselemente und Social Proof

Erfahren Sie, wie wir KI-gestützte Effizienzgewinne erzielen.

Die Anatomie eines sauberen A/B-Tests

1. Hypothese (Pflicht!)

Ein Test ohne Hypothese ist Rätselraten. Format: "Wenn wir [Änderung] vornehmen, dann wird [Metrik] steigen, weil [Begründung aus Nutzerforschung]."

Beispiel: "Wenn wir den CTA von 'Jetzt kaufen' auf 'In den Warenkorb' ändern, wird die Warenkorb-Add-Rate steigen, weil Nutzer-Interviews zeigten, dass 'Jetzt kaufen' als zu verbindlich empfunden wird."

2. Primäre Metrik definieren

Genau eine primäre Metrik pro Test. Mehrere Metriken zu testen führt zu Fehlinterpretationen. Sekundäre Metriken können beobachtet werden, entscheiden aber nicht.

3. Stichprobengrösse berechnen

Vor dem Test: Berechnnen Sie die nötige Stichprobengrösse. Online-Tools: Evan Miller Sample Size Calculator. Inputs: aktuelle Conversion Rate, erwartete Verbesserung, gewünschte statistische Power (80 %).

4. Traffic splitten

50/50 ist der Standard. Wichtig: Nutzer bekommen konsistent dieselbe Variante (kein Flicker). Tools verwenden Cookie-basiertes Assignment.

5. Warten und nicht anfassen

Das grösste Fehler: Tests zu früh stoppen wenn eine Variante vorne liegt. Warten bis zur vordefinierten Stichprobengrösse und Signifikanz.

Statistische Signifikanz: Was Sie wirklich wissen müssen

95 % statistische Signifikanz bedeutet: 5 % Wahrscheinlichkeit eines falsch-positiven Ergebnisses. Bei 100 Tests erwarten Sie 5 falsch-positive Ergebnisse, selbst wenn keine Änderung wirklich hilft.

Konsequenzen für die Praxis:

Testen Sie nur Hypothesen mit echter Begründung
Replizieren Sie wichtige Ergebnisse in einem Folgetest
Betrachten Sie statistische Signifikanz als notwendige, nicht hinreichende Bedingung

Das PIE-Priorisierungsframework

Mit begrenztem Traffic und Budget muss priorisiert werden:

Kriterium	Frage	Score 1-10
Potential (P)	Wie viel Verbesserungspotenzial hat diese Seite?	Basierend auf Analytics
Importance (I)	Wie viel Traffic und Revenue hat diese Seite?	Traffic-Daten
Ease (E)	Wie schnell kann der Test implementiert werden?	Entwickler-Aufwand

PIE-Score = (P + I + E) / 3. Höchster Score = höchste Priorität.

Über A/B-Testing hinaus: Personalisierung

A/B-Testing zeigt, was für den Durchschnitt besser ist. Personalisierung zeigt, was für spezifische Segmente besser ist:

Neue vs. wiederkehrende Besucher (andere Value Proposition)
Mobile vs. Desktop (andere Layouts)
Geographie (lokale Angebote, Sprache)
Traffic-Quelle (SEA-Traffic hat andere Erwartungen als organischer Traffic)

3× schnellere Entwicklung mit unserem ebiCore AI Framework

Identifizieren Sie Ihre Top-KI-Chancen, validieren Sie mit einem PoC und bringen Sie es in Produktion.

Strategiegespräch starten

A/B-Testing-Kultur aufbauen

Die grössten Unternehmen der Welt testen weil sie wissen: Die Mehrheit der Ideen, auch gute Ideen, verbessern die Metrics nicht. Das akzeptieren ist der Kern einer Testkultur.

Keine Schuldzuweisungen für gescheiterte Tests - sie sind Erkenntnisse
Alle Testergebnisse (auch Verlierer) dokumentieren
Erkenntnisse teilen und auf andere Bereiche übertragen
Kontinuierliches Testing als Prozess, nicht als Projekt

Fazit

A/B-Testing ist kein Allheilmittel - es ist ein Werkzeug. Das wertvollste ist nicht der gewonnene Test, sondern das Verständnis Ihrer Nutzer, das Sie durch die Forschung davor und die Analyse danach gewinnen. Beginnen Sie mit einer starken Hypothese, testen Sie methodisch sauber, und bauen Sie eine Lernkultur auf.

Referenzen

Optimizely (2024): A/B Testing Methodology
CXL Institute (2024): Statistical Significance in A/B Testing
Evan Miller: Sample Size Calculator
Harvard Business Review (2023): Building an A/B Testing Culture

A/B-Testing im E-Commerce: Der vollständige Leitfaden für datengetriebene Entscheidungen

Wichtigste Erkenntnisse

A/B-Testing: Die Grundlagen