Leistungen / Websites & Conversion / CRO & A/B-Testing
A/B-Tests, die zu Entscheidungen führen — nicht nur zu Tabellen.
CRO funktioniert nur mit Hypothesen-Disziplin und statistischer Sauberkeit. Ich baue Programme mit klaren Lernzielen, validem Setup und Roll-Out-Plänen — damit Wins skaliert werden, nicht nur dokumentiert.
Hypothesen-Pipeline
Tests laufen entlang Lernzielen, nicht entlang von Bauchgefühl. Jede Hypothese hat einen erwarteten Effekt.
Statistisch valide
Klare Stichproben-Größe, Frequentist- oder Bayesian-Methodik, keine Peeking-Falle. Wir stoppen Tests nicht zu früh.
Roll-Out, nicht nur Dashboard
Gewinner-Varianten gehen in die Hauptversion. Tests sind Werkzeug für Entscheidungen, nicht Forschungs-Projekt.
Was du buchen kannst
Sechs Bausteine, einzeln oder als Paket
Start meist mit CRO-Audit + Hypothesen-Backlog. Test-Volumen kommt erst, wenn das Setup steht.
CRO-Audit
Heatmap-Analyse, Session-Recordings, Funnel-Drops, Form-Abandonment. Output: Probleme-Map.
Hypothesen-Backlog
PIE-/ICE-priorisierte Liste, jede Hypothese mit erwartetem Effekt, Aufwand und Lernziel.
Tool-Setup
VWO, Convert, Vercel-Edge-Splits oder eigenes Setup. Tracking-Integration, QA-Routine.
Implementation
Test-Varianten bauen — Code, Design, Copy. Für kleine Änderungen im Tool, für größere als Branch im Repo.
Statistik & Analyse
Stichproben-Plan, Signifikanz-Check, Subgroup-Analyse, Side-Effect-Doku. Klare Win/Loss-Entscheidung.
Roll-Out + Lernlog
Gewinner geht live, Verlierer ins Lern-Log. Monatlicher Sync mit Backlog-Aktualisierung.
Wie unterscheiden wir uns?
Drei Wege, CRO einzukaufen
CRO-Marktführer liefern Volumen mit Tagessätzen. Tool-Self-Service ist schnell, aber dünn. Wir koppeln Strategie und Implementation.
| CRO-Marktführer konversionsKRAFT, FELD M | Tool-Self-Service VWO, Convert + Inhouse-Team | Truong Suarez Strategie + Bau-Hand | |
|---|---|---|---|
| Modell | Retainer 8–20 k€+/Monat | Tool-Lizenz + Inhouse-Stunden | Festpreis-Audit + modulare Test-Pakete |
| Hypothesen-Quelle | Heuristische Frameworks, Best-Practice-Bibliothek | Inhouse-Bauchgefühl + Tool-Empfehlungen | Daten-getrieben aus Heatmap + Funnel-Analyse |
| Implementation | Eigenes Dev-Team | Tool-Editor (limitiert) | Tool-Editor + Code-Branch je nach Komplexität |
| Statistik-Disziplin | Sehr stark, oft Bayesian | Tool-Default-Werte, Peeking-Risiko | Klarer Stichproben-Plan vor jedem Test |
| Beste Phase für dich | Enterprise mit Test-Programm > 50/Jahr | Erstes Test-Programm mit eigenem Dev | 10–30 Tests/Jahr, Wachstum mit System |
Vergleich basiert auf öffentlich verfügbaren Informationen, Stand 2026. Wenn deine Konstellation woanders besser aufgehoben wäre, sage ich dir das im Erstgespräch.
Wie wir arbeiten
Fünf Phasen, ein Ansprechpartner
Disziplin im Setup, Geschwindigkeit in der Iteration. Jede Phase hat einen Output, den du behalten kannst.
CRO-Audit
Funnel-Analyse, Heatmaps, Session-Recordings, Form-Drops. Output: Probleme-Map.
Hypothesen
PIE/ICE-Backlog, erwartete Effekte, Test-Priorisierung. Output: Test-Plan.
Setup
Tool-Wahl, Tracking-Integration, QA-Routine. Output: Test-Plattform live.
Test-Loop
2–4 Tests parallel, klar dokumentiert. Output: monatliches Lernlog.
Review
Programm-Review, Methodik-Update, Backlog-Refresh. Wins langfristig sichern.
Stack
Womit wir arbeiten
Keine Black-Box-Tools. Alles, was wir nutzen, kannst du selbst betreiben — wenn du es willst.
Test-Tools
- VWO
- Convert
- Vercel Edge Config
- Optimizely (Enterprise)
Analyse / Heatmap
- Hotjar
- Microsoft Clarity
- FullStory
- GA4 + BigQuery
Statistik
- Evan Miller A/B Sample Calc
- Bayesian-A/B-Tooling
- BigQuery (Subgroups)
Doku / Ops
- Notion (Test-Datenbank)
- Linear (Tickets)
- Loom (Sync)
- Looker Studio (Dashboard)
Empfohlener Einstieg
Zwei Wege, je nachdem wo du stehst
Für laufende CRO-Programme zeigt der Tracking-Audit Setup-Schwächen. Für den Programm-Aufbau ist der Growth-Sprint die bessere Wahl.
Für dich, wenn
Du testest schon
Du willst wissen, ob das Tracking sauber ist, Tests statistisch valide laufen und wie das Programm strukturiert werden kann.
5–7 Tage · Report + 30-Min-Call
Starter-Audit / Tracking
- – Tool-Setup-Check (VWO/Convert/Edge)
- – Statistik-Hygiene-Bewertung
- – Hypothesen-Backlog-Review
- – Top-3-Programm-Empfehlungen
Für dich, wenn
Du baust das Programm neu auf
Du startest CRO als systematisches Programm und willst Hypothesen-Backlog, Tool-Setup und Statistik-Disziplin von Anfang an richtig aufsetzen.
2 Wochen · Report + Workshop
Growth-Sprint
- – Funnel- & Heatmap-Analyse
- – 20–30 Hypothesen-Backlog (priorisiert)
- – Tool- & Statistik-Setup
- – 3-Monats-Test-Roadmap
- – Half-Day-Workshop mit Team
Unsicher? Die Symptom-Triage auf der Audit-Seite hilft bei der Wahl. Der Audit-Preis wird auf ein Folgeprojekt angerechnet.
Wann das relevant wird
Typische Ausgangspunkte
Drei wiederkehrende Situationen, in denen CRO & A/B-Testing das richtige Werkzeug ist.
Funnel-Plateau
Ads skalieren nicht mehr
Wenn nicht das Ad-Konto, sondern der Funnel nach dem Klick das Problem ist — was CRO konkret macht.
Tracking
Tracking trotz Consent-Verlust
Warum klassische Test-Tools mit Server-Side-Tracking kombiniert werden müssen, damit Conversions valide bleiben.
Launch
Launch mit Landing Pages
Wenn neue Landing Pages live gehen — wie A/B-Tests von Anfang an die Conversion-Hebel finden.
FAQ
Was Kunden vor der ersten Zusammenarbeit oft fragen
Brauche ich Mindest-Traffic für CRO?
Faustregel: > 10.000 Besucher/Monat auf der Test-Seite und > 200 Conversions/Monat. Darunter dauern Tests sehr lange (4–8 Wochen) und Signifikanz ist schwer. Bei niedrigerem Traffic eher heuristische Optimierung statt A/B-Programm.
VWO oder Convert oder eigene Lösung?
Für Marketing-Teams ohne Dev-Ressourcen: VWO oder Convert (Editor + Statistik-Dashboard). Für Teams mit Next.js + Vercel: Vercel-Edge-Config-Splits (deutlich performanter, kein Flicker). Für Enterprise mit BigQuery/Data-Warehouse: Optimizely oder eigene Splits + statistische Analyse in dbt.
Wie lange muss ein Test laufen?
Mindestens 2 volle Wochen (um Wochentag-Schwankungen zu erfassen) und bis zur Signifikanz nach Stichproben-Plan. Typisch 2–6 Wochen je nach Traffic und erwartetem Effekt. Peeking (Test stoppen, sobald „p < 0,05“) führt zu falschen Wins — wir halten uns dran.
Was ist eine realistische Erfolgsquote?
Branchen-Durchschnitt: 10–25 % der Tests sind klare Wins, 10–15 % klare Loses, der Rest neutral. Wer 50 % Win-Rate behauptet, hat entweder Peeking-Probleme oder Cherry-Picking. Lernen aus Loses ist genauso wichtig — daher das saubere Lern-Log.
Inhouse oder Agentur?
Hybrid funktioniert am besten: Ich baue das System auf (Audit + Backlog + Statistik-Routine), dein Team führt es fort. Nach 6–12 Monaten ist das Programm intern verankert, ich bleibe für Strategie-Reviews und kniffelige Stats-Fragen.
Lass uns sprechen
Drei Wege — je nachdem wo du stehst.