Changelog

Prompt-Experimente — A/B-Tests für Prompts in Produktion

Traffic zwischen Prompt-Versionen aufteilen, Qualität mit automatischen Evaluatoren messen und den Gewinner wählen.

A/B-Tests für Prompts in Produktion. Zwei oder mehr Prompt-Versionen veröffentlichen, ein Experiment mit konfigurierbaren Traffic-Gewichten starten, und Grepture routet Anfragen automatisch. Ein automatisch erstellter Relevanz-Evaluator bewertet jede Variante — Entscheidungen basierend auf echten Daten, nicht auf Bauchgefühl.