LLM-as-a-Judge-Evaluierungen auf echtem Produktions-Traffic. Evaluatoren mit eingebauten Templates oder eigenen Judge-Prompts erstellen, und Grepture bewertet echte Antworten auf einer Skala von 0 bis 1. Keine synthetischen Datensätze oder separate Eval-Pipelines nötig.