[Changelog]

Was gibt's Neues bei Grepture

[JUN.22.2026]Kostenzuordnung nach Label

Sehen Sie genau, welches Team, Projekt oder welche Umgebung was ausgibt. Versehen Sie Requests mit einem Label, und Grepture schluesselt Kosten, Tokens und Request-Volumen pro Label auf.

[JUN.10.2026]OpenTelemetry-Export — Echte Agent-Traces & Beispiel-Download

Der OTLP-Export liefert jetzt echte Agent-Traces — Span-Baeume, Tool-Call-Spans, gen_ai-Attribute und Kosten — plus Beispiel-Download per Klick.

[JUN.08.2026]Anfragen im Playground erneut abspielen

Jede protokollierte Anfrage direkt aus dem Traffic-Log erneut abspielen, anpassen und die neue Antwort neben dem Original ueber Ihre Evaluatoren bewerten.

[MAY.29.2026]Tool-Restriktionsregeln

Erzwingen Sie eine Tool-Allowlist am Gateway. Entfernen Sie verbotene Tool-Definitionen, bevor das Modell sie sieht, und blockieren oder entfernen Sie verbotene Tool-Aufrufe in der Antwort.

[MAY.24.2026]Debug-Modus — Volle Pipeline-Transparenz

Neuer opt-in Debug-Modus erfasst den Roh-Input, jede Schwaerzung, den Upstream-Body, die Upstream-Response und den wiederhergestellten Output einer einzelnen Anfrage. Loescht sich nach 24 Stunden automatisch.

[MAY.16.2026]Budgets & Ausgabenlimits

Pro-Key- und Pro-Label-Ausgabenregeln mit E-Mail-Alerts bei 50/80/100% und HTTP-402-Durchsetzung am Proxy, wenn der Cap erreicht ist.

[MAY.14.2026]LLM-Chat-UIs durch Grepture routen

TypingMind, LibreChat, LobeChat, Open WebUI, NextChat, ChatBox und weitere BYOK-Chat-Clients laufen jetzt mit einer einzigen Basis-URL-Aenderung durch Grepture — ohne Plugin, ohne Fork. Kosten pro Nutzer, PII-Schwaerzung und Audit-Logs ueber jede Chat-App, die Ihr Team ohnehin schon nutzt.

[MAY.13.2026]Unbegrenzte Request-Body-Groessen

Traffic-Logs schneiden grosse Request- und Response-Bodies nicht mehr ab. Grosse Payloads — Long-Context-Prompts, Agent-Laeufe mit tiefer Tool-Historie, RAG-Dokumente — werden vollstaendig gespeichert und im Detail-Sheet end-to-end angezeigt.

[MAY.11.2026]PII-Schwärzung für Embeddings — ein First-Class-Endpunkt

Embeddings sind dauerhafte Angriffsflaeche, kein fluechtiger Traffic. Der neue POST /v1/embeddings-Endpunkt schwaerzt PII aus der Eingabe, bevor OpenAI den Vektor erzeugt — PII landet nie im Vektorspeicher. Eigener Endpunkt, eigene Log-Tabelle, eigener Dashboard-Tab.

[MAY.01.2026]Trace-Filter — Sortieren nach Kosten & Token-Verbrauch

Neue Filter- und Sortieroptionen in der Trace-Ansicht zeigen die teuersten Requests und groessten Token-Verbraucher auf einen Blick.

[APR.26.2026]Schnellere Analytics, Logs und Traces

Das Dashboard bleibt jetzt auch bei Accounts mit Millionen von Requests fluessig. Analytics, Traffic-Logs und Traces laden deutlich schneller.

[APR.24.2026]Tool-Call-Analytics

Tool-Calls sind jetzt ein First-Class-Objekt in Grepture. Aufrufvolumen, p50/p95-Latenz und Fehlerraten pro Tool — ueber die gesamte Traffic-Historie.

[APR.22.2026]Demnaechst: Performance-Upgrades & ClickHouse

Ein Ausblick auf die naechsten Wochen — Performance-Verbesserungen fuer Proxy und Dashboard sowie ClickHouse-gestuetzte Traffic-Logs mit deutlich laengerer Aufbewahrung.

[APR.12.2026]Provider-Keys & Automatisches Fallback

LLM-Provider-API-Keys in Grepture speichern. Automatisches Same-Provider- und Cross-Provider-Fallback bei Auth-Fehlern, Rate-Limits, Timeouts und Server-Fehlern.

[APR.07.2026]Pricing-Update — Overage-Abrechnung & USD

Behalten Sie die niedrige Pro-Grundgebuehr und wachsen Sie zu Ihren Bedingungen in Business hinein. Neue Overage-Abrechnung schliesst die Luecke zwischen Pro und Business, und Grepture rechnet jetzt auch in USD ab.

[APR.06.2026]Datasets & Experiments

Produktions-Logs in kuratierte Test-Suites verwandeln und Experiments durchfuehren, um Prompt-Versionen und Modelle mit LLM-as-a-Judge-Bewertung zu vergleichen.

[APR.04.2026]Marke & UI-Refresh

Einheitlichere visuelle Identitaet auf der Marketing-Seite und Dokumentation mit einem einheitlichen Grid-Layout, verbesserter Typografie.

[APR.02.2026]Teams — Multi-Team-Support & Team-Switcher

Nutzer koennen jetzt mehreren Teams angehoeren, sofort zwischen ihnen wechseln und neue Teams mit eigenen Abrechnungsplaenen erstellen.

[MAR.30.2026]Trace-Ansicht — Wasserfall, Suche & Kostenaufschluesselung

Die Trace-Detailansicht wurde mit einer Wasserfall-Timeline, Tool-Call-Anzeige, Volltextsuche und Aufschluesselung von Kosten, Tokens und Latenz komplett ueberarbeitet.

[MAR.27.2026]Labels, Metadata & eigene Log-Events fuer Traces

Einzelne Anfragen mit Labels taggen, Key-Value-Metadata anhaengen, eigene Events in Traces loggen und Traces in einer eigenen Detailansicht inspizieren.

[MAR.26.2026]Prompt-Experimente — A/B-Tests für Prompts in Produktion

Traffic zwischen Prompt-Versionen aufteilen, Qualität mit automatischen Evaluatoren messen und den Gewinner wählen.

[MAR.22.2026]Grepture CLI — Lokales AI Gateway

Ein lokales AI Gateway in der Entwicklung mit der gleichen Observability und PII-Schutz wie in Produktion.

[MAR.21.2026]LLM-Evals auf echtem Traffic

LLM-as-a-Judge-Evaluierungen, die automatisch auf Produktions-Traffic laufen.

[MAR.20.2026]Trace-Modus — Observability ohne Latenz

Neuer Trace-Modus bietet volle Dashboard-Sichtbarkeit ohne zusätzliche Latenz.

[MAR.18.2026]Cursor Gateway

Cursor-AI-Traffic durch Grepture routen — für Observability, Kosten-Tracking und PII-Schutz.

[MAR.16.2026]Claude Code Gateway

Allen Claude-Code-Traffic durch Grepture routen — für Observability, Kosten-Tracking und PII-Schutz.

[MAR.14.2026]Von PII-Redaktion zum AI Gateway

Grepture erweitert sich vom PII-Redaktions-Proxy zum vollständigen AI Gateway mit Prompt-Verwaltung, Tracing und mehr.

[FEB.07.2026]Einführung von Grepture

Grepture gestartet — ein programmierbarer Proxy, der jede LLM-Anfrage auf PII, Secrets und sensible Daten scannt.