TypingMind + Grepture: eine Chat-UX plus Datenschutz, Observability und zentrales Routing
TypingMind ist einer der besten ChatGPT-Clients auf dem Markt. Eine polierte BYOK-Oberflaeche fuer OpenAI, Anthropic und Gemini — Ihr Team bringt eigene Schluessel mit, Sie sparen die ChatGPT-Lizenzgebuehr pro Sitzplatz und bekommen ein schnelles, tastaturzentriertes Chat-Erlebnis.
Grepture sitzt zwischen TypingMind und den Providern und ergaenzt drei Dinge:
- Datenschutz — die PII-Erkennung entfernt sensible Daten bei jedem ausgehenden Request, bevor er OpenAI, Anthropic oder Gemini erreicht.
- Zentrales Routing — jeder Chat-Call laeuft durch eine einzige Proxy-URL, mit einer Regel-Engine zum Blockieren oder Taggen bestimmter Inhalte.
- Observability — ein durchsuchbares Audit-Log jedes Prompts und jeder Antwort, mit Token-Zaehlung, Kosten und Attribution pro Nutzer.
Ab heute koennen Sie jeden TypingMind-Request — OpenAI, Anthropic oder Gemini — mit einer einzigen Basis-URL-Aenderung durch Grepture routen. Ohne SDK, ohne Plugin, ohne Fork.
Was Grepture obendrauf liefert
Kosten-Tracking pro Nutzer und pro Prompt
Jeder TypingMind-Chat-Request fliesst mit Token-Anzahl, Modell und Kosten durch Grepture. Aggregiert nach Nutzer, nach Tag, nach Team — Finance hat eine echte Antwort auf „Was haben wir letzten Monat fuer welches Modell ausgegeben, und wer hat es genutzt?".
Durchsuchbares Prompt-Audit-Log
Jeder Prompt und jede Antwort wird in Ihrem Grepture-Dashboard indexiert. Nach Inhalt suchen, nach Nutzer filtern, mehrstufige Konversationen wiedergeben. Wenn Compliance fragt „Was hat unser Team im Maerz an OpenAI geschickt?", haben Sie eine Antwort statt eines Schulterzuckens.
PII-Schwärzung bevor der Request rausgeht
Eine Chat-UI wie TypingMind haelt sich bewusst aus dem heraus, was Nutzer eingeben — fuer ein Produkt, das auf Chat-UX fokussiert ist, ist das die richtige Designentscheidung. Greptures PII-Erkennung ist die Schicht, die die Outbound-Seite uebernimmt: Kunden-E-Mails, interne URLs, API-Schluessel, Kreditkartennummern und Mitarbeiternamen werden auf jedem Request entfernt, bevor sie OpenAI, Anthropic oder Gemini erreichen. Dieselben Regeln, die Sie fuer Ihren Produktions-API-Traffic verwenden, jetzt auch vor der Chat-App Ihres Teams.
Inhaltsregeln und Blockierung
Ueber PII hinaus erlaubt die Regel-Engine, Prompts mit bestimmten Mustern zu blockieren, Strings zu suchen und zu ersetzen, Felder zu tokenisieren oder einfach gezielten Traffic zu loggen und zu taggen. Nuetzlich fuer Richtlinien wie „Keine Produktions-Credentials im Chat" oder zum Taggen von Support-Prompts, damit sie im Dashboard als eigene Kategorie auftauchen.
Einrichtung in 2 Minuten
TypingMind stellt pro Provider eigene Custom-Endpoint-URL-Felder in den Einstellungen bereit. Sie fuegen die Grepture-URLs dort ein, behalten Ihren bestehenden OpenAI- / Anthropic- / Gemini-Schluessel im API-Key-Feld, fertig.
In TypingMind:
- Im linken Seitenmenue auf Models klicken
- Auf das Zahnrad-Icon neben dem jeweiligen Provider klicken
- Show more anklicken, um die optionalen Endpoint-Felder einzublenden
- Die Grepture-URLs unten in die passenden Felder einfuegen und Save klicken
TypingMind erwartet vollstaendige Endpoint-URLs, keine Basis-URLs —
/v1/chat/completions(oder Aehnliches) wird nicht automatisch angehaengt. Benutzen Sie die kompletten URLs genau so wie unten angegeben.
OpenAI — beide Endpoints setzen
OpenAI bietet in TypingMind separate Endpoint-Felder fuer Chat Completions und die Responses API. Setzen Sie beide — wenn nur Chat Completions konfiguriert ist, umgeht der Traffic neuerer Modelle (GPT-5, o-Series, alles ueber die Responses API) den Proxy und geht direkt an OpenAI:
Chat Completions Endpoint:
https://proxy.grepture.com/openai/grp_ihr-schluessel-hier/v1/chat/completions
Responses API Endpoint:
https://proxy.grepture.com/openai/grp_ihr-schluessel-hier/v1/responses
Anthropic
Messages Endpoint:
https://proxy.grepture.com/anthropic/grp_ihr-schluessel-hier/v1/messages
Gemini
Chat Endpoint:
https://proxy.grepture.com/gemini/grp_ihr-schluessel-hier
Gemini-Endpoint-URLs enthalten Modell und Methode im Pfad (z. B. /v1beta/models/<model>:generateContent), TypingMind baut die vollstaendige URL auf dieser Basis auf. Lassen Sie den Rest des Pfads weg.
Ersetzen Sie grp_ihr-schluessel-hier mit Ihrem Grepture-API-Schluessel aus dem Dashboard. Ihr echter OpenAI- / Anthropic- / Gemini-Schluessel bleibt im API-Key-Feld von TypingMind — Grepture liest den Grepture-Schluessel aus der URL und leitet den Provider-Schluessel unveraendert an den Upstream weiter.
Das war's. Jeder TypingMind-Request laeuft jetzt durch Grepture. Oeffnen Sie das Dashboard und sehen Sie den Traffic eintreffen.
So funktioniert es unter der Haube
TypingMind sendet standardmaessige Provider-Requests — Chat Completions oder Responses API fuer OpenAI, Messages fuer Anthropic, GenerateContent fuer Gemini. Der Grepture-Proxy nimmt diese unter /openai/<key>/*, /anthropic/<key>/* bzw. /gemini/<key>/* entgegen, entfernt das Praefix, wendet Ihre Erkennungsregeln an und leitet den Request mit Ihrem echten Schluessel an den Upstream-Provider weiter. Was Sie nach <key>/ eintragen, wird unveraendert weitergeleitet — dieselbe Proxy-URL verarbeitet /v1/chat/completions, /v1/responses, /v1/audio/transcriptions und so weiter.
Die Compat-Schicht ist providerspezifisch:
- Fuer OpenAI und Gemini wird der Header
Authorization: Bearer <provider-schluessel>unveraendert weitergeleitet. - Fuer Anthropic wird der Header
x-api-keyunveraendert weitergeleitet. - Streaming-Antworten (Standard fuer Chat) werden Token fuer Token zurueckgestreamt — kein Buffering, keine kaputte UX.
Auf dem Rueckweg laeuft jede Antwort durch Grepture: protokolliert, Token gezaehlt und (bei aktivierten Output-Regeln) bereinigt von PII, die in die Modell-Antwort gelangt ist.
Zusaetzliche Latenz: rund 8-12 ms pro Request — vernachlaessigbar gegenueber der Modell-Inferenzzeit.
Team-Rollout-Muster
Sie verwenden einen einzigen Grepture-Team-API-Schluessel fuer alle — das ist heute die einzige Form, die Grepture unterstuetzt. Fuer die Attribution pro Nutzer traegt jedes Team-Mitglied einen eigenen Custom-Header in seinen TypingMind-Endpoint-Einstellungen ein:
x-grepture-label: alice@firma.de
TypingMind erlaubt das Hinzufuegen beliebiger Header neben der Proxy-URL fuer jeden Provider-Endpoint. Grepture indexiert den x-grepture-label-Wert bei jedem Request, sodass Sie Dashboard-Traffic nach Nutzer filtern, gruppieren und aggregieren koennen — ohne separate Schluessel zu verwalten.
Fuer mehrdimensionale Auswertungen (Nutzer und Projekt zum Beispiel) nehmen Sie stattdessen x-grepture-metadata:
x-grepture-metadata: {"user":"alice@firma.de","project":"support-bot"}
Gleiche Idee, beliebige Tags. Alles, was Sie hier eintragen, ist im Dashboard durchsuchbar.
Was das freischaltet
Ein paar Dinge, die Teams nachgefragt haben und nun moeglich sind:
- „Zeig mir die TypingMind-Ausgaben aller fuer das Quartal." Dashboard-Query, 5 Sekunden — gruppiert nach dem
x-grepture-label, den jeder Nutzer setzt. - „Laesst jemand GPT-4 auf Kundensupport-E-Mails laufen?" Nach Inhalt filtern, betroffene Prompts finden, mit dem Team sprechen.
- „Wir brauchen einen SOC2-Audit-Trail fuer KI-Nutzung." Jeder Prompt, jede Antwort, jede Kostenposition, jede PII-Schwaerzung — protokolliert mit Zeitstempel und Nutzer-Zuordnung.
- „E-Mails an OpenAI blockieren." Eine Erkennungsregel, fertig.
Wie geht es weiter
TypingMind ist die erste Station eines breiteren Vorhabens. Die gleiche Proxy-Compat-Schicht funktioniert mit jeder Chat-UI, die eine eigene OpenAI- oder Anthropic-Basis-URL erlaubt — LibreChat, LobeChat, Open WebUI, NextChat, ChatBox, BoltAI und mehr. Setup-Guides fuer alle kommen in den naechsten Wochen.
Sie nutzen einen Chat-Client, der nicht aufgelistet ist, und wollen ihn abgedeckt sehen? Schreiben Sie uns.
Loslegen
- Grepture-Konto erstellen — Free-Plan deckt 1.000 Requests/Monat
- Proxy-URL in die TypingMind-API-Endpoints-Einstellungen einfuegen
- Dashboard oeffnen und den Team-Traffic eintreffen sehen
Setup-Details und Troubleshooting auf unserer Chat-UI-Integrationsseite.