AI Gateway

Eine API. Alle KI-Modelle.

Schluss mit fünf verschiedenen KI-Anbieter-APIs. Synaplan leitet Anfragen an OpenAI, Claude, Gemini, Groq und lokale Ollama-Modelle über einen einzigen Endpunkt weiter — mit Fallbacks, Kostenkontrolle und vollständiger Transparenz.

Modellflexibilität
Modelle je nach Anwendungsfall wechseln — schnelles Groq für Chat, leistungsstarkes GPT-4o für komplexe Analysen, lokales Ollama für DSGVO-kritische Umgebungen.
Kostenkontrolle
Einfache Anfragen an günstigere Modelle, komplexe an leistungsstärkere routen. Regeln nach Kosten, Latenz oder Kapazität definieren.
Kein Vendor-Lock-in
Open-Source und self-hosted. Anbieter wechseln, ohne Anwendungscode neu schreiben zu müssen.
Vollständige Transparenz
Jede Anfrage mit Modell, Tokens, Latenz und Kosten protokolliert. Prüfpfade für Compliance-Reviews.
Lokale Modelle via Ollama
Llama 3, Mistral, Qwen oder beliebige Ollama-kompatible Modelle auf eigener Hardware betreiben. Keine Daten verlassen den Server.
OpenAI-kompatible API
Synaplan spricht das OpenAI-API-Format. Als OpenAI-Proxy einsetzen — keine SDK-Änderungen in bestehenden Apps nötig.

Modelle & Anbieter

Konkrete Modellnamen hier aufzuzählen wäre wenig sinnvoll — sie sind alle paar Wochen veraltet. Stattdessen: Wir decken die großen drei kommerziellen Anbieter sowie eine wachsende Auswahl spezialisierter Nischenanbieter ab, betreiben beliebige Modelle lokal über Ollama oder NVIDIA Triton, bieten direkten Zugang zu HuggingFace und arbeiten für besonders schnelle Inferenz mit Groq zusammen. Den vollständigen, aktuellen Katalog pflegen wir in unserer API-Dokumentation.

  • OpenAI · Anthropic · Google — die großen Drei
  • Spezialisierte Nischenanbieter
  • Ollama — lokale Open-Source-Modelle
  • NVIDIA Triton — GPU-Selbsthosting
  • HuggingFace — direkte Integration
  • Groq — Partner für ultraschnelle Inferenz

KI-Modell-Routing in Minuten einrichten