Bento



Einheitliche Inferenzplattform, die es Entwicklern ermöglicht, KI-Modelle – von traditionellem ML bis hin zu großen Sprachmodellen – in jeder Cloud oder Infrastruktur bereitzustellen, bereitzustellen und zu skalieren. Ziel ist es, die Bereitstellung produktionsreifer Modelle mit OpenAI-kompatiblen APIs, automatischer Skalierung, GPU-Unterstützung und modularen Workflows für private RAG-Systeme, Bildgenerierung und Echtzeit-Inferenz zu vereinfachen.