Wir konzipieren und implementieren autarke KI-Infrastrukturen für Unternehmen mit höchsten Ansprüchen an Datensouveränität. Unser Fokus liegt auf der technischen Integration moderner Large Language Models (LLMs) – ohne Cloud-Abhängigkeit und ohne Datenabfluss.
Wir decken das gesamte Spektrum aktueller Modellarchitekturen ab und optimieren diese für die jeweilige Hardware-Zielplattform:
Small & Efficient Models (SLMs):
Einsatz kompakter Modelle (z. B. Qwen 3.5, Minimax-m, GLM-Flash, Ministral) für spezialisierte Aufgaben. Diese laufen performant auf hocheffizienter Hardware wie der NVIDIA DGX Spark oder der AMD Strix Halo Plattform.
Mid-Size Reasoning Models:
Implementierung leistungsstarker Allrounder wie Mistral, Nemotron oder größeren Versionen von Qwen, Minimax oder GPT OSS auf Workstations mit mehreren NVIDIA RTX 5090 GPUs.
High-End Enterprise Models:
Deployment großer Sprachmodelle (GLM, MiniMax, GPT-OSS) auf Server-Clustern mit NVIDIA RTX Pro 6000 Prozessoren für komplexe logische Operationen und hohen parallelen Durchsatz.
Wir nutzen unter anderem Tools wie n8n als lokale Orchestrierungsschicht, um KI-Modelle tief in Ihre Geschäftsprozesse einzubinden. Dies ermöglicht klare, regelbasierte Abläufe:
Implementierung von Open Notebook (die Open-Source-Alternative zu NotebookLM). Damit erschließen Mitarbeiter hunderte interne Dokumente gleichzeitig, führen komplexe Recherchen durch und generieren Zusammenfassungen – vollständig innerhalb Ihres Firmennetzwerks, auf Ihrer eigenen Hardware.
Wir bauen maßgeschneiderte, interne Web-Interfaces oder APIs zugeschnitten auf Ihre Anforderungen:
Custom Web-UIs: Entwicklung nativer Applikationen zur einfachen Nutzung komplexer Workflows (z. B. spezialisierte Dashboards für die Rechtsabteilung oder das Controlling).
Backend-Infrastruktur: Bereitstellung von APIs via vLLM oder llama.cpp zur Anbindung an Ihre Bestandssoftware.
Full-Stack Setup: Docker-Umgebungen und GPU-Optimierung direkt auf Ihrer Inhouse-Hardware.
Als langjähriger selbstständiger Programmierer habe ich bereits zahlreiche komplexe Softwareprojekte erfolgreich umgesetzt. Heute nutze ich diese Erfahrung, um Unternehmen dabei zu unterstützen, das volle Potenzial lokaler Künstlicher Intelligenz auszuschöpfen – mit dem klaren Fokus auf automatisierte Lösungen und effiziente Workflows.
Obwohl ich in Wien zu Hause bin, betreue ich meine Kunden überregional. Mein Ansatz ist rein technisch getrieben: Ich entwickle für Ihren spezifischen Use-Case die passende KI-Strategie und setze diese schlüsselfertig um.
Dabei konzentriere ich mich auf drei Kernbereiche:
KI-Agenten & Automation: Ich entwickle autonome Agents, die wiederkehrende Aufgaben in Ihrem Unternehmen selbstständig übernehmen und Prozesse durch intelligente Logik radikal vereinfachen und Zeit sparen.
Maßgeschneiderte WebApps: Damit Ihre Mitarbeiter KI-Tools effizient nutzen können, programmiere ich spezialisierte interne Web-Applikationen, die komplexe KI-Logik in intuitive Oberflächen verpacken und nahtlos in Ihren Arbeitsalltag integrieren.
So erhalten Sie das Beste aus beiden Welten: Maßgeschneiderte Software-Entwicklung und perfekt darauf abgestimmte Hardware-Power.
Absolut. Dank effizienter Quantisierungsmethoden und hochoptimierter Inferenz-Engines wie llama.cpp benötigen moderne Modelle nicht mehr zwingend riesige Rechenzentren. Wir bieten Lösungen für unterschiedliche Budgetrahmen an:
Einstiegslösungen: Kompakte Systeme auf Basis der AMD Strix Halo Plattform oder NVIDIA DGX Spark bieten bereits beeindruckende Performance für lokale Assistenzsysteme und RAG-Anwendungen bei moderaten Anschaffungs- und Betriebskosten.
Skalierbarkeit: Sie können klein starten und die Hardware-Ressourcen (z. B. durch weitere GPUs) sukzessive erweitern, wenn die interne Nutzung steigt.
2. Wann ist eine spezialisierte WebApp besser als eine Automatisierung via n8n?
Während n8n hervorragend für die Verknüpfung vieler verschiedener Drittsysteme und komplexer, linearer Prozessketten geeignet ist, bietet eine dedizierte WebApp oft entscheidende Vorteile:
Benutzererfahrung: Eine speziell entwickelte WebApp ist für den Endnutzer oft intuitiver und schneller zu bedienen als abstrakte Automatisierungs-Flows.
Kosteneffizienz: Für klar definierte, wiederkehrende interne Abläufe ist die Entwicklung einer schlanken WebApp oft preiswerter in der Wartung und effektiver in der täglichen Anwendung als eine überladene Automatisierungs-Logik.
Da wir auf bewährte Container-Technologien (Docker) und stabile Inferenz-Backends setzen, ist der laufende Wartungsaufwand minimal. Wir nutzen zudem modulare Toolboxes, um Ihre Systeme schnell und sicher zu aktualisieren. So können Modelle regelmäßig gegen neuere, leistungsfähigere Versionen (z. B. Updates von Nemotron, Gemma oder Qwen) ausgetauscht werden, damit Ihre Infrastruktur technisch immer auf dem neuesten Stand bleibt.
Ja, das ist einer unserer Kernbereiche. Wir binden Ihre vorhandenen Datenbestände sicher an die lokale KI an. Durch Techniken wie RAG (Retrieval Augmented Generation) kann die KI auf Ihr Firmenwissen zugreifen, ohne dass die Daten jemals Ihre Infrastruktur verlassen oder zum Training der Basismodelle verwendet werden.
Die Zusammenarbeit mit Oliver hat wirklich reibungslos geklappt. Oliver war stets wie vereinbart erreichbar, hat alle Aufgaben verlässlich und weit vor der vereinbarten Zeit erledigt und stand auch für Rückfragen immer zur Verfügung. Das Ergebnis kann sich durch seinen Einsatz wirklich sehen lassen. Vielen Dank für die gute und unkomplizierte Zusammenarbeit 🙂
Seit dem ersten Beratungsgespräch überzeugt Oliver Sulzer mit seiner kompetenten und super freundlichen Art. Oliver hat uns einen tollen Onlineshop gemacht, für den wir ständig Komplimente bekommen und der einwandfrei funktioniert. Oliver reagiert irrsinnig schnell und unkompliziert auf Anliegen – eine wirklich angenehme Zusammenarbeit! Es hat bisher noch nichts gegeben, was er nicht konnte. Wir sind wirklich froh, ihn ‚gefunden‘ zu haben und können ihn nur jedem weiterempfehlen!
Wir arbeiten inzwischen seit mehreren Jahren in vielen verschiedenen Projekten zusammen und es ist jedes mal eine Freude das Ergebnis zu sehen.
Menschlich und fachlich kompetent und gewissenhaft.
Wünsche werden prompt umgesetzt … geht nicht, gibt’s nicht!
Was nicht passt, wird passend gemacht.
Oliver ist stets freundlich, hilfsbereit und beantwortet auch Fragen.
Vielen Dank an dieser Stelle für die gute Zusammenarbeit.
Ich freue mich schon auf zukünftige Projekte.
Herr Sulzer ist hervorragend auf unsere Wünsche eingegangen und hat die Weiterentwicklung unserer WordPress Seite maßgeblich unterstützt. Er hat auf Anfragen immer sehr schnell geantwortet, hat verlässlich alle Termine eingehalten und sehr gute eigene Ideen eingebracht. Wir sind mit dem Ergebnis sehr zufrieden.
Zuverlässig und kompetente Beratung. Projekte werden professionell abgewickelt, die Kommunikation erfolgt rasch und immer zielführend. Wir freuen uns auf eine weiterhin gute Zusammenarbeit!
Schicken Sie uns einfach eine E-Mail oder meldn Sie sich direkt telefonisch.

Bürozeiten:
Montag – Donnerstag: 9:00 – 17:00 Uhr
Freitag: 9:00 – 14:00 Uhr
