"Eigenes KI-Modell" ist nicht gleich "eigenes KI-Modell". Vier Stufen, vier Welten.
Wenn ein Kunde sagt "wir wollen unser eigenes AI-Model", lohnt es sich, kurz zu klären, was er meint. Es gibt vier Stufen, und sie unterscheiden sich erheblich in Aufwand, Datenschutz und Kontrolle.
Stufe 1: Custom GPT. Ein gut konfigurierter Assistent auf einem fremden Modell wie GPT-4, Claude oder Gemini, mit System-Prompt und Wissensbasis. Schnell aufgesetzt, oft genau richtig für interne Use Cases. Aber: die Daten gehen bei jeder Anfrage an den Anbieter. "Eigenes Modell" stimmt nur in einem sehr weichen Sinn.
Stufe 2: Open-Weight-Modell, gehostet bei einem Cloud-Anbieter. Du wählst Llama, Mistral, Gemma ... und lässt es auf AWS Bedrock, Azure ML oder Vertex AI laufen. EU-Locations sind möglich, alle drei bleiben aber US-Anbieter mit CLOUD-Act-Reichweite. In der Schweiz ohne US-Mutter betreibt Infomaniak diverse Modells.
Mehr Kontrolle als Stufe 1, aber die Daten verlassen dein Umfeld weiterhin.
Stufe 3: Open-Weight-Modell, selbst betrieben. Das gleiche Modell, aber in einem Rechenzentrum deiner Wahl. On-Premise oder bei einem Schweizer RZ-Partner. Die Daten bleiben dort, wo du sie haben willst. Das meinen wir, wenn wir bei ongoing von "lokalen Modellen" sprechen.
Stufe 4: Fine-Tuning oder Pre-Training. Du nimmst ein bestehendes Modell und trainierst es auf deinen Daten weiter. Im Extremfall trainierst du from scratch. Aufwendig, oft unnötig. Im Mittelstand fast nie der richtige Hebel – es sei denn, du hast einen klar abgegrenzten Fach-Use-Case mit eigenem Vokabular und genug gelabelten Daten, etwa in Medizin, Recht oder technischer Dokumentation. Dann kann Fine-Tuning ein kleineres Modell auf das Niveau eines grösseren heben, bei einem Bruchteil der Inferenzkosten.
Die meisten Anfragen, die wir hören, meinen Stufe 1. Wenn sensible Daten im Spiel sind, empfehlen wir fast immer Stufe 3. Genau zwischen Stufe 1 und Stufe 3 liegt der Punkt, an dem über physische Datenkontrolle entschieden wird.