# KI-Systeme und lokale Modell-APIs

makeIT4U betreibt eigene KI-Cluster im Rechenzentrum Karlsruhe und bietet lokale KI-Systeme, KI-Agent-Computer sowie API-Zugriff auf selbst gehostete Modelle. Ziel ist KI-Nutzung fuer sensible Unternehmensdaten ohne dauerhafte Speicherung und ohne Abgabe an fremde Trainingssysteme.

## Betrieb

- Rechenzentrum: makeIT4U-Rechenzentrum Karlsruhe, Deutschland.
- Datenhaltung: API-Anfragen werden nicht dauerhaft gespeichert.
- Training: API-Anfragen werden nicht zum Training verwendet.
- Integration: ERP, CRM, Ticketsysteme, Dokumentenablaegen und interne Fachsysteme.
- Modelltraining: synthetische Trainingsdaten, SFT, LoRA und RL fuer kundenspezifische Anforderungen.

## Lokal gehostete Modelle

- [Qwen3.6-27B](https://makeit4u.de/model-qwen36-27b.md): Primary Chat, 262.144 Kontext, Text/Bilder/Videos, BF16, KV-Cache BF16, Decode 85,65 tok/s.
- [qwen3-embedding-8b](https://makeit4u.de/model-qwen3-embedding-8b.md): Embeddings, 4096 Dimensionen.
- [bge-m3](https://makeit4u.de/model-bge-m3.md): Embeddings und Honcho Memory, 1024 Dimensionen.
- [whisper-large-v3](https://makeit4u.de/model-whisper-large-v3.md): lokale Speech-to-Text-Verarbeitung.

## Externer Dienst

- Voxtral TTS wird nicht selbst kommerziell gehostet. Der Dienst wird ueber die Mistral API bezogen.

## Preise

- Qwen3.6-27B: Input 0,28 EUR / M Tokens, Output 3,20 EUR / M Tokens.
- qwen3-embedding-8b: Input 0,01 EUR / M Tokens, Output kostenlos.
- bge-m3: Input 0,005 EUR / M Tokens, Output kostenlos.
- whisper-large-v3: 0,006 EUR / Minute.
- Voxtral TTS ueber Mistral API: 16 EUR / M Zeichen.

API-Key beantragen: [Kontakt](https://makeit4u.de/kontakt.md)