Lokale Modelcard

Qwen3.6-27B

Qwen3.6-27B als lokal gehostetes makeIT4U-Modell im Rechenzentrum Karlsruhe: Primary Chat, Kontextlänge 262.144
Input: Text, Bilder und Videos
BF16, KV-Cache BF16
Decode: 85,65 tok/s.

Lokales Modell

Qwen3.6-27B als DSGVO-konforme makeIT4U API.

Unser primäres Chatmodell für lange Kontexte, technische Assistenz, Agenten-Workflows und multimodale Aufgaben mit Text, Bildern und Videos. Es läuft lokal auf unserer Infrastruktur in Karlsruhe und wird über eine kontrollierte API bereitgestellt.

RollePrimary Chat
AnbieterQwen / Alibaba Cloud
ModelltypChat, Reasoning, multimodale Eingaben
LizenzApache 2.0
Kontext / Sequenz262.144 Tokens nativer Kontext
Input-DatenText, Bilder und Videos
QuantisierungBF16
KV-CacheBF16
DurchsatzDecode: 85,65 tok/s
BackendKI-Server mit SGLang
BetriebmakeIT4U-Rechenzentrum Karlsruhe
Input0,28 EUR / M Tokens
Output3,20 EUR / M Tokens

Einsatzbereiche

Wofür wir Qwen3.6-27B einsetzen.

Use Case

Chat- und Assistenzsysteme

Wir integrieren das Modell passend zu Daten, Berechtigungen, Schnittstellen und Betriebsanforderungen.

Use Case

lange Dokumente und technische Akten

Wir integrieren das Modell passend zu Daten, Berechtigungen, Schnittstellen und Betriebsanforderungen.

Use Case

Agenten mit Tool-Nutzung

Wir integrieren das Modell passend zu Daten, Berechtigungen, Schnittstellen und Betriebsanforderungen.

Use Case

Bild- und Dokumentverständnis

Wir integrieren das Modell passend zu Daten, Berechtigungen, Schnittstellen und Betriebsanforderungen.

Lokaler Betrieb statt fremder Cloud.

Qwen3.6-27B wird als lokales makeIT4U-Modell betrieben. Anfragen laufen über unsere Infrastruktur in Karlsruhe, werden nicht für Training verwendet und nicht dauerhaft gespeichert. Zugriff, Rate Limits und Integration werden passend zum Kundenszenario eingerichtet.

Grenzen und Qualitätssicherung.

  • Antworten müssen bei kritischen Entscheidungen fachlich geprüft werden.
  • Sehr lange Kontexte erhöhen Latenz und Ressourcenbedarf.
  • Multimodale Workflows werden je nach Use Case separat abgestimmt.

Quelle

Technische Basis: offizielle Modelcard.

Die Angaben zu Lizenz und Modellbasis orientieren sich an der offiziellen Modelcard. Unsere Preise, Backends und Betriebsangaben beziehen sich auf den makeIT4U-Betrieb im Rechenzentrum Karlsruhe.

Offizielle Modelcard öffnen

Der nächste Schritt

Lassen Sie uns über Ihre IT sprechen.

Das Erstgespräch ist kostenlos und unverbindlich – telefonisch oder vor Ort in Karlsruhe. Sie bekommen eine klare technische Einschätzung statt eines Verkaufsgesprächs.

Anrufen Kontakt