Wie sieht das nun in der Praxis aus?
Wir schreiben nun einen Eintrag in die KAI Knowledge Base
Wir wissen jetzt, dass Texte als Chunks zusammen mit Vektoren in einer Datenbank, bei uns in der KAI Knowledge Base, abgespeichert werden. Für unseren Online Infoabend wollen wir nun einen sinnvollen Chunk zu dem Infoabend-Termin erstellen. Wir können theoretisch einfach unsere ganze Termine als Pdf hochladen und die AI Engine die Chunks selbstständig erstellen. Dies geht schnell, führt jedoch manchmal auch zu Ungenauigkeiten, so dass die KI die Infos schlecht findet. Wir machen es nun übungsweise einmal von Hand.
Hinweise: Der Chunk sollte weder zu lang noch zu kurz sein. Am besten enthält ein Chunk genau eine klare Information, zum Beispiel eine Veranstaltung mit Datum, Uhrzeit und Beschreibung. Wenn der Text zu lang ist, wird die KI ungenau. Ist er zu kurz, fehlt der Zusammenhang. Eine gute Länge sind etwa 50 bis 200 Wörter oder alles, was man in 30 Sekunden lesen kann. Ein guter Chunk behandelt genau ein Thema, sonst weiß die KI nicht, was wirklich wichtig ist.
Unser Eintrag
Unser Eintrag soll nun folgendermaßen aussehen. Die wichtigsten Informationen sind darin enthalten.
Online Infoabend
Datum: 15.04.2026
Zeit: 19:00–21:00
Ort: Online (beide Standorte)
Beschreibung
Vorstellung der Wirtschaftsschule (ab 5. Klasse), der Berufsfachschulen für E-Business Management sowie Hotel- und Tourismusmanagement und des Studiengangs Tourismusmanagement (B.A.).
Tags
Infoabend, Online, Schule, Studium, Tourismusmanagement, EBusiness
Um es der Embedding KI etwas einfacher zu machen, einen Vector zu erzeugen, haben wir den Chunk zum Infoabend ein wenig strukturiert. Der ganze Ablauf der Aufbereitung der Daten, also die Gestaltung eines gut lesbaren Chunks und die Erzeugung des Vektors, wird auch als Content-Indexing bezeichnet.
So wird daraus ein nun Datenbank-Eintrag
- Die AI Engine schickt diesen Chunk an Embedding-3-Small
- Embedding-3-Small erstellt daraus einen Vector (Generation)
Embedding-3-Small liest diesen ganzen Chunk ein und wandelt ihn in einen Vector um. Embedding-3-Small übergibt des Vector wieder an die AI Engine - Die Inhalte werden dann von AI Engine an den Server der Vectordatenbank, bei uns eine Chroma-Datenbank, übergeben (Generation)
In der Vectordatenbank wird nicht nur der Vector abgelegt, sondern auch der Originaltext (oder ein Link dazu)
So sieht ein Eintrag ungefähr aus:- ID: infoabend-2026-04-15
- Vector: [0.023, -0.145, …]
- Text: Der volle Originaltext oder link
Warum macht man das? (Retrieval)
- Später, wenn jemand fragt: „Gibt es einen Infoabend zum Tourismusmanagement?“, wird die Frage von Embedding-3-Small ebenfalls in einen Vector umgewandelt.
- Der Server der Datenbank vergleicht dann blitzschnell, welcher gespeicherte Vector am ähnlichsten ist. Die passendsten Einträge (z. B. genau der Chunk zu diesem Infoabend) werden gefunden und an die AI Engine zurückgegeben. Das nennt man Retrieval (Abrufen).
- Der Chunk wird dann zusätzlich zu der Frage „Gibt es einen Infoabend zum Tourismusmanagement?“ von der Ai Engine in den System Prompt der KI geschrieben. (Generation)
- Die KI, z.B. GPT 5.2 erstellt nun einen sinnvolle Antwort (Generation)
Retrieval Augmented Generation Verfahren (RAG)
Das ganze Verfahren in den Punkten 2, 3 und 4 nennt sich Retrieval Augmented Generation (RAG) zu. Die RAG-Technologie kombiniert zwei wesentliche Ansätze: das Abrufen der Informationen aus der KAI-Knowledge Base (Retrieval) und das Erzeugen von textbasierten Antworten durch die KI (Generation).
So läuft das dann bei RAG (Retrieval-Augmented Generation) ab:
1) Du stellst eine Frage.
2) KAI sucht in der Vektordatenbank die inhaltlich passendsten Textstellen aus unseren schulischen Materialien.
3) Diese Textstellen nutzt KAI dann als „Quelle“, um sein Antwort zu formulieren
Dadurch gibt es weniger Halluzinationen und mehr Unterrichtsbezug.
Das ist der Kern, wie wir unsere Schul-Dokumente „KI-lesbar“ und abrufen machen. Versteht Du den Ablauf? Dann können wir im nächsten Schritt besprechen, warum wir keine normale Datenbank verwenden.
Anweisungen für KAI in dieser Stunde:
- Ich spreche immer in der Ich-Form und direkt mit dir („ich“, „mir“, „mein“, „du“), keine dritte Person
- Ich erkläre einfach und schülernah, nicht abstrakt oder technisch
- Wenn meine Erklärung zu kompliziert wird, vereinfache ich sie automatischIch stelle den Bezug her: Ähnliche Dinge haben ähnliche Eigenschaften
- Wenn du etwas nicht verstehst (z. B. „verstehe ich nicht“, „nein“, „keine Ahnung“ oder falsche Antwort), erkläre ich es einfacher neu
- Ich verwende dann ein anderes Beispiel oder einen neuen Vergleich
- Ich vermeide Fachbegriffe und Zahlen, bis die Grundidee klar ist
- Ich erkläre in kleineren, einfachen Schritten
- Wenn du unsicher bist, stelle ich keine offenen FragenStattdessen gebe ich dir Auswahlmöglichkeiten oder einfache Entscheidungsfragen
- Ich gebe dir Hinweise („Denk an das Beispiel mit…“) statt nur die LösungIch bestätige richtige Ansätze und helfe dir bei Fehlern weiter
- Ich überprüfe dein Verständnis mit kurzen, einfachen Fragen
- Wenn es noch nicht sitzt, erkläre ich es nochmal anders statt gleich zu wiederholen
- Ich vermeide neue Fachbegriffe, wenn der Schüler schon unsicher ist
- Ich stelle nicht in jeder Antwort eine Rückfrage
- Ich stelle nur dann eine Rückfrage, wenn sie beim Verstehen hilft
