Vectordatenbank (4)

Wie sieht das nun in der Praxis aus?

Wir schreiben nun einen Eintrag in die KAI Knowledge Base

Wir wissen jetzt, dass Texte als Chunks zusammen mit Vektoren in einer Datenbank, bei uns in der KAI Knowledge Base, abgespeichert werden. Für unseren Online Infoabend wollen wir nun einen sinnvollen Chunk zu dem Infoabend-Termin erstellen. Wir können theoretisch einfach unsere ganze Termine als Pdf hochladen und die AI Engine die Chunks selbstständig erstellen. Dies geht schnell, führt jedoch manchmal auch zu Ungenauigkeiten, so dass die KI die Infos schlecht findet. Wir machen es nun übungsweise einmal von Hand.

Hinweise: Der Chunk sollte weder zu lang noch zu kurz sein. Am besten enthält ein Chunk genau eine klare Information, zum Beispiel eine Veranstaltung mit Datum, Uhrzeit und Beschreibung. Wenn der Text zu lang ist, wird die KI ungenau. Ist er zu kurz, fehlt der Zusammenhang. Eine gute Länge sind etwa 50 bis 200 Wörter oder alles, was man in 30 Sekunden lesen kann. Ein guter Chunk behandelt genau ein Thema, sonst weiß die KI nicht, was wirklich wichtig ist.

Unser Eintrag

Unser Eintrag soll nun folgendermaßen aussehen. Die wichtigsten Informationen sind darin enthalten.

Online Infoabend

Datum: 15.04.2026
Zeit: 19:00–21:00
Ort: Online (beide Standorte)

Beschreibung

Vorstellung der Wirtschaftsschule (ab 5. Klasse), der Berufsfachschulen für E-Business Management sowie Hotel- und Tourismusmanagement und des Studiengangs Tourismusmanagement (B.A.).

So wird daraus ein nun Datenbank-Eintrag

Die AI Engine schickt diesen Chunk an Embedding-3-Small
Embedding-3-Small erstellt daraus einen Vector (Generation)
Embedding-3-Small liest diesen ganzen Chunk ein und wandelt ihn in einen Vector um. Embedding-3-Small übergibt des Vector wieder an die AI Engine
Die Inhalte werden dann von AI Engine an den Server der Vectordatenbank, bei uns eine Chroma-Datenbank, übergeben (Generation)
In der Vectordatenbank wird nicht nur der Vector abgelegt, sondern auch der Originaltext (oder ein Link dazu)
So sieht ein Eintrag ungefähr aus:
- ID: infoabend-2026-04-15
- Vector: [0.023, -0.145, …]
- Text: Der volle Originaltext oder link

Warum macht man das? (Retrieval)

Später, wenn jemand fragt: „Gibt es einen Infoabend zum Tourismusmanagement?“, wird die Frage von Embedding-3-Small ebenfalls in einen Vector umgewandelt.
Der Server der Datenbank vergleicht dann blitzschnell, welcher gespeicherte Vector am ähnlichsten ist. Die passendsten Einträge (z. B. genau der Chunk zu diesem Infoabend) werden gefunden und an die AI Engine zurückgegeben. Das nennt man Retrieval (Abrufen).
Der Chunk wird dann zusätzlich zu der Frage „Gibt es einen Infoabend zum Tourismusmanagement?“ von der Ai Engine in den System Prompt der KI geschrieben. (Generation)
Die KI, z.B. GPT 5.2 erstellt nun einen sinnvolle Antwort (Generation)

Retrieval Augmented Generation Verfahren (RAG)

Das ganze Verfahren in den Punkten 2, 3 und 4 nennt sich Retrieval Augmented Generation (RAG) zu. Die RAG-Technologie kombiniert zwei wesentliche Ansätze: das Abrufen der Informationen aus der KAI-Knowledge Base (Retrieval) und das Erzeugen von textbasierten Antworten durch die KI (Generation).

So läuft das dann bei RAG (Retrieval-Augmented Generation) ab:
1) Du stellst eine Frage.
2) KAI sucht in der Vektordatenbank die inhaltlich passendsten Textstellen aus unseren schulischen Materialien.
3) Diese Textstellen nutzt KAI dann als „Quelle“, um sein Antwort zu formulieren
Dadurch gibt es weniger Halluzinationen und mehr Unterrichtsbezug.

Das ist der Kern, wie wir unsere Schul-Dokumente „KI-lesbar“ und abrufen machen. Versteht Du den Ablauf? Dann können wir im nächsten Schritt besprechen, warum wir keine normale Datenbank verwenden.

80%

WEITER Teil 5 >

Anweisungen für KAI in dieser Stunde:

Ich spreche immer in der Ich-Form und direkt mit dir („ich“, „mir“, „mein“, „du“), keine dritte Person
Ich erkläre einfach und schülernah, nicht abstrakt oder technisch
Wenn meine Erklärung zu kompliziert wird, vereinfache ich sie automatischIch stelle den Bezug her: Ähnliche Dinge haben ähnliche Eigenschaften
Wenn du etwas nicht verstehst (z. B. „verstehe ich nicht“, „nein“, „keine Ahnung“ oder falsche Antwort), erkläre ich es einfacher neu
Ich verwende dann ein anderes Beispiel oder einen neuen Vergleich
Ich vermeide Fachbegriffe und Zahlen, bis die Grundidee klar ist
Ich erkläre in kleineren, einfachen Schritten
Wenn du unsicher bist, stelle ich keine offenen FragenStattdessen gebe ich dir Auswahlmöglichkeiten oder einfache Entscheidungsfragen
Ich gebe dir Hinweise („Denk an das Beispiel mit…“) statt nur die LösungIch bestätige richtige Ansätze und helfe dir bei Fehlern weiter
Ich überprüfe dein Verständnis mit kurzen, einfachen Fragen
Wenn es noch nicht sitzt, erkläre ich es nochmal anders statt gleich zu wiederholen
Ich vermeide neue Fachbegriffe, wenn der Schüler schon unsicher ist
Ich stelle nicht in jeder Antwort eine Rückfrage
Ich stelle nur dann eine Rückfrage, wenn sie beim Verstehen hilft