RAG erklärt

Retrieval-Augmented Generation (RAG) löst eine der größten Einschränkungen von KI: den Wissensstichtag. Durch die Verbindung von KI mit Ihren Dokumenten und Datenquellen ermöglicht RAG Antworten, die auf dem spezifischen Wissen Ihrer Organisation basieren.

Was ist RAG?

RAG ist eine Technik, die KI-Antworten verbessert, indem relevante Informationen aus einer Wissensbasis abgerufen werden, bevor eine Antwort generiert wird. Anstatt sich ausschließlich auf das zu verlassen, was die KI während des Trainings gelernt hat, ermöglicht RAG der KI den Zugriff auf Ihre spezifischen Dokumente.

Das Problem, das RAG löst

Ohne RAG	Mit RAG
Auf Trainingsdaten beschränkt	Zugriff auf aktuelle Dokumente
Kann keine Quellen zitieren	Kann auf spezifische Dokumente verweisen
Generische Antworten	Organisationsspezifische Antworten
Wissensstichtag-Probleme	Aktuelle Informationen
Kann Fakten halluzinieren	Auf tatsächlichen Quellen basierend

Wie RAG funktioniert

Der RAG-Prozess umfasst drei Hauptphasen:

Indexierung: Ihre Dokumente werden verarbeitet und in einem durchsuchbaren Format gespeichert
Abruf: Wenn Sie eine Frage stellen, werden relevante Dokumentenabschnitte gefunden
Generierung: Die KI nutzt abgerufene Inhalte, um eine fundierte Antwort zu generieren

Phase 1: Indexierung

Bevor RAG funktionieren kann, müssen Ihre Dokumente vorbereitet werden:

┌──────────────┐     ┌──────────────┐     ┌──────────────┐
│  Dokumente   │ --> │   Chunking   │ --> │  Embeddings  │
│  (PDF, DOC)  │     │   (Teilen)   │     │  (Vektoren)  │
└──────────────┘     └──────────────┘     └──────────────┘
                                                 │
                                                 v
                                          ┌──────────────┐
                                          │ Vektor-Store │
                                          │  (Datenbank) │
                                          └──────────────┘

Chunking: Dokumente werden in kleinere Stücke (Chunks) aufgeteilt, die einzeln abgerufen werden können. Ein 50-seitiges Richtliniendokument könnte zu 200 separaten Chunks werden.

Embedding: Jeder Chunk wird in eine mathematische Darstellung (Vektor) umgewandelt, die seine Bedeutung erfasst.

Speicherung: Diese Vektoren werden in einer spezialisierten Datenbank für schnelle Ähnlichkeitssuche gespeichert.

Phase 2: Abruf

Wenn Sie eine Frage stellen:

Ihre Frage wird mit demselben Embedding-Prozess in einen Vektor umgewandelt
Das System findet Dokumenten-Chunks mit ähnlichen Vektoren
Die relevantesten Chunks werden abgerufen

Phase 3: Generierung

Die abgerufenen Chunks werden der KI zusammen mit Ihrer Frage bereitgestellt:

System: Sie sind ein hilfreicher Assistent. Nutzen Sie den
folgenden Kontext, um die Frage des Benutzers zu beantworten.
Wenn die Antwort nicht im Kontext ist, sagen Sie das.

Kontext:
[Abgerufener Chunk 1: Baugenehmigungsanforderungen...]
[Abgerufener Chunk 2: Schritte des Antragsverfahrens...]
[Abgerufener Chunk 3: Liste erforderlicher Unterlagen...]

Benutzer: Welche Dokumente brauche ich für eine Baugenehmigung?

Die KI generiert dann eine Antwort unter Verwendung sowohl ihres allgemeinen Wissens als auch des spezifischen abgerufenen Inhalts.

RAG in Ayunis Core

Ayunis Core implementiert RAG durch die Quellen-Funktion:

RAG einrichten

Dokumente hochladen zu einer Quellen-Sammlung
Chunking konfigurieren (standardmäßig automatisch)
Die Quelle anhängen an einen Agenten
Abfragen durch normale Konversation

Unterstützte Dokumenttypen

Format	Am besten für
PDF	Offizielle Dokumente, Formulare, Berichte
Word (.docx)	Interne Dokumente, Schreiben
Text (.txt)	Einfache Inhalte, Protokolle
Markdown (.md)	Technische Dokumentation
HTML	Web-Inhalte, gespeicherte Seiten

Praktische Beispiele

Beispiel 1: Richtlinienfragen

Ohne RAG:

Benutzer: Was ist unsere Urlaubsregelung für neü Mitarbeiter?
KI: Ich habe keinen Zugriff auf die spezifischen Richtlinien
Ihrer Organisation. Generell variieren Urlaubsregelungen
je nach Arbeitgeber...

Mit RAG:

Benutzer: Was ist unsere Urlaubsregelung für neü Mitarbeiter?
KI: Laut Ihrem Mitarbeiterhandbuch (Abschnitt 4.2) erhalten
neü Mitarbeiter jährlich 30 Tage bezahlten Urlaub, wobei
20 Tage nach der Probezeit und die restlichen 10 Tage
nach 6 Monaten Beschäftigung verfügbar sind.

Beispiel 2: Vorschriften-Nachschlagen

Szenario: Ein Bürger fragt nach Genehmigungsanforderungen

Benutzer: Was sind die Lärmvorschriften für Baustellen?

KI: Basierend auf der Kommunalen Bauordnung (§12) sind
Baulärm wie folgt geregelt:

- Werktags: 7:00 - 20:00 Uhr
- Samstags: 9:00 - 16:00 Uhr
- Sonn- und Feiertage: Nicht gestattet

Schwere Maschinen (Presslufthammer, Rammgeräte) sind
zusätzlich auf 8:00 - 18:00 Uhr an Werktagen beschränkt.

Quelle: Kommunale Bauordnung, aktualisiert März 2024

Best Practices für RAG

Dokumentenvorbereitung

Tun Sie:

Verwenden Sie klare, beschreibende Überschriften
Fügen Sie relevante Metadaten ein (Daten, Versionsnummern)
Teilen Sie lange Dokumente in logische Abschnitte
Aktualisieren Sie Dokumente, wenn sich Informationen ändern

Vermeiden Sie:

Gescannte Bilder ohne OCR
Dokumente mit komplexen Tabellen als Bilder
Veraltete Dokumente ohne Versionsdaten
Doppelte Inhalte über Dokumente hinweg

Abfrage-Optimierung

Weniger effektiv:

Erzählen Sie mir etwas über Genehmigungen

Effektiver:

Welche Unterlagen sind für einen Antrag auf
Wohnbaubaugenehmigung erforderlich?

Quellen-Management

Nach Thema organisieren: Gruppieren Sie verwandte Dokumente in derselben Quelle
Aktuell halten: Entfernen Sie veraltete Dokumente, fügen Sie neü Versionen hinzu
Qualität überwachen: Prüfen Sie, ob der Abruf relevante Inhalte zurückgibt
Angemessenen Zugang setzen: Stellen Sie sicher, dass sensible Dokumente ordnungsgemäß gesichert sind

Einschränkungen von RAG

Das Verständnis von Einschränkungen hilft, angemessene Erwartungen zu setzen:

Chunk-Grenzen: Wichtige Informationen, die über Chunks verteilt sind, werden möglicherweise nicht vollständig abgerufen

Abruf-Fehler: Der relevanteste Inhalt wird nicht immer gefunden, besonders bei komplexen Abfragen

Kontext-Limits: Nur eine begrenzte Anzahl von Chunks kann in jede Abfrage einbezogen werden

Dokumentenqualität: Schlecht formatierte oder gescannte Dokumente reduzieren die Genauigkeit

Keine Argumentation über Dokumente hinweg: RAG ruft Inhalte ab, kann aber bei Fragen, die Synthese aus vielen Quellen erfordern, Schwierigkeiten haben

Wann RAG verwenden

Gute Anwendungsfälle

Beantwortung von Fragen zu spezifischen Richtlinien oder Verfahren
Nachschlagen von Vorschriften und Anforderungen
Informationen in großen Dokumentensammlungen finden
Konsistente, quellenbasierte Antworten liefern

Weniger geeignete Fälle

Fragen, die komplexe Argumentation über viele Dokumente erfordern
Echtzeit-Daten, die sich häufig ändern
Hochsensible Informationen mit strengen Zugriffskontrollen
Aufgaben, bei denen Dokumentenkontext weniger wichtig ist als allgemeines Wissen

Wichtige Erkenntnisse

RAG verbindet KI mit den Dokumenten und dem Wissen Ihrer Organisation
Es funktioniert durch Indexierungs-, Abruf- und Generierungsphasen
RAG reduziert Halluzinationen, indem Antworten auf tatsächlichen Quellen basieren
Dokumentenqualität und -organisation beeinflussen die Ergebnisse erheblich
In Ayunis Core nutzen Sie Quellen, um RAG für Ihre Agenten zu implementieren
RAG ist am besten für faktische Nachschlagen in Dokumentensammlungen geeignet