Zum Inhalt springen

RAG erklärt

Retrieval-Augmented Generation (RAG) löst eine der größten Einschränkungen von KI: den Wissensstichtag. Durch die Verbindung von KI mit Ihren Dokumenten und Datenquellen ermöglicht RAG Antworten, die auf dem spezifischen Wissen Ihrer Organisation basieren.

RAG ist eine Technik, die KI-Antworten verbessert, indem relevante Informationen aus einer Wissensbasis abgerufen werden, bevor eine Antwort generiert wird. Anstatt sich ausschließlich auf das zu verlassen, was die KI während des Trainings gelernt hat, ermöglicht RAG der KI den Zugriff auf Ihre spezifischen Dokumente.

Ohne RAGMit RAG
Auf Trainingsdaten beschränktZugriff auf aktuelle Dokumente
Kann keine Quellen zitierenKann auf spezifische Dokumente verweisen
Generische AntwortenOrganisationsspezifische Antworten
Wissensstichtag-ProblemeAktuelle Informationen
Kann Fakten halluzinierenAuf tatsächlichen Quellen basierend

Der RAG-Prozess umfasst drei Hauptphasen:

  1. Indexierung: Ihre Dokumente werden verarbeitet und in einem durchsuchbaren Format gespeichert
  2. Abruf: Wenn Sie eine Frage stellen, werden relevante Dokumentenabschnitte gefunden
  3. Generierung: Die KI nutzt abgerufene Inhalte, um eine fundierte Antwort zu generieren

Bevor RAG funktionieren kann, müssen Ihre Dokumente vorbereitet werden:

┌──────────────┐ ┌──────────────┐ ┌──────────────┐
│ Dokumente │ --> │ Chunking │ --> │ Embeddings │
│ (PDF, DOC) │ │ (Teilen) │ │ (Vektoren) │
└──────────────┘ └──────────────┘ └──────────────┘
v
┌──────────────┐
│ Vektor-Store │
│ (Datenbank) │
└──────────────┘

Chunking: Dokumente werden in kleinere Stücke (Chunks) aufgeteilt, die einzeln abgerufen werden können. Ein 50-seitiges Richtliniendokument könnte zu 200 separaten Chunks werden.

Embedding: Jeder Chunk wird in eine mathematische Darstellung (Vektor) umgewandelt, die seine Bedeutung erfasst.

Speicherung: Diese Vektoren werden in einer spezialisierten Datenbank für schnelle Ähnlichkeitssuche gespeichert.

Wenn Sie eine Frage stellen:

  1. Ihre Frage wird mit demselben Embedding-Prozess in einen Vektor umgewandelt
  2. Das System findet Dokumenten-Chunks mit ähnlichen Vektoren
  3. Die relevantesten Chunks werden abgerufen

Die abgerufenen Chunks werden der KI zusammen mit Ihrer Frage bereitgestellt:

System: Sie sind ein hilfreicher Assistent. Nutzen Sie den
folgenden Kontext, um die Frage des Benutzers zu beantworten.
Wenn die Antwort nicht im Kontext ist, sagen Sie das.
Kontext:
[Abgerufener Chunk 1: Baugenehmigungsanforderungen...]
[Abgerufener Chunk 2: Schritte des Antragsverfahrens...]
[Abgerufener Chunk 3: Liste erforderlicher Unterlagen...]
Benutzer: Welche Dokumente brauche ich für eine Baugenehmigung?

Die KI generiert dann eine Antwort unter Verwendung sowohl ihres allgemeinen Wissens als auch des spezifischen abgerufenen Inhalts.

Ayunis Core implementiert RAG durch die Quellen-Funktion:

  1. Dokumente hochladen zu einer Quellen-Sammlung
  2. Chunking konfigurieren (standardmäßig automatisch)
  3. Die Quelle anhängen an einen Agenten
  4. Abfragen durch normale Konversation
FormatAm besten für
PDFOffizielle Dokumente, Formulare, Berichte
Word (.docx)Interne Dokumente, Schreiben
Text (.txt)Einfache Inhalte, Protokolle
Markdown (.md)Technische Dokumentation
HTMLWeb-Inhalte, gespeicherte Seiten

Ohne RAG:

Benutzer: Was ist unsere Urlaubsregelung für neü Mitarbeiter?
KI: Ich habe keinen Zugriff auf die spezifischen Richtlinien
Ihrer Organisation. Generell variieren Urlaubsregelungen
je nach Arbeitgeber...

Mit RAG:

Benutzer: Was ist unsere Urlaubsregelung für neü Mitarbeiter?
KI: Laut Ihrem Mitarbeiterhandbuch (Abschnitt 4.2) erhalten
neü Mitarbeiter jährlich 30 Tage bezahlten Urlaub, wobei
20 Tage nach der Probezeit und die restlichen 10 Tage
nach 6 Monaten Beschäftigung verfügbar sind.

Szenario: Ein Bürger fragt nach Genehmigungsanforderungen

Benutzer: Was sind die Lärmvorschriften für Baustellen?
KI: Basierend auf der Kommunalen Bauordnung (§12) sind
Baulärm wie folgt geregelt:
- Werktags: 7:00 - 20:00 Uhr
- Samstags: 9:00 - 16:00 Uhr
- Sonn- und Feiertage: Nicht gestattet
Schwere Maschinen (Presslufthammer, Rammgeräte) sind
zusätzlich auf 8:00 - 18:00 Uhr an Werktagen beschränkt.
Quelle: Kommunale Bauordnung, aktualisiert März 2024

Tun Sie:

  • Verwenden Sie klare, beschreibende Überschriften
  • Fügen Sie relevante Metadaten ein (Daten, Versionsnummern)
  • Teilen Sie lange Dokumente in logische Abschnitte
  • Aktualisieren Sie Dokumente, wenn sich Informationen ändern

Vermeiden Sie:

  • Gescannte Bilder ohne OCR
  • Dokumente mit komplexen Tabellen als Bilder
  • Veraltete Dokumente ohne Versionsdaten
  • Doppelte Inhalte über Dokumente hinweg

Weniger effektiv:

Erzählen Sie mir etwas über Genehmigungen

Effektiver:

Welche Unterlagen sind für einen Antrag auf
Wohnbaubaugenehmigung erforderlich?
  1. Nach Thema organisieren: Gruppieren Sie verwandte Dokumente in derselben Quelle
  2. Aktuell halten: Entfernen Sie veraltete Dokumente, fügen Sie neü Versionen hinzu
  3. Qualität überwachen: Prüfen Sie, ob der Abruf relevante Inhalte zurückgibt
  4. Angemessenen Zugang setzen: Stellen Sie sicher, dass sensible Dokumente ordnungsgemäß gesichert sind

Das Verständnis von Einschränkungen hilft, angemessene Erwartungen zu setzen:

Chunk-Grenzen: Wichtige Informationen, die über Chunks verteilt sind, werden möglicherweise nicht vollständig abgerufen

Abruf-Fehler: Der relevanteste Inhalt wird nicht immer gefunden, besonders bei komplexen Abfragen

Kontext-Limits: Nur eine begrenzte Anzahl von Chunks kann in jede Abfrage einbezogen werden

Dokumentenqualität: Schlecht formatierte oder gescannte Dokumente reduzieren die Genauigkeit

Keine Argumentation über Dokumente hinweg: RAG ruft Inhalte ab, kann aber bei Fragen, die Synthese aus vielen Quellen erfordern, Schwierigkeiten haben

  • Beantwortung von Fragen zu spezifischen Richtlinien oder Verfahren
  • Nachschlagen von Vorschriften und Anforderungen
  • Informationen in großen Dokumentensammlungen finden
  • Konsistente, quellenbasierte Antworten liefern
  • Fragen, die komplexe Argumentation über viele Dokumente erfordern
  • Echtzeit-Daten, die sich häufig ändern
  • Hochsensible Informationen mit strengen Zugriffskontrollen
  • Aufgaben, bei denen Dokumentenkontext weniger wichtig ist als allgemeines Wissen
  • RAG verbindet KI mit den Dokumenten und dem Wissen Ihrer Organisation
  • Es funktioniert durch Indexierungs-, Abruf- und Generierungsphasen
  • RAG reduziert Halluzinationen, indem Antworten auf tatsächlichen Quellen basieren
  • Dokumentenqualität und -organisation beeinflussen die Ergebnisse erheblich
  • In Ayunis Core nutzen Sie Quellen, um RAG für Ihre Agenten zu implementieren
  • RAG ist am besten für faktische Nachschlagen in Dokumentensammlungen geeignet