RAG erklärt
Retrieval-Augmented Generation (RAG) löst eine der größten Einschränkungen von KI: den Wissensstichtag. Durch die Verbindung von KI mit Ihren Dokumenten und Datenquellen ermöglicht RAG Antworten, die auf dem spezifischen Wissen Ihrer Organisation basieren.
Was ist RAG?
Abschnitt betitelt „Was ist RAG?“RAG ist eine Technik, die KI-Antworten verbessert, indem relevante Informationen aus einer Wissensbasis abgerufen werden, bevor eine Antwort generiert wird. Anstatt sich ausschließlich auf das zu verlassen, was die KI während des Trainings gelernt hat, ermöglicht RAG der KI den Zugriff auf Ihre spezifischen Dokumente.
Das Problem, das RAG löst
Abschnitt betitelt „Das Problem, das RAG löst“| Ohne RAG | Mit RAG |
|---|---|
| Auf Trainingsdaten beschränkt | Zugriff auf aktuelle Dokumente |
| Kann keine Quellen zitieren | Kann auf spezifische Dokumente verweisen |
| Generische Antworten | Organisationsspezifische Antworten |
| Wissensstichtag-Probleme | Aktuelle Informationen |
| Kann Fakten halluzinieren | Auf tatsächlichen Quellen basierend |
Wie RAG funktioniert
Abschnitt betitelt „Wie RAG funktioniert“Der RAG-Prozess umfasst drei Hauptphasen:
- Indexierung: Ihre Dokumente werden verarbeitet und in einem durchsuchbaren Format gespeichert
- Abruf: Wenn Sie eine Frage stellen, werden relevante Dokumentenabschnitte gefunden
- Generierung: Die KI nutzt abgerufene Inhalte, um eine fundierte Antwort zu generieren
Phase 1: Indexierung
Abschnitt betitelt „Phase 1: Indexierung“Bevor RAG funktionieren kann, müssen Ihre Dokumente vorbereitet werden:
┌──────────────┐ ┌──────────────┐ ┌──────────────┐│ Dokumente │ --> │ Chunking │ --> │ Embeddings ││ (PDF, DOC) │ │ (Teilen) │ │ (Vektoren) │└──────────────┘ └──────────────┘ └──────────────┘ │ v ┌──────────────┐ │ Vektor-Store │ │ (Datenbank) │ └──────────────┘Chunking: Dokumente werden in kleinere Stücke (Chunks) aufgeteilt, die einzeln abgerufen werden können. Ein 50-seitiges Richtliniendokument könnte zu 200 separaten Chunks werden.
Embedding: Jeder Chunk wird in eine mathematische Darstellung (Vektor) umgewandelt, die seine Bedeutung erfasst.
Speicherung: Diese Vektoren werden in einer spezialisierten Datenbank für schnelle Ähnlichkeitssuche gespeichert.
Phase 2: Abruf
Abschnitt betitelt „Phase 2: Abruf“Wenn Sie eine Frage stellen:
- Ihre Frage wird mit demselben Embedding-Prozess in einen Vektor umgewandelt
- Das System findet Dokumenten-Chunks mit ähnlichen Vektoren
- Die relevantesten Chunks werden abgerufen
Phase 3: Generierung
Abschnitt betitelt „Phase 3: Generierung“Die abgerufenen Chunks werden der KI zusammen mit Ihrer Frage bereitgestellt:
System: Sie sind ein hilfreicher Assistent. Nutzen Sie denfolgenden Kontext, um die Frage des Benutzers zu beantworten.Wenn die Antwort nicht im Kontext ist, sagen Sie das.
Kontext:[Abgerufener Chunk 1: Baugenehmigungsanforderungen...][Abgerufener Chunk 2: Schritte des Antragsverfahrens...][Abgerufener Chunk 3: Liste erforderlicher Unterlagen...]
Benutzer: Welche Dokumente brauche ich für eine Baugenehmigung?Die KI generiert dann eine Antwort unter Verwendung sowohl ihres allgemeinen Wissens als auch des spezifischen abgerufenen Inhalts.
RAG in Ayunis Core
Abschnitt betitelt „RAG in Ayunis Core“Ayunis Core implementiert RAG durch die Quellen-Funktion:
RAG einrichten
Abschnitt betitelt „RAG einrichten“- Dokumente hochladen zu einer Quellen-Sammlung
- Chunking konfigurieren (standardmäßig automatisch)
- Die Quelle anhängen an einen Agenten
- Abfragen durch normale Konversation
Unterstützte Dokumenttypen
Abschnitt betitelt „Unterstützte Dokumenttypen“| Format | Am besten für |
|---|---|
| Offizielle Dokumente, Formulare, Berichte | |
| Word (.docx) | Interne Dokumente, Schreiben |
| Text (.txt) | Einfache Inhalte, Protokolle |
| Markdown (.md) | Technische Dokumentation |
| HTML | Web-Inhalte, gespeicherte Seiten |
Praktische Beispiele
Abschnitt betitelt „Praktische Beispiele“Beispiel 1: Richtlinienfragen
Abschnitt betitelt „Beispiel 1: Richtlinienfragen“Ohne RAG:
Benutzer: Was ist unsere Urlaubsregelung für neü Mitarbeiter?KI: Ich habe keinen Zugriff auf die spezifischen RichtlinienIhrer Organisation. Generell variieren Urlaubsregelungenje nach Arbeitgeber...Mit RAG:
Benutzer: Was ist unsere Urlaubsregelung für neü Mitarbeiter?KI: Laut Ihrem Mitarbeiterhandbuch (Abschnitt 4.2) erhaltenneü Mitarbeiter jährlich 30 Tage bezahlten Urlaub, wobei20 Tage nach der Probezeit und die restlichen 10 Tagenach 6 Monaten Beschäftigung verfügbar sind.Beispiel 2: Vorschriften-Nachschlagen
Abschnitt betitelt „Beispiel 2: Vorschriften-Nachschlagen“Szenario: Ein Bürger fragt nach Genehmigungsanforderungen
Benutzer: Was sind die Lärmvorschriften für Baustellen?
KI: Basierend auf der Kommunalen Bauordnung (§12) sindBaulärm wie folgt geregelt:
- Werktags: 7:00 - 20:00 Uhr- Samstags: 9:00 - 16:00 Uhr- Sonn- und Feiertage: Nicht gestattet
Schwere Maschinen (Presslufthammer, Rammgeräte) sindzusätzlich auf 8:00 - 18:00 Uhr an Werktagen beschränkt.
Quelle: Kommunale Bauordnung, aktualisiert März 2024Best Practices für RAG
Abschnitt betitelt „Best Practices für RAG“Dokumentenvorbereitung
Abschnitt betitelt „Dokumentenvorbereitung“Tun Sie:
- Verwenden Sie klare, beschreibende Überschriften
- Fügen Sie relevante Metadaten ein (Daten, Versionsnummern)
- Teilen Sie lange Dokumente in logische Abschnitte
- Aktualisieren Sie Dokumente, wenn sich Informationen ändern
Vermeiden Sie:
- Gescannte Bilder ohne OCR
- Dokumente mit komplexen Tabellen als Bilder
- Veraltete Dokumente ohne Versionsdaten
- Doppelte Inhalte über Dokumente hinweg
Abfrage-Optimierung
Abschnitt betitelt „Abfrage-Optimierung“Weniger effektiv:
Erzählen Sie mir etwas über GenehmigungenEffektiver:
Welche Unterlagen sind für einen Antrag aufWohnbaubaugenehmigung erforderlich?Quellen-Management
Abschnitt betitelt „Quellen-Management“- Nach Thema organisieren: Gruppieren Sie verwandte Dokumente in derselben Quelle
- Aktuell halten: Entfernen Sie veraltete Dokumente, fügen Sie neü Versionen hinzu
- Qualität überwachen: Prüfen Sie, ob der Abruf relevante Inhalte zurückgibt
- Angemessenen Zugang setzen: Stellen Sie sicher, dass sensible Dokumente ordnungsgemäß gesichert sind
Einschränkungen von RAG
Abschnitt betitelt „Einschränkungen von RAG“Das Verständnis von Einschränkungen hilft, angemessene Erwartungen zu setzen:
Chunk-Grenzen: Wichtige Informationen, die über Chunks verteilt sind, werden möglicherweise nicht vollständig abgerufen
Abruf-Fehler: Der relevanteste Inhalt wird nicht immer gefunden, besonders bei komplexen Abfragen
Kontext-Limits: Nur eine begrenzte Anzahl von Chunks kann in jede Abfrage einbezogen werden
Dokumentenqualität: Schlecht formatierte oder gescannte Dokumente reduzieren die Genauigkeit
Keine Argumentation über Dokumente hinweg: RAG ruft Inhalte ab, kann aber bei Fragen, die Synthese aus vielen Quellen erfordern, Schwierigkeiten haben
Wann RAG verwenden
Abschnitt betitelt „Wann RAG verwenden“Gute Anwendungsfälle
Abschnitt betitelt „Gute Anwendungsfälle“- Beantwortung von Fragen zu spezifischen Richtlinien oder Verfahren
- Nachschlagen von Vorschriften und Anforderungen
- Informationen in großen Dokumentensammlungen finden
- Konsistente, quellenbasierte Antworten liefern
Weniger geeignete Fälle
Abschnitt betitelt „Weniger geeignete Fälle“- Fragen, die komplexe Argumentation über viele Dokumente erfordern
- Echtzeit-Daten, die sich häufig ändern
- Hochsensible Informationen mit strengen Zugriffskontrollen
- Aufgaben, bei denen Dokumentenkontext weniger wichtig ist als allgemeines Wissen
Wichtige Erkenntnisse
Abschnitt betitelt „Wichtige Erkenntnisse“- RAG verbindet KI mit den Dokumenten und dem Wissen Ihrer Organisation
- Es funktioniert durch Indexierungs-, Abruf- und Generierungsphasen
- RAG reduziert Halluzinationen, indem Antworten auf tatsächlichen Quellen basieren
- Dokumentenqualität und -organisation beeinflussen die Ergebnisse erheblich
- In Ayunis Core nutzen Sie Quellen, um RAG für Ihre Agenten zu implementieren
- RAG ist am besten für faktische Nachschlagen in Dokumentensammlungen geeignet