ADOLF KNOWLEDGE — Раздел 3: RAG Pipeline
Проект: Корпоративная база знаний с RAGМодуль: Knowledge / RAG Pipeline
Версия: 1.1
Дата: Январь 2026
3.1. Обзор RAG Pipeline
Назначение
RAG (Retrieval-Augmented Generation) Pipeline обеспечивает:- Приём запроса пользователя
- Поиск релевантных документов
- Генерацию ответа на основе найденного контекста
- Фильтрацию по правам доступа
Архитектура
3.2. Этапы обработки
Этап 1: Получение контекста пользователя
Этап 2: Формирование prompt-инъекции
Этап 3: Семантический поиск
Этап 4: Генерация ответа
3.3. Prompt-инъекция
Структура System Prompt
Пример для Manager (ohana_market)
3.4. Обработка запроса
Sequence Diagram
3.5. Параметры поиска
Настройки по умолчанию
| Параметр | Значение | Описание |
|---|---|---|
top_k | 3 | Количество возвращаемых чанков |
min_score | 0.7 | Минимальный порог релевантности |
max_tokens | 4000 | Максимальный размер контекста |
Настройка через settings
3.6. Форматирование ответа
Структура ответа
Уровни уверенности
| Уровень | Score | Описание |
|---|---|---|
high | ≥ 0.85 | Высокая релевантность |
medium | 0.7 - 0.85 | Средняя релевантность |
low | < 0.7 | Низкая релевантность |
3.7. Обработка ошибок
Единая политика (Core)
| Параметр | Значение |
|---|---|
| Timeout запроса | 30 секунд |
| Retry стратегия | Exponential backoff: 1с → 2с → 4с |
| Максимум попыток | 3 |
Типы ошибок
| Ошибка | Действие |
|---|---|
| Timeout AI Agent | Retry с backoff |
| Нет релевантных документов | Ответ “Информация не найдена” |
| Ошибка авторизации | HTTP 401 |
| Превышен лимит токенов | Сокращение контекста |
3.8. Логирование
Запись в audit_log
Приложение А: Примеры запросов
Успешный запрос
Запрос без результатов
Документ подготовлен: Январь 2026
Версия: 1.1
Статус: Согласовано