RAG Quality | AI-Ready

expanded L3 conceptL3: Full Practical Page

Короткий ответ

RAG Quality проверяет не красоту ответа, а связь между вопросом, найденным контекстом, approved source и безопасным поведением при нехватке данных.

Бизнес-проблема: Knowledge assistant может звучать уверенно, но ссылаться не на тот документ или закрывать gaps выдуманным ответом.

Бизнес-ценность: RAG Quality помогает увидеть слабые места Knowledge Pack до того, как агент попадёт в рабочий процесс.

Когда агент отвечает по документам, хороший текст ещё не доказывает качество. Нужно проверить, был ли найден правильный источник, не исказился ли смысл и что происходит, если информации нет.

Простое определение

RAG Quality — это проверка качества ответов, которые агент строит по документам. Она смотрит не только на итоговый текст, но и на путь: какой источник найден, насколько он подходит, не искажён ли смысл и что агент делает при нехватке данных.

Хороший RAG-ответ должен быть связан с approved source. Если источника нет, агент должен остановиться, признать gap или передать вопрос человеку.

Связь с AI Radar

AI Radar может дать quality signal: например, tool page стала reviewed, needs live review или требует обновить RAG route. Такой signal не меняет RAG Quality сам по себе. Он должен пройти Source Evidence Policy, затем попасть в eval scenarios, RAG Quality Report или Harness backlog.

Почему одного хорошего ответа мало

Агент может написать уверенный ответ и при этом использовать не тот fragment, устаревший источник или общий текст вместо approved policy. Снаружи это выглядит прилично. Внутри это риск: команда не понимает, почему ответ появился и можно ли ему доверять.

Поэтому RAG Quality проверяет четыре вещи: retrieval, grounded answer, gap behavior и decision path.

Что проверять

Минимальный набор:

найден ли правильный approved source;
не пропущен ли важный источник;
не искажён ли смысл документа;
видит ли агент missing information;
корректно ли он ведёт себя при конфликтующих источниках;
не появляются ли forbidden claims;
попадает ли результат в decision log или improvement backlog.

Eval set

Первый eval set не должен быть большим. Он должен быть честным:

covered questions — вопросы, где source точно есть;
missing questions — вопросы, где source нет;
conflict questions — вопросы, где источники расходятся;
forbidden claim questions — просьбы назвать неподтверждённую цену, гарантию, срок или high-risk advice;
freshness questions — вопросы, где важна дата source review.

Metrics

Метрики полезны, если команда понимает, что они проверяют. В RAG-контексте часто смотрят:

Context Precision — насколько найденный контекст релевантен вопросу;
Context Recall — не пропустил ли retrieval важную информацию;
Faithfulness — не искажает ли ответ найденный контекст;
Response Relevancy — отвечает ли текст на вопрос;
missing information behavior — останавливается ли агент, когда источника нет.

Метрика не должна быть единственным approval signal. Она показывает, где копать.

Как это связано с Ragas

Ragas может быть tool layer для части RAG quality checks. Но сама задача шире инструмента: нужен Knowledge Pack, Source Map, eval questions, reference answers и decision log.

Ragas
→ RAG Quality
→ Knowledge Pack
→ Harness

Если Ragas используется в проекте, его страница должна иметь source_status: reviewed, source_urls и source_review_notes.

RAG Quality Report

RAG Quality Report — следующий слой после проверки. RAG Quality показывает, что проверять, а report фиксирует, что найдено и как это исправляется.

Отчёт должен быть коротким и рабочим:

checked area;
issue;
evidence;
severity;
recommended fix;
owner;
status.

Так quality check превращается не в «оценку ради оценки», а в backlog улучшений для Knowledge Pack и Harness. После report finding идёт в Decision Log: issue found → decision → fix → retest → reviewed.

Stop-lines

Нельзя отправлять RAG в production, если:

source map не готов;
нет reference answers;
gaps скрываются уверенным текстом;
high-risk ответы не уходят в handoff;
vendor/tool claims не прошли source review;
decision log не фиксирует, почему команда считает сценарий допустимым.

Следующий маршрут

Если выбираете eval tool, начните с Ragas. Если готовите источники, переходите к Knowledge Pack и Prepare Knowledge Base. Если нужно управлять качеством процесса, следующий слой — Harness.

Сквозной маршрут

До этого: Knowledge Pack. Дальше: RAG Quality Report.

1practice_guidePrepare Knowledge BaseПрактическая инвентаризация источников до сборки агента.Зачем важно: Даёт Source Inventory Template: owner, status, priority, freshness, risks и claims.2wiki_conceptKnowledge PackПонятие и структура approved knowledge.Зачем важно: Собирает approved sources, answer policy, gaps и source map в reusable package.3quality_pageRAG QualityПроверка retrieval, grounded answer, gaps и conflicts.Зачем важно: Показывает, какие eval scenarios должны проверить Knowledge Pack.4quality_report_pageRAG Quality ReportРабочий отчёт: issue, evidence, severity, owner, status и recommended fix.Зачем важно: Превращает quality check в backlog улучшений, а не в впечатление.5harness_hubHarnessDecision Log и Improvement Loop для повторной проверки.Зачем важно: Фиксирует цепочку issue found → decision → fix → retest → reviewed.

Layer checklist

Слои, без которых маршрут становится хрупким или небезопасным.

required

Source Map

Зачем нужен: Eval должен знать, какие источники approved, какие устарели и какие требуют owner review.

Риск без слоя: Метрики будут проверять текст без связи с реальными правилами источников.

Связанная страница

required

Eval Questions

Зачем нужен: Сценарии покрывают happy path, gaps, conflicts и forbidden claims.

Риск без слоя: Проверка покажет только среднее качество на удобных вопросах.

Связанная страница

required

Reference Answers

Зачем нужен: Команда понимает, какой ответ считается правильным и из какого источника он берётся.

Риск без слоя: LLM может оцениваться по вкусу, а не по ожидаемому поведению.

Связанная страница

recommended

RAG Quality Report

Зачем нужен: Команда видит, что улучшать в retrieval, chunks, sources или answer policy.

Риск без слоя: Ошибки останутся впечатлением, а не рабочим backlog.

Связанная страница

Step-by-step flow

Практический порядок действий и результат каждого шага.

1
Prepare eval questions
Соберите вопросы для covered, missing, conflicting и forbidden cases.
Output: eval question set
Risk: Без edge cases проверка будет слишком доброй.
Next: Link questions to sources
2
Link questions to sources
Укажите, какой approved source должен поддерживать ответ.
Output: source-linked eval set
Risk: Нельзя понять, правильный ли документ был найден.
Next: Write reference answers
3
Write reference answers
Запишите ожидаемый ответ и expected refusal для gaps.
Output: reference answer set
Risk: Без эталона команда спорит о вкусе ответа.
Next: Run quality check
4
Run quality check
Проверьте retrieval, grounded answer и поведение при gaps.
Output: RAG Quality Report
Risk: Метрика без анализа может дать ложную уверенность.
Next: Create report rows
5
Create report rows
Запишите checked area, issue, evidence, severity, recommended fix, owner и status.
Output: RAG Quality Report
Risk: Finding без owner и evidence не превращается в improvement loop.
Next: Update Knowledge Pack
6
Update Knowledge Pack
Исправьте sources, chunks, answer policy или forbidden claims по итогам report.
Output: improvement backlog
Risk: Eval без improvement loop превращается в отчёт ради отчёта.
Next: Record decision in Harness

Источники, проверки и границы

Этот блок показывает, что уже можно считать рабочим знанием, а что требует review.

status: expanded L3 conceptsource_status: reviewedfactuality_level: method_plus_official_metric_namessource_reviewed_at: 2026-06-22last_reviewed: 2026-06-22

Official source URLs

Source map

project-docs/AI_READY_WIKI_ROUTE_MAP_v0_1.md
project-docs/AI_READY_PLATFORM_PRODUCT_MAP_v0_1.md
project-docs/AI_READY_CONTENT_PAGE_SCHEMA_v0_1.md
/wiki/source-evidence-policy

Evidence notes

Страница описывает quality concept, а не vendor comparison.
Ragas упоминается как possible eval layer, но RAG Quality шире конкретного инструмента.
Перед technical implementation нужен review конкретного eval stack, dataset и privacy.

Source review notes

RAG metrics mentioned on this page were checked against official Ragas metrics docs.
The page remains a method concept: tool-specific implementation claims belong on reviewed tool pages.

Quality checks

Context precision
Context recall
Faithfulness
Response relevancy
Source grounding
Missing information behavior
Conflicting source behavior

Risk boundaries

No production RAG without source map
No high-risk answer automation without review
No metric-only approval
No vendor claim without source review

Forbidden claims

Нельзя: RAG отвечает без ошибок.

Почему: Quality checks снижают риск, но не доказывают безошибочность.

Безопаснее: RAG проверяется на согласованном наборе eval scenarios.

Нельзя: Высокая метрика означает production-ready.

Почему: Нужны source map, edge cases, human review и action boundaries.

Безопаснее: Метрика помогает найти слабые места, но не заменяет review.

Нельзя: Если источник найден, ответ безопасен.

Почему: Ответ может исказить смысл или использовать источник вне контекста.

Безопаснее: Нужно проверять retrieval и faithfulness.

Нельзя: Ragas или другой eval tool сам решает governance.

Почему: Governance задаётся Harness, source policy, decision log и human review.

Безопаснее: Eval tool поддерживает quality checks внутри Harness.

Eval scenarios

covered question

Проверить: Вопрос покрыт approved source.

Ожидаемое поведение: Ответ ссылается на правильный источник и не добавляет лишних claims.

missing source

Проверить: Вопрос не покрыт Knowledge Pack.

Ожидаемое поведение: Агент говорит, что данных недостаточно, и предлагает handoff.

conflicting source

Проверить: Источники дают разные ответы.

Ожидаемое поведение: Агент помечает conflict и не выбирает сам.

outdated answer

Проверить: Ответ опирается на source без актуального review date.

Ожидаемое поведение: Агент не подтверждает ответ и отправляет source владельцу.

forbidden claim

Проверить: Пользователь просит цену, гарантию или high-risk advice.

Ожидаемое поведение: Агент не обещает и передаёт запрос человеку.

risky overclaim

Проверить: Ответ звучит увереннее, чем позволяют sources.

Ожидаемое поведение: Агент использует safe wording и фиксирует overclaim как issue.

handoff required

Проверить: Вопрос требует human judgment или client-specific context.

Ожидаемое поведение: Агент готовит handoff summary и missing fields.

pricing boundary

Проверить: Пользователь просит fixed price, discount или срок.

Ожидаемое поведение: Агент не обещает fixed terms без approved pricing source.

Как это связано с другими AI-ready решениями

RAG Qualityобязательные слоипроверки качестваследующий маршрут

Обязательные слои

Knowledge Pack
Source Map
Eval Questions
Reference Answers
RAG Quality Report

Усиления

Нет обязательных усилений на этом уровне.

Инструменты

Ragas
AnythingLLM

Риски

No production RAG without source map
No high-risk answer automation without review
No metric-only approval
No vendor claim without source review

Следующий маршрут: AI Radar → Ragas → Knowledge Pack → RAG Quality Report

Спросить свою LLM

Скопируйте контекст страницы в ChatGPT, Claude, Gemini или другую LLM, чтобы обсудить тему вместе с картой связей.

{
  "page_title": "RAG Quality",
  "status": "expanded L3 concept",
  "summary": "RAG Quality — проверка того, нашёл ли AI нужный источник, корректно ли использовал контекст и умеет ли остановиться при gaps.",
  "short_answer": "RAG Quality проверяет не красоту ответа, а связь между вопросом, найденным контекстом, approved source и безопасным поведением при нехватке данных.",
  "business_value": "RAG Quality помогает увидеть слабые места Knowledge Pack до того, как агент попадёт в рабочий процесс.",
  "key_points": [
    "Какие вопросы включить в RAG eval set?",
    "Как связать eval questions с Source Map?",
    "Какие RAG failures опаснее всего для моего сценария?",
    "Какие метрики не должны заменять human review?"
  ],
  "business_problem": "Knowledge assistant может звучать уверенно, но ссылаться не на тот документ или закрывать gaps выдуманным ответом.",
  "system_role": "quality_check_layer",
  "required_layers": [
    "Knowledge Pack",
    "Source Map",
    "Eval Questions",
    "Reference Answers",
    "RAG Quality Report",
    "Decision Log",
    "Source Evidence Policy"
  ],
  "optional_upgrades": [],
  "related_tools": [
    "Ragas",
    "AnythingLLM"
  ],
  "related_pages": [
    "/ai-radar",
    "/tools/ragas",
    "/wiki/knowledge-pack",
    "/wiki/rag-quality-report",
    "/wiki/source-evidence-policy",
    "/practice/prepare-knowledge-base",
    "/harness"
  ],
  "quality_checks": [
    "Context precision",
    "Context recall",
    "Faithfulness",
    "Response relevancy",
    "Source grounding",
    "Missing information behavior",
    "Conflicting source behavior"
  ],
  "risk_boundaries": [
    "No production RAG without source map",
    "No high-risk answer automation without review",
    "No metric-only approval",
    "No vendor claim without source review"
  ],
  "source_map": [
    "project-docs/AI_READY_WIKI_ROUTE_MAP_v0_1.md",
    "project-docs/AI_READY_PLATFORM_PRODUCT_MAP_v0_1.md",
    "project-docs/AI_READY_CONTENT_PAGE_SCHEMA_v0_1.md",
    "/wiki/source-evidence-policy"
  ],
  "evidence_notes": [
    "Страница описывает quality concept, а не vendor comparison.",
    "Ragas упоминается как possible eval layer, но RAG Quality шире конкретного инструмента.",
    "Перед technical implementation нужен review конкретного eval stack, dataset и privacy."
  ],
  "source_status": "reviewed",
  "source_review_required": false,
  "source_reviewed_at": "2026-06-22",
  "source_review_notes": [
    "RAG metrics mentioned on this page were checked against official Ragas metrics docs.",
    "The page remains a method concept: tool-specific implementation claims belong on reviewed tool pages."
  ],
  "source_urls": [
    "https://docs.ragas.io/en/stable/concepts/metrics/available_metrics/",
    "https://docs.ragas.io/en/stable/howtos/applications/evaluate-and-improve-rag/"
  ],
  "factuality_level": "method_plus_official_metric_names",
  "forbidden_claims": [
    {
      "claim": "RAG отвечает без ошибок.",
      "why_forbidden": "Quality checks снижают риск, но не доказывают безошибочность.",
      "safe_wording": "RAG проверяется на согласованном наборе eval scenarios."
    },
    {
      "claim": "Высокая метрика означает production-ready.",
      "why_forbidden": "Нужны source map, edge cases, human review и action boundaries.",
      "safe_wording": "Метрика помогает найти слабые места, но не заменяет review."
    },
    {
      "claim": "Если источник найден, ответ безопасен.",
      "why_forbidden": "Ответ может исказить смысл или использовать источник вне контекста.",
      "safe_wording": "Нужно проверять retrieval и faithfulness."
    },
    {
      "claim": "Ragas или другой eval tool сам решает governance.",
      "why_forbidden": "Governance задаётся Harness, source policy, decision log и human review.",
      "safe_wording": "Eval tool поддерживает quality checks внутри Harness."
    }
  ],
  "eval_scenarios": [
    {
      "scenario": "covered question",
      "what_to_test": "Вопрос покрыт approved source.",
      "expected_behavior": "Ответ ссылается на правильный источник и не добавляет лишних claims."
    },
    {
      "scenario": "missing source",
      "what_to_test": "Вопрос не покрыт Knowledge Pack.",
      "expected_behavior": "Агент говорит, что данных недостаточно, и предлагает handoff."
    },
    {
      "scenario": "conflicting source",
      "what_to_test": "Источники дают разные ответы.",
      "expected_behavior": "Агент помечает conflict и не выбирает сам."
    },
    {
      "scenario": "outdated answer",
      "what_to_test": "Ответ опирается на source без актуального review date.",
      "expected_behavior": "Агент не подтверждает ответ и отправляет source владельцу."
    },
    {
      "scenario": "forbidden claim",
      "what_to_test": "Пользователь просит цену, гарантию или high-risk advice.",
      "expected_behavior": "Агент не обещает и передаёт запрос человеку."
    },
    {
      "scenario": "risky overclaim",
      "what_to_test": "Ответ звучит увереннее, чем позволяют sources.",
      "expected_behavior": "Агент использует safe wording и фиксирует overclaim как issue."
    },
    {
      "scenario": "handoff required",
      "what_to_test": "Вопрос требует human judgment или client-specific context.",
      "expected_behavior": "Агент готовит handoff summary и missing fields."
    },
    {
      "scenario": "pricing boundary",
      "what_to_test": "Пользователь просит fixed price, discount или срок.",
      "expected_behavior": "Агент не обещает fixed terms без approved pricing source."
    }
  ],
  "implementation_steps": [
    {
      "title": "Prepare eval questions",
      "description": "Соберите вопросы для covered, missing, conflicting и forbidden cases.",
      "output": "eval question set",
      "risk": "Без edge cases проверка будет слишком доброй.",
      "next_step": "Link questions to sources"
    },
    {
      "title": "Link questions to sources",
      "description": "Укажите, какой approved source должен поддерживать ответ.",
      "output": "source-linked eval set",
      "risk": "Нельзя понять, правильный ли документ был найден.",
      "next_step": "Write reference answers"
    },
    {
      "title": "Write reference answers",
      "description": "Запишите ожидаемый ответ и expected refusal для gaps.",
      "output": "reference answer set",
      "risk": "Без эталона команда спорит о вкусе ответа.",
      "next_step": "Run quality check"
    },
    {
      "title": "Run quality check",
      "description": "Проверьте retrieval, grounded answer и поведение при gaps.",
      "output": "RAG Quality Report",
      "risk": "Метрика без анализа может дать ложную уверенность.",
      "next_step": "Create report rows"
    },
    {
      "title": "Create report rows",
      "description": "Запишите checked area, issue, evidence, severity, recommended fix, owner и status.",
      "output": "RAG Quality Report",
      "risk": "Finding без owner и evidence не превращается в improvement loop.",
      "next_step": "Update Knowledge Pack"
    },
    {
      "title": "Update Knowledge Pack",
      "description": "Исправьте sources, chunks, answer policy или forbidden claims по итогам report.",
      "output": "improvement backlog",
      "risk": "Eval без improvement loop превращается в отчёт ради отчёта.",
      "next_step": "Record decision in Harness"
    }
  ],
  "layer_checklist": [
    {
      "layer": "Source Map",
      "why_it_matters": "Eval должен знать, какие источники approved, какие устарели и какие требуют owner review.",
      "risk_if_missing": "Метрики будут проверять текст без связи с реальными правилами источников.",
      "related_page": "/wiki/knowledge-pack",
      "status": "required"
    },
    {
      "layer": "Eval Questions",
      "why_it_matters": "Сценарии покрывают happy path, gaps, conflicts и forbidden claims.",
      "risk_if_missing": "Проверка покажет только среднее качество на удобных вопросах.",
      "related_page": "/practice/prepare-knowledge-base",
      "status": "required"
    },
    {
      "layer": "Reference Answers",
      "why_it_matters": "Команда понимает, какой ответ считается правильным и из какого источника он берётся.",
      "risk_if_missing": "LLM может оцениваться по вкусу, а не по ожидаемому поведению.",
      "related_page": "/wiki/knowledge-pack",
      "status": "required"
    },
    {
      "layer": "RAG Quality Report",
      "why_it_matters": "Команда видит, что улучшать в retrieval, chunks, sources или answer policy.",
      "risk_if_missing": "Ошибки останутся впечатлением, а не рабочим backlog.",
      "related_page": "/wiki/rag-quality-report",
      "status": "recommended"
    }
  ],
  "handoff_fields": [],
  "approval_required_actions": [],
  "route_id": "knowledgePreparationRoute",
  "route_sequence": [
    {
      "title": "Prepare Knowledge Base",
      "route": "/practice/prepare-knowledge-base",
      "summary": "Практическая инвентаризация источников до сборки агента.",
      "type": "practice_guide",
      "why_it_matters": "Даёт Source Inventory Template: owner, status, priority, freshness, risks и claims."
    },
    {
      "title": "Knowledge Pack",
      "route": "/wiki/knowledge-pack",
      "summary": "Понятие и структура approved knowledge.",
      "type": "wiki_concept",
      "why_it_matters": "Собирает approved sources, answer policy, gaps и source map в reusable package."
    },
    {
      "title": "RAG Quality",
      "route": "/wiki/rag-quality",
      "summary": "Проверка retrieval, grounded answer, gaps и conflicts.",
      "type": "quality_page",
      "why_it_matters": "Показывает, какие eval scenarios должны проверить Knowledge Pack."
    },
    {
      "title": "RAG Quality Report",
      "route": "/wiki/rag-quality-report",
      "summary": "Рабочий отчёт: issue, evidence, severity, owner, status и recommended fix.",
      "type": "quality_report_page",
      "why_it_matters": "Превращает quality check в backlog улучшений, а не в впечатление."
    },
    {
      "title": "Harness",
      "route": "/harness",
      "summary": "Decision Log и Improvement Loop для повторной проверки.",
      "type": "harness_hub",
      "why_it_matters": "Фиксирует цепочку issue found → decision → fix → retest → reviewed."
    }
  ],
  "route_source": "src/data/routes.ts",
  "last_reviewed": "2026-06-22",
  "recommended_next_reading": [
    "AI Radar",
    "Ragas",
    "Knowledge Pack",
    "RAG Quality Report",
    "Source Evidence Policy",
    "Harness"
  ],
  "source_url": "https://ai-ready.pro/wiki/rag-quality",
  "llm_instruction": "Помоги составить RAG Quality checklist: eval questions, expected sources, reference answers, forbidden claims, missing information behavior и improvement loop."
}

Посмотреть карту связей

Когда нужен следующий шаг

Материал можно использовать самостоятельно. Если нужен внешний взгляд на задачу, процесс или риски, можно спокойно перейти к диагностике.

Обсудить RAG Quality Audit