LangGraph 条件边与动态路由：从静态流程到智能决策的架构跃迁

流程的悖论

刚开始构建 Agent 时，我们倾向于设计完美的线性流程：用户提问 → 理解意图 → 检索知识 → 生成回答。这种确定性假设在 demo 阶段表现良好，却在生产环境中迅速崩塌。

真实世界的复杂性体现在：

用户问题可能是闲聊、技术咨询、或需要多轮澄清的模糊需求
某些查询需要调用外部工具，另一些则可以直接回答
部分任务可以并行处理，另一些必须严格串行
某些路径需要人工确认，另一些可以自动执行

静态流程图的困境在于：它在编译时就锁定了所有可能路径，而现实需要运行时决策。

LangGraph 的条件边（Conditional Edges）机制提供了一条出路。它将路由逻辑从固定的边定义中解放出来，让节点根据运行时状态动态决定下一步走向。

本文将从架构视角深入解析条件边的设计模式，展示如何将确定性流程升级为自适应系统。

条件边的核心机制

从静态到动态

传统 LangGraph 的边定义是编译期确定的：

1
2
3

# 静态边 - 编译时确定
graph.add_edge("node_a", "node_b")
graph.add_edge("node_b", "node_c")

条件边则引入运行时决策：

# 条件边 - 运行时路由
def router(state: GraphState) -> str:
    if state["confidence"] > 0.8:
        return "high_confidence_node"
    elif state["needs_tool"]:
        return "tool_calling_node"
    else:
        return "clarification_node"

graph.add_conditional_edges("node_a", router)

这里的 router 函数在每次状态到达 “node_a” 后执行，根据当前状态返回目标节点名称。这种设计将控制流从硬编码转化为数据驱动。

状态感知的路由决策

条件边函数可以访问完整的当前状态，这意味着路由决策可以基于：

内容特征：用户输入的分类、情感、复杂度
计算结果：前序节点的输出质量、置信度、元数据
外部信号：时间、用户身份、系统负载
历史上下文：对话轮次、之前的决策路径

def intelligent_router(state: GraphState) -> str:
    query = state["user_query"]
    history = state["conversation_history"]
    prev_attempts = state.get("retry_count", 0)
    
    # 基于内容分类
    category = classify_query(query)
    
    # 基于历史自适应
    if len(history) > 10 and category == "chitchat":
        return "brief_response"  # 长对话中简化闲聊
    
    # 基于重试次数调整
    if prev_attempts > 2:
        return "escalate_to_human"
    
    return f"{category}_handler"

三种路由架构模式

模式一：分类器路由（Classifier Routing）

最常见的模式：根据输入类型分发到专门的处理管道。

graph TD
    A[用户输入] --> B[意图分类器]
    B -->|技术问题| C[技术专家子图]
    B -->|产品咨询| D[销售支持子图]
    B -->|投诉建议| E[客服处理子图]
    B -->|闲聊| F[闲聊回复节点]
    
    C --> G[响应组装]
    D --> G
    E --> G
    F --> G

实现代码：

from typing import Literal
from langgraph.graph import StateGraph

class RouterState(TypedDict):
    user_input: str
    category: Literal["tech", "sales", "support", "chitchat"]
    response: str

def classifier(state: RouterState) -> RouterState:
    """意图分类节点"""
    categories = ["tech", "sales", "support", "chitchat"]
    prompt = f"将用户输入分类为以下之一：{categories}\n\n输入：{state['user_input']}"
    
    response = llm.invoke(prompt)
    state["category"] = parse_category(response.content)
    return state

def route_by_category(state: RouterState) -> str:
    """条件边路由函数"""
    return state["category"]

# 构建图
builder = StateGraph(RouterState)
builder.add_node("classifier", classifier)
builder.add_node("tech_handler", tech_subgraph)
builder.add_node("sales_handler", sales_subgraph)
builder.add_node("support_handler", support_subgraph)
builder.add_node("chitchat_handler", chitchat_node)

# 关键：条件边将分类结果映射到目标节点
builder.add_conditional_edges(
    "classifier",
    route_by_category,
    {
        "tech": "tech_handler",
        "sales": "sales_handler",
        "support": "support_handler",
        "chitchat": "chitchat_handler"
    }
)

适用场景：客服系统、多领域问答、复杂指令解析

优势：清晰的关注点分离，每个处理器只需处理一类问题

模式二：质量门路由（Quality Gate Routing）

基于输出质量决定继续处理还是回退重试。

graph TD
    A[生成回答] --> B[质量评估]
    B -->|质量达标| C[输出给用户]
    B -->|质量不足| D[分析失败原因]
    D --> E[选择改进策略]
    E -->|信息不足| F[补充检索]
    E -->|理解偏差| G[重写查询]
    E -->|模型限制| H[简化请求]
    
    F --> A
    G --> A
    H --> A

实现代码：

class QualityState(TypedDict):
    query: str
    draft_answer: str
    quality_score: float
    failure_reason: Optional[str]
    retry_count: int
    final_answer: Optional[str]

def generate_answer(state: QualityState) -> QualityState:
    """生成初稿"""
    response = llm.invoke(state["query"])
    state["draft_answer"] = response.content
    return state

def evaluate_quality(state: QualityState) -> QualityState:
    """质量评估节点"""
    eval_prompt = f"""评估以下回答的质量（0-1分）：
问题：{state['query']}
回答：{state['draft_answer']}

输出JSON：{{"score": float, "reason": str}}"""
    
    result = llm.invoke(eval_prompt)
    evaluation = json.loads(result.content)
    state["quality_score"] = evaluation["score"]
    state["failure_reason"] = evaluation.get("reason")
    return state

def quality_router(state: QualityState) -> str:
    """基于质量决定下一步"""
    if state["quality_score"] >= 0.8:
        return "output_final"
    
    if state["retry_count"] >= 3:
        return "escalate"  # 超过重试上限
    
    state["retry_count"] += 1
    
    # 根据失败原因选择修复策略
    reason = state.get("failure_reason", "")
    if "information" in reason.lower():
        return "augment_retrieval"
    elif "understanding" in reason.lower():
        return "rewrite_query"
    else:
        return "simplify_request"

builder = StateGraph(QualityState)
builder.add_node("generate", generate_answer)
builder.add_node("evaluate", evaluate_quality)
builder.add_node("output_final", output_node)
builder.add_node("augment_retrieval", retrieval_node)
builder.add_node("rewrite_query", rewrite_node)
builder.add_node("simplify_request", simplify_node)
builder.add_node("escalate", human_handoff_node)

# 条件边形成质量反馈循环
builder.add_conditional_edges(
    "evaluate",
    quality_router,
    {
        "output_final": "output_final",
        "augment_retrieval": "augment_retrieval",
        "rewrite_query": "rewrite_query",
        "simplify_request": "simplify_request",
        "escalate": "escalate"
    }
)

适用场景：高精度要求的生成任务、多轮优化流程、自动质量管控

优势：自纠错能力，持续提升输出质量

模式三：资源感知路由（Resource-Aware Routing）

根据系统状态和任务复杂度动态选择执行策略。

graph TD
    A[任务到达] --> B[复杂度评估]
    B -->|简单任务| C[轻量模型处理]
    B -->|中等任务| D[标准模型处理]
    B -->|复杂任务| E[高级模型处理]
    
    C --> F[结果合并]
    D --> F
    E --> F

实现代码：

import time
from dataclasses import dataclass

@dataclass
class SystemMetrics:
    queue_depth: int
    avg_latency: float
    error_rate: float

class AdaptiveState(TypedDict):
    task: dict
    complexity_score: float
    system_metrics: SystemMetrics
    selected_strategy: str
    result: Optional[str]

def assess_complexity(state: AdaptiveState) -> AdaptiveState:
    """评估任务复杂度"""
    task = state["task"]
    
    # 多维度评估
    factors = {
        "input_length": len(task["query"]) / 1000,  # 输入长度
        "context_items": len(task.get("context", [])),
        "required_tools": len(task.get("tools", [])),
        "reasoning_depth": task.get("reasoning_steps", 1)
    }
    
    state["complexity_score"] = (
        factors["input_length"] * 0.2 +
        factors["context_items"] * 0.3 +
        factors["required_tools"] * 0.3 +
        factors["reasoning_depth"] * 0.2
    )
    return state

def adaptive_router(state: AdaptiveState) -> str:
    """资源感知路由"""
    complexity = state["complexity_score"]
    metrics = state["system_metrics"]
    
    # 高负载时降级处理
    if metrics.queue_depth > 100 or metrics.error_rate > 0.05:
        if complexity < 0.5:
            return "fast_track"  # 简单任务快速通道
        else:
            return "queue_for_later"  # 复杂任务延后
    
    # 正常负载下按复杂度分级
    if complexity < 0.3:
        return "light_model"
    elif complexity < 0.7:
        return "standard_model"
    else:
        return "advanced_model"

builder = StateGraph(AdaptiveState)
builder.add_node("assess", assess_complexity)
builder.add_node("light_model", light_model_node)
builder.add_node("standard_model", standard_model_node)
builder.add_node("advanced_model", advanced_model_node)
builder.add_node("fast_track", optimized_fast_node)
builder.add_node("queue_for_later", deferral_node)

builder.add_conditional_edges(
    "assess",
    adaptive_router,
    {
        "light_model": "light_model",
        "standard_model": "standard_model",
        "advanced_model": "advanced_model",
        "fast_track": "fast_track",
        "queue_for_later": "queue_for_later"
    }
)

适用场景：多模型路由、负载均衡、成本优化

优势：根据实时条件优化资源使用

与 Streaming 的协同：实时动态路由

今天上午的文章探讨了 LangGraph 的流式输出机制。条件边与 Streaming 结合，可以实现更强大的交互模式。

模式：渐进式路由决策

from langgraph.types import StreamWriter

async def streaming_router(state: State, writer: StreamWriter) -> str:
    """流式条件边 - 向用户展示决策过程"""
    
    # 流式输出思考过程
    writer({
        "type": "reasoning",
        "content": "正在分析查询类型..."
    })
    
    query_type = await classify_async(state["query"])
    
    writer({
        "type": "decision",
        "content": f"识别为：{query_type}"
    })
    
    if query_type == "ambiguous":
        writer({
            "type": "clarification",
            "content": "需要更多信息来准确回答"
        })
        return "ask_clarification"
    
    return f"handle_{query_type}"

# 在前端展示整个决策链
# 用户看到的是：
# "正在分析查询类型..."
# "识别为：技术问题"
# [开始生成技术回答...]

模式：用户介入路由点

def human_in_the_loop_router(state: State) -> str:
    """在关键决策点暂停，等待用户确认"""
    
    if state.get("awaiting_confirmation"):
        # 已收到用户确认
        if state["user_decision"] == "approve":
            return state["proposed_route"]
        else:
            return "alternative_path"
    
    # 需要用户确认
    # 返回中断信号，LangGraph 会暂停执行
    return Command(
        goto=INTERRUPT,
        update={
            "interrupt_reason": "routing_decision",
            "proposed_route": determine_route(state),
            "context": generate_explanation(state)
        }
    )

这种组合模式实现了透明度和控制权的平衡：系统自动完成大部分路由决策，在关键或高风险路径上请求人类确认。

与子图的协同：分层路由架构

2月13日的文章介绍了子图的模块化设计。条件边与子图结合，可以构建出分层的路由系统。

顶层协调器模式

# 父图：顶层协调器
def coordinator_router(state: ParentState) -> str:
    """决定调用哪个子图"""
    task_type = analyze_task(state["input"])
    
    if task_type == "research":
        return "research_subgraph"
    elif task_type == "code_generation":
        return "code_subgraph"
    elif task_type == "data_analysis":
        return "analysis_subgraph"
    else:
        return "general_handler"

# 子图内部也有条件边
def code_subgraph() -> CompiledGraph:
    """代码生成子图"""
    builder = StateGraph(CodeState)
    
    def code_router(state: CodeState) -> str:
        if state["language"] == "python":
            return "python_generator"
        elif state["language"] == "javascript":
            return "js_generator"
        else:
            return "generic_generator"
    
    builder.add_conditional_edges("analyze", code_router)
    return builder.compile()

# 父图编译
parent_builder = StateGraph(ParentState)
parent_builder.add_node("coordinator", coordinator_node)
parent_builder.add_node("research_subgraph", research_subgraph())
parent_builder.add_node("code_subgraph", code_subgraph())
parent_builder.add_node("analysis_subgraph", analysis_subgraph())

parent_builder.add_conditional_edges(
    "coordinator",
    coordinator_router,
    {
        "research_subgraph": "research_subgraph",
        "code_subgraph": "code_subgraph",
        "analysis_subgraph": "analysis_subgraph",
        "general_handler": "general_handler"
    }
)

这种分层架构的好处：

关注点分离：顶层处理任务分发，子图处理具体实现
独立演进：子图的路由逻辑修改不影响父图
复用性：同一个子图可以被多个父图复用
可测试性：子图可以独立测试

高级模式：递归与循环路由

递归分解模式

将复杂任务递归分解为更简单的子任务，直到可以处理为止。

class RecursiveState(TypedDict):
    task: Task
    subtasks: List[Task]
    results: List[Result]
    depth: int

def decompose_or_execute(state: RecursiveState) -> str:
    """递归路由：分解或执行"""
    
    current_task = state["task"]
    current_depth = state["depth"]
    
    # 终止条件
    if current_depth > 3 or is_simple_enough(current_task):
        return "execute_task"
    
    # 分解为子任务
    subtasks = decompose_task(current_task)
    
    if len(subtasks) == 1:
        # 无法进一步分解
        return "execute_task"
    
    state["subtasks"] = subtasks
    return "process_subtasks"

def process_subtasks(state: RecursiveState) -> RecursiveState:
    """处理子任务并合并结果"""
    subtask_results = []
    
    for subtask in state["subtasks"]:
        # 递归调用子图
        subgraph = build_recursive_subgraph()
        result = subgraph.invoke({
            "task": subtask,
            "depth": state["depth"] + 1
        })
        subtask_results.append(result)
    
    state["results"] = subtask_results
    return state

def merge_results(state: RecursiveState) -> RecursiveState:
    """合并子任务结果"""
    state["task"].result = synthesize(state["results"])
    return state

builder = StateGraph(RecursiveState)
builder.add_node("decompose", lambda x: x)  # 状态已通过条件边更新
builder.add_node("execute_task", execution_node)
builder.add_node("process_subtasks", process_subtasks)
builder.add_node("merge", merge_results)

builder.add_conditional_edges("decompose", decompose_or_execute)
builder.add_edge("process_subtasks", "merge")

循环优化模式

基于迭代改进的路由循环。

def iterative_improvement_router(state: State) -> str:
    """迭代优化路由"""
    
    current_score = state["quality_score"]
    iteration = state["iteration_count"]
    improvement_rate = calculate_improvement_rate(state)
    
    # 停止条件
    if current_score >= 0.9:
        return "finalize"
    
    if iteration >= 5:
        return "finalize"  # 达到最大迭代次数
    
    if improvement_rate < 0.01 and iteration > 2:
        return "finalize"  # 收益递减
    
    # 选择改进方向
    if state["needs_more_context"]:
        return "augment_context"
    elif state["needs_refinement"]:
        return "refine_output"
    else:
        return "rethink_approach"

# 形成循环
builder.add_conditional_edges("evaluate", iterative_improvement_router)
builder.add_edge("augment_context", "generate")
builder.add_edge("refine_output", "generate")
builder.add_edge("rethink_approach", "generate")
# 回到评估节点形成闭环

常见陷阱与最佳实践

陷阱一：路由函数过于复杂

# ❌ 不好的实践：路由函数做太多事情
def bad_router(state):
    # 进行分类
    category = classify(state)
    # 验证输入
    if not validate(state):
        return "error"
    # 查询数据库
    user = db.get_user(state["user_id"])
    # 检查权限
    if not has_permission(user, category):
        return "forbidden"
    # 记录日志
    log_routing_decision(state, category)
    return category

# ✅ 好的实践：路由函数只做决策

def preprocess(state):
    """预处理节点：验证和准备"""
    state["category"] = classify(state)
    state["user"] = db.get_user(state["user_id"])
    return state

def router(state):
    """纯决策逻辑"""
    if not state["is_valid"]:
        return "error"
    if not has_permission(state["user"], state["category"]):
        return "forbidden"
    return state["category"]

原则：路由函数应该是纯粹的决策逻辑，副作用放在节点中。

陷阱二：状态突变陷阱

# ❌ 有副作用的路由
def risky_router(state):
    state["route_count"] = state.get("route_count", 0) + 1  # 突变状态
    if state["route_count"] > 10:
        return "circuit_breaker"
    return "continue"

# ✅ 使用 Reducer 处理累积状态
from langgraph.graph import add

class SafeState(TypedDict):
    route_count: Annotated[int, add]  # Reducer 处理累加
    
def safe_router(state):
    if state["route_count"] > 10:
        return "circuit_breaker"
    return "continue"

陷阱三：无限循环风险

# ❌ 可能无限循环
def retry_router(state):
    if state["success"]:
        return "done"
    return "retry"  # 没有重试次数限制

# ✅ 始终设置退出条件
def safe_retry_router(state):
    if state["success"]:
        return "done"
    if state["retry_count"] >= 3:
        return "give_up"
    return "retry"

最佳实践清单

单一职责：每个路由函数只负责一种决策逻辑
幂等性：多次执行相同输入应返回相同输出
可观测性：记录所有路由决策便于调试
测试覆盖：为每个路由分支编写单元测试
降级策略：处理未知输入的兜底路径
文档化：复杂路由逻辑需要注释说明决策依据

与 Checkpoint 的整合

条件边与 Checkpoint 持久化结合，可以实现复杂的中断和恢复逻辑。

from langgraph.checkpoint.memory import MemorySaver

# 在需要人工决策的路由点中断
def human_gate_router(state):
    if state["risk_score"] > 0.8:
        return Command(
            goto=INTERRUPT,
            update={
                "interrupt_reason": "high_risk_action",
                "proposed_action": state["next_action"],
                "risk_explanation": generate_risk_report(state)
            }
        )
    return state["next_action"]

# 配置 Checkpoint
memory = MemorySaver()
graph = builder.compile(checkpointer=memory)

# 执行时在中断点暂停
config = {"configurable": {"thread_id": "user_123"}}
result = graph.invoke(initial_state, config)

# 稍后恢复，用户已做出决策
state_update = {
    "user_approved": True,
    "user_comments": "确认执行"
}
result = graph.invoke(state_update, config)

这种组合确保了：

安全性：高风险操作需要确认
灵活性：用户可以在中断后修改输入
容错性：系统崩溃后可以从断点恢复

实战：智能客服系统的动态路由

将以上模式整合，构建一个完整的智能客服系统。

class TicketState(TypedDict):
    customer_id: str
    message: str
    category: Optional[str]
    priority: int
    sentiment: str
    assigned_agent: Optional[str]
    resolution: Optional[str]
    escalation_reason: Optional[str]

class SmartSupportSystem:
    def __init__(self):
        self.builder = StateGraph(TicketState)
        self._build_graph()
    
    def _build_graph(self):
        # 节点定义
        self.builder.add_node("intake", self.intake_node)
        self.builder.add_node("classify", self.classification_node)
        self.builder.add_node("sentiment_analysis", self.sentiment_node)
        self.builder.add_node("priority_assessment", self.priority_node)
        self.builder.add_node("route_to_bot", self.bot_handler)
        self.builder.add_node("route_to_agent", self.human_agent_handler)
        self.builder.add_node("route_to_specialist", self.specialist_handler)
        self.builder.add_node("escalate", self.escalation_handler)
        self.builder.add_node("resolve", self.resolution_node)
        
        # 边定义
        self.builder.set_entry_point("intake")
        self.builder.add_edge("intake", "classify")
        self.builder.add_edge("classify", "sentiment_analysis")
        self.builder.add_edge("sentiment_analysis", "priority_assessment")
        
        # 核心：动态路由
        self.builder.add_conditional_edges(
            "priority_assessment",
            self.routing_decision,
            {
                "bot": "route_to_bot",
                "agent": "route_to_agent",
                "specialist": "route_to_specialist",
                "escalate": "escalate"
            }
        )
        
        # 各处理路径汇聚
        self.builder.add_edge("route_to_bot", "resolve")
        self.builder.add_edge("route_to_agent", "resolve")
        self.builder.add_edge("route_to_specialist", "resolve")
        self.builder.add_edge("escalate", "resolve")
    
    def routing_decision(self, state: TicketState) -> str:
        """综合路由决策"""
        
        # 高优先级且负面情绪 → 人工
        if state["priority"] >= 4 and state["sentiment"] == "negative":
            return "agent"
        
        # 技术问题 → 专家
        if state["category"] in ["technical", "billing_dispute"]:
            return "specialist"
        
        # VIP 客户 → 人工
        if self.is_vip(state["customer_id"]):
            return "agent"
        
        # 简单问题 → 机器人
        if state["priority"] <= 2 and state["category"] in ["general", "faq"]:
            return "bot"
        
        # 默认
        return "agent"
    
    def compile(self, checkpointer=None):
        return self.builder.compile(checkpointer=checkpointer)

# 使用示例
system = SmartSupportSystem()
graph = system.compile(checkpointer=MemorySaver())

# 处理工单
ticket = {
    "customer_id": "C12345",
    "message": "我的账户被锁定了，急需访问"
}
result = graph.invoke(ticket, {"configurable": {"thread_id": "ticket_789"}})

与上午文章的呼应

上午我们探讨了 Streaming 流式输出机制，重点在于「如何让 Agent 的输出更实时、更流畅」。本文聚焦于「如何让 Agent 的决策更智能、更灵活」。

两者是相辅相成的：

维度	Streaming (上午)	Conditional Edges (本文)
关注点	输出体验	控制逻辑
核心问题	用户等待焦虑	流程僵化低效
解决方案	渐进式输出	动态路由决策
技术机制	events/token	state → decision → path
用户感知	实时反馈	精准响应

当两者结合，Agent 系统可以达到「智能决策 + 实时反馈」的理想状态：

用户提出问题
系统通过条件边快速分类和路由（<100ms）
通过 Streaming 向用户展示思考过程
到达生成节点后，Token 级流式输出答案
如果中途检测到需要澄清，条件边立即触发中断
用户补充信息后，从断点恢复继续执行

总结

条件边是 LangGraph 最强大的特性之一，它将 Agent 从静态流程图升级为动态决策系统。

核心要点：

数据驱动：路由决策基于运行时状态，而非编译时配置
模式多样：分类器路由、质量门路由、资源感知路由适应不同场景
组合威力：与 Streaming、Subgraph、Checkpoint 结合产生 1+1>2 的效果
安全边界：始终设置终止条件，避免无限循环

LangGraph 知识体系回顾：

日期	主题	层级
2/13	子图模块化	结构层
2/14	Multi-Agent 协作	协作层
2/15	可观测性 + 安全沙箱	监控层 + 安全层
2/16 上午	HITL 人机协作	交互层
2/16 下午	Checkpoint 持久化	数据层
2/17 上午	Streaming 流式输出	输出层
2/17 下午	条件边动态路由	控制层