工作流编排指南

本指南聚焦 YAML 结构、节点类型、Provider 配置、边条件与模板导出，帮助工作流作者快速构建与调试 DAG。

1. 必备背景

熟悉 yaml_instance/ 与 yaml_template/ 的目录结构。
了解基本节点类型（model、python、agent、human、subgraph、passthrough、literal）。
理解 FIELD_SPECS（见 field_specs.md）与 Schema API（见 config_schema_contract.md）可被前端/IDE 用于动态表单。

2. YAML 顶层结构

所有工作流文件都遵循 DesignConfig 根结构，仅包含 version、vars、graph 三个键。下面示例节选自 yaml_instance/net_example.yaml，可以直接运行：

version: 0.4.0
vars:
  BASE_URL: https://api.example.com/v1
  API_KEY: ${API_KEY}
graph:
  id: paper_gen
  description: 文章生成与润色
  log_level: INFO
  is_majority_voting: false
  initial_instruction: |
    这是一个文章生成与润色流程，请输入一个词语或短句作为任务提示。
  start:
    - Article Writer
  end:
    - Article Writer
  nodes:
    - id: Article Writer
      type: agent
      config:
        provider: openai
        base_url: ${BASE_URL}
        api_key: ${API_KEY}
        name: gpt-4o
        params:
          temperature: 0.1
    - id: Human Reviewer
      type: human
      config:
        description: 请审阅文章，如接受结果请输入 ACCEPT 结束流程；否则输入修改意见。
  edges:
    - from: Article Writer
      to: Human Reviewer
    - from: Human Reviewer
      to: Article Writer
      condition:
        type: keyword
        config:
          none:
            - ACCEPT
          case_sensitive: false

version：配置版本号，缺省为 0.0.0。当 entity/configs/graph.py 中的 Schema 发生破坏性调整时，用于与前端模板和迁移脚本对齐。
vars：根级键值对，可在任意字段使用 ${VAR} 占位，若未命中则回退到同名环境变量。GraphDefinition.from_dict 会拒绝在子图或节点下声明 vars，因此请仅在顶层维护。

环境变量与 .env 文件

系统支持在 YAML 配置中使用 ${VAR} 语法引用变量。这些变量可用于配置中的任意字符串字段，常见用途包括：

API 密钥：api_key: ${API_KEY}
服务地址：base_url: ${BASE_URL}
模型名称：name: ${MODEL_NAME}

系统在解析配置时会自动加载项目根目录下的 .env 文件（若存在）。变量解析的优先级如下：

优先级	来源	说明
1（最高）	`vars` 中显式定义的值	YAML 文件中直接声明的键值对
2	系统/Shell 环境变量	如通过 `export` 设置的值
3（最低）	`.env` 文件中的值	仅当环境变量尚未存在时生效

Tip

.env 文件不会覆盖已存在的环境变量。这意味着您可以在 .env 中定义默认值，同时通过 export 或部署平台的环境变量配置来覆盖它们。

Warning

若占位符引用的变量在上述三个来源中均未定义，配置解析时将抛出 ConfigError 并指明出错路径。

graph：唯一必填段落，映射到 GraphDefinition dataclass。它包含：
- 基础元信息：id（必填）、description、log_level（默认 DEBUG）、is_majority_voting、initial_instruction、可选 organization。
- 执行控制：start/end（入口出口列表；系统会在启动时执行 start 中的节点）、nodes、edges。nodes 与 edges 同步 entity/configs/node/*.py 与 entity/configs/edge.py，所有 Provider、模型、Tooling 配置都挂在 node.config 内，不再在顶层维护 providers 表。上例通过 keyword 条件在 Human Reviewer -> Article Writer 边上避免输入 ACCEPT 时继续循环。
- 共享资源：memory（定义 Memory store 列表，供模型节点的 config.memories 引用）。调度器会校验节点引用是否在 graph.memory 中声明。
- Schema 参考：yaml_template/design.yaml 会实时反映 GraphDefinition 字段，建议在修改后运行 python -m tools.export_design_template 或调用 Schema API 校验。

进一步阅读：docs/user_guide/zh/field_specs.md（字段精细描述）、docs/user_guide/zh/runtime_ops.md（运行期可观测性）、以及 yaml_template/design.yaml（自动生成的基准模板）。

3. 节点类型速览

类型	描述	关键字段	详细文档
`agent`	调用 LLM，支持工具、记忆、thinking	`provider`, `model`, `prompt_template`, `tooling`, `thinking`, `memories`	agent.md
`python`	执行 Python 代码（脚本或指令），共享 `code_workspace/`	`entry_script`, `inline_code`, `timeout`, `env`	python.md
`human`	在 Web UI 阻塞等待人工输入	`prompt`, `timeout`, `attachments`	human.md
`subgraph`	嵌入子 DAG，复用复杂流程	`graph_path` 或内联 `graph`	subgraph.md
`passthrough`	透传节点，默认只传递最后一条消息，可传递所有信息；用于上下文过滤和图结构优化	`only_last_message`	passthrough.md
`literal`	被触发时输出固定文本消息，忽略输入	`content`, `role`（`user`/`assistant`）	literal.md
`loop_counter`	限制环路执行次数的控制节点	`max_iterations`, `reset_on_emit`, `message`	loop_counter.md

详细字段可在前端使用 Schema API (POST /api/config/schema) 动态查询，也可参照 entity/configs/ 中同名 dataclass。

4. Provider 与 Agent 设置

provider 字段缺省时，使用 globals.default_provider（如 openai）。
model、api_key、base_url 等字段支持 ${VAR} 占位，便于跨环境复用。
对接多个 Provider 时，可在 workflow 层设置 globals: { default_provider: ..., retry: {...} }（若 dataclass 支持）。

4.1 Gemini Provider 配置示例

model:
  provider: gemini
  base_url: https://generativelanguage.googleapis.com
  api_key: ${GEMINI_API_KEY}
  name: gemini-2.0-flash-001
  input_mode: messages
  params:
    response_modalities: ["text", "image"]
    safety_settings:
      - category: HARM_CATEGORY_SEXUAL
        threshold: BLOCK_LOWER

Gemini Provider 支持多模态输入（图片/视频/音频会自动转换为 Part），并支持 function_calling_config 来控制工具调用行为。

5. 边与条件

基本边：
```
- source: plan
  target: execute
```

条件边：

edges:
  - source: router
    target: analyze
    condition:
      type: function
      config:
        name: should_analyze   # functions/edge/should_analyze.py

当 condition 抛错时，调度器会记录错误并抛出 WorkflowExecutionError，导致该分支（通常是整个运行）终止，后继节点不会继续执行。
通过注册中心可以声明更多条件类型，例如内置的 keyword（无需写 Python 函数）：

edges:
  - from: review
    to: finalize
    condition:
      type: keyword
      config:
        any: ["FINAL", "APPROVED"]
        none: ["RETRY"]
        case_sensitive: false   # 默认为 true

condition.type 的合法值由后端注册中心（使用 register_edge_condition 注册）决定，schema 会自动在前端的下拉列表中展示 summary 描述。默认的 function 类型兼容旧写法（直接填写函数名字符串），未提供配置时等价于 name: true。

5.1 边级 Payload Processor

场景：当条件成立后希望“先处理一下消息”，例如根据正则提取得分、只保留结构化字段或者调用自定义函数对文本重写。
YAML 字段：在任意边上新增 process，结构与 condition 相同（type + config），目前内置
- regex_extract：基于 Python 正则。支持 pattern、group（名称或序号）、mode（replace_content、metadata、data_block）、multiple、on_no_match（pass/default/drop）等字段。
- function：调用 functions/edge_processor/*.py 中的处理函数。函数签名为 def foo(payload: Message, **kwargs) -> Message | None。现在Processor 接口已标准化，kwargs 中包含了 context: ExecutionContext，可访问当前执行上下文。
运行时行为：
- Processor 在条件通过且 carry_data=true 时执行，若返回 None，该边不会触发也不会向后继节点发送输入。
- 日志中会在 EDGE_PROCESS 事件里显示 process_label、process_type，便于排查。

示例：

edges:
  - from: reviewer
    to: qa
    process:
      type: regex_extract
      config:
        pattern: "Score\\s*:\\s*(?P<score>\\d+)"
        group: score
        mode: metadata
        metadata_key: "quality_score"
        case_sensitive: false
        on_no_match: default
        default_value: "0"

6. 模型节点高级特性

Tooling：在 AgentConfig.tooling 中配置，具体见 Tooling 模块。
Thinking：在 AgentConfig.thinking 中开启，如 chain-of-thought、reflection（详见 entity/configs/thinking.py）。
Memories：AgentConfig.memories 绑定 MemoryAttachmentConfig，详见 Memory 模块。

7. 动态执行 (Map-Reduce/Tree)

节点配置新增同级字段 dynamic，用于启用并行处理或 Map-Reduce 模式。

7.1 核心概念

Map 模式 (type: map)：扇出（Fan-out）。将 List 输入拆分为多个单元并行执行，输出 List[Message]（结果打平）。
Tree 模式 (type: tree)：扇出与归约（Fan-out & Reduce）。将输入拆分并行执行后，按 group_size 分组递归归约，最终输出单个结果（如“总结的总结”）。
Split 策略：定义如何将上一节点的输出或当前输入拆分为并行单元。

7.2 配置结构

nodes:
  - id: Research Agents
    type: agent
    # 常规配置（作为并行单元的模板）
    config:
      provider: openai
      model: gpt-4o
      prompt_template: "Research this topic: {{content}}"
    # 动态执行配置
    dynamic:
      type: map
      # 拆分策略 (仅首层有效)
      split:
        type: message             # 可选: message, regex, json_path
        # pattern: "..."          # regex 模式下必填
        # json_path: "$.items[*]" # json_path 模式下必填
      # 模式专属配置
      config:
        max_parallel: 5           # 控制并发度

7.3 Tree 模式示例

适用于长文本分段摘要等场景：

dynamic:
  type: tree
  split:
    type: regex
    pattern: "(?s).{1,2000}(?:\\s|$)"  # 每 2000 字符切分
  config:
    group_size: 3   # 每 3 个结果归约为 1 个
    max_parallel: 10

该模式会自动构建多层级执行树，直到结果数量归约为 1。split 配置与 map 模式一致，

8. 设计模板导出

任意修改 Config/FIELD_SPECS 后，运行：

python -m tools.export_design_template \
  --output yaml_template/design.yaml \
  --mirror frontend/public/design_0.4.0.yaml

命令会读取注册表（节点、memory、tooling 等）与 FIELD_SPECS，自动生成 YAML 模板与前端镜像。
更新后请提交模板文件，并通知前端刷新静态资源。

9. CLI / API 运行

Web UI：访问前端页面 → 选择 YAML → 填写运行参数 → 启动 → 在面板监控。我们建议您采用此方式运行。
HTTP：POST /api/workflow/execute，payload 包含 session_name, graph_path 或 graph_content, task_prompt、可选的 attachments，以及 log_level（默认 INFO，支持 INFO 或 DEBUG）。
CLI：python run.py --path yaml_instance/demo.yaml --name test_run（执行前可设置 TASK_PROMPT 环境变量或在 CLI 提示中输入）。

10. 调试建议

使用 Web UI 的上下文快照或 WareHouse 中的 context.json 检查节点输入输出。注意所有节点输出现已统一为 List[Message] 结构。
结合 config_schema_contract.md 的 breadcrumbs 功能，用 CLI python run.py --inspect-schema 快速查看字段定义。
若 YAML 占位符缺失，解析阶段会抛出 ConfigError，在 UI/CLI 中都可看到明确路径。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

工作流编排指南

1. 必备背景

2. YAML 顶层结构

3. 节点类型速览

4. Provider 与 Agent 设置

4.1 Gemini Provider 配置示例

5. 边与条件

5.1 边级 Payload Processor

6. 模型节点高级特性

7. 动态执行 (Map-Reduce/Tree)

7.1 核心概念

7.2 配置结构

7.3 Tree 模式示例

8. 设计模板导出

9. CLI / API 运行

10. 调试建议

FilesExpand file tree

workflow_authoring.md

Latest commit

History

workflow_authoring.md

File metadata and controls

工作流编排指南

1. 必备背景

2. YAML 顶层结构

3. 节点类型速览

4. Provider 与 Agent 设置

4.1 Gemini Provider 配置示例

5. 边与条件

5.1 边级 Payload Processor

6. 模型节点高级特性

7. 动态执行 (Map-Reduce/Tree)

7.1 核心概念

7.2 配置结构

7.3 Tree 模式示例

8. 设计模板导出

9. CLI / API 运行

10. 调试建议