wsl-docs

❯

❯

observability

2026年3月11日2分钟阅读

定义

Observability（可观测性）指通过日志、指标、链路追踪与事件上下文，理解系统内部状态并快速定位问题的能力。

核心内涵

可观测性超越了传统的被动监控，强调系统在设计之初就具备暴露内部运行逻辑的机制。它不仅关注系统“是否发生故障”，更致力于解答“为什么发生故障”以及“故障的根本原因是什么”。在复杂分布式架构中，高可观测性是保障系统透明度、可靠性与持续优化的核心基石。

实践要点

对 AI/Agent 系统，观测对象不仅包括服务状态，还包括提示词、工具调用和评测结果。
建立统一的遥测数据标准，确保跨服务、跨组件的链路追踪能够无缝衔接。
避免过度采集无用数据，应聚焦于高价值的业务指标与关键路径的上下文信息。
以服务级目标（如 SLI/SLO）连接指标与告警，形成“发现异常-定位根因-复盘改进”的闭环。
可观测性与告警、回归测试和故障复盘共同构成生产稳定性的基础。

相关词条

llmops
evals
tool
workflow

关联主题

AI
Agent
bug-fix
data-pipeline
evals
llmops
prompt
软件工程
tool
workflow

关系图谱

定义
核心内涵
实践要点
相关词条
关联主题

反向链接

Agent
ETL
PostgreSQL
benchmark
bug-fix
data-pipeline
evals
llmops
rate-limiting
serverless
stream-processing
trading
workflow
无限大脑
软件工程
Claude Agent SDK Notebook 实战进阶
Claude Tool Use Cookbook 实战清单下篇
Claude 工程专题 Notebook Extended Thinking Finetuning 与可观测性
Claude 第三方集成 Cookbook 语音与多模态应用
Persona vectors：语言模型角色特征的监测与控制
使用 Claude Agent SDK 构建强大智能体教程
大型语言模型中内省能力的迹象
实践中测量 AI 智能体的自主性
揭秘 AI 智能体评估 Evals
衡量 AI 智能体在实践中的自主性
Bifrost Gateway 快速开始：设置网关与两种配置模式
Gemma Scope 2：助力AI安全社区深入理解复杂语言模型行为
IBM与加州大学伯克利分校：使用IT-Bench和MAST诊断企业级智能体失败原因
隆重介绍 SyGra Studio
Agoda 开源 API Agent：零代码将任意 API 转换为 MCP
Firestore 企业版重大更新：引入管道操作与百余项新查询功能
Java 近期资讯：JDK 26 候选发布版及各大框架更新
OpenAI Frontier：企业级 AI 智能体构建与治理平台
Teleport 发布全新智能体身份框架：重塑企业 AI 基础设施安全
LangChain 2026年1月产品动态与社区通讯
LangSmith 正式上线 Google Cloud Marketplace
monday Service 与 LangSmith：从零开始构建代码优先的评估策略
为什么智能体必须在生产环境中观察与评估
智能体可观测性：驱动智能体评估的核心动力
论智能体框架与智能体可观测性
通过脚手架工程提升深度智能体性能
vLLM 内存泄漏排查
Harness Engineering：Agent 优先时代的 Codex 协作
Harness engineering：在代理优先的世界里运用 Codex
用 Evals 系统化测试 Agent Skills
超越速率限制：扩大 Codex 和 Sora 的访问规模
超越速率限制：扩展 Codex 与 Sora 的访问权限
提示词缓存：Claude Code 降低延迟与成本的关键
构建 Claude Code 的经验教训：提示词缓存决定一切
从单体架构到契约驱动的数据网格：网站分析的实践之旅
使用代理 AI 自动化现代深度学习实验
Anthropic 在和客户合作的过程中总结的的企业落地 AI 最佳实践以及常见错误
Stack Overflow 2025 年度报告：写代码如果不值钱了，我们该去哪？
你是否听说过 MLOps 或者 LLMOps 呢？
在 AI 时代，新手算法工程师如何既依赖 AI，又能真正掌控代码？
Claude Task Viewer：Claude Code可视化的实时看板
Acontext：Agent 上下文存储与可观测服务
Agent2Agent A2A Protocol：多 Agent 互操作开放标准
AgentFS：将 SQLite 映射为 agent 可挂载虚拟文件系统
Agno：开源 Python 多智能体系统构建与运行工具链
Crawl4AI：LLM 友好的网页抓取与 Markdown 提取引擎
Google ADK：Agent 开发工具包与多语言部署支持
LangChain：LLM 应用开发组件库与 Agent 编排工具
LangWatch：AI Agent 测试与 LLMOps 可观测性工具
Langflow：AI agent 与工作流可视化构建工具
Langfuse：开源LLM工程工具，提供应用可观测性、提示词管理、评估、数据集与演练能力
LiteLLM：统一多模型调用网关与 SDK
Mastra：工具链用于 AI 应用与智能体工程
Motia：后端开发工具，通过 Step 统一 API、后台任务、队列、工作流、流处理和 AI 代理
OpenAI Agents Python：OpenAI 智能体 Python SDK
OpenViking：面向 AI Agent 的上下文数据库
Tencent-loli_profiler：Android 内存分析与诊断工具
crewAI：多智能体协作编排工具
gpt-load：Multi-channel AI proxy with in AI 平台
phoenix：AI Observability & Evaluation 应用平台
tensorzero：an open-source stack for industrial-grade LLM applications
Open WebUI：自托管 AI 系统与多模型 RAG 集成中枢
exo：AI 推理基础设施与多设备协同运行大模型
mlflow：应用平台
open-infra-index：Production-tested AI infrastructure tools for efficient AGI development and
AgentNeo：Agent 可观测与评测框架
Claude Code Router：Claude Code 路由与调度工具
Coze Studio：开源可视化 AI Agent 开发工具，支持工作流、RAG 与插件
Flowise：基于 TypeScript 开发的开源可视化工具，旨在帮助用户通过直观的拖拽界面轻松构建 AI 代理（AI Agents）
LangGraph：Python 语言代理图编排工具
LightRAG：简单且快速的检索增强生成（RAG）系统，通过结合知识图谱、双层检索机制以及多模态支持
Warp：Agent 框架
claude-flow：The leading agent orchestration platform for Claude
claudia：基于 Tauri 2 构建的 Claude Code 图形化桌面客户端与工具包
eliza：开源多智能体 AI 开发工具，支持模块化架构与插件扩展
gemini-fullstack-langgraph-quickstart：基于 React、LangGraph 和 Gemini 2.5 构建的全栈 AI 代理快速入门项目，该代理能够通过谷歌搜索进行迭代式网
opik：开源 AI 观测评估工具，用于追踪与监控 LLM 应用、RAG 系统及 Agent 工作流
voltagent：AI Agent Engineering Platform平台
Ink Node：Ink 链全节点与归档节点运行仓库
Hugging Face Agents Course：智能体开发课程
agents-towards-production：开源的实战指南，提供端到端、代码优先的 Jupyter Notebook 教程
claude-code-templates：高热度的 CLI 工具与资源库，提供了丰富的预置配置、AI 代理、自定义命令及实时监控功能
ninehills/blog 技术 issue 提及文档索引
Beszel：服务器监控工具与容器指标告警
Checkmate：自托管服务监控与告警工具
Conductor：面向微服务与 AI Agent 的事件驱动工作流编排引擎
Dokploy：自托管 PaaS 部署与运维工具
Hyperswitch：开源支付路由编排工具
Netdata：全栈可观测性监控平台
RagaAI-Catalyst：Agent AI 可观测性监控与评估 Python SDK
Sniffnet：网络流量监控工具与可视化实时协议分析
Uptime Kuma：开源自托管可用性监控工具
gofr：Go 语言微服务开发工具，支持 Kubernetes 部署与内置可观测性
httptap：Linux 程序 HTTP 与 HTTPS 抓包工具
kubernetes：Production-Grade Container Scheduling and Management
neohtop：Blazing-fast system moni 开发工具
nginx-ui：Yet another WebUI for Ng 开发工具
parlant：Python 开源 LLM 智能体开发工具，支持行为准则与上下文匹配引擎
perforator：开发工具
react-scan：Scan for React performance issues and eliminate slow renders in your app
rustfs：基于 Rust 构建的高性能、兼容 S3 的开源分布式对象存储系统，采用商业友好的 Apache 2.0 许可
rybbit：Rybbit - open-source and privacy-friendly alternative to Google Analytics that
stats：macOS system monitor in your menu bar
umami：a modern, privacy-focused analytics platform
watchtower：A process for automating 开发工具

Created with Quartz v4.5.2 © 2026

GitHub