Prometheus-Rules告警评估
Prometheus-Rules告警评估 基于v3.5 工作原理graph TD A[Rule Files] --> B[Manager.LoadGroups] B --> C[Parse Rule Groups] C --> D[Create Rule Objects] D --> E[Analyse Rule Dependencies] E --> F[Build Dependency Map] F --> G[Set Rule Dependencies] H[Manager.Run] --> I[Group Evaluation Loop] I --> J[Split Rules into Batches] J --> K{Concurrent Evaluation Enabled?} K -->|Yes| L[Concurrent Rule Execution] K -->|No| M[S...
Prometheus-Scrape指标抓取
Prometheus-Scrape指标抓取 基于v3.5 工作原理graph TD A[ScrapePool] --> B[Target Discovery] A --> C[Scrape Loop Management] A --> D[HTTP Client] B --> B1[Sync Targets] B1 --> B2[Target Group Processing] B2 --> B3[Target Creation/Deduplication] B3 --> B4[Active Targets Update] C --> C1[Loop Creation] C1 --> C2[Scrape Interval Setup] C2 --> C3[Scraper Initialization] D --> D1[Target Scraper] D1 --> D2[HTTP Request] D2 --> D3[Metrics Endpoint] C3 -->...
Prometheus-notifier告警推送
Prometheus-notifier告警推送 基于v3.5 工作原理sequenceDiagram participant Q as Queue participant M as Manager participant AM as Alertmanager participant AL as Alertmanager API Q->>M: nextBatch() M->>M: 分批处理告警 M->>AM: sendAll() AM->>AM: 应用特定于 AM 的 relabel AM->>AL: HTTP POST /api/v2/alerts AL-->>AM: Response AM->>M: 返回发送结果 关键特性 告警队列管理 有界队列,防止内存无限增长 支持队列满时的丢弃策略 可配置的批处理大小 Relabeling(重新标记) 发送前对告警应用 relabel 配置 支持每个 Alertmanager 集合的特定 relabel 规则 高可用性...
Prometheus-Discoverer服务发现
Prometheus-Discoverer服务发现 基于v3.5 启动流程sequenceDiagram participant main.go participant Manager participant Provider participant Discoverer participant TargetGroup main.go->>Manager: NewManager() main.go->>Manager: ApplyConfig() Manager->>Provider: 创建Provider实例 Manager->>Provider: startProvider() Provider->>Discoverer: 初始化具体发现器(如K8s/Consul等) Provider->>Discoverer: Run(ctx, updatesCh) loop 发现循环 Discoverer->>TargetGroup: 获取目标组 ...
Prometheus-载入配置
Prometheus-载入配置 基于v3.5 启动顺序sequenceDiagram participant main.go participant Config participant GlobalConfig participant ScrapeConfig participant RemoteWriteConfig participant RuntimeConfig participant Storage main.go->>Config: 加载配置文件(Load/LoadFile) Config->>GlobalConfig: 初始化全局配置 Config->>ScrapeConfig: 初始化抓取配置 Config->>RemoteWriteConfig: 初始化远程写入配置 Config->>RuntimeConfig: 初始化运行时配置 main.go->>Storage...
Prometheus-项目启动main.go
Prometheus-项目启动main.go 基于v3.5 启动顺序flowchart TD A[启动 main 函数] --> B[解析命令行参数/配置文件] B --> C[初始化日志系统] C --> D[初始化通知系统] D --> E[校验参数和配置] E --> F[初始化核心组件] F --> F1[本地存储 localStorage] F --> F2[抓取管理器 scrapeManager] F --> F3[远程存储 remoteStorage] F --> F4[规则管理器 ruleManager] F --> F5[Web 服务 webHandler] F --> F6[服务发现 discoveryManager] F --> F7[告警通知 notifierManager] F --> F8[Tracing 管理 tracingManager] F1 & F...
Alertmanager-告警发送
Alertmanager-告警发送 基于v0.28 启动顺序sequenceDiagram participant Alert as 新告警 participant Dispatcher as Dispatcher participant Route as Route participant AggrGroup as aggrGroup participant NotifyStage as notify.Stage participant Notifier as Notifier(邮件/微信等) Alert->>Dispatcher: 新告警流入 Dispatcher->>Route: 路由树匹配 Route-->>Dispatcher: 匹配到的 Route Dispatcher->>AggrGroup: 插入/创建分组 Note over AggrGroup: run 协程定时触发通知 AggrGroup->>Noti...
Alertmanager-dispatch告警分组
Alertmanager-dispatch告警分组 基于v0.28 总体流程flowchart TD A[告警流入 Alertmanager] --> B[dispatch 路由树匹配] B --> C{匹配到哪些 Route?} C -- 无匹配 --> Z[丢弃或默认处理] C -- 有匹配 --> D[分组聚合(按 group_by 标签)] D --> E[分组等待 group_wait] E --> F[分组内聚合告警] F --> G{到达 group_interval 或有新告警?} G -- 否 --> F G -- 是 --> H[触发通知管道] H --> I[通知发送(邮件/微信/钉钉等)] I --> J[分组生命周期管理] J --> K{分组内还有活跃告警?} K -- 有 --> F K -- 无 --...
Alertmanager-silencer告警静默
Alertmanager-silencer告警静默 基于v0.28 总体流程sequenceDiagram participant Alert as 告警(Labels) participant Silencer as Silencer participant Silences as Silences participant Store as state(存储) participant Marker as AlertMarker Alert->>Silencer: 新告警流入,调用 Mutes(lset) Silencer->>Marker: 查询该告警指纹的静默状态 alt Marker 版本与 Silences 一致 Silencer->>Silences: 仅查询已知静默ID是否仍然有效 else Marker 版本不一致 Silencer->>Silences: 全量查询所有匹配该告警的静默 end S...
Alertmanager-inhibitor告警抑制
Alertmanager-inhibitor告警抑制 基于v0.28 总体流程flowchart TD A[告警流入 Alertmanager] --> B{是否匹配抑制规则?} B -- 否 --> E[正常进入分发/通知流程] B -- 是 --> C[遍历所有 InhibitRule] C --> D{目标告警是否匹配 TargetMatchers?} D -- 否 --> C D -- 是 --> F{是否存在源告警满足 SourceMatchers 且 Equal 标签相等?} F -- 否 --> C F -- 是 --> G[该告警被抑制, 不再通知] C -->|遍历完所有规则| H{是否被抑制?} H -- 是 --> G H -- 否 --> E subgraph 规则说明 direction LR...