Joohwan

发表于2025-08-05|cloudprometheus

Prometheus-PromQL 基于v3.5 工作原理graph TD A[Query Input] --> B[Parser] B --> C[Engine] C --> D[Query Execution] D --> E[Result Output] %% Parser Module subgraph Parser["Parser (parser/)"] B1[Lexical Analysis] --> B2[Syntax Parsing] B2 --> B3[AST Generation] B3 --> B4[Validation] end %% Engine Module subgraph Engine["Engine (engine.go)"] C1[Query Initialization] --> C2[Query Planning]...

Prometheus-Rules告警评估

发表于2025-07-26|cloudprometheus

Prometheus-Rules告警评估基于v3.5 工作原理graph TD A[Rule Files] --> B[Manager.LoadGroups] B --> C[Parse Rule Groups] C --> D[Create Rule Objects] D --> E[Analyse Rule Dependencies] E --> F[Build Dependency Map] F --> G[Set Rule Dependencies] H[Manager.Run] --> I[Group Evaluation Loop] I --> J[Split Rules into Batches] J --> K{Concurrent Evaluation Enabled?} K -->|Yes| L[Concurrent Rule Execution] K -->|No| M[S...

Prometheus-Scrape指标抓取

发表于2025-07-25|cloudprometheus

Prometheus-Scrape指标抓取基于v3.5 工作原理graph TD A[ScrapePool] --> B[Target Discovery] A --> C[Scrape Loop Management] A --> D[HTTP Client] B --> B1[Sync Targets] B1 --> B2[Target Group Processing] B2 --> B3[Target Creation/Deduplication] B3 --> B4[Active Targets Update] C --> C1[Loop Creation] C1 --> C2[Scrape Interval Setup] C2 --> C3[Scraper Initialization] D --> D1[Target Scraper] D1 --> D2[HTTP Request] D2 --> D3[Metrics Endpoint] C3 -->...

Prometheus-notifier告警推送

发表于2025-07-24|cloudprometheus

Prometheus-notifier告警推送基于v3.5 工作原理sequenceDiagram participant Q as Queue participant M as Manager participant AM as Alertmanager participant AL as Alertmanager API Q->>M: nextBatch() M->>M: 分批处理告警 M->>AM: sendAll() AM->>AM: 应用特定于 AM 的 relabel AM->>AL: HTTP POST /api/v2/alerts AL-->>AM: Response AM->>M: 返回发送结果关键特性告警队列管理有界队列，防止内存无限增长支持队列满时的丢弃策略可配置的批处理大小 Relabeling（重新标记）发送前对告警应用 relabel 配置支持每个 Alertmanager 集合的特定 relabel 规则高可用性...

Prometheus-Discoverer服务发现

发表于2025-07-23|cloudprometheus

Prometheus-Discoverer服务发现基于v3.5 启动流程sequenceDiagram participant main.go participant Manager participant Provider participant Discoverer participant TargetGroup main.go->>Manager: NewManager() main.go->>Manager: ApplyConfig() Manager->>Provider: 创建Provider实例 Manager->>Provider: startProvider() Provider->>Discoverer: 初始化具体发现器(如K8s/Consul等) Provider->>Discoverer: Run(ctx, updatesCh) loop 发现循环 Discoverer->>TargetGroup: 获取目标组 ...

Prometheus-载入配置

发表于2025-07-22|cloudprometheus

Prometheus-载入配置基于v3.5 启动顺序sequenceDiagram participant main.go participant Config participant GlobalConfig participant ScrapeConfig participant RemoteWriteConfig participant RuntimeConfig participant Storage main.go->>Config: 加载配置文件(Load/LoadFile) Config->>GlobalConfig: 初始化全局配置 Config->>ScrapeConfig: 初始化抓取配置 Config->>RemoteWriteConfig: 初始化远程写入配置 Config->>RuntimeConfig: 初始化运行时配置 main.go->>Storage...

Prometheus-项目启动main.go

发表于2025-07-21|cloudprometheus

Prometheus-项目启动main.go 基于v3.5 启动顺序flowchart TD A[启动 main 函数] --> B[解析命令行参数/配置文件] B --> C[初始化日志系统] C --> D[初始化通知系统] D --> E[校验参数和配置] E --> F[初始化核心组件] F --> F1[本地存储 localStorage] F --> F2[抓取管理器 scrapeManager] F --> F3[远程存储 remoteStorage] F --> F4[规则管理器 ruleManager] F --> F5[Web 服务 webHandler] F --> F6[服务发现 discoveryManager] F --> F7[告警通知 notifierManager] F --> F8[Tracing 管理 tracingManager] F1 & F...

Alertmanager-告警发送

发表于2025-07-20|cloudalertmanager

Alertmanager-告警发送基于v0.28 启动顺序sequenceDiagram participant Alert as 新告警 participant Dispatcher as Dispatcher participant Route as Route participant AggrGroup as aggrGroup participant NotifyStage as notify.Stage participant Notifier as Notifier(邮件/微信等) Alert->>Dispatcher: 新告警流入 Dispatcher->>Route: 路由树匹配 Route-->>Dispatcher: 匹配到的 Route Dispatcher->>AggrGroup: 插入/创建分组 Note over AggrGroup: run 协程定时触发通知 AggrGroup->>Noti...

Alertmanager-dispatch告警分组

发表于2025-07-18|cloudalertmanager

Alertmanager-dispatch告警分组基于v0.28 总体流程flowchart TD A[告警流入 Alertmanager] --> B[dispatch 路由树匹配] B --> C{匹配到哪些 Route?} C -- 无匹配 --> Z[丢弃或默认处理] C -- 有匹配 --> D[分组聚合（按 group_by 标签）] D --> E[分组等待 group_wait] E --> F[分组内聚合告警] F --> G{到达 group_interval 或有新告警?} G -- 否 --> F G -- 是 --> H[触发通知管道] H --> I[通知发送（邮件/微信/钉钉等）] I --> J[分组生命周期管理] J --> K{分组内还有活跃告警?} K -- 有 --> F K -- 无 --...

Alertmanager-silencer告警静默

发表于2025-07-17|cloudalertmanager

Alertmanager-silencer告警静默基于v0.28 总体流程sequenceDiagram participant Alert as 告警(Labels) participant Silencer as Silencer participant Silences as Silences participant Store as state(存储) participant Marker as AlertMarker Alert->>Silencer: 新告警流入，调用 Mutes(lset) Silencer->>Marker: 查询该告警指纹的静默状态 alt Marker 版本与 Silences 一致 Silencer->>Silences: 仅查询已知静默ID是否仍然有效 else Marker 版本不一致 Silencer->>Silences: 全量查询所有匹配该告警的静默 end S...