Go mod 好菜系列 - 0x1A etcd/clientv3 这口分布式协调菜别只会 put 和 get

详细聊 etcd/clientv3 在配置、选主、租约和分布式协调里的常见用法,为什么 watch 与 lease 很关键,以及它和普通 KV 存储不是一回事。

很多人第一次接触 etcd,会把它理解成“一个更可靠点的 KV 数据库”。这个理解不能说全错,但非常不够。真正在项目里常用到它时,你会发现它更像一块分布式协调地基,而不是拿来随便存业务数据的抽屉柜。

etcd/clientv3 常见在干嘛

  • 配置动态监听
  • 服务注册信息存储
  • 分布式锁
  • 选主与租约
  • 协调类元数据管理

这几件事有个共同点:它们都更偏“系统状态协同”,而不是普通业务记录。

为什么不能把它当普通 KV

因为 etcd 的优势并不在“便宜地存很多业务数据”,而在于它对一致性、变更监听、租约和协调语义的支持。你如果拿它去存一堆高频业务明细,大概率会把最有价值的部分浪费掉。

watch 为什么这么重要

因为很多场景要的不是“我现在查一下值”,而是“只要值变了你立刻告诉我”。这就是动态配置、路由更新、服务状态变化能成立的基础。

项目一旦开始需要“感知变化”,轮询就会越来越笨,watch 的价值就出来了。

lease 又是在解决什么

租约本质上是在表达一种“临时有效”的状态。比如一个实例注册了自己,只要它持续续租,就说明它还活着;一旦续租断了,这条信息就自然过期。

这种机制对服务注册、选主和临时会话状态都非常有用。

watch 和 lease 的最小示例

cli, err := clientv3.New(clientv3.Config{
    Endpoints: []string{"127.0.0.1:2379"},
    DialTimeout: 5 * time.Second,
})
if err != nil {
    log.Fatal(err)
}

leaseResp, err := cli.Grant(context.Background(), 10)
if err != nil {
    log.Fatal(err)
}

_, err = cli.Put(context.Background(), "/service/user-api/1", "10.0.0.12:8080", clientv3.WithLease(leaseResp.ID))
if err != nil {
    log.Fatal(err)
}

watchCh := cli.Watch(context.Background(), "/service/user-api/", clientv3.WithPrefix())
for resp := range watchCh {
    for _, ev := range resp.Events {
        fmt.Println(ev.Type, string(ev.Kv.Key), string(ev.Kv.Value))
    }
}

把 watch 和 lease 放在一起看,etcd 的协调味道就出来了。它不是单纯存一条记录,而是在表达“谁活着、谁变化了、变化何时发生”。

它最容易让人踩坑的地方

  • 把业务数据也全塞进去
  • 只会 put/get,不会 watch/lease
  • 没有处理好连接抖动和重连
  • 把分布式锁当成万能灵药

尤其是分布式锁,很多时候你以为自己在“严谨控制并发”,实际上是在给系统加一个更难排障的新脆点。

什么时候它很值得引入

  • 系统里已经出现动态配置和协调需求
  • 你需要可靠的 watch 机制
  • 你确实有租约、会话、选主这类需求

如果只是想找个地方存几个开关值,甚至 Redis 都可能更省心。别为了“分布式系统味道”过早上 etcd。

小结

etcd/clientv3 这口菜要学的是协调思维:

  • 它更像分布式协调底座,不是普通业务 KV
  • watch 和 lease 是真正高价值能力
  • 适合动态配置、选主、注册和临时状态管理
  • 分布式锁要谨慎上,不要把它当万能钥匙

Read more

序章:长夜之后

后来的历史书把那一天称为“长夜之后”。 这个名字并不准确。事情发生在地球上的许多个白天和夜晚之间,发生在不同经度的清晨、午后、傍晚,发生在地下库房、山体掩体、海军基地、荒原试验场和无人值守的材料贮存井里。它既不是一场战争,也不是一次统一指挥的袭击。没有人按下那个能够解释一切的按钮。 但历史需要一个名称。 “长夜之后”最终被保留下来,是因为调查者在追溯事件源头时,不得不一次又一次回到海王星。回到那颗距离太阳太远、光照近乎吝啬的蓝色行星。回到六名中国宇航员死去的地方。回到一艘核动力科考船熄灭后的漫长黑暗。 在联合调查委员会公开的第一版报告中,事件时间线被压缩成了一页表格。 2030年9月,问海一号在海王星附近失联。 2034年11月,问海二号抵达失事区域,确认问海一号全员死亡。 2035年1月,问海二号完成样本封装,开始返航。 2038年6月,海王星样本进入地球高等级隔离实验室。 2038年7月,全球多个核材料设施发生不可逆事故,部分核电站进入最高级别应急。 2038年8月,所有已知核武库事实上失效,全球核电装机大规模停运。 这张表格后来被反复引用,因为它足够冷静,也

By Fuyu Jia

第一章:四小时以前的地球

林予舟第一次听见“问海一号”的最后通信,是在距离地面三百九十公里的轨道上。 那不是一个适合听遗言的地方。 舷窗外,地球从飞船腹侧缓慢转过去,云层像被谁铺平的白色金属屑,青藏高原的阴影压在晨昏线上。太阳还没有完全越出地平线,近地轨道的黑暗因此显得很薄,像一层马上要被擦掉的墨。 “链路稳定。”林予舟说。 他的声音被舱内麦克风收进去,压缩,打包,送进中继卫星,再落回海南深空任务中心。延迟不到一秒。这样奢侈的实时感,在他们离开地月系统后会迅速消失。等飞船抵达海王星附近,地球说一句话,要四个小时左右才能抵达;他们回一句,地球也要再等四个小时。 对话会变成考古。 控制台上方的状态灯一排排亮着,绿色多得几乎让人不安。问海二号还在近地轨道泊位上,推进舱、居住舱、通信桁架和补给舱刚完成最后一次组合检查。它不像公众宣传片里那样优雅。现实中的深空飞船更像一串被迫相互妥协的工程物:银灰色隔热层、外露管线、姿控喷口、展开到一半的高增益天线,所有东西都为了质量、功耗、散热和冗余让步。 它也不像一艘该去海王星的船。 至少不像一艘该去救援核动力深空飞船的船。 问海二号没有主反应堆。 这件事在公开报

By Fuyu Jia

第二章:没有核反应堆的船

发射前四十分钟,林予舟收到了一条来自地面的私人通信。 通信被压在任务数据包后面,标记为低优先级。它随着推进剂温度曲线、姿态平台校准结果、医学监测基线和最后一版逃逸窗口修正量一起进入问海二号的主机,像一枚被夹在工具箱里的薄纸片。 林予舟本来不该在这个时候打开它。 发射前四十分钟,人的每一个动作都应当有明确目的。检查阀门状态,确认加压序列,复诵逃逸程序,核对地面口令。人的情绪如果在这个时候出现,就应该被折叠起来,放进某个不影响任务的地方。 他还是点开了。 画面里是母亲的厨房。抽油烟机没有开,镜头被热气熏得微微发白。桌上摆着一碗面,青菜、荷包蛋和切得很薄的牛肉。母亲没有出镜,只在画面外说:“我知道你现在不能吃,等回来再吃也一样。” 林予舟看着那碗面,隔了几秒才意识到自己没有呼吸。 “怎么了?”沈从越问。 “私人包。” “家里?” “嗯。” “看完删掉。”沈从越说,“别让它留在主屏缓存里。发射时系统会重排任务窗口,乱七八糟的东西越少越好。” 他语气平淡,不像关心,也不像责备。沈从越说话常常这样,像把所有情绪都预先压成了流程。林予舟关掉视频,把它转存进私人存储区。那碗面从

By Fuyu Jia

第三章:地球变成录音

离开地月系统后的第十九天,林予舟第一次觉得,地球不是一个地方,而是一种延迟。 最初的几天,通信仍然近乎实时。地面问,他们答;他们报数,地面确认。贺岚的声音穿过中继链路抵达舱内时,还带着地球上办公室的秩序感:清晰、稳定、克制。林予舟甚至能从她停顿的长度判断总控大厅里有多少人在看同一块屏幕。 后来,停顿被拉长。 五秒。 十七秒。 一分钟。 再后来,地球的每一句话都像从更早的时间里寄来。母亲发来的第二条视频在一个姿态修正段后抵达。她说北京降温了,问他那边冷不冷。林予舟看着舷窗外没有温度的黑暗,忽然不知道该怎么回答。 他当然冷。 但那不是气温。 “私人日志,任务日二十。”他说,“今天第一次做梦,梦见自己回到地面,站在厨房里。锅里有水,水一直不开。母亲在旁边说火太小,我低头看,灶台下面接着的是问海二号的离子推进器。” 他说完后,自己笑了一下。 笑声在舱内很短,很快被风机吞掉。 沈从越从设备舱飘过,听见最后半句:“梦境记录?” “心理监测要求。” “别把自己写得太正常。

By Fuyu Jia