Go mod 好菜系列 - 0x17 kafka-go 这口异步队列菜别只会丢消息

详细聊 kafka-go 在 Go 项目里的常见用法、生产者和消费者各自要关注什么、它适合哪些异步场景,以及为什么“能发能收”离可用还差很远。

很多人第一次用消息队列,最容易产生一种错觉:只要消息发出去了、也收到了,这套链路就算成了。可真到了生产环境里,异步系统最麻烦的地方往往不是“能不能收发”,而是 乱序、重试、幂等、积压、消费失败之后怎么办。而在 Go 里,kafka-go 是一个很常见的入口。

它适合什么场景

  • 事件通知
  • 异步削峰
  • 日志或埋点采集
  • 服务解耦

说白了,就是那些“不一定要同步立刻做完,但必须最终被处理”的事。

为什么大家不用原生客户端,偏偏常提 kafka-go

因为它比较贴近 Go 的使用习惯,接口也更顺手。很多团队并不是在追求“最极致的吞吐 benchmark”,而是在追求一个够稳、够直觉、集成成本不高的客户端库。kafka-go 往往就卡在这个平衡点上。

生产者最容易忽略什么

不是怎么把消息发出去,而是发出去以后你怎么确认它真的值得被消费:

  • 消息 key 怎么设计
  • 是否需要保证同 key 有序
  • 失败重试策略是什么
  • 消息体有没有版本演进空间

很多系统后面越来越痛,不是 Kafka 的锅,而是消息模型一开始就写得像一封随手便签。

生产和消费的最小示例

writer := &kafka.Writer{
    Addr:     kafka.TCP("127.0.0.1:9092"),
    Topic:    "user-events",
    Balancer: &kafka.Hash{},
}

err := writer.WriteMessages(context.Background(),
    kafka.Message{Key: []byte("user:42"), Value: []byte(`{"event":"created"}`)},
)
if err != nil {
    log.Fatal(err)
}

reader := kafka.NewReader(kafka.ReaderConfig{
    Brokers: []string{"127.0.0.1:9092"},
    Topic:   "user-events",
    GroupID: "user-worker",
})

msg, err := reader.ReadMessage(context.Background())
if err != nil {
    log.Fatal(err)
}
fmt.Println(string(msg.Key), string(msg.Value))

这段代码很好上手,但真正要上生产时,重点会落到重试、幂等、监控和 offset 提交策略上,而不是这几行 API 本身。

消费者最容易翻车什么

  • 处理失败后直接丢
  • offset 提交时机不清楚
  • 没有幂等,重试一次就把业务写炸
  • 积压严重却没有监控和报警

真正的消费者设计,核心不是“收到了”,而是“失败时还能不能优雅地再来一次”。

一个很关键的意识:Kafka 不是任务队列的平替

它当然可以承载异步任务,但它的本质更偏事件流和日志流。你如果把所有业务都当成“扔个消息就算解耦”,最后会得到一堆谁也说不清依赖关系的黑箱订阅者。

kafka-go 的使用心法

  • 把 producer 和 consumer 的责任想清楚
  • 消息模型尽量稳定,别频繁随意改字段
  • 消费者一定做幂等
  • 对积压、失败率、消费延迟做监控

这些东西听起来不像代码,但它们往往比那几行连接 Kafka 的代码重要得多。

什么时候值得引入 Kafka

  • 流量高峰下同步处理压力太大
  • 多个系统都要订阅同一类业务事件
  • 你希望业务链路更松耦合

如果只是偶尔做个后台任务,小项目直接上 Kafka 也可能太重。别把“有异步需求”和“必须 Kafka”画等号。

小结

kafka-go 这口菜最该学的,其实不是 API,而是异步思维:

  • 它适合事件流、削峰、解耦等异步场景
  • 生产者和消费者要分别思考消息模型与失败处理
  • 幂等、重试、监控、积压,比“能发能收”更重要
  • Kafka 不是万能任务队列,别什么都往里扔

Read more

序章:长夜之后

后来的历史书把那一天称为“长夜之后”。 这个名字并不准确。事情发生在地球上的许多个白天和夜晚之间,发生在不同经度的清晨、午后、傍晚,发生在地下库房、山体掩体、海军基地、荒原试验场和无人值守的材料贮存井里。它既不是一场战争,也不是一次统一指挥的袭击。没有人按下那个能够解释一切的按钮。 但历史需要一个名称。 “长夜之后”最终被保留下来,是因为调查者在追溯事件源头时,不得不一次又一次回到海王星。回到那颗距离太阳太远、光照近乎吝啬的蓝色行星。回到六名中国宇航员死去的地方。回到一艘核动力科考船熄灭后的漫长黑暗。 在联合调查委员会公开的第一版报告中,事件时间线被压缩成了一页表格。 2030年9月,问海一号在海王星附近失联。 2034年11月,问海二号抵达失事区域,确认问海一号全员死亡。 2035年1月,问海二号完成样本封装,开始返航。 2038年6月,海王星样本进入地球高等级隔离实验室。 2038年7月,全球多个核材料设施发生不可逆事故,部分核电站进入最高级别应急。 2038年8月,所有已知核武库事实上失效,全球核电装机大规模停运。 这张表格后来被反复引用,因为它足够冷静,也

By Fuyu Jia

第一章:四小时以前的地球

林予舟第一次听见“问海一号”的最后通信,是在距离地面三百九十公里的轨道上。 那不是一个适合听遗言的地方。 舷窗外,地球从飞船腹侧缓慢转过去,云层像被谁铺平的白色金属屑,青藏高原的阴影压在晨昏线上。太阳还没有完全越出地平线,近地轨道的黑暗因此显得很薄,像一层马上要被擦掉的墨。 “链路稳定。”林予舟说。 他的声音被舱内麦克风收进去,压缩,打包,送进中继卫星,再落回海南深空任务中心。延迟不到一秒。这样奢侈的实时感,在他们离开地月系统后会迅速消失。等飞船抵达海王星附近,地球说一句话,要四个小时左右才能抵达;他们回一句,地球也要再等四个小时。 对话会变成考古。 控制台上方的状态灯一排排亮着,绿色多得几乎让人不安。问海二号还在近地轨道泊位上,推进舱、居住舱、通信桁架和补给舱刚完成最后一次组合检查。它不像公众宣传片里那样优雅。现实中的深空飞船更像一串被迫相互妥协的工程物:银灰色隔热层、外露管线、姿控喷口、展开到一半的高增益天线,所有东西都为了质量、功耗、散热和冗余让步。 它也不像一艘该去海王星的船。 至少不像一艘该去救援核动力深空飞船的船。 问海二号没有主反应堆。 这件事在公开报

By Fuyu Jia

第二章:没有核反应堆的船

发射前四十分钟,林予舟收到了一条来自地面的私人通信。 通信被压在任务数据包后面,标记为低优先级。它随着推进剂温度曲线、姿态平台校准结果、医学监测基线和最后一版逃逸窗口修正量一起进入问海二号的主机,像一枚被夹在工具箱里的薄纸片。 林予舟本来不该在这个时候打开它。 发射前四十分钟,人的每一个动作都应当有明确目的。检查阀门状态,确认加压序列,复诵逃逸程序,核对地面口令。人的情绪如果在这个时候出现,就应该被折叠起来,放进某个不影响任务的地方。 他还是点开了。 画面里是母亲的厨房。抽油烟机没有开,镜头被热气熏得微微发白。桌上摆着一碗面,青菜、荷包蛋和切得很薄的牛肉。母亲没有出镜,只在画面外说:“我知道你现在不能吃,等回来再吃也一样。” 林予舟看着那碗面,隔了几秒才意识到自己没有呼吸。 “怎么了?”沈从越问。 “私人包。” “家里?” “嗯。” “看完删掉。”沈从越说,“别让它留在主屏缓存里。发射时系统会重排任务窗口,乱七八糟的东西越少越好。” 他语气平淡,不像关心,也不像责备。沈从越说话常常这样,像把所有情绪都预先压成了流程。林予舟关掉视频,把它转存进私人存储区。那碗面从

By Fuyu Jia

第三章:地球变成录音

离开地月系统后的第十九天,林予舟第一次觉得,地球不是一个地方,而是一种延迟。 最初的几天,通信仍然近乎实时。地面问,他们答;他们报数,地面确认。贺岚的声音穿过中继链路抵达舱内时,还带着地球上办公室的秩序感:清晰、稳定、克制。林予舟甚至能从她停顿的长度判断总控大厅里有多少人在看同一块屏幕。 后来,停顿被拉长。 五秒。 十七秒。 一分钟。 再后来,地球的每一句话都像从更早的时间里寄来。母亲发来的第二条视频在一个姿态修正段后抵达。她说北京降温了,问他那边冷不冷。林予舟看着舷窗外没有温度的黑暗,忽然不知道该怎么回答。 他当然冷。 但那不是气温。 “私人日志,任务日二十。”他说,“今天第一次做梦,梦见自己回到地面,站在厨房里。锅里有水,水一直不开。母亲在旁边说火太小,我低头看,灶台下面接着的是问海二号的离子推进器。” 他说完后,自己笑了一下。 笑声在舱内很短,很快被风机吞掉。 沈从越从设备舱飘过,听见最后半句:“梦境记录?” “心理监测要求。” “别把自己写得太正常。

By Fuyu Jia