cache key 是输入音频的内容哈希:对 raw bytes/base64 输入用 xxh3_64。 两段音频产生相同哈希就算命中,其余都是 miss。 cache 本身是一个以该内容哈希为 key、用 OrderedDict 实现的小 LRU(stage_cache.py): ...