Снижение задержки и нагрузки: часто запрашиваемые или тяжелые данные хранят в быстром хранилище (память, Redis). Меньше обращений к БД и внешним API. В Go кеш в памяти - map + sync.RWMutex или sync.Map; для распределенного - Redis (go-redis). TTL и инвалидация задают под бизнес-логику.
var cache = struct {
sync.RWMutex
m map[string]cached
}{m: make(map[string]cached)}