Java 中使用 CompletableFuture 构建高并发异步流程的实战指南

在 Java 后端里，“并发高” 和 “链路长” 往往是一起出现的：一个接口进来，要查用户、查库存、算价格、打标签、写日志、发通知。
如果全都串行执行，响应时间会被最慢路径拖垮；如果一股脑起线程，又很容易把线程池打爆。

CompletableFuture 恰好处在一个很实用的位置：它既不是最底层的 Thread/Future，也不是响应式框架那种全家桶，而是一套足够轻量、足够强大的异步编排工具。很多团队第一次用它，只停留在 supplyAsync() 和 thenApply()；真正到了高并发场景，才会遇到超时、线程池隔离、异常传播、依赖编排这些现实问题。

这篇文章我会从架构视角 + 可运行代码带你完整走一遍，重点不是 API 背诵，而是：怎么把它用得稳、用得准、用得可维护。

背景与问题

先看一个典型聚合接口：

根据用户 ID 获取用户信息
并行获取订单统计
并行获取优惠券
再根据前面结果组装首页视图
同时异步记录审计日志

如果写成串行：

调用户服务
调订单服务
调优惠券服务
拼装结果
记日志

那么总耗时大致是：

总耗时 ≈ 用户服务 + 订单服务 + 优惠券服务 + 拼装 + 日志

如果把相互独立的步骤并行化，总耗时会更接近：

总耗时 ≈ max(订单服务, 优惠券服务) + 用户服务依赖链 + 拼装

问题来了：在真实系统里，我们通常会碰到这些痛点。

1. Future 能拿到结果，但不好编排

传统 Future 的问题很明显：

get() 会阻塞
没有优雅的链式回调
多任务聚合写起来非常别扭
异常和超时处理不直观

2. “异步”不等于“高并发友好”

很多人上来就：

CompletableFuture.supplyAsync(...)

看起来很异步，但默认用的是 ForkJoinPool.commonPool()。
如果你的业务是 I/O 密集型，例如 HTTP 调用、数据库访问、RPC 请求，这么用很容易产生几个问题：

公共线程池被别的任务污染
阻塞任务占满 worker 线程
排查时很难知道是哪条业务链路拖垮线程池

3. 业务编排复杂后，代码容易“回调地狱 2.0”

虽然 CompletableFuture 比 callback 好很多，但如果随便嵌套：

thenCompose
thenCombine
allOf
exceptionally

写多了以后，也可能变成“看似链式，实则难维护”的异步面条代码。

所以本文的核心不是“教你会用”，而是回答一个更实战的问题：

如何用 CompletableFuture 设计一条高并发、可观测、可降级、可维护的异步流程。

方案轮廓与架构思路

先给出一个推荐思路：把 CompletableFuture 当作异步流程编排器，而不是线程魔法。

核心原则：

独立任务并行化
有依赖关系的任务显式串联
线程池按业务隔离
超时、异常、降级前置设计
聚合点统一收口
日志与监控贯穿全链路

下面这张图可以帮助理解一个聚合接口的执行方式。

flowchart LR
    A[请求进入] --> B[查询用户信息]
    B --> C1[并行查订单统计]
    B --> C2[并行查优惠券]
    B --> C3[异步记审计日志]
    C1 --> D[组装首页视图]
    C2 --> D
    D --> E[返回响应]

从架构角度看，CompletableFuture 最适合做的是：

服务聚合层
异步后处理
批量并发查询
多阶段依赖编排
失败降级与兜底

而不太适合做的是：

无限复杂的流式处理
强背压要求的长生命周期数据流
对取消、中断、资源释放要求极高的复杂异步系统

后者通常更适合 Reactor、RxJava，或者更完整的响应式栈。

核心原理

理解 CompletableFuture，我建议抓住四件事：创建、串联、组合、收口。

1. 创建：异步任务从哪里来

最常见的入口：

runAsync()：无返回值
supplyAsync()：有返回值

示意：

CompletableFuture<String> future =
    CompletableFuture.supplyAsync(() -> "hello", executor);

这里强烈建议：显式传入自定义线程池，不要默认依赖公共池。

2. 串联：任务之间有依赖时怎么接

两个常见方法：

thenApply：同步转换结果
thenCompose：把“返回 Future 的任务”拍平

区别是很多人的第一个坑。

`thenApply`

CompletableFuture<User> f1 = ...
CompletableFuture<String> f2 = f1.thenApply(user -> user.getName());

用于：上一步结果 -> 普通值

`thenCompose`

CompletableFuture<User> f1 = ...
CompletableFuture<Order> f2 = f1.thenCompose(user -> fetchOrderAsync(user.getId()));

用于：上一步结果 -> 另一个异步任务

如果这里用错成 thenApply，就会得到嵌套结构：

CompletableFuture<CompletableFuture<Order>>

代码会越来越难看。

3. 组合：没有依赖的任务如何并行

常见方式：

thenCombine：两个任务结果合并
allOf：等待一组任务全部完成
anyOf：任一完成即返回

比如订单和优惠券相互独立，就可以并发。

sequenceDiagram
    participant Client
    participant API
    participant UserSvc
    participant OrderSvc
    participant CouponSvc

    Client->>API: 请求首页
    API->>UserSvc: 查询用户
    UserSvc-->>API: 用户信息
    par 并行任务
        API->>OrderSvc: 查询订单统计
        API->>CouponSvc: 查询优惠券
    end
    OrderSvc-->>API: 订单统计
    CouponSvc-->>API: 优惠券
    API-->>Client: 聚合结果

4. 收口：最终如何拿结果

最终通常有两类方式：

join()：拿结果，异常包装为 CompletionException
get()：会抛受检异常，处理更繁琐

在业务代码里，我更常用 join() 做最终聚合；
但前提是：异常在链路中已经被有意识地处理过。

5. 异常传播模型一定要理解

CompletableFuture 的异常不会像同步代码那样自然冒泡到你眼前。
常见处理方式：

exceptionally
handle
whenComplete

它们的语义不同：

exceptionally：出错时给默认值
handle：无论成功失败都能转换结果
whenComplete：更像观察者，通常用于日志，不改变结果

我自己经验里，最稳妥的策略是：

业务降级：用 exceptionally 或 handle
日志记录：用 whenComplete
最终统一失败：在聚合层抛业务异常

方案对比与取舍分析

在架构设计上，很多人会问：到底该用 ExecutorService + Future、CompletableFuture，还是直接上响应式？

这里给一个实用对比。

方案	优点	缺点	适用场景
Future	简单、原生	组合能力弱、阻塞 get	少量异步任务
CompletableFuture	编排能力强、接近业务表达	复杂链路易失控	聚合接口、异步编排
Reactor/RxJava	流式处理强、适合响应式系统	学习成本高、调试复杂	高吞吐异步流、响应式架构

如果你当前系统还是经典 Spring MVC / Dubbo / MyBatis 风格，
而你只是想把接口聚合层和异步后处理做得更高效，CompletableFuture 往往是投入产出比最高的方案。

实战代码（可运行）

下面我们做一个可运行的示例，模拟一个“用户首页聚合服务”。

目标：

先查用户
再并行查订单统计与优惠券
异步记审计日志，不阻塞主流程
对优惠券查询设置降级
最终输出聚合结果

下面代码基于 JDK 9+，因为用了 orTimeout 和 completeOnTimeout。
如果你还在 JDK 8，也能实现，只是超时控制要自己封装。

import java.time.LocalDateTime;
import java.util.*;
import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicInteger;

public class CompletableFutureDemo {

    public static void main(String[] args) {
        ThreadPoolExecutor ioPool = new ThreadPoolExecutor(
                8,
                16,
                60,
                TimeUnit.SECONDS,
                new LinkedBlockingQueue<>(200),
                new NamedThreadFactory("io-pool"),
                new ThreadPoolExecutor.CallerRunsPolicy()
        );

        HomeService homeService = new HomeService(ioPool);

        try {
            HomeView view = homeService.loadHomePage(1001L);
            System.out.println("最终结果: " + view);
        } finally {
            ioPool.shutdown();
        }
    }

    static class HomeService {
        private final Executor executor;
        private final UserService userService = new UserService();
        private final OrderService orderService = new OrderService();
        private final CouponService couponService = new CouponService();
        private final AuditService auditService = new AuditService();

        public HomeService(Executor executor) {
            this.executor = executor;
        }

        public HomeView loadHomePage(Long userId) {
            long start = System.currentTimeMillis();

            CompletableFuture<User> userFuture = CompletableFuture
                    .supplyAsync(() -> userService.getUser(userId), executor)
                    .orTimeout(500, TimeUnit.MILLISECONDS)
                    .whenComplete((user, ex) -> {
                        if (ex != null) {
                            System.err.println("查询用户失败: " + ex.getMessage());
                        } else {
                            System.out.println("用户信息已获取: " + user);
                        }
                    });

            CompletableFuture<Void> auditFuture = userFuture.thenAcceptAsync(user -> {
                auditService.record("访问首页", user.getUserId());
            }, executor).exceptionally(ex -> {
                System.err.println("审计日志记录失败: " + ex.getMessage());
                return null;
            });

            CompletableFuture<OrderStat> orderFuture = userFuture.thenCompose(user ->
                    CompletableFuture.supplyAsync(() -> orderService.getOrderStat(user.getUserId()), executor)
                            .orTimeout(800, TimeUnit.MILLISECONDS)
            ).whenComplete((r, ex) -> {
                if (ex != null) {
                    System.err.println("订单统计失败: " + ex.getMessage());
                }
            });

            CompletableFuture<List<String>> couponFuture = userFuture.thenCompose(user ->
                    CompletableFuture.supplyAsync(() -> couponService.getCoupons(user.getUserId()), executor)
                            .completeOnTimeout(Collections.singletonList("默认优惠券"), 300, TimeUnit.MILLISECONDS)
                            .exceptionally(ex -> {
                                System.err.println("优惠券服务异常，走降级: " + ex.getMessage());
                                return Collections.singletonList("默认优惠券");
                            })
            );

            CompletableFuture<HomeView> resultFuture = orderFuture.thenCombine(couponFuture,
                    (orderStat, coupons) -> new HomeView(userId, orderStat, coupons));

            HomeView view = resultFuture.join();

            auditFuture.join(); // 可选：演示等待审计完成；真实场景可不阻塞主链路

            long cost = System.currentTimeMillis() - start;
            System.out.println("接口总耗时: " + cost + " ms");
            return view;
        }
    }

    static class UserService {
        public User getUser(Long userId) {
            sleep(120);
            return new User(userId, "用户" + userId, LocalDateTime.now());
        }
    }

    static class OrderService {
        public OrderStat getOrderStat(Long userId) {
            sleep(200);
            return new OrderStat(12, 3588.50);
        }
    }

    static class CouponService {
        public List<String> getCoupons(Long userId) {
            sleep(400); // 故意慢一点，触发超时降级
            return Arrays.asList("满100减20", "88折券");
        }
    }

    static class AuditService {
        public void record(String action, Long userId) {
            sleep(50);
            System.out.println("审计日志已记录, action=" + action + ", userId=" + userId);
        }
    }

    static class User {
        private final Long userId;
        private final String name;
        private final LocalDateTime registerTime;

        public User(Long userId, String name, LocalDateTime registerTime) {
            this.userId = userId;
            this.name = name;
            this.registerTime = registerTime;
        }

        public Long getUserId() {
            return userId;
        }

        @Override
        public String toString() {
            return "User{userId=" + userId + ", name='" + name + "'}";
        }
    }

    static class OrderStat {
        private final int orderCount;
        private final double totalAmount;

        public OrderStat(int orderCount, double totalAmount) {
            this.orderCount = orderCount;
            this.totalAmount = totalAmount;
        }

        @Override
        public String toString() {
            return "OrderStat{orderCount=" + orderCount + ", totalAmount=" + totalAmount + "}";
        }
    }

    static class HomeView {
        private final Long userId;
        private final OrderStat orderStat;
        private final List<String> coupons;

        public HomeView(Long userId, OrderStat orderStat, List<String> coupons) {
            this.userId = userId;
            this.orderStat = orderStat;
            this.coupons = coupons;
        }

        @Override
        public String toString() {
            return "HomeView{userId=" + userId + ", orderStat=" + orderStat + ", coupons=" + coupons + "}";
        }
    }

    static class NamedThreadFactory implements ThreadFactory {
        private final String prefix;
        private final AtomicInteger counter = new AtomicInteger(1);

        public NamedThreadFactory(String prefix) {
            this.prefix = prefix;
        }

        @Override
        public Thread newThread(Runnable r) {
            return new Thread(r, prefix + "-" + counter.getAndIncrement());
        }
    }

    static void sleep(long millis) {
        try {
            Thread.sleep(millis);
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
            throw new RuntimeException("线程被中断", e);
        }
    }
}

代码拆解：这段示例到底体现了什么

1. 主干依赖关系非常清晰

userFuture 是前置依赖
orderFuture 和 couponFuture 依赖用户信息，但彼此独立
auditFuture 是旁路任务，不应拖慢主结果

这就是异步编排里很关键的一点：

先画依赖图，再写代码。

很多人一上来就写 thenApply/thenCompose，最后越写越绕。
我现在通常会先问自己一句：这个任务是串行依赖，还是可以并行？

2. `thenCompose` 用来串异步依赖

CompletableFuture<OrderStat> orderFuture = userFuture.thenCompose(user ->
    CompletableFuture.supplyAsync(() -> orderService.getOrderStat(user.getUserId()), executor)
);

因为这里“拿到用户后，再发起订单异步请求”，所以用 thenCompose 最自然。

3. 超时不是可选项，是高并发系统的必选项

示例里用了两种方式：

.orTimeout(800, TimeUnit.MILLISECONDS)
.completeOnTimeout(Collections.singletonList("默认优惠券"), 300, TimeUnit.MILLISECONDS)

区别很重要：

orTimeout：超时直接异常
completeOnTimeout：超时返回默认值

怎么选？取决于业务语义：

核心路径：通常失败要暴露出来
非核心展示信息：更适合超时降级

我实际项目里，像“推荐列表”“营销信息”“埋点数据”这类非核心内容，往往都适合降级。

4. 旁路任务要与主链路解耦

日志、审计、消息通知，往往是“最好有，但不能影响主流程”的任务。

示例里：

CompletableFuture<Void> auditFuture = userFuture.thenAcceptAsync(...)

它依赖 userFuture，但不参与最终 resultFuture 的合成。
这是一个很实用的设计原则：

核心链路与附属链路拆开。

否则你会发现，明明只是日志服务偶发抖动，却把用户主接口也拖慢了。

容量估算：线程池不是随便拍脑袋配

高并发场景下，如果你真的想把 CompletableFuture 用稳，线程池配置一定要有基本估算。

一个粗略但实用的经验公式

对于 I/O 密集型任务，可以先这么估：

线程数 ≈ CPU核心数 * (1 + 平均等待时间 / 平均计算时间)

比如：

CPU 核心数：8
平均等待时间：90ms
平均计算时间：10ms

那么：

线程数 ≈ 8 * (1 + 90/10) = 80

这只是起点，不是标准答案。还要看：

下游服务 RT
队列长度
峰值 QPS
可接受排队时间
JVM 内存上限

一个更贴近业务的估算方式

假设：

峰值 QPS = 500
每个请求平均并发发起 3 个异步 I/O
每个 I/O 平均耗时 100ms

那么系统中同时活跃的 I/O 任务数大约：

500 * 3 * 0.1 = 150

这意味着你的执行资源至少要能承接这个级别的并发压力。
当然，不一定就是直接开 150 个线程，还要看：

是否有连接池限制
是否需要隔离不同下游
是否允许排队
是否有熔断限流

所以线程池大小不是“调个 16 或 32 看看”，而是要结合吞吐和耗时推演。

常见坑与排查

这部分我尽量讲得“接地气”一点，因为很多问题不是不会写，而是线上一出事不容易定位。

坑 1：默认使用 commonPool，结果线程池被污染

很多教程直接这样写：

CompletableFuture.supplyAsync(() -> callRemote());

这会使用 ForkJoinPool.commonPool()。

问题在于：

你的任务可能是阻塞 I/O
公共池还可能被别的模块使用
出现线程饥饿时很难定位业务归属

排查方式

打线程栈，看是否大量任务堆在 ForkJoinPool.commonPool
观察线程名，确认是否用了公共池
看任务是否存在阻塞调用：HTTP、DB、Redis、RPC

建议

业务线程池显式注入，按场景隔离。

坑 2：把 `thenApply` 当成 `thenCompose` 用

示例：

CompletableFuture<CompletableFuture<String>> nested =
    userFuture.thenApply(user -> fetchDataAsync(user));

这不是你想要的结果。
最终你会得到 Future 套 Future，后面越来越难拼。

正确写法

CompletableFuture<String> flat =
    userFuture.thenCompose(user -> fetchDataAsync(user));

识别口诀

返回普通值：thenApply
返回异步任务：thenCompose

坑 3：只管异步，不管异常

很多人写完链路后，默认觉得异常会“自然抛出来”。
实际上，如果你没有在合适位置处理，最后常常只看到：

CompletionException

真正原因被包了一层。

排查建议

future.whenComplete((r, ex) -> {
    if (ex != null) {
        ex.printStackTrace();
    }
});

如果最终 join() 抛出异常，记得看：

Throwable cause = ex.getCause();

建议

每个关键节点都打日志
区分业务降级和系统失败
不要在最外层才第一次看异常

坑 4：以为异步就更快，实际上更慢

这类情况特别常见：

异步任务很轻，线程切换反而增加开销
下游本身有限流，并发打过去全排队
大量异步对象创建，GC 压力上升
线程池太小，任务排队
线程池太大，上下文切换严重

一个经验判断

如果任务本身是极轻量计算，完全没必要异步化。
CompletableFuture 适合的，是耗时明显、相互独立、适合并发执行的任务。

坑 5：主线程提前退出，异步任务没跑完

在 demo、脚本、单测里特别容易遇到。
主线程结束，线程池关闭或 JVM 退出，异步任务来不及完成。

表现

本地偶现“怎么日志没打出来”
单测时结果不稳定

解决

在测试中显式 join()
控制线程池生命周期
不要依赖“应该会执行完”的侥幸心理

坑 6：上下文丢失

比如这些信息：

TraceId
MDC 日志上下文
当前登录用户
ThreadLocal 中的租户信息

一旦切到异步线程，就可能丢失。

排查表现

日志链路断裂
监控 trace 不连续
多租户场景偶发串数据

建议

显式传递上下文
封装带上下文的 Executor
避免在异步链路中过度依赖裸 ThreadLocal

这是我自己踩过很多次的坑，尤其是接日志平台后，查问题会非常痛苦。

安全/性能最佳实践

这一节我会把建议尽量写成“能直接执行”的形式。

1. 线程池必须隔离

不要把所有异步任务都扔进一个池子。

建议至少按这几类拆：

核心业务查询池
日志/审计池
消息通知池
计算密集型任务池

这样做的意义在于：

防止慢任务拖死关键接口
故障域更清晰
监控更容易做

2. 为每个下游调用设置超时

没有超时的异步，本质上只是“换个地方卡住”。

推荐做法：

RPC/HTTP 客户端本身有超时
CompletableFuture 编排层再有超时
两层超时语义要一致

例如：

客户端读取超时 200ms
编排层总超时 300ms

不要反过来，否则超时控制会很混乱。

3. 非核心链路要允许降级

比如：

推荐结果
优惠券信息
用户画像标签
审计与埋点

这些通常可以：

返回默认值
返回空集合
异步补偿

但要注意边界：
支付、库存扣减、权限判断 这类关键路径，不能为了“快”而盲目降级。

4. `allOf` 之后别忘了取结果

很多人第一次用 allOf 会这样写：

CompletableFuture.allOf(f1, f2, f3).join();

以为这就完了。其实它只是表示“都完成了”，结果还在各自 future 里。

正确做法通常是：

CompletableFuture<Void> all = CompletableFuture.allOf(f1, f2, f3);
all.join();

String r1 = f1.join();
Integer r2 = f2.join();
Double r3 = f3.join();

如果你有批量聚合需求，可以封装一个工具方法统一处理。

5. 限制并发，不要对下游无脑放大流量

假设一个入口请求会并发调用 10 个下游，
当入口 QPS 是 1000 时，你可能瞬间制造出 1 万次下游请求/秒。

这就是典型的并发放大效应。

flowchart TD
    A[入口请求 QPS 1000] --> B[每次请求并发 10 个异步任务]
    B --> C[下游感知 QPS 10000]
    C --> D[线程池排队]
    D --> E[超时增加]
    E --> F[重试增多]
    F --> G[雪崩风险]

建议配套：

舱壁隔离
限流
熔断
重试预算控制
下游容量协同评估

6. 避免在异步线程里做阻塞式二次阻塞

比如这种写法很危险：

CompletableFuture.supplyAsync(() -> {
    return anotherFuture.get();
}, executor);

你本来是异步，结果又在异步线程里阻塞等待另一个异步。
这很容易导致线程池利用率恶化，甚至死锁式等待。

推荐直接编排：

future1.thenCompose(result -> future2(result))

而不是在中间 get()。

7. 日志、指标、Trace 要跟上

高并发异步最怕什么？
不是代码写不出来，而是出问题以后看不懂。

至少建议监控这些指标：

线程池活跃线程数
队列长度
拒绝次数
各异步步骤耗时
超时次数
降级次数
异常类型分布

如果能加上 traceId，把每一步打成结构化日志，排查效率会高很多。

8. 谨慎使用重试

异步 + 超时 + 重试，一不小心就会把下游打爆。

建议：

只对幂等读操作做有限重试
重试必须有上限
避免多个层级同时重试
超时后重试要考虑整体 SLA

我见过一种很危险的情况：
接口层超时重试一次，RPC 客户端又重试两次，网关还兜底重试一次。最终一次请求放大成了数倍流量，系统直接雪崩。

一个更通用的批量并发模板

如果你有“批量查多个资源，再聚合返回”的场景，可以参考这种模板。

import java.util.*;
import java.util.concurrent.*;
import java.util.stream.Collectors;

public class BatchTemplateDemo {

    public static void main(String[] args) {
        ExecutorService executor = Executors.newFixedThreadPool(8);

        List<Integer> ids = Arrays.asList(1, 2, 3, 4, 5);

        List<CompletableFuture<String>> futures = ids.stream()
                .map(id -> CompletableFuture.supplyAsync(() -> queryById(id), executor)
                        .completeOnTimeout("timeout-" + id, 200, TimeUnit.MILLISECONDS)
                        .exceptionally(ex -> "error-" + id))
                .collect(Collectors.toList());

        CompletableFuture<Void> all = CompletableFuture.allOf(
                futures.toArray(new CompletableFuture[0])
        );

        List<String> results = all.thenApply(v ->
                futures.stream().map(CompletableFuture::join).collect(Collectors.toList())
        ).join();

        System.out.println(results);
        executor.shutdown();
    }

    static String queryById(int id) {
        try {
            Thread.sleep(100L * id);
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        }
        return "data-" + id;
    }
}

这个模板适合：

批量查商品
批量查用户画像
批量查配置中心数据
聚合多个缓存源

但请记住：
批量并发不是无限并发。
如果 ids 很大，比如几千几万，必须加分片、限流或窗口化处理。

排查思路：线上异步流程变慢时怎么看

如果某条 CompletableFuture 链路变慢，我一般按这个顺序排查。

第一步：看线程池

关注：

活跃线程数是否打满
队列是否持续增长
是否有拒绝策略触发
线程名是否符合预期业务池

第二步：看每个异步节点耗时

不要只看总耗时，要拆开：

用户查询耗时
订单统计耗时
优惠券查询耗时
聚合耗时
审计耗时

很多时候真正慢的不是主链路，而是下游某个波动点。

第三步：看超时和降级比例

如果某个步骤的：

超时率升高
降级率升高
异常率升高

说明它已经成为瓶颈，或者下游容量不足。

第四步：看是否有阻塞等待

典型信号：

异步线程里大量 get()/join()
线程栈停在网络 I/O 或锁等待
任务互相依赖形成长等待链

第五步：看是否发生并发放大

入口流量变化不大，但下游流量暴增，通常意味着：

一个请求并发拆分太多
超时后又叠加重试
降级策略失效导致“硬扛”

边界条件：什么时候不建议用 CompletableFuture

这点也很重要。不是所有异步问题都该用它。

以下场景要谨慎：

1. 强依赖响应式全链路背压

如果你系统是流式处理、事件流消费、WebFlux 全栈响应式，
那 Reactor 往往比 CompletableFuture 更自然。

2. 流程过于复杂，状态机比链式更合适

如果有：

多分支条件
多次回滚
补偿事务
长生命周期状态迁移

这时更适合显式状态机或工作流引擎，而不是把一切都塞进 Future 链。

3. 团队对异步调试经验不足

CompletableFuture 不难学，但很考验排障能力。
如果团队还没有建立：

线程池规范
日志链路追踪
超时与降级约定
监控告警

那贸然大规模异步化，收益未必大于成本。

总结

CompletableFuture 在 Java 里最大的价值，不是“让代码看起来高级”，而是帮助我们把高并发下的异步流程表达清楚、控制住、收得回来。

你可以记住这几个关键点：

先画依赖关系，再写链式代码
独立任务并行，有依赖任务用 thenCompose 串联
永远显式指定线程池，不要滥用 commonPool
超时、异常、降级是设计的一部分，不是补丁
核心链路和旁路链路分离
监控线程池、耗时、超时率、降级率
并发会放大流量，要结合下游容量做设计

如果你现在要落地，我建议从一个典型聚合接口开始，小步改造：

先挑 2~3 个独立查询并行化
加上自定义线程池
加上超时和降级
做埋点监控
观察 RT、吞吐、错误率变化

这样比一次性把整条系统都异步化，要稳得多。

说到底，CompletableFuture 不是银弹，但在 Java 服务端里，它确实是一个非常值得掌握的中间层武器：既比 Future 强得多，又没有全量响应式那么重。
如果你的系统正在做接口聚合、异步优化、高并发治理，它通常是一个很现实、很有效的选择。