在 Spring 5 中调试 Reactive Streams

qianmoQ

案例概述

调试Reactive Streams可能是我们开始使用这些数据结构后必须面对的主要挑战之一。

考虑到Reactive Streams在过去几年中越来越受欢迎，了解我们如何有效地执行此任务是个好主意。

让我们首先使用Reactive Streams设置项目，看看为什么这通常很麻烦。

带有错误的场景

我们想要模拟一个实际情况，其中运行了几个异步进程，并且我们在代码中引入了一些最终会触发异常的缺陷。

为了理解全局，我们将提到我们的应用程序将使用和处理简单Foo对象流，这些对象只包含id、formattedName和quantity字段。

分析日志输出

现在，让我们检查一个片段以及当出现未处理的错误时它生成的输出：

public void processFoo(Flux<Foo> flux) {
    flux = FooNameHelper.concatFooName(flux);
    flux = FooNameHelper.substringFooName(flux);
    flux = FooReporter.reportResult(flux);
    flux.subscribe();
}
 
public void processFooInAnotherScenario(Flux<Foo> flux) {
    flux = FooNameHelper.substringFooName(flux);
    flux = FooQuantityHelper.divideFooQuantity(flux);
    flux.subscribe();
}

运行我们的应用程序几秒钟后，我们会看到它会不时记录异常。

仔细查看其中一个错误，我们会发现类似于此的内容：

Caused by: java.lang.StringIndexOutOfBoundsException: String index out of range: 15
    at j.l.String.substring(String.java:1963)
    at com.baeldung.debugging.consumer.service.FooNameHelper
      .lambda$1(FooNameHelper.java:38)
    at r.c.p.FluxMap$MapSubscriber.onNext(FluxMap.java:100)
    at r.c.p.FluxMap$MapSubscriber.onNext(FluxMap.java:114)
    at r.c.p.FluxConcatMap$ConcatMapImmediate.innerNext(FluxConcatMap.java:275)
    at r.c.p.FluxConcatMap$ConcatMapInner.onNext(FluxConcatMap.java:849)
    at r.c.p.Operators$MonoSubscriber.complete(Operators.java:1476)
    at r.c.p.MonoDelayUntil$DelayUntilCoordinator.signal(MonoDelayUntil.java:211)
    at r.c.p.MonoDelayUntil$DelayUntilTrigger.onComplete(MonoDelayUntil.java:290)
    at r.c.p.MonoDelay$MonoDelayRunnable.run(MonoDelay.java:118)
    at r.c.s.SchedulerTask.call(SchedulerTask.java:50)
    at r.c.s.SchedulerTask.call(SchedulerTask.java:27)
    at j.u.c.FutureTask.run(FutureTask.java:266)
    at j.u.c.ScheduledThreadPoolExecutor$ScheduledFutureTask
      .access$201(ScheduledThreadPoolExecutor.java:180)
    at j.u.c.ScheduledThreadPoolExecutor$ScheduledFutureTask
      .run(ScheduledThreadPoolExecutor.java:293)
    at j.u.c.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    at j.u.c.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at j.l.Thread.run(Thread.java:748)

基于根本原因，并注意到堆栈跟踪中提到的FooNameHelper类，我们可以想象在某些情况下，我们的Foo对象正在使用比预期更短的formattedName 值进行处理。

当然，这只是一个简化的案例，解决方案似乎相当明显。

但是让我们假设这是一个真实案例场景，如果没有一些上下文信息，异常本身并不能帮助我们解决问题。

异常是作为processFoo或processFooInAnotherScenario方法的一部分触发的吗？

在到达此阶段之前，其他前面的步骤是否影响了formattedName字段？

日志条目无法帮助我们找出这些问题。

更糟糕的是，有时甚至不会从我们的功能中抛出异常。

例如，假设我们依赖反应式存储库来保存我们的Foo对象。如果此时错误上升，我们甚至可能不知道从哪里开始调试代码。

我们需要工具来有效地调试反应流。

使用调试会话

确定我们的应用程序正在发生什么的一个选项是使用我们喜欢的IDE启动调试会话。

我们必须设置几个条件断点，并在流中的每个步骤执行时分析数据流。

实际上，当我们有大量的被动进程在运行和共享资源时,这可能是一项繁琐的任务。

此外，在许多情况下，出于安全原因，我们无法启动调试会话。

使用doOnError方法或使用订阅参数记录信息

有时，我们可以通过提供Consumer作为subscribe方法的第二个参数来添加有用的上下文信息：

public void processFoo(Flux<Foo> flux) {
 
    // ...
 
    flux.subscribe(foo -> {
        logger.debug("Finished processing Foo with Id {}", foo.getId());
    }, error -> {
        logger.error(
          "The following error happened on processFoo method!",
           error);
    });
}

注意：值得一提的是，如果我们不需要对subscribe方法进行进一步处理，我们可以在发布者上链接doOnError函数：

flux.doOnError(error -> {
    logger.error("The following error happened on processFoo method!", error);
}).subscribe();

现在我们将对错误的来源提供一些指导，即使我们仍然没有太多关于生成异常的实际元素的信息。

激活Reactor的全局调试配置

Reactor库提供了一个hook类，它允许我们配置Flux和Mono操作符的行为。

通过添加以下语句，我们的应用程序将检测对发布者方法的调用，包装运算符的构造，并捕获堆栈跟踪：

Hooks.onOperatorDebug();

这样就可以默认启用Thymeleaf - 无需额外配置。
调试模式激活后，我们的异常日志将包含一些有用的信息：

16:06:35.334 [parallel-1] ERROR c.b.d.consumer.service.FooService
  - The following error happened on processFoo method!
java.lang.StringIndexOutOfBoundsException: String index out of range: 15
    at j.l.String.substring(String.java:1963)
    at c.d.b.c.s.FooNameHelper.lambda$1(FooNameHelper.java:38)
    ...
    at j.l.Thread.run(Thread.java:748)
    Suppressed: r.c.p.FluxOnAssembly$OnAssemblyException: 
Assembly trace from producer [reactor.core.publisher.FluxMapFuseable] :
    reactor.core.publisher.Flux.map(Flux.java:5653)
    c.d.b.c.s.FooNameHelper.substringFooName(FooNameHelper.java:32)
    c.d.b.c.s.FooService.processFoo(FooService.java:24)
    c.d.b.c.c.ChronJobs.consumeInfiniteFlux(ChronJobs.java:46)
    o.s.s.s.ScheduledMethodRunnable.run(ScheduledMethodRunnable.java:84)
    o.s.s.s.DelegatingErrorHandlingRunnable
      .run(DelegatingErrorHandlingRunnable.java:54)
    o.u.c.Executors$RunnableAdapter.call(Executors.java:511)
    o.u.c.FutureTask.runAndReset(FutureTask.java:308)
Error has been observed by the following operator(s):
    |_    Flux.map ⇢ c.d.b.c.s.FooNameHelper
            .substringFooName(FooNameHelper.java:32)
    |_    Flux.map ⇢ c.d.b.c.s.FooReporter.reportResult(FooReporter.java:15)

我们可以看到，第一部分保持相对相同，但以下部分提供了有关以下内容的信息：

发布者的程序集跟踪 - 这里我们可以确认错误最初是在processFoo方法中生成的。
在第一次触发错误之后观察到错误的运算符，以及链接它们的用户类。

注意：在这个例子中，主要是为了清楚地看到这一点，我们在不同的类上添加操作。

我们可以随时打开或关闭调试模式，但它不会影响已经实例化的Flux和Mono对象。

在不同的线程上执行运算符

要记住的另一个方面是即使在流上运行不同的线程，也会正确生成程序集跟踪。

我们来看看下面的例子：

public void processFoo(Flux<Foo> flux) {
    flux = flux.publishOn(Schedulers.newSingle("foo-thread"));
    // ...
 
    flux = flux.publishOn(Schedulers.newSingle("bar-thread"));
    flux = FooReporter.reportResult(flux);
    flux.subscribeOn(Schedulers.newSingle("starter-thread"))
      .subscribe();
}

现在，如果我们检查日志，我们会理解在这种情况下，第一部分可能会稍微改变，但最后两部分保持相同。

第一部分是线程堆栈跟踪，因此它只显示特定线程执行的操作。

正如我们所看到的，当我们调试应用程序时，这不是最重要的部分，因此这种更改是可以接受的。

在单个进程上激活调试输出

在每个单一的反应过程中检测和生成堆栈跟踪都是昂贵的。

因此，我们应该只在关键情况下实施前一种方法。

无论如何，Reactor提供了一种在单个关键进程上启用调试模式的方法，这样可以减少内存消耗。

我们指的是检查点操作员：

public void processFoo(Flux<Foo> flux) {
     
    // ...
 
    flux = flux.checkpoint("Observed error on processFoo", true);
    flux.subscribe();
}

请注意，以这种方式，将在检查点阶段记录程序集跟踪：

Caused by: java.lang.StringIndexOutOfBoundsException: String index out of range: 15
    ...
Assembly trace from producer [reactor.core.publisher.FluxMap],
  described as [Observed error on processFoo] :
    r.c.p.Flux.checkpoint(Flux.java:3096)
    c.b.d.c.s.FooService.processFoo(FooService.java:26)
    c.b.d.c.c.ChronJobs.consumeInfiniteFlux(ChronJobs.java:46)
    o.s.s.s.ScheduledMethodRunnable.run(ScheduledMethodRunnable.java:84)
    o.s.s.s.DelegatingErrorHandlingRunnable.run(DelegatingErrorHandlingRunnable.java:54)
    j.u.c.Executors$RunnableAdapter.call(Executors.java:511)
    j.u.c.FutureTask.runAndReset(FutureTask.java:308)
Error has been observed by the following operator(s):
    |_    Flux.checkpoint ⇢ c.b.d.c.s.FooService.processFoo(FooService.java:26)

我们应该在反应链的末尾实施检查点方法。

否则，操作员将无法观察下游发生的错误。

另外，请注意，库提供了重载方法。我们可以避免：

如果我们使用no-args选项，则指定观察到的错误的描述
通过仅提供自定义描述来生成填充堆栈跟踪（这是最昂贵的操作）

记录元素序列

最后，Reactor发布商提供了一种在某些情况下可能会派上用场的方法。

通过在我们的反应链中调用log方法，应用程序将使用它在该阶段具有的状态记录流中的每个元素。

让我们在我们的例子中尝试一下：

public void processFoo(Flux<Foo> flux) {
    flux = FooNameHelper.concatFooName(flux);
    flux = FooNameHelper.substringFooName(flux);
    flux = flux.log();
    flux = FooReporter.reportResult(flux);
    flux = flux.doOnError(error -> {
        logger.error("The following error happened on processFoo method!", error);
    });
    flux.subscribe();
}

并检查日志：

INFO  reactor.Flux.Map.1 - onSubscribe(FluxMap.MapSubscriber)
INFO  reactor.Flux.Map.1 - request(unbounded)
INFO  reactor.Flux.Map.1 - onNext(Foo(id=0, formattedName=theFo, quantity=8))
INFO  reactor.Flux.Map.1 - onNext(Foo(id=1, formattedName=theFo, quantity=3))
INFO  reactor.Flux.Map.1 - onNext(Foo(id=2, formattedName=theFo, quantity=5))
INFO  reactor.Flux.Map.1 - onNext(Foo(id=3, formattedName=theFo, quantity=6))
INFO  reactor.Flux.Map.1 - onNext(Foo(id=4, formattedName=theFo, quantity=6))
INFO  reactor.Flux.Map.1 - cancel()
ERROR c.b.d.consumer.service.FooService 
  - The following error happened on processFoo method!
...

我们可以在此阶段轻松查看每个Foo对象的状态，以及在异常发生时框架如何取消流。

当然，这种方法也很昂贵，我们必须适度使用它。

案例结论

如果我们不知道正确调试应用程序的工具和机制，我们可能会花费大量时间和精力来解决问题。

如果我们不习惯处理被动和异步数据结构，那么尤其如此，我们需要额外的帮助来弄清楚事情是如何工作的。

小助手

在Spring 5中调试Reactive Streams这个话题引起了很多讨论。一方面，有人认为Reactive Streams的调试并不容易，特别是当项目处于复杂的并发环境时。这些人认为，Reactive Streams的设计追求高性能和响应性，可能会牺牲可调试性。他们提出了一些问题，例如，如何追踪事件的流动，如何定位问题的根源以及如何在异步环境中调试代码？

另一方面，也有人表示感谢Spring 5对于调试Reactive Streams的改进。他们指出，Spring 5提供了一些方便的工具和功能，使得调试Reactive Streams变得更加容易。例如，Spring 5引入了一种名为"ReactorDebugAgent"的工具，它可以通过在项目启动时添加JVM参数来启用，从而提供更详细的事件日志和调试信息。此外，Spring 5还加入了更多的断点和调试支持，使得开发人员可以更方便地跟踪和调试Reactive Streams。

这些讨论引起了社区中一些资深Spring开发者的参与。他们分享了他们在实际项目中调试Reactive Streams的经验和建议。有人建议使用ReactorDebugAgent工具，并充分利用其提供的事件日志和调试信息。其他人还建议使用IDE的断点和调试功能来跟踪和调试Reactive Streams的代码。他们还提到了一些常见的调试问题和解决方案，例如如何处理处理器的异常，如何处理事件流的错误以及如何检查事件的顺序和时间戳。

总的来说，关于在Spring 5中调试Reactive Streams的讨论是充满争议和值得感谢的。一些人认为调试Reactive Streams很困难，需要借助工具和技术来帮助解决问题。另一些人则感谢Spring 5提供的改进和工具，使得调试Reactive Streams变得更加容易。讨论中引入了一些经验和建议，有助于开发人员更好地理解和处理Reactive Streams的调试问题。