您的位置 首页 > 数码极客

[如何录制线上流量]如何录制线上课程…

线上流量

什么是录制线上流量回放

为什么需要录制线上流量回放

  • 项目大迭代更新,容易漏测,或者有很多没用评估到的地方。
  • 如果用线上流量做一次回归测试,可以进一步减少 bug 的风险。
  • 大大节省构造测试数据,或者构造测试数据脚本的时间,提高效率。

线上流量回放的限制是什么

  • 只回放 GET 请求

因为其他请求的回放,会对用户数据进行操作,有风险,需要排除。

除非构建多套备份数据库,但成本太高,不是很有必要。

  • 需要对比回放前后的流量

不然回放就没有意义了,你都不知道回放前后对比的差异是什么。

  • 需要去噪音

对比完了,对于一些类似时间戳的值,其实就是噪音,这些不一样很正常,我们需要剔除,不然差异没有价值。

由此可见,想要正确打开线上流量录制回放,需要解决很多问题。

而重中之重,就是 diff。

回放差异 diff

diff 实现对比和去噪

demo 实现

docker-compose

version: '2' services: http-demo-record: image: shaonian/http-demo:gor-test-v2.9 ports: - "8080:8080" http-demo-replay-old: image: shaonian/http-demo:diff-old-1 http-demo-replay-old-noise: image: shaonian/http-demo:diff-old-2 http-demo-replay-new: image: shaonian/http-demo:diff-new diff: image: shaonian/di command: - -candidate=http-demo-replay-new:8080 - -master.primary=http-demo-replay-old:8080 - -master.secondary=http-demo-replay-old-noise:8080 - - - -serviceName='Diff Test' - -proxy.port=:8880 - -admin.port=:8881 - -http.port=:8888 - -rootUrl=localhost:8888 - -;your@email.com' ports: - "8881:8881" - "8888:8888"

diff 效果

diff 限制

diff 的归类有问题。

因为 url 能携带各种各样的 param,所以 diff 设计里面不会直接把 url 作为归纳名,需要通过在请求的 header 里面增加 Canonical-Resource: http-demo 来设置。

这就出来一个问题,线上转发的流量,无法根据具体的路由来动态设置归纳名,只能统一设置成是一个服务的,比如 http-demo 这样,但是我这个 http-demo 下有很多 api,出来的差异具体是哪一个 api 呢,我也不知道,得看返回字段去猜,就很华而不实。

所以做到这里,只能自嗨,无法落地到实际项目中,想要真正落地,这一步也是一定一定要解决的!

缺陷

以上实现的方法总结起来,就是把录制 gor 组件写进 Dockerfile,并在项目运行的时候,实时录制线上流量,转发到测试环境,然后进行 diff 去噪对比。

但是这样就大功告成了吗?

并没有。

还有几个问题需要自我反问一下。

  • 我们真的需要实时录制转发吗?

其实不需要。

我们只是希望能够录制线上请求,然后根据再迭代之后用来回放测试。

如果开启实时回放,会在我们不需要测试的时候,浪费服务器的性能和资源。

  • 线上录制的回放,真的就代表全部场景吗?

其实也不对。

用户不一定不触发的场景,其实我们也需要覆盖。

录制只是让我们更容易更便捷生成测试数据而已。

  • 线上录制会有性能损耗吗?

或多或少都有影响,毕竟 gor 和 服务处于同一个容器中。

所以三个反问以后,我们的需求逐渐明确了。

我们需要一个不会影响线上服务性能的,又能快速生成测试数据回放,并且能自定义补全更多场景的测试回放。

同时,我们还需要解决 diff 的路由智能匹配的问题。

这样可以吗?

我觉得可以。

尝试的解决方案

可以通过复制粘贴人为构造回放所需的测试数据日志

上图是录制流量以后保存的 log 文件,我们可以清楚看到它的结构,所以这是不是意味着,只要我们写出来这份相同格式的 log,我们就能直接凭借这份 log 来回放呢?

对的。

此外,这个 log 里面,你可以直接根据具体的 url,设置好相应的 Canonical-Resource,就直接解决了 diff 路由归纳名的问题。

而且,我们根本不需要真的到线上去录制,伪造一份这样格式的 log,甚至还可以直接修改补全一些没有的场景进去,就可以直接以此为范本,作为回放 log 的效果了。

这样也根本不需要担心线上录制会影响线上服务器的性能和资源。

解决所有问题以后,还有什么不优雅的地方

那 log 我也得复制粘贴去生成,而且 log 里面的时间戳排序,我也得自己造,这样看似方便,其实只是方便了不用手写代码来编造测试数据,可以直接通过编写 log 就能回放流量。

也就是,这样的方案,只是降低了测试技术栈的门槛,提高了一点点的效率。

而且还有个问题,很多的数据,我其实是动态生成的,我传进去之前,还得通过其他接口去获取返回值,再动态填进去,这样写 log 并不能实现啊。

还有,很多参数也有时效问题,过段时间 token 过期了,我替换 token 也很麻烦。

就算,设置成万能的 token,那涉及到用户的数据,比如有些业务场景 token 里面包含了某类用户具体信息的时候,万能 token 就不管用了,因为有很多自定义的数据要去测。

所以,看似解决完所有技术栈问题以后,其实还有很多业务问题,导致它使用场景有限,甚至无法完全落地。

正确打开方式

为什么要拘泥于用线上流量来回放呢?

如果我的脚本能够批量构造大量且覆盖众多场景,且可高度自定义的请求,再将这些请求直接去请求 diff,不就能直接对比出前后有什么差异吗?

何况,就算我的内部 rpc 服务调用更改,变得更加复杂,但是暴露在外给用户的业务操作,是不会发生大改的。

而且此前,基于项目 shaonian/boomer_locust 的压测工具,我之前已经实现了全链路压测的业务逻辑覆盖。

所以这里完全可以引出一个全新的概念,用可控速度的压测工具,以及高度灵活的编程脚本,实现大批量构造测试数据,模拟业务场景压力,并直接实现前后对比差异的不同。

因为数据全部都是新构造好的,所以不止 GET 请求我可以做,POST PUT DELETE 请求我也可以,因为数据都是我构造上传的,如果在测试环境中,完全删掉都不会有影响,而且只要设置好前后的测试脏数据的清理,其实线上数据库都能做。(当然,直接做到 stage 环境数据库就可以了,prod 没必要。)

进一步完善

既然正确打开了前后版本的快速 diff 测试,那么如何进一步完善呢?

当然是提高脚本的业务覆盖场景,已经代码覆盖率。

如何判断自己的构造回归流量,尽可能覆盖完全呢?

我们可以引入代码的实时染色,在本地就先测好覆盖率,再去部署上线。

这个代码实时染色,可以基于 goc 在 vscode 的插件来实现。

至此,快速构造测试数据,对比前后版本的方案成型,且可根据业务定制脚本,可落地实现,真正意义上地实现回归 diff 测试。

由此为基础以后,下一步,当然就是精准化测试,也是未来测试的大势所趋。

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“如何录制线上流量,如何录制线上课程,如何录制线上视频,如何获取线上流量,如何线上充流量”边界阅读