给 PWART(WebAssembly 的 JIT 轻量运行时)增加了性能测 ...

之前写了一个 WebAssembly 的轻量运行时 PWART( https://github.com/partic2/pwart , https://gitee.com/partic/pwart )，感觉 Bug 应该修差不多了，就在前两天做了一次简单的性能测试。在这次性能测试中，发现一些有趣的地方，先放测试结果。
[td][/td]
[td]GCC (-O2)[/td]
[td]PWART (fixed memory)[/td]
[td]PWART (dynamic memory)[/td]
[td]TinyCC[/td]
[td]V8(Chrome v113)[/td]
Windows10 x86_64
2823ms
3622ms
2720ms
6330ms
2618ms
Linux aarch64
1561ms
1997ms
2079ms
7681ms
1465ms
32 位 arm 的也稍测了下，PWART 耗时大约在 GCC -O2 的两倍，tinycc 是 GCC -O2 的三倍。32 位 x86 PWART 耗时大概在 GCC -O2 的 1.5 倍左右。
WebAssembly 里需要一段线性地址空间作为内存，PWART 就在进入函数时，将线性内存的基地址保存到局部变量，最开始因为局部变量较多，内存基址被挤到内存栈上了，每次 WASM 访问内存，都要从内存栈取出值加上偏移，此时耗时只有 2900ms 左右，后来我把内存基址固定放到寄存器中，耗时居然就增加到 3622ms ，让人十分摸不着头脑，不过在 32 位 arm 上测试这样是有 8%左右性能提升的。还有上表中，dynamic memory 模式需要每次函数返回时更新内存基址，按理来说是额外消耗，结果在 x86_64 上耗时竟然缩短了，不知道 x86 上究竟是有什么黑魔法。
虽然能理解，但我还是对 WebAssembly 不出指针类型耿耿于怀，在 JIT 实现和 API 设计上都能简单很多，虽然有 ref 特性，但感觉目前 ref 的设计比起指针还是麻烦不少，目前也不存在指向内存空间的 ref 。
性能优化还是挺难做的，有很多细节要考虑，而且不知道怎么分析性能关键点，有大佬有相关经验可以分享一下。

给 PWART(WebAssembly 的 JIT 轻量运行时)增加了性能测试

浏览过的版块

热门主题

stash 耗电异常

关于 AI 算命，在一位正一派的道长指导下，

花 2 月写了一款软件，结果 claude code ro

偶然看到以前写的东西，怀念没被 AI 浸润过

微信 Mac 版最新版，你们没发觉吗？实时调

现在很多技术活，是不是已经开始被 AI 吃掉

v2ex 网站右边的未读提醒上面的那个横线是

把自己的 Android 手机，接入 Phones Cloud

4414老铁们有人膝盖疼吗？膝盖检查拍片子没

公众号6月1号到15号账单，有点拉了

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则