某网站wasm md5简单分析

查看 155|回复 9
作者:我是不会改名的   
某网站wasm md5逆向分析
目标网站:aHR0cHM6Ly93d3cuaXFpeWkuY29tL3ZfMXIxb2JoanRpNTguaHRtbA==
目标参数:&vf=
一扣代码
下一个xhr断点

往回找堆栈,发现核心部分在mmc里面,下个断点刷新跟进去

传入参数就是链接去头去尾,返回字符串长32

跟进去,看起来就一个简单的webpack
(window.iqiyiPlayerJSONPCallback = window.iqiyiPlayerJSONPCallback || []).push([[1], {
    1089: function(module, exports, __webpack_require__) {
    ...............
    },
    576: function(x, a, e) {
        var i;
        i = function(x, a, i) {
            var r = e(1089)
              , c = null;
            i.exports = {
                setEngine: function(x) {
                    c = x
                },
                mmcd: r.mmcd,
                mmc: function() {
                    var x = c && c.sbtr;
                    x && x.authkeyInvoking();
                    var a = r.mmc.apply(r, arguments);
                    return x && x.authkeyInvoked(),
                    a
                }
            }
        }
    }
}]);
关键函数就是1089里面的mmc,直接扣下来,因为没有依赖其他文件直接拿下来就行了,简单运行一下


结果就是不一样,说明很可能检测了环境,直接上v神插件
插件地址:https://github.com/cilame/v_jstools

检测了一些简单的东西

点击生成临时环境,复制到文件开头

根据报错修改代码

测试结果完全一致

算法还原
首先是一个简单的ob混淆,随便找个开源的就能还原

然后删除虚假分支,我用的蔡老板插件

然后删除无用代码,找大妈

从还原后的代码可以依稀看出来,是wasm,只不过并没有看到有wasm文件,它是直接编译成了asm.js

通常最简单的命令是
emcc main.cpp -s WASM=1 -o main.js
要想不输出wasm,而是转成asm.js.把WASM=1 改成WASM=0
除此之外,它还将异步加载改为了同步-s WASM_ASYNC_COMPILATION=0;
如果是异步加载,直接运行会报错
最常见的报错就是
TypeError: Cannot read properties of undefined (reading 'apply')
主要原因就是,异步加载asm没有赋值,也就是c导出函数与js没完成交互

既然是wasm,那么环境检测很可能不在wasm,而是在导入函数中,目前遇到的检测,有直接导入检测函数,有把eval导入,wasm里面存有部分检测代码,除此之外,由于go自带js的特殊性,给人一种感觉可以直接获取环境,实际上还是通过js交互的
目标网站就属于第一种导入函数

导入了很多函数,一个个分析发现,只要au返回6就行
function aU() {
    return 6
}

测试和网站一样,基本准备工作就完成了
返回值是32位很可能是md5,搜索一下关键字

然后就没有然后了

还原是不可能还原的,这辈子都不可能的
从初始化的值没看出有什么魔改,找一份标准的md5,有很明显的特征,16*轮循环,把每次的case打印出来,简单画一个图

把出现16次的打印一下
import numpy as np
from matplotlib import pyplot as plt
from collections import Counter
from t import data
counts = Counter(data)
valid_data_points = {key for key, value in counts.items() if value == 16}
filtered_data = np.array([point for point in data if point in valid_data_points])
plt.plot(filtered_data)
plt.show()
很明显有4次16轮循环

101,80,25,-117,-98,96,88,17,
第一轮核心部分就这些
101
                        case 101: {
                                v = $x & ~Rx | Qx & Rx,
                                Ex = sa + -1 | 0,
                                s = 80,
                                Ex = Ex >> 2,
                                f = v,
                                ta = na,
                                v = (v + (Ux & -2) & -2 | Ux & 1) + (v & 1) | 0,
                                g = aa + ((ia | 0) % 16 | 0) | 0;
                            break
                        }
就对应着
(b & c) | ((~b) & d) 以及safe_add(a, q)
                       case 80: {
                                s = sa + 32 | 0,
                                    s = (g | 0) > (s >> 2 | 0) ? 36 : 25;
                                break
                            }
                       case 25: {
                            s = (g | 0) > (Tx | 0) ? 136 : 139;
                            break
                        }
                       case -117: {
                                s = (g | 0) == (Tx | 0) ? 166 : 158;
                                break
                            }
                      case -98: {
                                s = (g | 0) > (Tx + 1 | 0) ? 83 : 96;}
                      case 96: {
                                s = 88,
                                    f = c[G + (g > 2] | 0;
                                break
                            }
​                           
看起来没啥用
                        case 88: {
                            Ex = ca + (ia > 1,
                                g = _i64Add(c[Ex >> 2] | 0, c[Ex + 4 >> 2] | 0, _bitshift64Shl(g | 0, ((g | 0) > 31 | 0, 1) | 0, w() | 0) | 0,
                            w() | 0,
                                g = (f & 1) + g | 0,
                                Ex = (g + (v & -2) & -2 | v & 1) + (g & 1) | 0,
                                f = ((ia | 0) % 4 | 0) * 5 | 0,
                                ta = f + 7 | 0,
                                f = 25 - f | 0,
                                f = Ex >> f : Ex),
                                s = 17,
                                Vx = $x,
                                Fx = (f + (Rx & -2) & -2 | Rx & 1) + (f & 1) | 0,
                                _x = Rx,
                                xa = Qx,
                                ra = ia + 1 | 0,
                                ma = ka;
                            break
                        }
88就是最核心的了,看不懂不重要,其中f就是加密的数据,保存下来跑一下

添加一个日志点,保存数据

from Crypto.Util.number import long_to_bytes
d = [1935762479, 1819557736, ''']
datas = b""
for i in d:
    datas += long_to_bytes(i)[::-1]
print(datas)
去除填充转成字符串,随便找个在线网站试一下,很好说明只是加盐了,只是加的有一点点离谱

总结
总的来说,相对还是不难,比某迅的vmp加wasm简单一点,环境监测有但不多,有混淆相当于没有(蔡老板yyds),主要是控制流烦人,我这里取巧了,大佬们直接还原就行了
除此之外,app,TV端用的应该是同一套代码还原基本一致,trace代码,找到添加数据位置,拿出来就行了,只是TV端同一个src可能有
两个盐,主要是qd_v不一样。

bj.7z
(1.3 MB, 下载次数: 75)
2023-9-21 22:52 上传
点击文件名下载附件
下载积分: 吾爱币 -1 CB


代码, 函数

liangjinwuxin   

tql!请速速删掉,让我来发
gallon   

可以,原来还有检测环境的说法啊。这个厉害
yiyuh95   

大佬已经开始注入了,我还不懂是什么呢
xixicoco   

大佬,为啥我根据你教程拿到那个盐值后后面跟着好几个\x的十六进制数据,这个去掉与不去掉结果都不正确哎,求大佬再指点一下,给个提示
naturewonder   

太强了,牛逼
ttyer   

怎么判断加盐那块还不是很清楚,烦请楼主指导下
Castlana   

记录一下。番茄下载失效了。能站内消息指导一下吗?
mxywwtml   

这个厉害,
gallon   

一头雾水
您需要登录后才可以回帖 登录 | 立即注册

返回顶部