llama.cpp 看你的模型要求了,如果经常试新模型,新模型又用了新的算子…… gpt-oss 为例 sycl 版本 12 月中旬的时候我记得是不能跑还是很慢,因为有算子不支持,会把相关操作退化为 cpu 操作,最近看有 issue 处理,不清楚现状。 valkan 版本能跑,推理速度能用的程度,算子支持速度还行,不过相对 sycl 有折扣。 @after1990s