我认为有,更大众的语言,更容易命中训练语料。 举个极端的例子,比如要求 LLM 不用任何库,手搓一个堆排序。一个用现代的 go/python ,另一个用上古时期的 COBOL 。 我猜测后者几乎没有什么训练的资料,会需要更多的 token 才能写出来,甚至还需要反复试错。