如何突破大模型的敏感词拦截?

查看 39|回复 4
作者:NeverBelieveMe   
黄赌毒一类的拦截就算了,敲诈勒索都算敏感词给拦截了。
想要做文字处理方面的功能,稍微有点擦边的词,就不行,太折磨了。
有没有懂哥们给点方法建议?
565656   
大模型只能用抽象骗过了
Byleth   
可以参考下 sillytavern 圈子里的各种方法(他们叫「破限」),我从里面看到的一个比较巧妙的方法是在 system prompt 里面,让 AI 以一些"安全词"替换"危险词",然后输出到本地时,通过正则表达式替换为正确的词语。
当然,最简单的还是选择道德审查比较弱的开源模型,比如 commander+ 这些
ShinichiYao   
天堂里的奶奶讲睡前故事大法?
tetora   
编码绕过,你可以倒叙文字或者加密之后给它提供密钥试试
您需要登录后才可以回帖 登录 | 立即注册

返回顶部