关于我做了一个自嗨的语音助手,愿景是小白也能通过自然语言轻松操控电脑或手机(跪求大佬指点)

查看 27|回复 2
作者:jayn1985   
因为市面上没有一个真正好用的语音助手,帮助我释放双手,并且现在主流的智能体助手,像豆包,Gemini 等,因为过于通用化而显得有时候很弱智和胡说八道,也出于对童年魔幻手机里的傻妞这样的人工智能的憧憬,所以自嗨了一个语音智能体
  这个智能体能够记得我上次的对话,熟悉我的情绪,不会一味的附和我,甚至在我偷懒提问时直接“怼”我,引导我独立思考,会不会组成一个真正的伙伴
  它能够扮演任何角色,导师,朋友,商业精英等等(计划中)
  它还能根据对话推理你下达的任务与期望的目标
  它能经过同意,操控电脑或手机,如清理垃圾,打开应用,使用应用(下单淘宝购物,剪辑视频)(计划中,成本爆炸)
  现阶段已完成一部分,暂时没放服务器里
  目前一个人/小团队全栈开发,有些技术方案可能是“能跑就行”,跪求大家多提意见(啥意见都行):
  关于记忆的 TTL 和置信度算法:目前是基于规则的简单衰减,在大佬做长期记忆检索( RAG )时,有没有更轻量、更智能的本地管理或图数据库推荐?
  IPC 通信的流畅性:Node.js 和 Python 之间传音频目前采用了“传本地文件路径 + TCP Socket 传 JSON”的方案,感觉还是有点,有没有更好的本地跨进程通信最佳实践?
  在 MVP 阶段,大佬们觉得哪些功能是伪需求,应该断断续续聚焦核心吗

语音助手, 智能体, 开发

cpstar   
你说的可是 openclaw+遥控器 skill ?
亦或者是粗粮或者水果乃至遥遥领先的全家桶?
cpstar   
不好意思,想成家电了。
但是遥控电脑和手机,不更是虾或者马么
您需要登录后才可以回帖 登录 | 立即注册

返回顶部