我花了一个月时间做了一款开源语音输入法 Typeflux,希望让每个人都能用上 Typeless 级别的体验

查看 80|回复 8
作者:mylxsw   
事情要从一篇产品体验说起。
年初第一次用到 Typeless,被它的效果震惊了。它能把你口语化、零散的表达转换成结构清晰的专业内容,用起来像是给大脑装了个翻译器。但它太贵了——按年订阅每月 12 美金,按月订阅要 30 美金。
当时我就想:能不能做一个自己的版本?
然后花了一个下午让 Codex 给我搭了个基本框架,居然跑起来了。但因为有其它项目在忙,就搁置了。
直到 3 月底,X 上突然涌现了大量关于语音输入法的讨论,闪电说、西瓜说、智谱语音输入法……那个时间节点让我重新把这个项目捡了起来。
其中智谱语音输入法(AutoGLM)的"人设"功能给了我很大启发——能为不同场景配置不同的指令集和写作风格,这个设计被我借鉴到了 Typeflux 的 Persona 系统里。在这里也记一笔致敬,他们是先把这个想法做成成熟产品的人。
最初我以为花一两天就能跑通。结果发现,做一个"能用的原型"和做一个"可以给别人用的产品"之间,差的是一个月的废寝忘食。
到今天,我终于把它发布出来了。
Typeflux 是什么?
一款开源的 macOS 菜单栏语音输入工具。按住快捷键说话,松开就把文字输入到当前任何 App 的光标位置。
但我对它的定位不仅仅是语音输入法。
我希望它成为一款桌面端的语音 Agent——不仅能帮你输入内容,还能改写、润色、基于桌面内容问答,通过语音控制电脑完成工作。Agent 功能目前在 Beta ,还在持续迭代中,但这是我最终想去的方向。




主要功能:
  • 按住快捷键说话,松开自动插入当前光标位置,无需切换窗口
  • 选中文字后用语音指令润色 / 翻译 / 缩写,LLM 直接替换选中内容
  • STT 支持:Apple Speech 、Whisper API / Groq 、本地模型( SenseVoice Small / WhisperKit Medium/Large / Qwen3-ASR )、阿里云实时 ASR / Qwen ASR 、豆包实时 ASR 、Google Cloud Speech 、多模态 LLM 、Typeflux Cloud
  • LLM 支持:OpenAI 兼容接口( 15+ 提供商:OpenAI 、Anthropic 、Gemini 、DeepSeek 、Kimi 、Qwen 、Zhipu 、MiniMax 、xAI 、Groq 等)+ Ollama 本地模型
  • 完全本地推理可选(本地语音模型 SenseVoice Small / WhisperKit Medium/Large / Qwen3-ASR + Ollama 本地大模型),不需要任何 API Key ,隐私友好
  • Persona 系统:为不同场景配置不同的指令集(设计灵感来自智谱语音输入法的人设功能)
  • 历史记录:每次对话存档,可回放音频、重新转录

    关于 Typeflux Cloud:
    同时上线了 Typeflux Cloud ,提供云端语音和大模型服务。早期测试阶段,目前完全免费
    后续如果推出会员服务,也会定价非常亲民。不想折腾的朋友直接注册账号,开箱即用。
    核心功能会一直开源,始终支持你自己配置任意语音模型和大语言模型,这是项目的根本基石,不会改变。
  • 项目地址: https://github.com/mylxsw/typeflux
  • 官方网站: https://typeflux.app

    我现在是全职独立开发者(开发的一些好玩儿的东西我会在 这里 发布,欢迎关注),这个项目也是我目前最重要的方向。欢迎大家试用、提问题、给建议。一起把它做好。

    语音输入法, 开源, agent

  • getadoggie   
    支持一下
    xiafuxin   
    前排支持,我觉得语音输入 是 ai 时代的 一个刚需。希望 op 能够越做越好!
    Echo28   
    typeless 引导印象太深刻了,都操作了至少 5 分钟,价格也是真贵
    mylxsw
    OP
      
    @getadoggie 谢谢支持
    mylxsw
    OP
      
    @xiafuxin 谢谢支持
    mylxsw
    OP
      
    @Echo28 而且还不能跳过引导,必须做完🤣
    xyovo999   
    支持
    mylxsw
    OP
      
    @xyovo999 感谢支持
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部