我花了一个月时间做了一款开源语音输入法 Typeflux，希 ...

作者：mylxsw 发布时间：2026-4-27 08:45:23

事情要从一篇产品体验说起。
年初第一次用到 Typeless，被它的效果震惊了。它能把你口语化、零散的表达转换成结构清晰的专业内容，用起来像是给大脑装了个翻译器。但它太贵了——按年订阅每月 12 美金，按月订阅要 30 美金。
当时我就想：能不能做一个自己的版本？
然后花了一个下午让 Codex 给我搭了个基本框架，居然跑起来了。但因为有其它项目在忙，就搁置了。
直到 3 月底，X 上突然涌现了大量关于语音输入法的讨论，闪电说、西瓜说、智谱语音输入法……那个时间节点让我重新把这个项目捡了起来。
其中智谱语音输入法（AutoGLM）的"人设"功能给了我很大启发——能为不同场景配置不同的指令集和写作风格，这个设计被我借鉴到了 Typeflux 的 Persona 系统里。在这里也记一笔致敬，他们是先把这个想法做成成熟产品的人。
最初我以为花一两天就能跑通。结果发现，做一个"能用的原型"和做一个"可以给别人用的产品"之间，差的是一个月的废寝忘食。
到今天，我终于把它发布出来了。
Typeflux 是什么？
一款开源的 macOS 菜单栏语音输入工具。按住快捷键说话，松开就把文字输入到当前任何 App 的光标位置。
但我对它的定位不仅仅是语音输入法。
我希望它成为一款桌面端的语音 Agent——不仅能帮你输入内容，还能改写、润色、基于桌面内容问答，通过语音控制电脑完成工作。Agent 功能目前在 Beta ，还在持续迭代中，但这是我最终想去的方向。

主要功能：

按住快捷键说话，松开自动插入当前光标位置，无需切换窗口

选中文字后用语音指令润色 / 翻译 / 缩写，LLM 直接替换选中内容

STT 支持：Apple Speech 、Whisper API / Groq 、本地模型（ SenseVoice Small / WhisperKit Medium/Large / Qwen3-ASR ）、阿里云实时 ASR / Qwen ASR 、豆包实时 ASR 、Google Cloud Speech 、多模态 LLM 、Typeflux Cloud

LLM 支持：OpenAI 兼容接口（ 15+ 提供商：OpenAI 、Anthropic 、Gemini 、DeepSeek 、Kimi 、Qwen 、Zhipu 、MiniMax 、xAI 、Groq 等）+ Ollama 本地模型

完全本地推理可选（本地语音模型 SenseVoice Small / WhisperKit Medium/Large / Qwen3-ASR + Ollama 本地大模型），不需要任何 API Key ，隐私友好

Persona 系统：为不同场景配置不同的指令集（设计灵感来自智谱语音输入法的人设功能）

历史记录：每次对话存档，可回放音频、重新转录

关于 Typeflux Cloud：
同时上线了 Typeflux Cloud ，提供云端语音和大模型服务。早期测试阶段，目前完全免费。
后续如果推出会员服务，也会定价非常亲民。不想折腾的朋友直接注册账号，开箱即用。
核心功能会一直开源，始终支持你自己配置任意语音模型和大语言模型，这是项目的根本基石，不会改变。

项目地址： https://github.com/mylxsw/typeflux

官方网站： https://typeflux.app

我现在是全职独立开发者（开发的一些好玩儿的东西我会在这里发布，欢迎关注），这个项目也是我目前最重要的方向。欢迎大家试用、提问题、给建议。一起把它做好。

语音输入法, 开源, agent

我花了一个月时间做了一款开源语音输入法 Typeflux，希望让每个人都能用上 Typeless 级别的体验

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则