你是否经常开会时手忙脚乱记笔记,事后却想不起关键结论?是否刷完一小时技术文档却抓不住重点?又或者刚和客户聊完,转头就忘了对方提的三个待办事项?Omi 正是为解决这些“信息过载却记忆失焦”的现代知识工作者痛点而生——它不是另一个聊天机器人,而是一个始终在线、主动理解你所见所闻的「可信第二大脑」。通过屏幕录制、语音转录、上下文建模与智能摘要,Omi 把碎片化的注意力流,转化为可搜索、可回顾、可执行的知识资产。
核心功能
- 全场景感知:自动捕获桌面操作、会议通话、视频会议(Zoom/Teams)、甚至手机屏幕(iOS/Android),无需手动开启录音或截图
- 毫秒级语音转写:支持中英文混合实时转录,准确率高,保留语气词与停顿逻辑,为后续理解打下基础
- 动态摘要+行动项提取:不只是生成会议纪要,还能识别“需要我下周提交方案”“请李工确认接口文档”等明确待办,并自动归入你的任务看板
- 长期记忆增强型对话:在 AI 聊天界面提问“上次王总提到的API延期原因是什么?”,Omi 能精准定位两周前某次腾讯会议的语音片段并给出上下文摘要
- 跨端无缝同步:Mac/iOS/Android/智能眼镜(如Ray-Ban Meta)数据实时加密同步,手机上看到的摘要,回家后在 Mac 上继续追问细节
- 完全本地优先,隐私可控:所有音视频原始数据默认仅存于你设备;敏感内容可选端侧ASR(Python+C加速)与LLM微调,不上传云端
适合哪些人用
如果你是以下角色之一,Omi 将显著提升你的认知效率:
• 频繁参与多方会议的产品经理、项目经理与咨询顾问
• 需要快速消化大量技术文档、论文或课程视频的工程师与学生
• 多线程处理客户沟通、需求变更与内部协作的销售与运营人员
• 使用智能眼镜或可穿戴设备探索人机协同新工作流的极客与早期采用者
• 对主流AI工具的数据隐私政策存疑,坚持“我的数据我做主”的开源践行者
快速上手
无需编程!三步即可启用:
① macOS 用户下载安装包(签名已认证);
② iPhone 用户前往 App Store 搜索 “Friend AI Wearable”;
③ 安卓用户通过 Google Play 安装(国内用户可访问官网获取APK直链)。首次启动后授权屏幕录制与麦克风权限,Omi 即开始静默学习你的工作流——你只需专注做事,它来负责记住一切。
项目信息
AI that sees your screen, listens to your conversations and tells you what to do
编程语言:Dart(Flutter 跨端框架) + Python(语音/模型后端) + C(性能敏感模块)
GitHub Star 数:9877(持续增长中)
开源协议:MIT 许可证
项目地址:https://github.com/BasedHardware/omi
这不是一个“更聪明的Siri”,而是一次对人机关系的重新定义——当AI真正成为你注意力的延伸,而非干扰源,高效工作才真正开始。


