跳转到内容

导入音频(进阶)

导入已有音频、监听语音备忘录这两项还没进 App——它们走可选的命令行引擎。先一次性配置好:

Terminal window
git clone https://github.com/MeetGist/meetgist.git
cd meetgist
make setup # 引擎的 Python 环境
# 然后把 Key 填进 scripts/.env: GEMINI_API_KEY=你的-key

一个文件或一个文件夹

转录你手头已有的音频(.m4a / .mp3 / .wav / .mp4):

Terminal window
python3 scripts/transcribe_file.py ~/Downloads/interview.mp3

文档会就地生成,放在源文件旁边(interview.transcript.mdinterview.polished.mdinterview.summary.md)。传入一个文件夹,就会把里面的每个音频都转录一遍。单人备忘录保持单一说话人, 多人对话则拆成 说话人 1 / 说话人 2 / …。

Apple 语音备忘录(自动导入)

盯着你的语音备忘录库,自动转录在 iPhone、Apple Watch 或 Mac 上新录的备忘录:

Terminal window
scripts/install_voicememo_watcher.sh # 启动(约每 10 分钟检查一次)
scripts/install_voicememo_watcher.sh status
scripts/install_voicememo_watcher.sh uninstall

安装时它会把已有的备忘录标记为“已看过”,所以只导入此后新录的。后台 launchd 任务用到的 Python 解释器需要完全磁盘访问权限才能读取语音备忘录的数据。