Appearance
与其他很多字幕软件软件不同,haoone 并没有使用 whisper,whisper 的中文识别准确率是很一般的,还容易出现幻觉。
2026 年 haoone 的本地模型已经升级成 qwen3-asr(感谢阿里开源如此优秀的 asr 模型) ,对齐算法是自研的,可以实现中英识别准确率在 96% ,可以识别歌曲与地方方言,且字幕与音频可以实现词语级的高精度对齐。
本地转录需要你先安装好模型,请看[模型安装教程](./4 模型下载与管理)。
免费用户可以无限次转录 20 分钟的音视频文件。
windows 与 mac 都已经自动开启 GPU 加速,无需你复杂设置,开箱即用。windows 要求电脑需要有显卡,特别是英伟达显卡。
haoone 本地转录速度很快。3 分钟的音频,mac m4 max 30 秒内可转录完成,windows i5 5060 显卡 2 分钟可完成转录。
本地模型专门针对长音频优化,不限转录时长与使用次数。
相比于远程转录,本地模型中文与英文的识别正确率差 1%-3% 左右,很接近。
达芬奇插件支持设置时间线的出入点,实现局部转录。
软件中使用本地转录


务必开启 AI 拆行
尽量配置与开启 AI 热词替换
达芬奇插件中使用本地转录
达芬奇中,点击菜单“工作区”,点击“脚本”,选择 haoone,就会出现插件界面。


字幕轨道
可以指定将字幕放在哪个字幕轨道
禁用背景音乐
有 BGM 的最好禁用掉音乐。
局部转录
在时间线上使用 I O 设置出入点,可以仅转录 I O 区间的视频字幕。
