4 模型下载与管理教程

与其他很多字幕软件软件不同，haoone 并没有使用 whisper，whisper 的中文识别准确率是很一般的，还容易出现幻觉。

2026 年 haoone 的本地模型已经升级成 qwen3-asr（感谢阿里开源如此优秀的 asr 模型），对齐算法是自研的，可以实现中英识别准确率在 95% ，可以识别歌曲与地方方言，且字幕与音频可以实现词语级的高精度对齐。

windows 与 mac 都已经自动开启 GPU 加速，无需你复杂设置，开箱即用。windows 要求电脑需要有显卡，特别是英伟达显卡。

haoone 本地转录速度很快。3 分钟的音频，mac m4 max 30 秒内可转录完成，windows i5 5060 显卡 2 分钟可完成转录。

模型比较大，建议设置模型位置，避免模型放在 C 盘

下载模型

必须下载对齐模型-V2 ，不然无法使用转录功能。