125

Kokoro TTS 中文文本转语音环境搭建

准备工作

基础环境

环境版本
windows11
python3.12
pip24.x or 25.x

可选环境(强烈推荐)

如果使用NVIDIA显卡,推荐安装GPU推理环境

软件版本
cuda选择不高于已安装的NVIDIA显卡驱动的版本
cudnn选择与cuda对应的版本

按照kokoro官方的说法,使用GPU推理比CPU速度快50倍。

亲身使用对比下来效果:

  • 250字左右的一段话,使用CPU推理,耗时10秒左右
  • 500字左右一段小说,使用GPU推理,耗时2秒左右
  • 2500字的一章小说,使用GPU推理,耗时8秒左右

安装步骤

安装显卡推理环境(可选)

NVIDIA官方下载CUDA和CUDNN,选择版本时,不能高于系统已安装的显卡驱动版本。

https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/rdp/cudnn-archive

可参考这两篇帖子

配置HF镜像地址

huggingface官方地址,国内无法访问,所以配置镜像站,用于程序下载模型

HF_ENDPOINT=https://hf-mirror.com

安装Pytorch

如果本身已经安装了cpu推理的Pytorch也没关系,安装pytorch cuda版会自动卸载cpu版。

前往Pytorch官网,查找符合自己电脑环境的版本,进行安装。

https://pytorch.org/get-started/locally/

由于cuda版pytorch比较大,安装较慢,可以用其他下载软件,直接把安装包下载到本地,

下载地址:

https://download.pytorch.org/whl/torch/

然后本地安装,下载好的whl文件,例如:

pip install torch-2.6.0+cu126-cp312-cp312-win_amd64.whl

安装Kokoro

pyhton3.12版本有kokoro的最新版本,所以可直接安装。推荐加上镜像源 https://pypi.tuna.tsinghua.edu.cn/simple

pip install kokoro -i https://pypi.tuna.tsinghua.edu.cn/simple

其他依赖,在运行程序时,提示缺少什么,再使用与此同样的方法安装即可。

下载运行程序

由于官方的示例程序只有英文版,我已修改并发布了中文版,Github地址自行克隆运行。

git clone https://github.com/DOTATONG/kokoro-zh
cd kokoro-zh

python web.py
文章作者:DOTATONG
发布日期:2025-03-26
# nvidiaKokorocudaTTS

评论

暂无

添加新评论