Skip to content

AidVoice SDK

简介

AidVoice SDK 是阿加犀推出的专门针对语音类模型的 AI 推理 SDK,旨在简化开发者开发基于端侧 AI 技术的语音处理核心功能,灵活快速的集成到智能应用中。SDK 提供了统一高效的 API,支持业界领先的语音处理 AI 模型,可满足不同业务场景需求。

支持情况

操作系统支持情况

LinuxAndroid
C++
Python🚧
Java

ASR 模型支持情况

Whisper-Base-enSenseVoiceSmallWhisper Other Versions
🚧

TTS 模型支持情况

MeloTTS-ChineseMeloTTS-English

✅:已支持 🚧:计划支持

快速开始

安装

bash
# 安装AidLite QNN 2.36版本
sudo aid-pkg update
sudo aid-pkg install aidlite-sdk
sudo aid-pkg install aidlite-qnn236

# 安装 AidVoice SDK
sudo aid-pkg -i aidvoice-sdk
bash
To be released

开发流程图

ASR

TTS

例子

更多案例请参考 案例中心

ASR:在 QCS8550 Linux 系统中识别音频文件

安装 AidVoice SDK

bash
# 安装AidLite QNN 2.36版本
sudo aid-pkg update
sudo aid-pkg install aidlite-sdk
sudo aid-pkg install aidlite-qnn236

# 安装 AidVoice SDK
sudo aid-pkg -i aidvoice-sdk

测试代码编译

bash
# 拷贝测试代码
cp -r /usr/local/share/aidvoice/examples /home/aidlux/aidvoice

# 编译
cd /home/aidlux/aidvoice/asr/cpp/
mkdir -p build && cd build
cmake ..
make

运行例子

bash
./test_asr

提示

例子默认使用 Whisper ,切换成 SenseVoiceSmall 请修改 test_asr.cpp 代码中的 cfg.model_type = ModelType::TYPE_WHISPER; -> cfg.model_type = ModelType::TYPE_SENSEVOICE;

TTS:在 QCS8550 Linux 系统中文字转语音

安装 AidVoice SDK

bash
# 安装AidLite QNN 2.36版本
sudo aid-pkg update
sudo aid-pkg install aidlite-sdk
sudo aid-pkg install aidlite-qnn236

# 安装 AidVoice SDK
sudo aid-pkg -i aidvoice-sdk

测试代码编译

bash
# 拷贝测试代码
cp -r /usr/local/share/aidvoice/examples /home/aidlux/aidvoice

# 编译
cd /home/aidlux/aidvoice/tts/cpp/
mkdir -p build && cd build
cmake ..
make

运行例子

bash
cd /home/aidlux/aidvoice/tts/cpp/build
./test_tts

音频文件会在当前目录下生成。

提示

例子默认使用 MeloTTS-English ,切换成 MeloTTS-Chinese 请修改 test_asr.cpp 代码中的 cfg.model_type = ModelType::TYPE_MELOTTS_ENGLISH; -> cfg.model_type = ModelType::TYPE_MELOTTS_CHINESE;