New Lyra 是 Google 开源的超低比特率,却拥有超高语音质量的编解码器,即便在很糟糕的网络情况下,lyra 也能让你有流畅的语音体验。Lyra 编解码器的基本架构非常简单,它每隔 40ms 从语音中提取语音特征,然后将其压缩以 3kbps 的比特率进行传输。而这些特征本身是对数梅尔声谱图,代表了不同频段语音能力的数字列表。
https://github.com/google/lyra.git
这种题的主要是环境部署极为困难,如果网络不好可以用codespace构建
下载依赖
sudo apt install apt-transport-https curl gnupg -y
curl -fsSL https://bazel.build/bazel-release.pub.gpg | gpg --dearmor >bazel-archive-keyring.gpg
sudo mv bazel-archive-keyring.gpg /usr/share/keyrings
echo "deb [arch=amd64 signed-by=/usr/share/keyrings/bazel-archive-keyring.gpg] https://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list
sudo apt update && sudo apt install bazel-5.3.2
python3 -m pip install --upgrade pip
pip install numpy
修改WORKSPACE
git_repository(
name = "gflags",
remote = "https://github.com/gflags/gflags.git",
branch = "master"
)
构建编码器
bazel-5.3.2 build -c opt lyra/cli_example:decoder_main
编码
bazel-bin/lyra/cli_example/decoder_main --encoded_path=input.lyra --output_dir=temp/ --bitrate=3200
成功获得音频文件
也遇到过几次了,构建起来是十分麻烦,但弄好也许能在未来的某个比赛中可以夺得一血呢
今年的ISCC就出过,可以练练手
Comments | NOTHING