Lyra

发布于 15 天前  32 次阅读


New Lyra 是 Google 开源的超低比特率,却拥有超高语音质量的编解码器,即便在很糟糕的网络情况下,lyra 也能让你有流畅的语音体验。Lyra 编解码器的基本架构非常简单,它每隔 40ms 从语音中提取语音特征,然后将其压缩以 3kbps 的比特率进行传输。而这些特征本身是对数梅尔声谱图,代表了不同频段语音能力的数字列表。

https://github.com/google/lyra.git

这种题的主要是环境部署极为困难,如果网络不好可以用codespace构建

下载依赖

sudo apt install apt-transport-https curl gnupg -y
curl -fsSL https://bazel.build/bazel-release.pub.gpg | gpg --dearmor >bazel-archive-keyring.gpg
sudo mv bazel-archive-keyring.gpg /usr/share/keyrings
echo "deb [arch=amd64 signed-by=/usr/share/keyrings/bazel-archive-keyring.gpg] https://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list
sudo apt update && sudo apt install bazel-5.3.2
python3 -m pip install --upgrade pip
pip install numpy

修改WORKSPACE

git_repository(
    name = "gflags",
    remote = "https://github.com/gflags/gflags.git",
    branch = "master"
)

构建编码器

bazel-5.3.2 build -c opt lyra/cli_example:decoder_main

编码

bazel-bin/lyra/cli_example/decoder_main --encoded_path=input.lyra --output_dir=temp/ --bitrate=3200

成功获得音频文件

也遇到过几次了,构建起来是十分麻烦,但弄好也许能在未来的某个比赛中可以夺得一血呢

今年的ISCC就出过,可以练练手


Defend with determination