Skip to content

omasakun/concat-vc

Repository files navigation


Concat VC

A Personal Experiment in Real-Time Voice Conversion

学習が高速なリアルタイム声質変換を作ってみる個人的な実験



開発のはじめかた

Linux や WSL2 での開発を想定しています。

# Install `asdf` before you start if you haven't already.
# asdf: https://asdf-vm.com/guide/getting-started.html

# Clone this repository.
git clone https://github.com/omasakun/concat-vc.git
cd concat-vc

# Install the required tools and packages.
asdf install
pdm  install -G :all

# Now you are ready to go!
source .venv/bin/activate
python engine/hello.py

やってみたこと

Attempt 01: 単純な音声の切り貼り

変換先の音声が十分にあるなら、変換元の声の発音に近い変換先話者の音声を切り貼りするだけでもそれなりにうまく変換できるかもしれないと思ったので、試してみた。

関連する Notebook

Attempt 02: 音程によらない表現をつかう

先の Attempt 01 では、音程があっていない音声を無理やりつなげているせいでうまくいかないように見えた。

なので今度は、音程を調節してから切り貼りするようにしたら良くなるか試してみる。

→ 音程によらない表現を作るのがうまくできなかったので、ひとまず後回しにした。

Attempt 03: FragmentVC をつかう

Fragment VC がどれくらいの性能なのか、実際に確認してみる。

公式の実装があるので、それを使ってみる。

参考にしたものなど

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Languages