Всем хай, недавно ленни ферст выложил видео в котором он говорит голосами разных ютуберов и сегодня я решил показать вам как это сделать.
Качество звука зависит от вашего пк. На моей слабой 1050ti звук получился довольно баганным и херовым
1. Установка программы
1. переходим на гитхаб, листаем чуть ниже и скачиваем архив:
https://github.com/w-okada/voice-changer/tree/master
2. распаковываем архив в любое место
3. запускаем start_http.bat и ждем (первый запуск может длится около 10 минут
2. "Копирование" голоса
Для копирования голоса нам нужна аудиозапись с голосом. Для примера я сделаю модель голоса ленни ферста.
1. находим аудио запись (в моем случае это видео, так что я скачал видео, закинул их в Vegas Pro 13, обрезал на части и отрендерил в .mp3)
2. переходим сюда:
https://colab.research.google.com/drive/1r4IRL0UA7JEoZ0ZK8PKfMyTIBHKpyhcw
3. нажимаем сюда:
Посмотреть вложение 211363
4. ждем пока появится строка "
Running on public URL: https://РАНДОМНЫЕ ЦИФРЫ И БУКВЫ.gradio.live
"(может занять около 10 минут)
5. тыкаем на ссылку
6. переходим во вкладку "Train"
Посмотреть вложение 211353
7. меняем название
8. перетаскиваем сюда .mp3 файлы
Посмотреть вложение 211354
9. ждем пока напротив всех файлов будет написано "Download"
10. Нажимаем "Process The Dataset"
11. Ждем пока в поле ввода (под кнопкой) появится текст "end preprocess"
12. выбираем режим (можете почитать на что они влияют) и нажимаем на "Pitch Extraction", теперь ждем пока появится надпись "all-feature-done"
Посмотреть вложение 211355
13. нажимаем на "Train Model" и ждем пока в colab появится строка "Training is done. Program is closed.".
Это самый долгий процесс, в моем случае он занял около 40 минут (суммарный размер моих аудио вышел ~2.05 мб)
Посмотреть вложение 211357
14. нажимаем на Train Index и ждем текста "Done"
15. нажимаем на Download и скачиваем оба файла
Посмотреть вложение 211358
Для примера я буду копировать голос ленни
3. Добавление модели в программу
1. нажимаем на "Edit"
Посмотреть вложение 211359
2. находим пустой слот и нажимаем "Upload"
Посмотреть вложение 211360
3. загружаем файлы
Посмотреть вложение 211361
4. Жмем "upload" и ждем
5. выбираем наш голос в списке
Посмотреть вложение 211362
6. ждем и пиздим что-нибудь в микрофон