« Clonage vocal en quelques coups » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 2 : Ligne 2 :


== Définition ==
== Définition ==
Technique de '''[[clonage vocal]]''' qui se concentre sur le '''[[speaker adaptation]]''' grâce à un '''[[peaufinage]]''' avec un minimum de '''[[données]]'''. L'audio de référence peut être de quelques secondes à cinq minutes maximum.  
Technique de '''[[clonage vocal]]''' qui se concentre sur l'adaptation au locuteur (''speaker adaptation'') grâce à un '''[[peaufinage]]''' avec un minimum de '''[[données]]'''. L'audio de référence peut être de quelques secondes à cinq minutes maximum.  


Voir aussi '''[[clonage vocal]]''', '''[[synthèse de la parole]]''' et  '''[[clonage vocal zéro-coup]]'''
Voir aussi '''[[clonage vocal]]''', '''[[synthèse de la parole]]''' et  '''[[clonage vocal zéro-coup]]'''

Version du 4 mars 2026 à 15:30

en construction

Définition

Technique de clonage vocal qui se concentre sur l'adaptation au locuteur (speaker adaptation) grâce à un peaufinage avec un minimum de données. L'audio de référence peut être de quelques secondes à cinq minutes maximum.

Voir aussi clonage vocal, synthèse de la parole et clonage vocal zéro-coup

Français

Clonage vocal en quelques coups

Clonage vocal avec peu d'exemples

Clonage vocal avec quelques coups

Clonage vocal à partir de peu d'exemples

Clonage à multiples coups

Anglais

Few-Shot Voice Cloning

Few-Shot TTS

FS-TTS

A voice cloning technique that focuses on speaker adaptation through fine tuning with minimal data. The reference audio can range from a few seconds to a maximum of five minutes.

Sources

Source : Arxiv

Source : Arxiv

Contributeurs: Arianne Arel, Patrick Drouin, wiki