Audio pauses and suspensions #1470
Unanswered
DarioBonini
asked this question in
Q&A
Replies: 2 comments 1 reply
-
|
please always attach the FULL Log as a FILE, not as comment. also always provide your OS, E2A version, dockert or native etc... |
Beta Was this translation helpful? Give feedback.
1 reply
-
|
I talk about the TERMINAL LOG from your TERMINAL thanks |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
Hi everyone,
Before I start let me say that I love this project :)
I'm doing audio creation in Italian using CPU and xtts.
everything works pretty well but the generated audio has pauses where there shouldn't be. I'm not a great programming expert but I would like to understand how to generate a complete sentence and insert pauses only in the presence of punctuation (period, comma, question mark, etc.).
Is this something that can be done?
If you give me some tips I can try independently (and maybe I'll help improve the management in Italian)
below I attach a log trace of how the sentences are broken up (I see that the blocks of sentences are generated in a way that is unclear to me)
Details
``` Analyzing numbers, maths signs, dates and time to convert in words... speakers_xtts.pth: 100%|██████████████████████████████████████████████████████████| 7.75M/7.75M [00:00<00:00, 8.44MB/s] C:\ebook2audiobook\python_env\Lib\site-packages\huggingface_hub\file_download.py:143: UserWarning: `huggingface_hub` cache-system uses symlinks by default to efficiently store duplicated files but your machine does not support them in C:\ebook2audiobook\models\tts\models--coqui--XTTS-v2. Caching files will still work but in a degraded version that might require more space on your disk. This warning can be disabled by setting the `HF_HUB_DISABLE_SYMLINKS_WARNING` environment variable. For more details, see https://huggingface.co/docs/huggingface_hub/how-to-cache#limitations. To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development warnings.warn(message) Loading TTS xtts-internal model, it takes a while, please be patient... config.json: 4.37kB [00:00, 4.50MB/s] model.pth: 100%|██████████████████████████████████████████████████████████████████| 1.87G/1.87G [00:26<00:00, 69.7MB/s] vocab.json: 361kB [00:00, 41.0MB/s] C:\ebook2audiobook\python_env\Lib\inspect.py:1007: UserWarning: Module 'speechbrain.pretrained' was deprecated, redirecting to 'speechbrain.inference'. Please update your script. This is a change from SpeechBrain 1.0. See: https://github.com/speechbrain/speechbrain/releases/tag/v1.0.0 if ismodule(module) and hasattr(module, '__file__'): Loading ZeroShot knnvc model, it takes a while, please be patient... 100%|████████████████████████████████████████████████████████████████████████████| 61.5M/61.5M [00:02<00:00, 29.9MiB/s] -------------------------------------------------- A total of 1 block and 43 sentences. -------------------------------------------------- 0.00%: 0/52 Block 1 containing 43 sentences... Converting builtin eng voice to ita...Normalize completed!
Computing speaker latents...
1.92%: : 0/52 : Ogni anno, la notte prima di Natale,
3.85%: : 1/52 : arriva Babbo Natale. Viaggia su una slitta trainata da piccole renne con campanelli sulle briglie. Drin
5.77%: : 2/52 : drin,
7.69%: : 3/52 : suonano i campanelli, e trot trot,
9.62%: : 4/52 : trottano le piccole renne per portare Babbo Natale in giro per il mondo. Babbo Natale indossa una
11.54%: : 5/52 : pelliccia dalla testa ai piedi. I suoi pantaloni sono di pelliccia,
13.46%: : 6/52 : il suo cappotto è di pelliccia, e porta un cappello di pelliccia che gli copre le orecchie,
15.38%: : 7/52 : perché i venti dell'inverno sono gelidi.
17.31%: : 8/52 : ‡pause‡
19.23%: : 9/52 : U-u-u-u, soffiano i venti; drin drin, suonano i campanelli; trot trot,
21.15%: : 10/52 : trottano le piccole renne quando Babbo Natale attraversa il mondo. La barba di Babbo Natale è bianca come
23.08%: : 11/52 : la neve,
25.00%: : 12/52 : le sue guance sono rosse come le mele e i suoi occhi sono luminosi come le stelle scintillanti che lo
26.92%: : 13/52 : osservano dal cielo mentre viaggia per il mondo.
28.85%: : 14/52 : ‡pause‡
30.77%: : 15/52 : Brillano, brillano e splendono le stelle; U-u-u-u, soffiano i venti; drin drin, suonano i campanelli;
32.69%: : 16/52 : trot trot, trottano le piccole renne quando Babbo Natale attraversa il mondo.
34.62%: : 17/52 : ‡pause‡
36.54%: : 18/52 : Babbo Natale è vecchio, vecchio come il tempo,
38.46%: : 19/52 : ma è forte come un gigante e porta sulla sua schiena un sacco pieno di giocattoli. Nel sacco ci sono
40.38%: : 20/52 : bambole e tamburi,
42.31%: : 21/52 : palle e trottole, carri e slitte, set da tè con rose blu dipinte, e trombe con strisce rosse e bianche;
44.23%: : 22/52 : sono tutti per i bambini. Alla vigilia di Natale, non appena i bimbi si addormentano,
46.15%: : 23/52 : Babbo Natale arriva per riempire le loro calze di cose buone e distribuire bellissimi regali. Sa
48.08%: : 24/52 : esattamente cosa vogliono i bambini,
50.00%: : 25/52 : ciascuno di loro, e ride di gioia mentre se ne va.
51.92%: : 26/52 : ‡pause‡
53.85%: : 27/52 : Oh! Oh! Oh! ride Babbo Natale; brillano, brillano e splendono le stelle; U-u-u-u, soffiano i venti;
55.77%: : 28/52 : drin drin, suonano i campanelli; trot trot,
57.69%: : 29/52 : trottano le piccole renne quando Babbo Natale attraversa il mondo.
59.62%: : 30/52 : ‡pause‡
61.54%: : 31/52 : I bambini non lo vedono mai arrivare. Se sente in casa anche solo una risata o un sussurro,
63.46%: : 32/52 : resta fuori finché tutto non è tranquillo. Una volta c'era un bambino che non voleva andare a letto la
65.38%: : 33/52 : notte prima di Natale. Resterò sveglio e vedrò Babbo Natale,
67.31%: : 34/52 : disse. Appese la sua calza al camino, si sedette nella grande sedia a dondolo della madre e aspettò,
69.23%: : 35/52 : guardò e aspettò. Ma tutto ciò che vide fu un topolino grigio,
71.15%: : 36/52 : anche se rimase sveglio fino a quando tutti, tranne sua madre,
73.08%: : 37/52 : furono a letto e non riuscì a tenere gli occhi aperti nemmeno un altro minuto.
75.00%: : 38/52 : ‡pause‡
76.92%: : 39/52 : L'ultima cosa che vide mentre si addormentava fu la calza appesa proprio dove l'aveva lasciata e dentro
78.85%: : 40/52 : non c'era nulla;
80.77%: : 41/52 : ma. ci credi. quando si svegliò la mattina dopo,
82.69%: : 42/52 : era piena zeppa di dolcetti e proprio davanti al camino c'era un carretto con le ruote rosse! Babbo Natale
84.62%: : 43/52 : è stato qui,
86.54%: : 44/52 : disse il bimbo battendo le mani perché era felice come non mai.
88.46%: : 45/52 : ‡pause‡
90.38%: : 46/52 : Tutto il mondo è felice quando arriva Babbo Natale. Trot trot, trottano le piccole renne; drin drin,
92.31%: : 47/52 : suonano i campanelli; U-u-u-u, soffiano i venti; brillano, brillano e splendono le stelle,
94.23%: : 48/52 : e Oh! Oh! Oh! ride Babbo Natale mentre attraversa il mondo per riempire le calze dei bambini e portare
96.15%: : 49/52 : bellissimi regali.
98.08%: : 50/52 : ‡pause‡
100.00%: : 51/52 : ‡break‡
End of Block 1
Preparing batches: 100%|█████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 969.11batch/s]
Preparing batches: 0%| | 0/1 [00:00<?, ?batch/s]
Assemble completed!
Completed → C:\ebook2audiobook\tmp\proc-26cd2301-de8f-4911-b22d-2f33d615de92\93703ba35e759941d164d6420ef0468f\sentence_chunks\tmpgrhdm24u\chunk_0000.flac
Assemble completed!
Completed → C:\ebook2audiobook\tmp\proc-26cd2301-de8f-4911-b22d-2f33d615de92\93703ba35e759941d164d6420ef0468f\chapters\chapter_1.flac
********* Combined block audio file saved in C:\ebook2audiobook\tmp\proc-26cd2301-de8f-4911-b22d-2f33d615de92\93703ba35e759941d164d6420ef0468f\chapters\chapter_1.flac
Combining block 1 to audio, sentence 0 to 42
100.00%: : 52/52
Assemble completed!
Completed → C:\ebook2audiobook\tmp\proc-26cd2301-de8f-4911-b22d-2f33d615de92\93703ba35e759941d164d6420ef0468f\export\tmpyvqddh4z\all.flac
Export - 100.0%
Export completed!
Adding cover C:\ebook2audiobook\tmp\proc-26cd2301-de8f-4911-b22d-2f33d615de92\93703ba35e759941d164d6420ef0468f\BabboNatale1.jpg into the final audiobook file...
Beta Was this translation helpful? Give feedback.
All reactions