- Ho provato Machine Learning Spleeter. (Spiegazione di come usare)
- Ho provato Machine Learning Spleeter. (Spiegazione di come utilizzare) Riepilogo
Ho provato Machine Learning Spleeter. (Spiegazione di come usare)
Sono Yosi, l'amministratore di Chillout con Beats.
Ho provato Spleeter, che è diventato un argomento caldo nelle strade.
A causa della CLI (riga di comando), il livello di difficoltà è alto.
Riga di comando cosa?Se non capisci, non te lo consiglio.
Per il momento, ascolta i risultati della demo song.
Questo è fantastico.
dati originali
Dati vocali estratti
Dati diversi dalla voce
Panoramica di Spleeter
Sebbene non sia un argomento ben noto, la questione della separazione delle fonti è stata di interesse per un'ampia comunità di ricercatori sui segnali musicali per decenni.Si parte da una semplice osservazione.Le registrazioni musicali sono solitamente un mix di più tracce di strumenti individuali (voce solista, batteria, basso, pianoforte, ecc.).Le attività per separare le sorgenti musicali sono:Dato il mix, queste singole tracce (note anche come stem) possono essere ripristinate?Ciò ha molti potenziali usi.Prendi in considerazione la pre-elaborazione per altre attività come remix, upmixing, ascolto attivo, scopi educativi e trascrizione.
È interessante notare che il nostro cervello è molto bravo a separare gli strumenti musicali.Concentrati solo su uno degli strumenti di questa traccia (ad esempio, la voce solista) e sentirai qualcosa di completamente diverso dagli altri.Ma non è proprio una separazione, senti ancora tutte le altre parti.In molti casi potrebbe non essere possibile recuperare accuratamente le singole tracce mixate tra loro.Pertanto, la sfida è approssimarli il più vicino possibile.In altre parole, cerca di avvicinarti il più possibile all'originale senza creare distorsioni eccessive.
Nel corso degli anni, molte strategie sono state studiate da dozzine di grandi gruppi di ricerca in tutto il mondo.Se sei interessato a questo affascinante viaggio, leggi la panoramica di questo articolo o leggilo.Il ritmo dei recenti progressi ha fatto un grande balzo in avanti, principalmente a causa dei progressi nei metodi di apprendimento automatico.Per tenere traccia, le persone stanno confrontando gli algoritmi nelle campagne di valutazione internazionali.Ciò mostra che le prestazioni di Spleeter corrispondono alle prestazioni dell'algoritmo ottimale proposto.
Inoltre, Spleeter è molto veloce. Se stai eseguendo la versione GPU, puoi aspettarti di isolare 100 volte più velocemente che in tempo reale, il che lo rende adatto per l'elaborazione di grandi set di dati.
Come installare Pleeter
Il primo è il posto dove ottenere informazioni.
La storia principale sulla pagina ufficiale è "Spleeter".
Preferenze più belle
Per eseguire Spleeter, devi prima preparare l'ambiente.
Scarica e installa Miniconda
Conda è probabilmente il più semplice, quindiminiondaIntrodurre.
Penso che l'installazione di default vada bene.
Installa Git
Hai bisogno di un client Git, quindi scaricalo e installalo.
Penso che l'installazione di default vada bene.
Installa Pleeter
Per Windows, avvia "Anaconda Prompt" dal menu di avvio.
Una volta avviato, copia e incolla riga per riga i seguenti comandi.
conda install -c conda-forge spleeter
conda env create -f spleeter /conda/spleeter-cpu.yaml
conda attivare spleeter-cpu
Verifica del funzionamento di Spleeter utilizzando la sorgente sonora demo
cd spleeter python -m separato -h
Se è possibile installarlo senza alcun problema, verrà visualizzata la seguente guida (viene descritta solo una parte).
[–Verbose] -i AUDIO_FILENAMES [AUDIO_FILENAMES…]
[-o OUTPUT_PATH] [-n {directory, filename}]
[-d DURATA_MAX] [-c {wav, mp3, ogg, m4a, wma, flac}]
[-M]
Esporta in 2stem
python -m spleeter separato -i audio_example.mp3 -o audio_output
Il file è archiviato nella cartella "audio_output \ audio_example".
L'ho provato due volte, ma la prima volta ottengo solo "vocals.wav" con la voce estratta.
Se si esegue nuovamente il comando (utilizzare il tasto superiore della tastiera per tornare indietro nella cronologia del comando), verrà emesso.
Viene emesso anche "Accompagnamento.wav" diverso dalla voce.
Esporta in 4stem
spleeter separato -i audio_example.mp3 -o audio_output -p spleeter: 4stems
In caso di successo, verranno esportati 4 file come di seguito.
INFO: spleeter: File audio_output \ audio_example \ bass.wav scritto INFO: spleeter: File audio_output \ audio_example \ vocals.wav scritto INFO: spleeter: File audio_output \ audio_example \ drums.wav scritto INFO: spleeter: File audio_output \ audio_example \ altro. wav scritto
È possibile specificare quanti dividere con "-p". Attualmente, sono supportati i seguenti 3 tipi.
spleeter:2stems(ボーカル、その他)
spleeter:4stems(ボーカル、ベース、ドラム、その他)
spleeter:5stems(ボーカル、ベース、ドラム、ピアノ、その他)
Usa Spleeter per la tua sorgente sonora
Se vuoi divertirti per te stesso, penso che fosse giusto estrarre solo la voce dalla sorgente sonora che hai strappato da solo. (Attenzione perché uscirà se lo carichi in rete)
Descriverò solo come farlo.
Per prima cosa, copia il file che hai preparato allo stesso livello di "audio_example.mp3".
Tutto quello che devi fare ora è cambiare il comando "audio_example.mp3" con il nome del file che hai preparato.
spleeter separato -i audio_example.mp3 -o audio_output
L'ho provato in giapponese, ma ha funzionato.
Sono sorpreso che possa essere estratto in modo abbastanza bello.
Se ricevi un errore, potrebbe funzionare se lo cambi in alfanumerico.
Ho provato Machine Learning Spleeter. (Spiegazione di come utilizzare) Riepilogo
È una grande tecnologia.
Inoltre, se hai uno stelo, puoi saperne di più.
Questa è un'ipotesi, ma al momento sembra che ci sia poco apprendimento della voce giapponese.
Se impari da un CD karaoke ecc., potrebbe essere possibile estrarre con notevole precisione.
Inoltre, poiché questo software può essere utilizzato gratuitamente, esiste un'elevata possibilità che in futuro vengano pubblicate applicazioni con interfaccia grafica che utilizzano questa tecnologia.
Improvvisamente ho pensato che sarebbe stato fantastico se questa tecnologia e la tecnologia di Dialogue Match di iZotope rilasciata l'altro giorno fossero fuse.
コメント
Ho studiato un po' l'estrazione vocale, quindi sto fornendo informazioni.
Per favore, usalo come materiale quando non riesci a pensare a un articolo.Va bene se non lo usi, ma w
Sono volato dalla classifica annuale degli accessi, ma nel tempo l'ambiente intorno a Spleeter è notevolmente migliorato e ha raggiunto un livello che può essere gestito se si ha un po' di dimestichezza con i personal computer.
Anche così, se lo fai correttamente, non puoi usare almeno Docker, ma se è limitato a Windows, viene fornita un'applicazione GUI.
Il nome è lo stesso della GUI di Spleeter.
https://makenweb.com/#spleetergui
Sembra che tutti i dati necessari siano inclusi, quindi sembra che possa essere utilizzato immediatamente.
Sono un utente Mac, quindi uso Spleeter Web, ma la GUI sembra essere estremamente facile da usare su Windows.
Mi dispiace se non funziona perché non l'ho provato, ma sembra funzionare perché è il secondo più popolare su GitHub relativo a Spleeter.
Bene, se includi il pagamento, non è una corrispondenza con LALAL.AI, ma se è gratuito, sento che puoi conoscerlo come opzione.
Ci sono pochi articoli in giapponese.
Grazie per aver fornito informazioni!
Non lo sapevo, quindi lo guarderò un po'.
Questo è davvero facile.
E il caricamento è problematico online, ma è facile e buono a livello locale.
Lasciami scrivere un articolo!
Come forse saprai, AUDIOSTRIP ha rilanciato la rimozione vocale da Youtube con un servizio online.
https://www.audiostrip.co.uk/
È abbastanza comodo, ma sento che scomparirà se si diffonde a causa di problemi di copyright ...
Non sapevo affatto w
Sembra una versione semplificata di Spleeter Web, che è pubblicata su GitHub e che uso anche io.
https://github.com/JeffreyCA/spleeter-web
Questo può utilizzare non solo Spleeter ma anche Demucs, Tasnet, CrossNet-Open-Unmix (X-UMX) e supporta anche l'importazione da YouTube, ma è necessario utilizzare Docker.
Ci vuole molto tempo per avviarsi e consuma memoria.
Poiché questa è solo una combinazione di youtubedl, ffmpeg e spleeter, ritengo che non ci siano problemi per l'uso personale, ma potrebbe essere sospetto in termini di copyright quando verrà aperto al pubblico come AUDIOSTRIP.
Grazie per l'informazione!
Spleeter Web È incredibile.
Penso che proverò anche questo.
Non ho mai usato Docker, ma è davvero problematico consumare molta capacità nei sistemi virtuali.
Sento che AUDIOSTRIP scompare (o rimuove i download da Youtube).
Penso che sia un problema poterlo scaricare.