我尝试了机器学习 Spleeter。 (说明如何使用)

2019年11月09日00时28分50 新闻
スポンサーリンク

我尝试了机器学习 Spleeter。 (说明如何使用)

我是 yosi,Chillout with Beats 的管理员。

2020/04/14 后记
当我再次尝试时,在我的家庭环境中无法收到以下错误消息。我调查并尝试了一些,但问题目前没有解决。
因此,请注意,即使您尝试这篇文章,您也可能无法做到。
在动态库 C:\Users\isee\Miniconda242\Library\bin\mkl_intel_thread.dll 中找不到序数 3。 

我试过Spleeter,它已经成为街头的热门话题。

由于 CLI(命令行),难度级别很高。

命令行什么的?如果你不明白,我不推荐它。

暂时先听听示范曲的效果。

这真太了不起了。

原始数据

提取的声音数据

人声以外的数据

斯普利特概述

尽管不是一个众所周知的话题,但几十年来,源分离问题一直是众多音乐信号研究人员感兴趣的话题。它从一个简单的观察开始。音乐录音通常是多个单独的乐器轨道(主唱、鼓、贝司、钢琴等)的混合。分离音乐源的任务是:考虑到混合,这些单独的轨道(也称为茎)可以恢复吗?这有很多潜在的用途。考虑对其他任务进行预处理,例如混音、上混音、主动聆听、教育目的以及转录。

有趣的是,我们的大脑非常擅长分离乐器。只需专注于该轨道上的一种乐器(例如,主唱),您就会听到与其他乐器完全不同的声音。但这并不是真正的分离,您仍然可以听到所有其他部分。在许多情况下,可能无法准确恢复混合在一起的各个音轨。因此,挑战在于尽可能接近它们。换句话说,在不造成过度失真的情况下,尽量接近原件。

多年来,世界各地数十个伟大的研究团队研究了许多策略。如果您对这段迷人的旅程感兴趣,请阅读本文的概述或阅读它。最近进展的步伐有了很大的飞跃,主要是由于机器学习方法的进步。为了跟踪,人们正在比较国际评级活动中的算法。这表明 Spleeter 的性能与所提出的最优算法的性能相匹配。
此外,Spleeter 非常快。 如果您运行的是 GPU 版本,则可以预期隔离速度比实时快 100 倍,这使其适合处理大型数据集。

 

如何安装Spleeter

首先是获取信息的地方。

官方页面上的主要故事是“Spleeter”。

 
可执行文件在这里。

Spleeter 偏好

要运行 Spleeter,首先需要准备环境。

下载并安装 Miniconda

Conda 可能是最简单的,所以迷你康达介绍。

2019年11月08日16时38分20

我认为默认安装很好。

安装 Git

你需要一个 Git 客户端,所以下载并安装它。

 
单击相应的操作系统开始未经许可下载。

2019年11月08日17时18分25

我认为默认安装很好。

 

安装 Spleeter

对于 Windows,从开始菜单启动“Anaconda Prompt”。

2019年11月08日17时21分37

2019年11月08日17时23分14

启动后,逐行复制并粘贴以下命令。

git 克隆 https://github.com/deezer/spleeter
conda安装-c conda-forge spleeter
conda env create -f spleeter /conda/spleeter-cpu.yaml
conda 激活 spleeter-cpu
 

使用演示音源检查 Spleeter 的操作

 
安装完成后复制并粘贴以下命令。
cd spleeter python -m 分离 -h

如果可以安装没有任何问题,将显示以下帮助(仅描述了一部分)。

用法:分开 [-h] [-a AUDIO_ADAPTER] [-p PARAMS_FILENAME]
[–详细] -i AUDIO_FILENAMES [AUDIO_FILENAMES…]
[-o OUTPUT_PATH] [-n {目录,文件名}]
[-d MAX_DURATION] [-c {wav, mp3, ogg, m4a, wma, flac}]
[-米]
 

导出到 2stem

2stem可分为“声乐”和“非声乐”。
 
使用演示文件检查操作。
 
复制并粘贴以下命令。
 
python -m spleeter 分离 -i audio_example.mp3 -o audio_output

该文件存储在“audio_output\audio_example”文件夹中。

我尝试了两次,但第一次我只得到了“vocals.wav”,其中提取了人声。

如果再次执行该命令(使用键盘上的上键返回该命令的历史记录),它将被输出。

人声以外的“Accompaniment.wav”也被输出。

导出到 4stem

4stem可分为“人声”、“贝司”、“鼓”和“其他”。
 
使用演示文件检查操作。
spleeter 分离 -i audio_example.mp3 -o audio_output -p spleeter: 4stems

如果成功,将导出 4 个文件,如下所示。

INFO: spleeter: 文件 audio_output\audio_example\bass.wav 写入 INFO: spleeter: 文件 audio_output\audio_example\vocals.wav 写入 INFO: spleeter: 文件 audio_output\audio_example\drums.wav 写入 INFO: spleeter: 文件 audio_output\audio_example\other。 wav 写的

可以用“-p”指定分多少,目前支持以下3种。

  • spleeter:2stems(ボーカル、その他)
  • spleeter:4stems(ボーカル、ベース、ドラム、その他)
  • spleeter:5stems(ボーカル、ベース、ドラム、ピアノ、その他)

使用 Spleeter 作为您自己的声源

如果您想自己享受它,我认为只从您自己撕下的声源中提取人声是可以的。 (小心上传到网上会出问题)

我将只描述如何做到这一点。

首先,将您准备的文件复制到与“audio_example.mp3”相同的级别。

您现在要做的就是将命令“audio_example.mp3”更改为您准备的文件的文件名。

spleeter 分离 -i audio_example.mp3 -o audio_output

我用日文试了一下,还是成功了。

我很惊讶它可以非常漂亮地提取出来。

如果出现错误,将其更改为字母数字可能会起作用。

我尝试了机器学习 Spleeter。 (说明如何使用) 摘要

这是一项很棒的技术。

此外,如果你有一个词干,你可以学到更多。

这是一个猜测,但目前看来日语语音的学习很少。

如果您从卡拉 OK CD 等中学习,则可以相当准确地提取。

此外,由于该软件可以免费使用,因此将来很有可能会出现使用该技术的包含 GUI 的应用程序。

突然想到,如果把这项技术和前几天发布的iZotope的对话比赛的技术融合起来,那该多好啊。

スポンサーリンク
スポンサーリンク
新闻
与节拍一起放松

评论

  1. 本站爱好者 更多信息:

    我已经对声音提取进行了相当多的研究,所以我提供了信息。
    当您想不出一篇文章时,请使用它作为材料。不使用也没关系,但是w

    我从年度访问排名飞了出来,但是随着时间的推移,Spleeter 周围的环境已经有了很大的改善,已经达到了稍微熟悉个人电脑就可以管理的水平。
    即便如此,如果做得好,至少不能使用 Docker,但如果仅限于 Windows,则提供 GUI 应用程序。
    名称与 Spleeter GUI 相同。
    https://makenweb.com/#spleetergui
    似乎包含了所有必要的数据,因此似乎可以立即使用。
    我是 Mac 用户,所以我使用 Spleeter Web,但 GUI 似乎在 Windows 上非常容易使用。
    如果它不起作用,我很抱歉,因为我没有尝试过,但它似乎有效,因为它是 GitHub 上与 Spleeter 相关的第二受欢迎的。

    好吧,如果你包括付费,它与LALAL.AI是不匹配的,但如果它是免费的,我觉得你可以知道它作为一个选项。
    日文的文章很少。

    • 约西 更多信息:

      感谢您提供信息!
      我不知道,所以我会稍微查一下。
      这真的很容易。
      而且网上上传比较麻烦,但是在本地很方便,也不错。
      让我写一篇文章!

      您可能知道,AUDIOSTRIP 已经通过在线服务恢复了从 Youtube 中删除声音的功能。
      https://www.audiostrip.co.uk/

      挺方便的,但是我觉得如果因为版权问题传播出去就会消失……

      • 本站爱好者 更多信息:

        您可能知道,AUDIOSTRIP 已经通过在线服务恢复了从 Youtube 中删除声音的功能。

        我完全不知道w
        它看起来像是 Spleeter Web 的简化版本,发布在 GitHub 上,我也在使用。
        https://github.com/JeffreyCA/spleeter-web
        这个不仅可以使用Spleeter,还可以使用Demucs、Tasnet、CrossNet-Open-Unmix (X-UMX),还支持从YouTube导入,但需要使用Docker。
        启动需要很长时间,而且会占用内存。

        由于这只是youtubedl、ffmpeg和spleeter的组合,所以个人使用感觉没有问题,但是像AUDIOSTRIP这样对外开放的时候可能会在版权方面存疑。

        • 约西 更多信息:

          这个不仅可以使用Spleeter,还可以使用Demucs、Tasnet、CrossNet-Open-Unmix (X-UMX),还支持从YouTube导入,但需要使用Docker。

          感谢您的信息!
          Spleeter Web 太棒了。
          我想我也会试试这个。
          我从来没有用过Docker,但是在虚拟系统中吃很多容量真的很麻烦。

          我觉得 AUDIOSTRIP 消失了(或从 Youtube 删除了下载)。
          我认为能够下载它是一个问题。

我复制了标题和网址