谷歌发布 MusicLM：生成式人工智能迎来爆发

日期：2023-2-2 （来源：互联网）

1月27日，谷歌发布了全新的人工智能模型——MusicLM。通过人工智能模型，文字可以直接产生高保真的音乐。

这是继文字生成人工智能模型 Wordcraft、视频生成工具 Imagen Video 之后，谷歌又一次推出生成式人工智能BD140模型工具，这一次谷歌将目标瞄准了音乐领域。

透过MusicLM，不难看出，近两年生成式人工智能赛道正在爆发。

01、MusicLM挑战更复杂的场景

谷歌最新推出的人工智能模型MusicLM，文字可以直接使用、图像自动生成音乐，风格多样，所有想听的音乐，基本上都可以自动生成。

MusicLM它不是第一个可以自动生成音乐的人工智能模型。在此之前，可视化人工智能工具Rifusion也可以自动创作音乐，以及DanceDiffusion，此外，最受欢迎的聊天机器人ChatGPT研发人员OpenAI也推出了Jukebox。

但值得注意的是，这些自动生成音乐的人工智能系统受到技术和数据的限制，创作的音乐相对简单，相对不复杂。

与前辈不同的是，MusicLM它可以创作特别复杂和高度保真的音乐，也可以通过图像生成音乐。这是一个新的突破。通过人工智能技术，我们不仅可以识别乐器，整合音乐流派，还可以通过更抽象的概念生成音乐。

比如想要街机游戏配乐，只要输入“街机游戏主配乐，它的节奏快而乐观”等字样，MusicLM音乐可以自动生成。MusicLM音乐也可以通过图像生成，如世界名著《呐喊》、《格尔尼卡》、《星空》等。

然而，值得一提的是，谷歌目前只发布了MusicLM的研究成果。由于版权等问题，谷歌还没有向公众开放MusicLM。

02、人工智能生成音乐有什么困难？

去年10月，谷歌推出了生成人工智能模型AudioLM，只需输入短音频，就可以生成类似风格的音频。当时，AudioLM只是一个纯音频模型，类似于语言模型，根据提示的语音内容独立判断并生成相似的内容。

从这个角度看，AudioLM可视为MusicLM的前身。AudioLM在不转录或标记的情况下，可模仿音频的音色.响度和清晰度等。但是，AudioLM生成的音频与原版没有太大区别，也没有公开应用。

通过人工智能模型创作音乐并不容易，因为生成的音乐包括音频信号.环境声音.人的声音和其他维度是由许多信号相互作用形成的，每次人体发出声音，无论声音的大小、音色好坏，都是由句法、音律等组成，这是一个非常复杂的综合系统。

正是因为这些原因，在早期的探索过程中，自动生成的音频合成痕迹明显，声音听起来不自然，发音不标准。因此，人工智能模型依靠大量的数据训练和模拟来实现音频的真正自动生成是必不可少的基本步骤。

针对这些挑战，作为AudioLM的“升级版”，MusicLM训练数据更大。据了解，谷歌在28万小时的音乐数据集中，才训练出来。MusicLM，为理解深度和复杂的音乐场景提供了基础。

此外，值得一提的是，谷歌特别介绍了任务缺乏评估数据等问题MusicCaps，用于评估从文本到音乐的生成任务。

03、生成人工智能迎来爆发

谷歌的推出MusicLM，它可以看作是扩展人工智能应用的注脚，其背后是生成人工智能轨道的爆发。事实上，生成人工智能一直是过去两年中最热门的话题。

2021年，OpenAI相继发布划时代DALL-E.DALL-E2模型，实现了文本生成图像的飞跃；去年，Meta发布人工智能短视频生成模型Make-A-Video，视频也可以通过文本内容生成；谷歌还发布了短视频人工智能生成模型ImagenVideo与Phenaki。

不仅在国外，在国内也有很多生成式人工智能应用。例如，字节跳动的剪映式。APP，匹配的视频图片可以根据文本内容自动生成。去年年初，网易推出了“网易天音”，也是一站式人工智能音乐创作平台，通过人工智能自动生成用户编辑的歌曲。

可以看出，生成式人工智能的应用场景越来越广泛，写作、绘画、剪辑视频等都可以通过人工智能技术来实现。谷歌基于生成式人工智能的广阔应用前景，具有广阔的应用前景，微软、Meta巨头们纷纷推动研发，将生成式人工智能技术融入产品，加速了生成式人工智能轨道的爆发。

事实上，生成式人工智能的快速发展并不是过去两年的事情，而是由于技术门槛过高，其前沿趋势在科技界广泛传播。直到人工智能绘画.AI写作等频繁出圈，生成式人工智能得到了更广泛的关注。

生成式人工智能轨道的爆发是不可避免的。大数据和算法应用越来越成熟，模型工具越来越完善，加速了生成人工智能应用的迭代。目前，生成式人工智能已经爆发，未来仍有巨大的发展潜力。根据Gartner的统计，预计到2025年，生成人工智能将占所有生成数据的10%，而目前的比例不到1%。

当然，任何技术都是一把“双刃剑”，生成式人工智能也面临着版权问题等挑战。此外，它还面临着人工智能生成“错误”造成的各种损失。目前，人工干预是不可或缺的。但从长远来看，生成式人工智能的巨大发展潜力已成为共识。

相关资讯