自从今年 3 月 Suno 火爆全网,音乐生成赛道便人才辈出。有才的不是各家的大模型,而是擅长整活的广大网友。
从「萨菲罗斯男人中的男人」到「你的钢门比较松弛」,初听痛苦,再听着迷,AI 以鬼畜、抽象的方式出道音乐界,征服了你我他的心。
我们也就此明白,AI 还不是来代替人类的,而是更像一个趁手的工具,让脑洞实现生产力的大解放。
8 月 8 日,字节旗下的豆包,表示也要加入这个家庭,网页和手机端都上线了音乐生成的功能。
豆包的音乐生成功能有什么不一样?能不能让更多人玩起来?体验了 2 天后,我们有了一些有趣的发现。
25 秒三段歌曲,接地气又懂艺术的国产音乐 AI 来了
目前,豆包能够生成 1 分钟以内的音乐,支持民谣、流行等 11 种曲风,驾驭快乐、忧郁等 9 种情绪,音色只能指定男声或者女声,歌词可以让 AI 生成,也可以自己上传。
如果你拿捏不准自己要什么曲风、情绪,可以直接听听输入框上面现成的模板,哪首歌曲听着顺耳,就可以一键「做同款」。
我一眼相中了《牙买加的偶遇》这个超 chill 的夏日风模板,那么就等于选定了「雷鬼」的音乐风格、「活力」的情绪、「男声」的音色。
▲ 豆包的网页端音乐生成界面
然后再让 AI 帮我写歌词,我从头到尾只需要打几个字,描述歌词要表达的主题。身为「紧人」的我,输入了「古希腊掌管松弛感的神」。
几乎无需等待,25 秒左右就出来了 3 段 1 分钟左右的音乐,歌名、封面、歌词、旋律,都由 AI 一手包办。
▲ 收听点这里
封面符合古希腊的主题,像幅油画,艺德充沛。歌词更是深得我心,报菜名似的,把神的名讳挨个说一遍。旋律还很容易上头,适合单曲循环。句句不提松弛感,句句都是松弛感。
至于 AI 演唱的水平,难得的是总体的中文演唱效果很好,吐字清晰度、演唱流畅性胜过海外的音乐生成 AI,甚至听出些北方人的调调。
再蹭一下奥运会的热点,输入「光靠干饭就获胜」,生成一首嘻哈音乐。
▲ 收听点这里
AI 不仅拥有清澈的男声,还懂得跟着伴奏变换唱腔,强有力地切入,抒情地收尾。我很喜欢歌词体现的生活态度,吃饱喝足,才能上场比赛。事已至此,先吃饭吧。
论表达感情,AI 这个风格百变的歌手,可以欢快而活泼,也可以细腻而深情。
▲ 收听点这里
让豆包以「奶奶的针线包」为主题唱一首民谣,朴实的歌词仿佛讲了一个故事,女声缓缓道来,没有复杂的技巧,没有过多的修饰,就足够打动听者的内心。
除了指定主题让 AI 生成歌词,我们也可以自定义歌词,但这个概念很宽泛,AI 的参与度可大可小,我们可以粘贴自己的歌词不做改动,或者再让 AI 优化,甚至完全让 AI 随机生成。
豆包对于版权比较严格,我上传了一段明代戏剧家汤显祖《牡丹亭》的曲词,但被豆包拒绝生成了,因为涉嫌侵权。
较真些挺好,总站在前人的肩膀上也很无聊,我上传了几句最近的热梗,「偷感很重、已读乱回、别吵我在思考、感觉尸体暖暖的、正是藏不住话的年纪」,随意排了序,让 AI 帮我优化歌词。
结果 AI 稍加改编之后,这个歌词看起来还真有些意义,像一个网速 5G 年轻人的自嘲。
▲ 收听点这里
就拿这段歌词,让豆包来段忧郁的、男声演唱的民谣,AI 这回不仅吐词清晰,唱腔还确实有些伤感,吉他这么一弹,仿佛云南哪个酒吧的长发忧郁男。
接下来我又上传了一段歌词,是之前让 Siri 给我写的诗,不用 AI 改编,直接用,表现一个赶 DDL 的创作者美好的精神状态。
▲ 收听点这里
爵士的风格、活力的情绪、女声的演唱,乐景衬哀情的化学反应果然很奇妙,一曲听罢,码字都变得更有精神了。
一番体验下来,我觉得豆包很适合我的中国宝宝体质。
普通话拿捏了,风格也更符合国内听众的喜好,擅长民谣、嘻哈、R&B 等曲风,旋律流畅,歌词通俗易懂、贴近生活,听着听着,人就跟着哼起来了,听了三遍,就会唱了。
▲ 豆包的手机端音乐生成界面
同时,初出茅庐的豆包也存在不足的地方,一个是时长短,一个是定制化功能欠缺。
豆包目前只能生成 1 分钟,Suno 已经可以生成 4 分钟。
Udio 最近的更新引入了调性控制,作为音乐爱好者,我也希望豆包后续能提供更多定制性选项,目前豆包暂时不支持生成男中音、高音等音色,不支持乐器,曲风还不够丰富。
最懂个性化的 AI 音乐,是属于所有人的表达工具
豆包的音乐生成虽然是一个新功能,但上手没什么压力。
「音乐生成」和「帮我写作」「图像生成」等功能一样,驻守在网页端的聊天框上方,等你点击,或者用「@」和「/」召唤,无缝融入豆包的生态里。
选择这个功能之后,豆包也很懂得照顾对音乐一窍不通的小白,连提示词的公式都帮着写好了,我们只需要在蓝色框里做选择题或者完形填空。
而且,其中一个选项是情绪,使用起来很直观,不通乐理的普通人,同样能下意识地判断,我们希望这首歌包含怎样的感情。
生成歌曲之后,豆包还会推荐一些相关问题,顺便让我们学点知识,相比垂直的音乐生成平台,时刻陪伴的聊天机器人不会让你觉得弱小孤独又无助。
即使不是专业的音乐人,也可以在这里贡献创意,拿到一首包含歌词、歌名、封面的完整音乐作品。
作者栏上面的名字,首先是你,其次是豆包,时刻提醒着,这份作品有你的贡献。
当 AI 生成的音乐日渐丰富,海外的 Suno、Udio,都在向音乐社区发展,它们的首页,以热度、题材、风格等标准,给歌曲列排行榜。
然而目前看来,它们取代 Spotify 为时尚早,这是因为,大多数 AI 生成的音乐离专业创作还是有距离的,不耐听,大白嗓,旋律简单,缺乏抑扬顿挫和起承转合。
豆包也存在这个问题,有些生成结果不如人意,比如拿「青梅竹马」作为主题,豆包写的歌词就有些敷衍了。这可以理解,要给 AI 一些成长时间,才能更好地捕捉人类「郎骑竹马来,绕床弄青梅」的意境。
不论国内海外,AI 生成音乐存在共同的难点,音乐的信息密度极高,每一秒都可能整合了多个节拍、音符、和声。同时,不同乐句之间还要保持流畅性,多种旋律和声音也需要协调。总之,生成音乐可比生成语言难得多了。
但这不影响我们可以用 AI 音乐,个性化地表达自我。那些难以为外人道的心绪、灵感,存在被 AI 接收并生成出来的可能性,这是目前 AI 赋予每个人的微观创作权利。
技术交给产品团队去攻克,作为用户,我们输入简单的提示词,就能让 AI 带给我们灵感和创造。
为午餐创作一首歌、创作一首关于月亮的歌…… 提示词只有一句话甚至一个词,但可能确实是我们当下的所思所想。
我常常在周日晚上陷入焦虑,玩也玩不好,工作也工作不了,只能通过晚睡的方式,延缓又一个周一的到来。
基于这种心情,我给豆包指定了一个主题:「周日恐慌」,音乐风格 R&B,情绪伤感,女声演唱。
▲ 收听点这里
AI 给出的作品,有些出乎我的意料,这些歌词,不就是我想说的话吗?AI 甚至还能把它们唱出来,押了韵。
更多情绪上头的时刻,我们都可以邀请 AI 共享和分担。最近广州的天气太热了,于是我让豆包基于「热得我拖鞋都快融化了」的主题写了一首放松的摇滚。
▲ 收听点这里
天气一热,人是想什么都不做,豆包很擅长写这种带点情绪的主题,甚至可以道出我们内心的潜台词,一口郁气也就跟着吐出来了。
曹操在《观沧海》里写,幸甚至哉,歌以咏志。
虽然这些歌是 AI 帮我完成的,但也只有我能够生成,并需要这样的歌曲。
豆包的音乐生成功能简介是:「把你的想象力变成音乐。」
AI 让我们的想象力,更容易具象化了。AI 创作离专业作品还有距离,但每个人都能参与其中,以更丰富的方式表达自己的感情。
点击播放键,听到歌曲,不管那一瞬间是被打动了,还是被逗得笑出声了,内心被击中的微妙感觉,就是技术给予人性的糖果。