7月,上海世界人工智能大会( WAIC )上人头攒动,各家公司各显神通,各式各样的机器人、虚拟人与AI生成的图片、视频与音频一起,组成一幅光怪陆离的画面,不禁令人遐想,AI对人类社会大规模改造的时代是否已经近在眼前。
与往年不同的是,今年的WAIC拥有了首支AI原创主题曲——《WAIC 正青春》,展现了人工智能在艺术创作领域的可能性。
生成式AI是今年最热门的科技话题之一——先是文生音乐工具Suno火爆,让许多人感叹“音乐界的ChatGPT”已经降临;紧跟着是OpenAI推出能打造音乐MV的Sora,国内的科技公司,如快手和字节等,也相继推出了自己的视频生成大模型和AI音乐工具。
人工智能,有再造字节或拼多多的机会吗?
相比往年,今年WAIC的特色在于,从业者们不再囿于对基础大模型的讨论,而是出现了更多面向垂直场景的应用端产品。这代表着技术研发人员的思路已经越来越清晰,AI也越来越接近普通人的生活。
从2022年底ChatGPT发布至今,也不过短短一年半而已。趣丸科技副总裁兼首席战略官庄明浩记得,一年前大家的讨论还局限在AI在语言和文本的应用,但如今,图片、视频、音频、音乐等等多模态板块爆款频出,也证明了新浪潮的生命力。
在这千帆竞逐的AI浪潮之中,无论是初创公司还是中小型公司,都再一次获得了与巨头公司同台竞技的机会——就像十多年前移动互联网创造的那方擂台一样。
庄明浩用“AI对创业者是暗牌,对大厂是明牌”这句话来概括如今的混战局面。
所谓“对大厂是明牌”,指的是对所有大厂来说,在今天做AI都是题中之义,是赋能现有业务必须要做,也有计划有节奏去做的事情;而“对创业者是暗牌”,指的则是对创业公司来说,要判断AI的创业方向,则是要靠猜、靠揣摩的事情。
但是,新一代巨头往往隐藏在打暗牌的机会之中。“2010年,大公司都在对业务做无线改造的时候,没有人会想到几年后会出现拼多多、抖音这样的公司。”庄明浩说。“只有明牌不成牌局,有了森林才会有参天大树,有了复杂的生态才会有出色的公司”。
十年前,趣丸科技抓住了那张“暗牌”,推出了TT语音,打破了移动语音市场的空白。十年后,在新一轮明牌与暗牌交错时刻,趣丸科技为什么拥有坐上牌桌的资格?庄明浩给出了三点原因。
首先,是趣丸在泛娱乐等垂直领域已经深耕十年,对这个场景的生态和用户有深度理解。“我们这些做业务的公司,本质上来讲,都是为了满足用户场景去做的,满足用户诉求,始终贴近用户需求,就是创业公司和业务公司一直以来的使命。”庄明浩说。
其次,是在垂直模型的研发上,趣丸长期投入自研的技术积累以及“人无我有”的高质量数据积累。在AI领域,数据的重要性远高于模型,而拥有独有数据的企业将更具竞争优势。
最后,趣丸拥有高粘性、高活跃的试验场景。如前文所说,因为拥有受欢迎的扎实产品,趣丸的创新性技术得以快速走出实验室,接受用户和市场的检验和打磨,尽早进入“研发—提效—增收”的正向发展循环。
先成为专才,在擅长的领域找新机会
2011年移动互联网兴起之际,著名风投公司合伙人约翰·杜尔提出了“SoLoMo”概念,即Social(社交)、Local(本地化)和Mobile(移动)。这一概念提出时,被很多人公认为是互联网未来发展趋势,成为了指引很多公司前进的标准答案。
回归到当下这个时间节点,AI仍处于发展的早期阶段,那个大家期待的标准答案仍未出现。无论是大厂还是初创公司,都不断在尝试和探索、取舍和博弈,很多东西都是模糊态的混乱的。但对于有些公司而言,这种“混乱”不是深渊,恰恰是阶梯。
相比于大厂“卷”通用大模型和大客户,趣丸科技更像是一个拥有“通才思维的专才”,其更擅长在垂直场景中解决难题与找新路径。这是趣丸与生俱来的优势和底气,且早已证明过自己的能力。
“现在快速演进的行业状态以及基础大模型能力的迅速迭代,给做工程端、应用端的公司带来了挑战。”庄明浩说,这导致基于大模型来塑造产品的公司常常被“拖着走”,往往是自己刚改好,底层模型又变更,很难保证服务的稳定性。
趣丸科技的做法是基于自己深耕的语音和泛娱乐场景,去自研垂直“小”模型,自己做训练,并形成了“产模并行”的发展路径。“在这个领域里面,我们能够保证这个模型是相对稳定的,不会特别受到底层通用大模型的迅速迭代带来的冲击。”庄明浩说。
截止目前,趣丸科技自研的垂直大模型已覆盖音频、音乐、对话等领域,在多模态理解、生成、交互上更专精更好用。在此前发布的《2024中国人工智能行业大模型企业竞争力100强研究报告》中,趣丸大模型也跻身100强行列。
比如,在AI音乐领域,趣丸科技自研出了全球范围内首个多模态配乐大模型,具备文生音乐、音频生音乐,甚至是视频生音乐的能力,支持AI作词,自动作曲、编曲、混音等,能够一站式解决用户音乐创作全流程难题,让普通音乐爱好者真正实现零门槛创作音乐。
AI音乐,是一个没有标准答案的新赛道。当“音乐界的 ChatGPT”Suno横空出世,全世界的注意力都投到这个小版块上时,趣丸科技已经耕耘了多年。可以说,趣丸科技也是业界最早开发音乐大模型和AI原生应用产品的企业之一。
此外,基于自研的生成式动作大模型和音频大模型等技术,趣丸科技开拓出了数智人、多语言翻译等一站式的企业级解决方案。除了服务于其产业链上下游的游戏厂商、MCN机构的视频内容创作、出海等业务,还被应用于智能客服、本地生活、影视文旅等场景,辐射了万亿级市场规模,合作伙伴包括中国电信等知名企业。
几乎所有的大产品,都是起于垂直人群,然后不断泛化最终变成国民级产品。而AI将结构性地改变用户体验和产业生态,垂直应用场景孕育的广泛商机不言而喻。
AI的“平权化”,让大家拥有站在同一起跑线上的资格。但对于创业公司来说,在垂直行业里做到“产模并行”的这一趣丸路径,或许可以借鉴但无法硬搬,毕竟数据和行业know-how积累是关键,积累得越久壁垒也就越高。
用“简单公式”抓住确定性之锚
AI时代大浪淘沙,企业如何在不确定中抓住确定性?庄明浩认为,决定成败的始终是一句“正确的废话”,那就是“贴近用户需求”。
“我们一直以来的使命,就是通过创新的技术和产品,来解决用户一直以来没有被满足的需求。”庄明浩说。无论技术怎么更迭,资本环境怎么变化,做X+AI还是AI Native,这个底层的逻辑永远不会改变。
从自研垂直大模型,到构建起全栈式AI交互技术产业生态。趣丸科技始终坚持从用户需求出发,优先选择典型的垂直场景作为试点进行突破,试点成功之后再将成功经验复制到其他场景,由此降低AI转型中的不确定性。通过种种的“多做一点”,实现了让用户与客户的“稳定一点”和“好用一点”。用这种一步一个脚印的“笨办法”,逐渐得出了一生二、二生三的“简单公式”。
与此同时,面对看上去是无所不能的AI,趣丸科技也强调使用的“边界感”。这个边界既包括AI与业务场景的融合的边界定义,也包括对现阶段AI能够做到什么技术程度的边界理解。
“今年的WAIC大会,让我回想起十几年前参与移动互联网大会时的感受。”庄明浩说。当年北京鸟巢旁巨大展厅里的气氛,与如今WAIC在上海引发万人空巷的状态如出一辙。
面对更加残酷的竞争环境,趣丸科技已在垂直领域率先建立一定的壁垒和优势,优先拿到跟上AI时代大浪潮的船票。明年AI行业的先行者们会带来什么新东西呢?企业如何储备更多的“弹药”?
庄明浩相信,AI行业在一两年之内就会迎来见证胜负的时刻。而现在,我们就像行走在黑暗森林里,你在森林的某一处燃起火把,只能照亮旁边的范围,但慢慢走下去就会看到有一些地方有微弱的光,发现更多的同类,直到把这些光连在一起,共同迎来一个崭新的世界。