2024年初,酱香酒企肆拾玖坊在经销商群里投放了一个大模型驱动的聊天机器人。
群聊机器人不是什么新鲜玩意儿,但大模型是时兴技术。肆拾玖坊是酒企里的新兵,2015年才成立,与传统酒企相比公司规模不大,但对新技术敏感。肆拾玖坊CIO(首席信息官)张鹏告诉我们,经销商对酒企来说太重要了,希望借助大模型的自然语义交互功能提高对经销商的服务能力,实现提高销量的目的。
热闹了一段时间,张鹏有点失望,“大模型加持的机器人就是不一样,特能说,比闺蜜还能提供情绪价值,但这不是业务价值。”
大模型落地企业的方式主要有两种。一种是企业私有化部署大模型,它可以保证企业的数据安全,但部署成本高达数百万元,适用金融、电信、能源等数据敏感行业。另一种是调用厂商的大模型API(应用程序编程接口),它的成本低,主要以输入输出的Token(模型可以理解和生成的最小单位,它可以是一个词、一个数字或一个标点符号等)量计费,部署方式简单,适合的场景也更广泛。
肆拾玖坊主要采用成本低的API调用模式。试点后,公司发现大模型对业务价值有限,决策者对后续大模型落地的探索已经趋于保守。
我们和十余位散落在各行各业(主要是相对传统的行业),规模不尽相同的头部公司CIO交流了大模型的落地情况,得到两个反馈:
其一,作为当下被认为是最重要的创新技术,大模型确实受到企业重视。他们想通过大模型技术解决痛点业务场景的问题,给企业带来降本、增效、提质、拉需、创利等实际价值。
其二,目前大模型技术主要在单点、小场景落地,难以对业务整体带来直观回报。 一位头部咖啡连锁品牌首席技术官表示,大模型只能锦上添花,无法雪中送炭。
目前,多数企业落地大模型的阻碍包括但不限于以下四点:明确有商业价值的落地场景有限、模型落地的工程化能力不足、行业和场景大模型尚不完善,以及企业自身对大模型的认知不足。
中观数据侧面支撑了以上反馈。国联证券核对了A股全部公司2023年财报,有883家上市公司提及生成式AI业务。落地的企业集中在TMT(Technology科技、Media媒体、Telecom电信)行业和大市值公司。超过一半的一级行业渗透率不到10%,A股上市公司整体渗透率不足20%。
从结果看,先行企业探索的落地场景有限,集中在虚拟人、客服问答、营销文案、平面设计、代码生成、知识库、智能助手等。这些场景与企业核心业务的关联较轻。由于大模型生成的内容和训练数据、提示词的质量息息相关,以上典型场景的大模型落地效果也很参差。
率先落地大模型技术的多是技术敏感、数字化基础较完善的企业,其他企业要落地大模型还需要补上这两课。各行业普遍对大模型讨论多、落地少。医药流通行业某头部企业的副总经理告诉我们,在他看来,2024年不是所在行业的大模型落地元年:人才、认知、技术都不足。
也就是说,目前大模型落地的是那些天然离数字化近的行业,更多传统行业目前仍处于观望状态。这符合新技术推广规律,也给科技公司带来时代命题——如果大模型真是一个能够促进产业革新的大技术,它在更广阔的行业赛道上的落地之路,应该怎么走?
“我不会为玩具买单”
企业落地大模型的步骤一般分为三步:
第一,IT团队梳理市场上开闭源模型的性能特征。不同的模型有明显差异,有的语义理解能力强,但对数据、时间不敏感;有的逻辑推理强,但语言表达不够好;还有的英文场景能力强,中文场景能力弱……
第二,识别各业务线的痛点,即大模型技术和业务需求的交叉结合点。
第三,评估具体大模型的适配场景。
为此,技术团队需要制定技术预算、投入人力资源、协调跨部门合作。但即便如此,大模型落地后的业务并不一定能收获更多商业价值。
智谱AI的相关负责人告诉我们,大模型行业经过一年多的发展,国内企业客户从2023年关注参数和榜单,到2024年更关注价值转化,即企业端的需求实现了“模型为王”到“商业价值为王”的转变。这要求企业找到大模型能力、企业场景和业务节点的最大公约数。
这不是一件易事。张鹏分析,其经销商群里的聊天机器人属于市场营销工具,经过大模型技术升级后,聊天机器人的语言表达更加自然,但仍不具备销售人员的主动服务和专业素质。它提供的核心功能是同步产品价格、渠道等信息或行业通识类知识,整体能力相比上一代问答机器人虽有提升,但业务价值不明显。
一开始张鹏选择聊天机器人落地大模型技术,是因为营销场景能直观评估商业价值转化。但从结果看,这个场景的投入和产出“不太能达到预期”。
上述头部咖啡连锁品牌CTO认为,目前大模型技术在业务中展示了部分效率工具的价值。该公司将大模型引入营销、客服和内部培训场景,大模型在辅助文案和设计创意时“有些作用”。但他评价效率价值是相对的,对企业来说业务价值更重要。 因此,他对后续大模型落地的优先级排序不会很高。
多位产业企业的CIO告诉我们,希望模型厂商提供更多大模型落地的标杆案例。但国内头部厂商的主要精力都在突破底层大模型,以实现对海外企业的追赶。它们普遍保持三个月迭代一次底层大模型的节奏。因此,大多数模型厂商和企业沟通时,以推销技术为主,而不是提供行业解决方案。
企业落地大模型的一个误区是,优先关注大模型的能力,拿着锤子找钉子。但现实是,不是所有应用现在用大模型重做一遍都能产生商业价值。
海底捞在2023年初开始接触大模型技术。和大多数企业一样,当时他们遵循外界对大模型的普遍印象,将其引入营销文案自动生成、飞书问答机器人等场景。海底捞信息技术部产品负责人杨炫之总结,那个阶段的应用“偏玩具、偏实验”,对业务帮助不大。
要找到价值场景,企业往往需要一段时间的探索。直到2024年初,海底捞才有所突破。杨炫之总结,大模型适合与成熟的小模型结合,落地重复性劳动的场景。
一个典型场景是,2024年初海底捞将大模型技术引入中央仓的物料识别环节。中央仓是海底捞门店货物的集散地,接收来自全世界的商品。商品的语言、印刷包装差异很大。过去中央仓使用OCR(光学字符识别技术。是一种扫描和识别图像中文字信息,并将其转换为可编辑、可搜索文本格式的技术)技术识别和提取物料的生产日期、保质期、厂商等信息,再让人工做信息归类,将物料信息整理成系统可识别的格式文档,发放给集团公司上下游单位使用。
杨炫之解释,OCR就是一个小模型,解决了信息识别和提取的问题,后续的信息归类则是人工的重复性劳动场景。人工信息归类存在翻译标准不统一、耗时长、成本高的问题。此前海底捞中央仓归类一条中文物料信息的成本大约是五角钱,归类一条外文物料信息是八角钱。现在接入大模型自然语言理解能力后,这个工作可以交给系统高性价比地完成。
能够像海底捞一样花一年时间尝试大模型在不同场景落地的企业是少数。多数民营企业在经济逆风的背景下减少了创新预算。如果在大模型落地早期选错了业务场景,企业的探索就会浅尝辄止。
2024年5月以来国内大模型厂商集体宣布降低调取模型API的价格,就是要降低企业探索大模型的落地成本,吸引更多企业加入大模型应用的创新生态。
有国内头部大模型厂商的核心人士评价,降价不是为了打价格战,是为了吸引客户,大模型落地科技公司其实是先走了一步,从其他行业的视角看,很多企业还没有到为大模型买单的阶段。
新兵器,难上手
在武侠世界里,人剑合一是达到武学最高境界的象征,在大模型的浪潮中,大模型融入企业的业务和发展,才有可能发挥出想象中的威力。这意味着企业内的系统、数据要充分和大模型融合。这极其考验企业数字化建设和工程化开发的能力,底子不够的企业甚至拿不起这个新兵器。
具体来说,企业的核心业务要落地大模型有两个前提条件。一是企业建设了数字化系统,且多个系统间能打通实现互操作性。二是企业实现对内部数据的整合与治理。
前者考验企业过往的数字化建设水平,只有打通了OA(办公自动化系统)、ERP(企业资源计划系统)、MES(制造执行系统)、CRM(客户关系管理系统)等内部管理工具和生产力工具的企业才能为大模型落地提供便捷。
后者需要企业挖掘散落在各处的海量的Excel、CSV、XML等格式的结构化数据和音频、视频、图片等非结构化数据,并完成对数据的清洗、预处理、打标、向量化处理等工作。这才能让大模型理解并使用企业的数据。
一直以来,产业企业中的IT部门主要承担采购的角色,为业务场景筛选、采购合适的技术解决方案,而很少承担具体的开发工作。IT部门可以花高价采购外部服务完成企业数字化系统建设,但是大模型对企业还提出了新要求——如何将企业原来的数字化基础与大模型结合、如何将专业人士对业务场景的理解转化为知识库和知识治理,这都需要大量的工程工作。
目前,大模型落地快的多是在智能化投入时间长、投入资金大的企业。它们的数字化基础较完善,模型厂商也愿意为这些少数头部企业提供贴身驻场的定制化服务。
然而,千行百业更多的是规模不那么巨大、年投入数字化资金有限的企业。它们的数字化建设和工程化开发能力落后,要用好大模型更需要贴身的工程化定制服务。 大模型厂商却因为要控制成本、精力有限等原因无法顾及这部分需求。
这是当下大模型落地的痛点,也是未来的机会——大模型落地,需要一个第三方开发服务商群体。
某消费领域头部企业的数字化负责人告诉我们,美国有很多软件企业在探索大模型场景落地的工程化服务业务,但国内这个生态还有缺陷。已有的服务商集中在大模型私有化部署领域,而对大模型API调用的深度使用关注不足。同时无论哪种落地方式,将大模型与企业价值场景结合的工程化解决方案都不成熟。
相关解决方案缺失会让企业只能在单一业务节点接入大模型,而无法在更复杂的业务场景落地大模型应用。
蒙牛落地大模型的进度在国内企业中处于第一梯队。其数智化团队从2022年下半年接触并进行大模型技术落地。蒙牛首席数智官李琤洁告诉我们,公司内部已经沉淀了一套大模型落地方法论。
蒙牛构建了“1+2”的AI技术底座。“1”是AI基础设施,它能高效且高性能地调度多模型并保障服务合规和数据安全。“2”是企业大脑和知识银行。其中企业大脑负责串联、调度大小模型,通过API方式接入和调用业务中台的已有能力,实现企业内系统的打通。知识银行则在充分挖掘企业数据后,将数据向量化处理,使之成为AI友好的知识,积累并治理蒙牛的行业知识。
在技术底座之上有AI Agent Builder低代码平台,它允许业务人员通过拖拉拽的方式快速构建AI Agent(具有一定智能性,可以自主或在用户指导下完成特定工作的软件实体)赋能具体业务场景。李琤洁告诉我们,如果企业只能在单一节点使用大模型,它能产生的价值就不大。以营销场景为例,蒙牛实现了大模型辅助营销投放决策及执行的端到端流程优化。
内容策略上,大模型会结合社媒热点、品牌及产品信息,自动进行创意概念及内容框架生成。具体营销内容的生成,则综合传播平台定位、账号定位、关键词策略等参考因素。投放人群决策上,大模型基于投放目标、投放预算、媒介属性及目标人群等进行自动推荐。投放效果分析上,大模型会根据行业及蒙牛过往经验、舆情声量、投放目标等,生成效果评估。
整个流程调动了知识管理Agent、数据调度Agent和信息分析Agent共同作用。如今蒙牛营销的投放响应率比人工方式提高了12% 。
李琤洁总结蒙牛大模型落地的经验:只有合适的AI底座+可部署的AI部件+公司特有知识/流程定制,企业才能实现端到端流程的优化提效。
过去ISV(独立软件开发商)提供不同领域的通用解决方案满足企业具体需求。但大模型应用落地建立在业务场景理解、知识梳理、知识增强、知识分发与应用的基础上,鲜有ISV掌握企业场景知识,这在市场上留出了很多空白。
很多厂商开始响应客户需求,提供模型部署的底层工程化能力。但因其对业务场景不熟悉,产品难以满足企业的实际需求,“好用的凤毛麟角”。
现阶段国内模型落地的服务生态尚未成熟,大模型落地依赖企业技术团队的统筹和开发能力。这在无形之中提高了大模型落地的门槛,也让更多基于通用大模型的创新应用场景难以被开发。
行业、场景模型尚未完善
落地服务商的位置空缺,导致通用大模型的能力不能在业务场景中得到充分释放。而在通用大模型能力覆盖不及的行业和垂直场景,与之更适配的模型同样处于缺位状态。
目前各大厂商商业化的主力都是通用大模型。它的知识面广但深度不够,在产业中的实用性不足。与之相对,行业和场景模型是专才,深钻具体场景需求,可以提供更多业务价值。
一方面,建筑、化工、医疗健康等具有高专业壁垒的行业尤其需要行业模型。以建筑业为例,建筑项目通常规模庞大,涉及设计、施工、管理等多个阶段,需要处理大量数据和信息。但建筑行业有独特的专业知识和规范标准,相关数据和信息的处理需要模型能够理解和应用专业知识,通用大模型通常难以应对建筑专业项目的需求。
去年下半年以来,多家厂商都推出了行业大模型。但产业界的共识是,这些行业大模型的能力极其有限。
多位产业企业CIO认为,让模型厂商提供行业模型本身就存在悖论。模型厂商训练大模型的数据一般来自互联网公开数据、采购的外部数据和企业自有数据。这些数据以通用为主,难以涵盖具体行业。行业数据主要掌握在行业的头部企业手中。但多数行业企业没有模型厂商的研发实力,也难以脱离主营业务开发行业大模型。
对此,模型厂商的主流做法是和行业头部企业共创开发行业大模型。但模型厂商不能将企业的数据纳为己有,这就无法解决行业数据来源的问题。
一种观点认为,行业头部企业部署私有化大模型后,可以将相关经验输出为行业解决方案。另一种观点认为,细分领域的科技公司也有机会成为行业大模型的推动者。不过多位消费、供应链、餐饮行业头部企业的数字化负责人表示,目前没有在业内看到完善的私有化模型。
缺少行业模型的后果是,大模型的准确率不足,和行业核心业务适配度低。一位给国内头部厂商做模型私有化部署的代理企业负责人告诉我们,截至目前,他给4-5家能源、金融、电信行业的企业推销过大模型,一开始这些企业都有兴趣,其中两家还进入了POC(Proof of Concepts的缩写,意为“概念验证”。它是一种解决方案,用于验证某个概念的有效性和适用性)阶段,但最后一家都没有买单。
核心原因是大模型准确率不足,最高只能达到70%左右。企业级应用对大模型的准确率要求越高越好,准确率达95%是一个门槛。目前国内主要模型厂商的解决方式是通过提高底层模型能力,提高大模型应用的准确率。
另一方面,具体场景模型的缺位,同样阻碍了大模型的落地。肆拾玖坊正在探索将图片模型落地酒品包装设计。他们尝试了多个开闭源的生图模型,没有发现可以直接应用的产品。
张鹏解释,包装设计和其他平面设计不同,印刷要求分辨率10M以上的图片;公司产品的核心受众是国内中年男性,包装设计要符合他们的审美;包装设计还要涵盖商标文字信息。
而现在市场上文生图模型生成的图片精度不达印刷要求;图片风格以二次元为主,即便微调模型后,也难以生成令人满意的符合酱酒设计的中式和新中式风格;能在图片上准确生成文字的模型也有限。
理论上,服务商对图片模型进行再训练和工程化开发,就能打造一款包装设计的大模型应用。但张鹏接触的几个服务商都对此表示兴趣不大。因为这意味着数十万元的研发投入和更长的商业转化周期。
多数服务商只希望卖通用大模型技术,并捆绑销售算力、云等现成的配套设施。 品牌方没有训练模型解决行业问题的能力。这就造成了大量需求服务的空缺。
大模型人才,既贵且少
一个事实是,目前能够落地大模型技术的企业是少数。多数企业因为数字化基础薄弱,缺乏对大模型技术的人才和认知积累。
某全球某顶级饮料国内代理商的数字化负责人告诉我们,他所在的公司从今年1月就开始通过各种渠道发出招聘信息,希望找到一位有咨询背景的大模型技术人才推动技术落地。到了5月下旬,这个人依然没有找到,其所在部门提供的技术方案还是传统的决策式AI。
传统企业如果无法从内部培养或从外部引入AI人才,就难以跨越对新技术的认知鸿沟。
对产业企业来说,从外部引入大模型人才难度很大,因为它要和科技企业竞争。2023年11月脉脉高聘人才智库发布的《2023人工智能人才洞察》显示,互联网、新生活服务、游戏等企业对AI人才的需求最大。2023年前八个月人工智能新发岗位开出的平均薪资为46518元,较2022年提升6.16%。
其中,数据挖掘、算法研究员、算法工程师平均月薪超过5.1万元,年薪(不包括年终奖)超过61万元。与之相对,2023年国家统计局公布面向社会生产和生活服务的IT岗位(城镇私营单位信息传输、软件和信息技术服务业)平均年薪仅为15.6万元。
AI人才可以带来技术认知和储备。有意愿招聘AI人才和已经有AI人才储备的企业,更容易落地大模型。由于AI人才的投入不菲,企业决策者对引入AI人才和落地大模型的态度将起到关键作用。
杨炫之指出,那些在过去曾从数字化建设中获益的决策者,更愿意投资新技术。否则,即便有专业的技术人员告诉他们大模型的价值,决策者也难以理解和相信。 “只有见过、用过、感受过技术好处的人,才能在新技术出现时愿意投入。”
蒙牛、海底捞大模型落地“快”,就是因为企业的决策者早就尝过数字化的甜头。海底捞从2016年开始加大对数字化转型的投入。公司财报显示,海底捞2018年上市的发行所得款中20%(约14.6亿港元)将用于“开发及使用新技术”,2018年以来,这笔资金每年消耗上亿港元。
杨炫之提到,海底捞的企业文化和组织架构支持技术团队在多个业务场景试验大模型。同时,海底捞所在的餐饮业已发展上千年,行业通用属性强,适合目前的大模型落地。作为行业头部企业,海底捞可以获得模型厂商的贴身服务,解决大模型落地的工程化问题。
然而,如蒙牛、海底捞一样在过去几年投资创新技术并获益的企业是少数。国际管理咨询和信息技术服务公司埃森哲发布的《2023中国企业数字化转型指数》显示,受宏观环境影响,中国企业聚焦运营和成本优化,创新力度明显减弱,2023年业务创新活跃的企业占比降至9%,较2022年下降约一半。过去六年,参与数字化业务创新的被调企业占总数的峰值为17%。
好消息是,企业对大模型技术的认知并非一成不变。它和大模型应用的商业价值、标杆案例、行业模型落地紧密相关。
有医药流通行业头部企业的副总经理告诉我们,受相关利好因素影响,即便是尚未组建AI团队的企业,也可能迅速采纳大模型技术获得收益。尤其是传统行业的头部公司,它们具有后发优势,当大模型对行业的价值显现后,它们可以通过投资并购获得相关能力。
2023年以来,AI大模型成为科技行业的新引擎,吸引了大量的资金,并催生了多家独角兽企业。但大模型究竟是一时的泡沫,还是具有实质性业务价值的工具,这个疑问一直盘桓在很多企业决策者心中。多位受访的CIO表示,今年是大模型在一些行业探索落地的元年。大模型的价值就将在落地实践中得到回应。