发布时间:2024-09-06 13:12:14 浏览:
·要想托举好一个优秀项目,一方面要打通科研成果产业化的通道,让最新的产业命题和前沿的技术发展碰撞,从命题的设置上形成常青常新的生态;另一方面,要链接科创和市场资源,来自专家评委以及资金、孵化器、政策上的帮扶等使得创业项目持续成长。
·孵化AI独角兽需要更加宽容的环境、试错的机会,让企业能够充分探索商业化可能性,构建数据流和算法流的闭环。
在大模型热潮席卷的当下,国内AI行业已涌现出智谱AI、MiniMax、百川,零一万物、月之暗面等大模型“五小龙”企业,发展势头迅猛。当前AI大模型行业现状及瓶颈在哪里?在B端(企业端)还是C端(消费端),中国AI大模型场景落地的真正痛点是什么?能够脱颖而出的AI独角兽企业具备怎样的特质?日前,AFAC2024金融智能创新大赛执行委员会主席李晖、国方创新行业合伙人张治、上海财经大学信息管理与工程学院院长黄海量向澎湃科技分享观点,把脉大模型行业趋势。
“AFAC大赛希望能在创新创业方面起到连接器和桥梁的作用。”AFAC2024金融智能创新大赛执行委员会主席李晖表示,一个好的项目或技术研发成果的商业应用转化,是一个复杂的工程,涉及多个维度,也存在诸多难点。要想托举好一个优秀项目的孵化,需要大赛持续地做好连接器和桥梁。
“五小龙”的出现也表明大模型技术从学术研究转向商业化应用,开始在各行各业加速探寻落地场景。李晖说,大模型及AI行业出现独角兽是必然的,也是大势所趋。这些企业的发展往往能催生新业态、新模式,带动产业、技术、人才等快速成长和突破。“可以预见,大模型在各行业落地后将带来更多变革和收益,各行业对AI的需求也会加速释放,形成正反馈。”
在李晖看来,具有成长性的创新企业通常具备长远且有挑战的目标,有清晰的市场定位,善于挖掘创新的商业模式。这些企业有打造好产品的能力,能够抓住甚至创造出客户想要的需求,有一定的核心技术优势,行业专家和顶尖人才的密度是成功的关键,同时有扎实落地、快速迭代和验证的能力。
“我们会关注AI企业是否具有端到端的模型训练能力、能否组织大规模的算力资源。更重要的是在商业化方面是否有清晰、可闭环的商业路径。”国方创新行业合伙人、大赛企业组评委张治表示,孵化AI独角兽需要更加宽容的环境、试错的机会,让企业能够充分探索商业化可能性,构建数据流和算法流的闭环。
今年,北京大学、复旦大学、香港大学、蚂蚁集团等20多家名校名企联合发起AFAC2024金融智能创新大赛,在近5000支队伍中寻找中国金融科技的明日之星。“赛事点燃了初创团队和中小企业的创新创业热情,他们的方案给评委留下了深刻印象,特别是首次设置的初创组和企业组,评委们从中看到了非常多的惊喜和突破。”李晖表示。
上海财经大学信息管理与工程学院院长、大赛初创组评委黄海量表示,研报观点提取、金融风险事件推理等参赛方案与实际金融需求的贴合度较高,已经接近行业实用水平。
为了催生新业态、新模式,带动产业、技术、人才等快速成长突破,大赛为优胜项目搭建产业和投融资对接服务,让优胜企业有机会与产业链上下游企业、投资机构、政府部门等建立联系,促进项目的产业化和商业化。学术界、产业界和投资界专家也为参赛项目提出建议。
大赛是创新创业的连接器和桥梁。一个好项目或技术研发成果的商业应用转化是一项复杂工程,存在市场洞察、资金需求、成熟度评估和周期等诸多难点。张治表示,尤其像金融大模型的落地需要更长周期,金融科技企业从小场景切入,围绕自身产品叠加AI能力,提升服务效率和效果是切实可行的路径。
李晖表示,要想托举好一个优秀项目,一方面要打通科研成果产业化的通道,让最新的产业命题和前沿的技术发展碰撞,从命题的设置上形成常青常新的生态;另一方面,要链接科创和市场资源,来自专家评委以及资金、孵化器、政策上的帮扶等使得创业项目持续成长,完成大赛平台对科创企业落地的托举。
国内大模型的发展经历了从打榜到降成本的阶段。张治表示,今年上半年,模型性价比尤其受到关注。大模型如何为真实业务场景赋能、产生真正的应用价值是当前行业内最关注的问题之一。
但眼下仍未出现大模型现象级的应用,一方面,模型性能仍有提升空间,面向商业落地还需打“补丁”。另一方面,ToB的商业模式和决策过程并未发生变化,张治表示,AI只能解决企业具体业务流中的一个小环节,若AI无法对B端的整体业务流带来改变,就无法让客户为AI买单。
大模型改变B端的周期仍然漫长,但新机会在于,“现在B端服务出现了一种新模式,从以前向B端卖软件、卖解决方案,到现在直接向B端交付结果,无论是人力场景、法律场景、财税场景,大模型企业为客户交付职能外包,这是客户愿意买单的。”张治表示。
相对于B端,大模型落地C端的周期将更短,张治介绍,一些产品正逐步跑通PMF(产品市场匹配度),解决C端的部分痛点就能得到持续应用,“AI应用在C端的成熟度大于B端,个人效率助手、情感陪伴、多模态表达、口语陪练都产生了可见的价值。”
尽管当前大模型技术和产品存在同质化,但黄海量认为,从科技发展历程来看,同质化是必经阶段,无论是大模型的原创性技术,还是垂直落地的应用技术,当前仍处于科技浪潮的早期,业界对大模型的认知是趋同的,一定程度上约束了大模型应用开发的发散性,但已有企业在越来越多地探索差异化道路。
张治认为,“产品的设计能力和定位能力很重要,产品定义和模型训练应该是一体化的。产品和客户互动的方式决定了产品的设计,也决定了模型的训练,用什么样的数据训练。”不同数据集训练出来的模型偏好和能力不同,这考验企业的原始资源禀赋。
随着大模型的发展,数据量级已从TB级跃升到PB级,对数据的需求也从单一文本向图片、视频、语音等多模态数据爆发,数据需求越来越复杂。
“在ChatGPT出圈之后,业界对算力、算法、数据这AI发展的三驾马车提高了关注度,避免 ‘木桶效应’成了大模型发展首要考虑的问题。”李晖表示,在算法方面,对Transformer基础架构及其衍生模型进行优化和创新是当前的主流,但追求底层的根本革新仍有欠缺。
大模型底层原理和基础是当前学术研究的前沿。黄海量表示,尽管Transformer架构和注意力机制被证明是有效的,但在处理长文本时会出现效率较低、算力依赖过大等问题,学术界正普遍研究是否有效率更高的架构来取代现在的Transformer架构。
而学术界与产业界的深度碰撞对于大模型学术研究和落地应用是必不可少的。“一个成功的金融大模型杀手级应用,可能不是仅通过科技公司做出来的,而是要跨行业整合。”黄海量说,正如这次大赛,参赛选手与科技界、学术界深度碰撞,提振金融大模型赛道上前行者的信心,推进产学研合作。