曹刚:加速大模型产业落地

无敌椰子 阅读:29 2024-09-14 19:00:02 评论:0

专题:2024中国AIGC创新发展论坛

曹刚:加速大模型产业落地

  2024年服贸会专题论坛之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举行。蚂蚁集团财富保险事业群平台科技总经理曹刚出席并演讲。

  曹刚表示,大模型技术是实现高质量金融服务普惠的关键。他说,高质量的金融服务是非常稀缺的,从统计数据来看,目前国内投资者大概有7.2亿,但真正具备投资顾问资质的专家只有20万,要服务好广大消费者的,光靠专家的能力是非常困难的,而且金融服务门槛比较高。

  “大模型技术的到来,让我们看到了高质量金融服务普惠的可能性,大模型具备压缩世界金融知识的能力,专业知识力一定程度上远超人类专家,同时还有强大的推理能力,并可以通过自然语言进行交互,相对于传统的GUI图形界面操作,自然语言交互更加简单和流畅”,他说。  

  以下为演讲实录:

  曹刚:各位领导、各位来宾,大家下午好,我是来自蚂蚁集团财富保险事业群的曹刚,很高兴参加今天2024中国AIGC创新发展论坛,我今天分享的题目是“加速大模型产业落地,让AI人人可事”。

  蚂蚁集团一直是普惠金融的实践者,伴随整个科技的发展,我们坚持用科技持续为整个社会带来微小而美好的变化。在互联网早期阶段,我们推出了快捷支付、扫码支付的服务,实现了整个支付服务的普惠。不管是在街边买一个包子还是去商场付个款,很容易就能完成支付过程。我自己也非常荣幸参与了快捷支付建设过程,至今仍然是非常有成就感的一件事情。进入大数据、云计算以及移动互联网这个阶段后,蚂蚁集团从支付走向了金融,推出了余额宝、花呗、借呗,以及蚂蚁财富等金融产品,通过这些产品用户能更加容易获得信贷服务和理财服务。到了2022年,以ChatGPT为代表的大模型技术爆发,点燃了整个业界,大模型出色的推理、认知和生成能力,让我们看到了实现AGI的可能。我们也一直在思考和探索怎么样让大模型技术落地到金融场景中,让大模型成为业务发展新的驱动力,就在刚过去的一周,我们在上海的外滩大会发布了蚂蚁集团三款大模型AI的产品,分别是AI金融管家、AI生活管家,还有AI健康管家,大家可以上支付宝进行搜索试用。

  回到金融领域,我们认为,大模型技术是实现高质量金融服务普惠的关键,高质量的金融服务是非常稀缺的,从统计数据来看,目前国内投资者大概有7.2亿,但真正具备投资顾问资质的专家只有20万,要服务好广大消费者的,光靠专家的能力是非常困难的,而且金融服务门槛比较高,相信大家都知道这个问题。大模型技术的到来,让我们看到了高质量金融服务普惠的可能性,大模型具备压缩世界金融知识的能力,专业知识力一定程度上远超人类专家,同时还有强大的推理能力,并可以通过自然语言进行交互,相对于传统的GUI图形界面操作,自然语言交互更加简单和流畅。

  面对大模型技术的发展以及实现高质量金融服务普惠的机遇和挑战,我们确定了金融AI的战略布局,在我们内部称为1+2布局,1+2是1个大模型基建,这个大模型基建是由我们自研的凤凰大模型以及AgentUniverse专业的智能体框架组成,后面会给大家展开介绍,两个大模型AI产品,一个是2C的蚂小财,也就AI金融管家,蚂小财集成了财经、投研、财报、核赔等金融服务能力,通过语控一切、有问必答、全程陪伴方式,为用户带来全新的智能服务体验。另一个是2P的支小助,支小助一个专业严谨的AI助手,主要服务对象就是我们整个金融服务链条上的各类专家,希望通过支小助提高专家作业流程的效率和水平。

  大模型基建部分,从去年大模型技术爆发以来,不管是国外还是国内,有非常多的大模型企业冒出来,形成了“百模大战”的态势。我们尝试过多个通用大模型底座,但效果都不是特别理想。我们看到大模型技术落地专业严谨领域还存在诸多困难和挑战,比如用户会问:”A公司的最新财报表现是什么样?”,在金融领域,这涉及到一个公司的财务数据,时效性要求高,需要对信息进行精确的处理。比如用户会问:”我有甲状腺结节,到底能不能买这款保险产品?”,这个问题涉及到保险领域核赔核保的专业知识,判断和决策逻辑是非常复杂的。再比如用户会问:”能不能给我推荐一款稳赚不赔的基金?”,这个问题涉及到金融常识以及金融合规性的要求,我们只能在安全合规的前提下去给用户做答。这些问题是通过大模型难以甚任的。

  为此,从去年开始,我们自研了蚂蚁凤凰大模型,去解决通用大模型在专业、严谨、安全合规层面面临的问题。凤凰大模型今年已经通过备案,我们的工作重心集中在这几个方面:首先是专业性方面,核心是让大模型对齐人类专家的知识和决策逻辑,通过这种方式,我们在产品客服、投研分析、财经编辑领域做到了80%左右的水平,可以很好的辅助专家进行作业。在严谨性上,我们核心在数据指标查询和数据指标计算等领域进行发力,从实践结果来看,在数据指标查询方面,我们已经实现了95%以上的准确率。在金融计算部分,金融领域有很多计算逻辑,比如计算你的存款利息、理财收益等等,大模型通过工具调用,能做到80%左右的水平,还有很大提升空间。在安全合规层面,我们搭建了安全技术围栏,通过专家标注以及自动化攻防等措施进行防控,上线以来,零风险事件的发生。 同时,为了提高上层应用的创新效率,我们搭建并开源了一套专业的多智能体的框架AgentUniverse,相对于市面上常见的智能体平台而言,我们核心在专业能力上进行增强,同时搭载了一些可快速插拔的工具,比如检索增强相关的RAG、SUG等等,通过这样的能力让我们在研发上层的蚂小财和支小助应用时,变得更加高效。现在我们把这套框架开源出来,希望这套框架能够助力更多企业在研发智能体的时候能更加高效。

  下面结合今天论坛主题,展开介绍一下我们在支小助部分的实践,首先是营销创意产品,先来看一下产品Demo视频。 (现场播放视频) 。营销是每个企业都会涉及的领域,大模型对于营销领域而言,最大的增益在于供给侧的创意可以直接由AI生产,我们通过多模态大模型能力,结合用户偏好以及市场热点,能够批量化地快速生成符合生产要求的图文、视频和卡片,改变过往这些素材需要运营专家或者设计师人工生产的方式,极大提升了运营的效率,同时丰富了对客表达的空间。 我们还在探索用大模型做用户理解、产品理解、做样本增强,通过与推荐系统的结合,整个流量运营效率能够进一步提升,从实践的结果看,我们平台上50%展位背后的创意是由AI生产的,同时,营销能力能为平台带来10%以上的GMV复利增长,效果上是非常好的。

  除了营销创意,我们还在用它做金融市场投研分析,金融市场投研分析是一个蛮复杂的事情,它需要投研分析专家对市场或某一个行业的趋势和问题进行分析,把趋势和问题拆解成一个一个小的任务,由各个专家小组通过对市场信息的收集、整理形成研判观点,最终形成投研分析报告需要经过专家评审后才会被广大用户看到。投研支小助的建设,核心就是用系统和AI的方式在模拟整个投研分析生产的过程,我们通过刚才讲到的Agent框架,将整个过程拆解成策划、执行、表达、评价这样四个大的阶段,通过注入专家知识框架,以及检索各种各样的知识库,用多个智能体去模拟整个小组分工协作的过程,从而产出投研分析内容。目前我们已经能够快速支撑9类标的物的分析,在分析效率上从过往的小时级别到现在的分钟级别。

  这是投研支小助方面的介绍,同时,我们还在尝试用大模型去做财务报告的撰写,上市公司每个季度都要发财务报告,财报是一个非常专业、复杂度极高的报告,去年我们跟阿里巴巴集团进行合作,用大模型的方式去辅助财务人员完成财报的生产过程,这里面包括怎么用大模型做财务数据计算,怎么做业绩归因和推理,怎么做财报专业的表达,这些都对大模型的能力提出了更高的要求和挑战。从实践结果来看,大模型辅助生成财报整体采纳率达到77%,上个季度阿里巴巴集团的财报就是通过我们的大模型和财务人员共同撰写,整个财报的写作效率得到了提升,同时我们也可以看到,大模型在业绩归因和财务推理这部分的准确率还不够高,我们还会进一步提升整个推理部分的能力。

  上面给大家介绍了我们在2P支小助部分的三个产品,支小助通过大模型能力、多智能体能力对整个金融服务链条各个环节进行升级和重塑,现在已经覆盖了营销、投研等十几个垂直领域,是各垂直领域专业严谨的AI业务助手,目前我们已经在蚂蚁集团财富保险多个业务场景中进行了规模化验证,基本上是业界首个完成规模化验证的产品,使得各服务环节效率倍增,通过这种2P2C模式,为上亿用户带来了高质量的金融服务。支小助已经跟平台上120多家机构开展了合作,我们期待和更多的产业合作伙伴一起,加速大模型产业落地,让AI人人可享。

  以上是我的分享,感谢大家聆听,谢谢。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

可以去百度分享获取分享代码输入这里。
声明

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容