国内首个零售金融大模型来了_股票

大模型在各行各业遍地开花，这一次轮到零售金融赛道。8月28日，消费金融巨头马上消费在金融大模型发展论坛中发布其“天镜”大模型，这也是国内首个零售金融大模型。

与传统通用大模型不同的是，金融大模型面对的更多是结构化的金融数据和知识图谱。用马上消费首席信息官蒋宁的话说即为，“我们希望任何情况下，大模型给出的回答是合规的，并且任何不可预期情况下，其给出的结果是稳定的。”

在论坛中，中国信通院、重庆国家应用数学中心还和马上消费牵头发起“金融大模型可信安全验证与联合创新行动计划”，参与这一计划的还包括阿里云、腾讯云、中国科学院自动化研究所等机构。

【资料图】

大模型还有四大难题待解

“金融行业人工智能应用要求高、场景丰富，是大模型技术和算法突破的沃土，”中国工程院院士倪光南在8月28日论坛上如是表述。

不过，在蒋宁看来，通用大模型在工业领域、金融领域，大模型还有四个关键难题待解。他表示，大模型目前还面临关键性任务和动态适应性、个性化要求和隐私保护、群体智能与安全可信和基础设施的能力四大难题。

“生成式大模型最大的问题是满腹经纶，回答错了可以不承担风险，”蒋宁直言。他以自动驾驶中的刹车、提速、转弯等操作为例，“随着外界环境不断变化，自动驾驶决策绝对不能出错，1%的错都会造成生命财产损失。”

蒋宁认为，金融大模型与自动驾驶的案例一脉相承，和传统大模型最大的区别是生成式模型不能做解释，但是金融大模型则具有判别性，“它需要做交易决策。”

他表示：“我们希望在任何情况下，给客户的回答都是合规的，并且任何不可预期情况下，结果是稳定的”。

欧洲科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松也有类似看法。他表示，生成式人工智能目前的一大特点是一定会出错。因为通用大模型对文本语言比较重视，对数字并不敏感，而金融数据大部分是结构化知识图谱，所以通用大模型在金融领域有不少挑战。

形成“三纵三横”布局

基于此，马上消费在论坛上发布了国内首个消费金融大模型——“天镜”大模型。

蒋宁解释，天镜大模型的推出基础在于，马上消费作为以科技驱动的头部持牌消费金融机构，积累了1.79亿用户，已经有超2000个模型，10万+变量，近50PB多模态、高质量数据等，通过在这些自身数据上做模型精调对齐训练，同时再用推理加速技术实现模型可控，因此相对通用大模型更懂金融。

其次，他透露，在算力平台方面，马上消费现拥有近万台服务器和近千张GPU储存卡。

据悉，该模型已运行近3个月，意图理解准确率达91%，相较于传统AI的68%有较大提升。另外，“天镜”大模型目前客户参与率61%，高于传统模型43%的参与率，也高于人工坐席平均28%的水平。

例如，将企业招股书、财报、经济预测数据等文件上传后，“天镜”大模型可以深入解析金融领域专业术语、同时拥有查询定位多个不同文档、洞悉金融图表隐含的信息和强大归纳总结能力。

而且，大模型SQL生成平台不再需要代码等专业指令，可直接向AI发出自然语言。随后天镜自动理解需求、展开检索、生成答复，按照用户意思去完成数据挖掘任务。据透露，当前，天镜每日线上SQL生成数量650多次，线上SQL生成可执行比例53.4%，SPIDER标准数据集EX得分75.2，线上使用者满意反馈比例82.3%。

蒋宁表示，马上消费目前已形成“三纵三横”的大模型发展技术布局，并领航构建可信、合规、多模态、适配全域、泛化的金融大模型技术能力体系，聚焦行业领先的基础语言特性能力、逻辑和推理能力、语义理解、生成与创作、金融领域能力、安全与合规能力等六大核心领域，进一步推动金融数字化转型产生实质性提升。

所谓三纵，是指实时人机协作、多模态智能、数据决策智能，在数据领域实现智能化，实现结构性数据判别式模型的综合能力。三横即是指持续学习、模型合规、组合式AI形成安全、合规、可信的鲁棒性技术能力，确保让模型越用越聪明，同时更稳定、更安全可控。

打造全能数字员工

基于三纵三横，马上消费人工智能研究院院长陆全围绕打造全能数字员工这一核心，对天镜大模型在汇集智慧、唤醒知识、众创价值、数字分身四大应用场景进行了诠释。他表示，汇集智慧方面是应用人工客服主要场景。

“通过大模型提炼萃取一线优秀人工坐席客服经验，汇聚成群体智慧，从而拥有一对多服务客户的能力，也可作为人工坐席的辅助角色，帮助推荐、优化回答，”他表示。

他希望打造的“数字外表+智慧大脑+情感内心”三合一数字人，不仅擅理解、有温度、懂心理，而且还是不休不眠的智能“打工人”。

在他看来，每个员工都可以能轻松拥有自己数字分身，上传自己的资料并定制一些参数后，只需5分钟的训练数据就可以生成“另一个我”。随时可以被唤起，成为人人都拥有的超级助手，代替员工完成大量工作。

（文章来源：中国基金报）