“人工智能的核心是要落地,让生活更美好,让经济更发达。回过头看过去几年的人工智能发展,计算在不断迭代,但是人工智能对经济、尤其是对中国企业大规模的营收增长和利润贡献,是没有达到预期的。”7月7日,在2023世界人工智能大会“大模型时代的通用人工智能产业发展机遇以及风险”主题论坛上,清华大学惠妍讲席教授、清华大学电子工程系长聘教授、北京衔远科技创始人周伯文指出,AI能否与业务充分结合,是决定未来AI能否充分实现经济价值的关键。
麦肯锡“2022全球AI调查”显示,全球领先国家AI使用率已经达到60%左右,而中国目前的AI使用率仅为41%,暂时落后全球平均水平。更为重要的是,仅有9%的中国企业可借助AI实现10%以上的收入增长,而领先国家受访企业中有19%的公司能实现该增长。
从这一维度来看,我国企业AI使用率还有较大提升空间,人工智能技术尚未能帮助企业普遍实现大规模的营收增长和利润贡献。如何进一步加快人工智能尤其是大模型应用落地,真正提升AI与实体经济融合度,也成为与会学者与企业讨论的焦点。
(资料图片)
会议期间,周伯文接受《每日经济新闻》记者(下称“NBD”)专访,谈及大模型产业化的关键问题、AI与产业深度融合等领域的探索和思考。
大模型是下一代AI爆发式成长的基石
NBD:如何理解大模型对人工智能的重要性?ChatGPT推出以来,国内城市也不断入局,您认为眼下大模型面临的关键问题是什么?
周伯文:可以这样理解,大模型是下一代AI或者说生成式AI爆发式成长的基石,它极大推动着人工智能前沿技术与应用能力的进步,同时提供了更多可能性。大模型能够更好地支持机器学习的复杂任务。比如,大模型能够应对更复杂的语义问答,通过模拟人类智能的思维过程,更好解决复杂业务场景下的问题。
大模型对算力的改进发挥着重要作用。大型模型由基于硬件的分布式平台来实现,并可以支持更多复杂但高效的计算。同时,大模型能够以更短的训练周期完成机器学习,从而更快地从数据中获取有效信息。
大模型在跨多种数据和多维度分析领域具有显著优势。比如,大模型能够同时处理多种数据,支持多个维度的分析,从而更高效、更精准地挖掘出数据背后的有价值信息。
大模型使得AI落地应用变得更容易。比如,大型模型在无人机领域的应用,有效提高了其图像识别的准确度和效率,能够更好地收集有价素材并分析更为复杂的地理信息和环境数据。
与此同时,大模型的产业化也面临诸多挑战:首先是数据规模大,且数据质量参差不齐;其次是模型的体积大,训练难度很高;第三是算力规模大,性能要求高。
因此,大模型研发依赖算法算力和数据的综合支撑。它是未来产业发展的重点,但大模型的商业模式值得探讨。因为大模型的成本壁垒非常高,大公司和小企业都有各自的负担。所以我觉得从端到端做起,慢慢迭代出更大的商业模型,或许是更适合的做法。
在具备通用能力的基础之上,于垂直领域不断训练、提升大模型的专业能力,是未来帮助大模型这项技术发展进步的一种重要手段。我们也希望用AI来推动实体经济的数智化发展,意味着我们需要深度理解客户的业务场景,理解消费者在不同场景下的消费体验,以及这种体验跟商品的品参、生产流程、供应商的关系,进而才能通过AI的推理和生成,找到打造爆款产品的最优方式。尤其是还有一些跨品类的迁移学习,这些在技术与业务层面都并不容易。
ChatGPT对特定行业的价值有待开发
NBD:如何看待垂类人工智能和通用人工智能这两种方向,哪一种更能代表未来的趋势?
周伯文:我认为,未来那些定义明确、高价值的工作流程,将由专业 AI 模型完成而不是通用 AI 模型。通用大模型在某个垂直场景做成功之后,再去进一步提升其基础能力,就很容易。另外,从垂直场景切入的话,算力、数据、算法方面,我们过去的积累都能更充分的发挥作用。
对于任何一个创业团队而言,在具备大模型的通用技术能力后,能否培养出更专业的能力十分重要。目前ChatGPT的突破主要在其通用能力上,但对于特定行业和垂直领域的价值还有待开发,比如它可以画很逼真的艺术画,但是画不了电路图,因为它对物理知识的专门学习并不深入,相关判断上也不够专业。
所以,我认为需要有这样一个工具(具备专业能力的大模型),让消费者更容易找到、也更愿意去购买所需的商品,这可能会完全改变人们现有的购物路径。生成式AI能够将海量的商业信息压缩到这类大模型之中,从而学习商品供应链各个环节,并以消费者为中心提升关键环节效率。这是在2021年就已经产生的想法和创意。
我们目前就在研发一个具备通用能力的大模型,这个大模型尤其在链接商品和消费者方面具备专长。我们有37项大模型评测指标,其中2/3是推理能力、计算能力等通用能力,还有十几项专门应用于产品和消费者的连接,以实现“让每一件商品都应需而生,让每一个消费者都得偿所愿”的目标。
NBD:您在演讲中提及,AI能否充分与业务融合是AI能否实现经济价值的关键。应该如何进一步提升AI跟产业的融合度?
周伯文:当今世界正处于“广义人工智能”阶段,深化专业学术研究与推动产业落地应用两方面都充满机遇和挑战。未来,消费行业将在统一大模型的驱动下由数据智能化向业务场景智能化转型,人与AI的协同交互也会日益紧密,共同催生以消费者为中心,从产品洞察、设计、研发到营销全流程的数智化“创新飞轮”。
包括我们公司正在做的,就是通过预测消费者和商品在体验上的依存关系,以及细颗粒度品参的对应关系,重新深刻理解什么样的消费者需要什么样的商品;消费者在什么样的场景和体验下,会被什么样的品参、材质、文化符号、功能打动,从而导致二者之间互动的产生。通过大模型对真实世界各类过程中产生的数据进行压缩表示,重构产品与用户的二元关系。同时,通过大模型实现对企业5D全生命周期的赋能,这里说的5D包括:对消费与供给的双侧市场机会进行洞察(Discover);帮助企业分析消费人群与场景,定义并孵化爆品(Define);协助设计创新型产品的外观、材质、包装及开发流程等(Design);再到驱动研发、测试与品参改进(Develop);最终通过生成千人千面的内容,完成对消费者的精准触达与高效转化(Distribute)。而以上这一切,都将在历史上第一次通过一个大模型来完全解决。
为了实现这一目标,大模型必须同时具备通用能力与专业性,既要有智商、还要有情商。智商让它具备语言、认知和推理的能力,能够明白消费者的反馈信息并根据指令进行微调;情商让它能够准确把握消费者的动机,理解消费者为什么喜欢、为什么不喜欢、为什么购买又为什么不买,基于“共情”的能力与消费者进行有效互动。
我相信大家都具备良好的智商与情商,但并不是每一个具备这类通识能力的人,都能做到你们在做的具体事情。这种差异的来源,即是对商品的深刻理解。
数据稀缺性是影响应用落地的一大难题
NBD:人工智能正在重塑全球各经济体的竞争格局乃至产业结构,我国人工智能产业发展有哪些优势和不足?除了大模型,还需要加快哪些领域的建设?
周伯文:从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%,美国在大模型数量方面始终居全球最高。从AI三要素来看,数据稀缺性明显是影响大模型应用落地的一大难题。
当前AI大模型的训练,算法端向神经网络Transformer模型收敛,算力端依赖具备大规模并行计算能力的AI服务器集群,数据端则需要巨大数据量的大规模数据集投喂,我们认为AI三要素中数据是直接影响AI大模型在垂直行业落地效果的关键,而垂类数据通常由政府和行业机构掌握,相比于模型和算力,数据稀缺性明显。目前通用大模型的训练数据集多来自互联网文本数据,例如ChatGPT训练数据集来自互联网新闻、社交媒体、电子书等。
我认为,单纯就中外AI发展快慢或水平高低的比较,其实并不那么重要。如果从理论、技术层面来看,差异一定是存在的,只需正视现状,夯实自身能力即可。同时,中国整体的发展速度在全球常年保持领先地位,中国的消费市场体量与消费需求潜力也是惊人的。同时,我们对技术的场景化落地也有着先天的优势,这一点从移动支付在中国的广泛普及应用可见一斑。因此,在AI的发展上,一方面我们是技术层面的追赶者,另一方面我们也很可能成为应用层面的创新者甚至引领者。我相信,中国的AI需要探索一条新的道路,即:垂直整合从自研通用大模型到应用、用户全场景闭环,实现生成式人工智能技术与商业价值“双落地”。没有技术愿景和创造力理念无以致远,但空谈技术缺乏商业化场景落地也不可持续。
此外,围绕AI布局与大模型建设,应着重关注以下几点:第一,要加强资源和研发力量统筹,促进大模型有序发展;第二,要加快基础研究和技术创新,提升学术和开源影响力;第三,要强化大模型发展中的场景牵引作用,打造大模型标杆项目;第四,要强化国际合作,积极参与全球人工智能治理。
实现生成式AI技术与产业价值“双落地”
NBD:近期,上海、北京、深圳相继发布人工智能产业发展的相关规划,他们布局上有哪些特点?与此同时,很多二三线城市也正在不断入局,应当注意些什么?
周伯文:《中国人工智能大模型地图研究报告》显示,据不完全统计,当前中国参数在10亿规模以上的大模型已发布79个。全国有14个省份在开展大模型研发,其中北京、广东两地的大模型产品分别达到38个和20个,居全国前列。在领域分布上,自然语言处理仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在计算机视觉和智能语言等领域的大模型还较少。我国大模型研发与算力发展匹配度高,公共算力发展迅速。北京、广东、浙江、上海等地的大模型数量最多,这四地也是近三年人工智能服务器采购数量最高的地区。
从政府侧来看,北京、深圳、上海、成都等地相继发布人工智能支持政策,且均在强调公共数据开放与共享。近年来,中国的数字经济备受国家重视、发展日新月异,为下一代AI在中国的应用落地提供了基础和土壤。
我们希望通过AI助力中国制造业、实体经济的数智化发展,这就意味着我们需要深度理解客户的业务场景,理解消费者在不同场景下的消费体验,以及这种体验跟商品的品参、生产流程、供应商的关系,进而才能通过大语言模型、多模态技术和AIGC实现训练、分析、推理和生成等解决垂直场景内复杂问题的能力,从而帮助企业找到打造爆款产品的最优方式,为用户推荐最适合商品。
在AI布局与大模型应用上,我认为紧抓制造业数智化升级,引导鼓励既有大模型技术与垂直领域经济发展的深度融合十分重要。应更多关注AI技术在垂直行业高价值场景的应用落地,帮助垂类企业敏锐捕捉行业市场机遇、精准定位创新发展方向,垂直整合从自有基础大模型到应用、到终端用户的全场景闭环,以实现生成式人工智能技术与产业价值的“双落地”。
(文章来源:每日经济新闻)