(相关资料图)

7月6日,在2023世界人工智能大会开幕式上,图灵奖得主、上海期智研究院院长姚期智表示,在ChatGPT以后,下一个重要目标就是让智能机器人有视觉、听觉等多种感知能力,即能够在各种环境中自主学习各种新技能的能力。

姚期智指出,在过去六七年里,人工智能最高层一直有“路线之争”,就是要不要走强化学习这条路。中国年轻学者的突破,把天平做了倾斜,就是我们现在这条路对于通用人工智能的完善,还有很长的路要走。

清华大学交叉信息研究院助理教授袁洋表示,大家对多模态的理解可能比较粗糙,要真正做到解决行业的问题,多模态需要做得更细致一些。具体到医疗、法律、教育等行业,我们不仅仅是把文本给模型,希望它解决专业的问题。我们应该深耕这个行业,找到里面最核心的问题,再找在这个问题中需要什么样的数据能够精准解决我们想要解决的问题,可称之为“模态的补全”。在这个基础上,需要收集足够的数据,做好模态的对齐,模态补全、模态对齐做好之后,相信能够赋予大模型更强大的能力,来解决更核心的交叉领域的问题。

关于大模型在垂直领域的发展,姚期智认为,最容易想到的场景就是文书工作,基于大模型的语言,更多的工作可以交由机器来做。

袁洋则看好自身从事的智能医疗行业。他认为,大模型其实是在学习数据与数据之间的关系。医疗里存在大量的关系,比如患者的症状与症状之间、与药物之间等,相较于人类,大模型可能会做得更好。

清华大学交叉信息研究院助理教授、Moonshot AI创始人杨植麟构想未来AI会与人拥有共同的记忆。“当前我们还是需要每天给AI灌输内容,提供很多上下文,未来可以通过新的方式,打开更大的使用想象空间。”

DragGAN第一作者、南洋理工大学计算机科学与工程学院助理教授潘新钢指出,当前AI在图像生成上表现很好,之后在视频以及三维内容生成上也有很大的发展前景,可以帮助设计师、艺术家、动画制作者以及视觉特效师等去更好更高效地创作高质量内容。

(文章来源:国际金融报)

推荐内容