火热的隐私计算发展至今已经完成了从0到1的突破,却似乎对从1到N有些犯难。
隐私计算以技术实现数据可用不可见并实现商业落地,可以说是从0到1。很多人或许认为这样的创造和创新最难,但其后从1到N却不是简单复制长大的过程。
对于一家隐私计算技术服务商来说,现实中的数据往往会根据不同场景、不同客户需求,被不同的应用反复调用计算,不但增加了计算成本,还降低了数据利用效率。
对于不同企业开发的各类隐私计算平台更是如此。单个隐私计算平台可能解决了一部分数据的共享与流通,但N个隐私计算平台各自为政却又形成了新的孤岛,反而降低了大数据整体流通的效率。
于是越来越多隐私计算业界的参与者都开始从更宏观的层面思考一种更高层级、更大范围的数据互联互通模式。翼方健数CEO罗震就是这方面的先行者之一,他认为实现数据和算法的互联互通将会经历三个步骤,最终将走向一个广范的数据和计算互联网(IoDC)。
首先在单个机构中建立基于隐私安全计算的独立的数据生态,解耦数据提供方和数据处理方,打通数据供需链条,使数据安全有序流通;其次通过平台联邦链接多个单体平台,通过协议实现平台联盟,联盟平台之间可以实现高效的数据探查、跨平台数据授权使用和通过隐私计算方式的数据共享;最终通过公开协议形成更加广泛的数据和计算的互联网(IoDC),实现数据和数据互联,数据和算法互联,打破人工智能在数据领域的瓶颈。
在罗震的带领下,翼方健数开发了贯穿这些步骤的技术和产品,其中最核心的是公司自主研发的隐私安全计算平台翼数坊XDP,以及为实现IoDC第二个关键节点推出的“XDP联盟”——通过链接众多翼数坊XDP平台形成数据和计算网络。
目前“XDP联盟”已完成落地应用,从数据汇集、治理到智能应用输出,形成价值输出闭环。
比如“宜昌市多点触发疾控平台”案例通过政企数据融合及各部委数据协作实现传染病多点触发预警机制,是典型的数据驱动的智能传染病防控案例。“中国科学院上海营养与健康研究所NODE-智数坊平台”案例建立了健康医疗、生物信息跨区域数据合作共享模式,基于该平台发起的“长三角生物医学产业大数据联盟”构建了全新的数据协作共享生态。
罗震表示,IoDC的理念已经得到越来越多客户的认可,因为大家都理解了建立数据计算网络的必要性,也愿意一起建立区域的或行业的IoDC网络。
建设IoDC可谓愿景宏大,或许也是隐私计算技术服务商更多关注的话题,而真正在实操场景中更普遍的问题,还是如何让各行业用户认识到数据带来的价值。罗震反复强调,翼方健数不满足于只给客户提供技术工具,而是希望让客户能够通过隐私计算这个工具获得可量化的数据的价值。
这里的可量化正是指用数字说话。比如在瑞金医院的案例中,翼方健数打造隐私计算平台,让医院数据同时服务于临床应用和医学研究。其中在内分泌科,住院病历辅助书写从过去耗时20分钟缩短至5分钟,上线3个月,就有47%的医生在日常工作中使用这一工具,并且这一使用率在不断攀升。此外,相关数据还帮助肿瘤科制定质子肿瘤大数据治理标准化流程并完成多篇论文发表。
在智能时代浪潮中,罗震希望与翼方健数共同肩负其IoDC编织者应有的使命感,同时也是在具体场景中为客户创造真实数据价值的“实践派”。正如他去年在寄语高考学子时所说:“星光不负赶路人,时光不负有心人”,用技术解锁数据价值的愿景正在变成现实,IoDC的数据计算网络也终将筑起。
打造IoDC多维度互联互通
算力智库:作为一家商业公司是否有足够能力去实现打造IoDC的宏大愿景,国家和政府需要扮演怎样的角色?翼方健数在2022年有怎样的规划或节点目标?
我们的能力和角色取决于不同场景,我认为先要区分数据源的类型,如果是连通政府的公共数据,我们就积极参与其中,如果是连通商业数据,我们就发挥更大的主导性。
对于政府的公共数据,我们可以扮演三种角色。第一是提供IoDC基础建设的工具,即隐私计算平台。第二是对接需求,也就是对接那些对公共数据有需求的商业公司,因为我们对数据的价值非常了解。第三是做数据加工,因为我们有原始数据加工的能力,把数据加工成数据产品,以便需求方能更好地使用这些数据价值。
另外在商业领域,我们可以主导做好数据平台搭建等基础建设以及数据价值流通。比如为生物医药行业部署隐私计算平台,让商业机构之间能够通过平台实现数据协作和数据价值共享,这类完全商业化的数据连通是我们这样的商业公司可以承接的。
2022年我们会继续推动上述两个方向的业务进展,因为我们看到公共数据的利用已经成为各地政府非常关注的话题,同时我们也会持续推动生物医药等产业的数据共享。
算力智库:互联网世界中,真实的地理概念是弱化的;而在数据世界中,不同行业的数据却泾渭分明。那么在IoDC中,不同行业数据互联互通的价值和难度是否远大于打破地理界限?在地理连通和行业连通两个维度上,IoDC各有怎样的挑战?
从我们的案例来看,比如宜昌传染病多点触发监测和智慧化预警平台,以及“长三角生物医学产业大数据联盟”这两个例子,就分别代表了地域和行业的互联互通,它们在不同维度上都发挥了很大价值,很难说哪一种模式的价值更大。
我们也可以借用联邦学习来做类比,横向联邦学习就好比是行业维度,纵向联邦学习则可以看作地域维度,两种方式都很重要。因此至少到现在为止,我们还不能把地域互通和行业互通简单比较而得出高低结论。
当然无论地域连通还是行业连通都会有一定挑战。地域连通的场景更多是在政府的公共数据,这类数据的地理特性更强,挑战在于只有地方政府才有能力去协调不同部委之间的数据连通。
而行业连通是一个行业数据生态中的机构、企业都对数据共享和协作有意愿,通过数据和计算的网络把大家串联起来,解决单体数据提供者数据量不够以及数据所有者自身数据处理能力不够的问题,通过互联互通充分发挥数据价值。所以行业连通的挑战就在于不同行业从业者对数据协作和数据共享的认识,认知程度越高,数据共享的门槛和壁垒就越小。
人人都从数据价值中获益
算力智库:在业务实践中,您可以看出相关终端行业对隐私计算的认知和应用有哪些共性特点和趋势?
过去一年我们客户数量增长主要源自两类客户,一类是政府机构,另一类是企业,企业还可以再分出不同行业,比如医疗、金融、营销等,行业类型广泛。
在和各行业客户的接触中,我们直观感受到各行各业对数据的认识有了极大提升,其中包括对数据本身重要性的认识,对数据流通必要性的认同,以及对隐私计算技术的认知。过去不少企业还分不清信息与数据,但今天几乎所有行业的企业都深刻理解了数据的价值,我想这既是数字化转型时代大潮的推动,也与国家把数据列为生产要素息息相关。
算力智库:科技公司往往严重依赖资本输血,即使成为高估值的上市公司也仍处于长期亏损,您认为隐私计算行业距离“造血”或者实现业务驱动还有多远?或者说还需要哪些关键因素?翼方健数也经历了多轮融资,对于盈利有怎样的预期?
我们一直在讲隐私计算是一项非常重要的技术,是促进数据流通的一个必要条件,但还不够充分,因为隐私计算本身不产生直接的数据价值。数据价值的体现一定是通过人工智能、统计方法等手段,最后给客户产生最直接的,看得见摸得着的价值,也才能让客户有动力采用这样一套技术解决方案。
这也是为什么翼方健数不仅仅专注于隐私计算本身,不只是给客户一种技术工具,而是让他们能够体会到这个工具带来的最终价值。从我们的角度来看,要实现业务驱动的一个核心点就是我们是否有这样的能力给客户带来可以直接感受到,可以量化的数据价值。
我们在融资过程中经常强调的一个理念是数据已经成为生产要素并在不同领域有很多应用,现在也是数据要素市场蓬勃发展的阶段,所以翼方健数希望能在更多领域通过隐私计算等全栈技术手解锁数据价值。
现在公司的整体业务状态应该说比较景气,总的来说我们非常看好公司长远的盈利预期。当然对于短期盈利预期,可能现在还不是考虑这个问题的时候,我们眼前的问题还是怎样在更多行业、更多场景里去实践利用技术解锁数据价值的愿景。
算力智库:“未来世界只有1%的人掌握算法,其他99%的人只能提供数据。”您是否认同尤瓦尔郝拉利的预言,隐私计算是否有这个潜力,让所有人都既能对自己的数据做主,又能从中获得收益,还能让想要掌握算法的人有足够的数据可以训练算法?
每个数据所有者都期待别人应该要在自己的授权下使用自己的数据,在一些具体场景中加工并产生价值,自己还能从这些价值中获得收益。我想这就是一种更加良性,或者说更加有序的数据流通状态。
我们做隐私安全计算的核心目的就是要为这种更加有序的数据流通提供一套基础设施,让所有人都既能对自己的数据做主,同时让大家可以放心地授权算法方加工自己的数据产生价值,实现数据所有者和加工者的解耦,又能从中获得收益,这也是我们的初心和出发点。
至于说未来世界是不是只有1%的人掌握算法,其他99%的人只能提供数据,我想如果按照绝对人口数量来讲或许会是这样。但我们也要看到,算法的门槛正在变低,相比过去做算法需要很多专业知识,现在做算法已经容易了许多。另外随着隐私计算的普及,越来越多的数据能够被利用起来,支持算法训练,也就有更多人能够涉足算法而不只是提供数据。
为客户对接价值
算力智库:翼方健数成为上海数据交易所首批数商,是否能透露更多相关详情以及在该体系中的角色?
我把数商理解为是代理人(agent),他不是数据的拥有者,也不是数据的提供方或需求方,他实际上是个对接人,帮助数据拥有者加工数据形成数据产品,继而满足需求方。
作为数商,我们所做的就是在供需双方之间促成数据产品交易,利用数据源的原始数据,在授权的前提下做加工,再对接需求方。当然我们也可以为数据源直接对接需求方,由他们自行加工数据。
其实在成为上海数据交易所数商前,我们的应用平台已经帮助多个数据提供方和需求方在数据平台授权协作,实现他们对数据价值变现和保护的诉求。
翼方健数一直强调自己是一家“0数据”的数据智能公司,是因为在整个服务过程中,我们不持有数据,只提供工具对数据进行管理,并在获得授权下帮助客户加工和处理数据,获取数据价值。
算力智库:翼方健数过去一年里业务实现大幅增长,请问增长主要源于哪些业务?总结来看,目前对隐私计算技术服务商来说,怎样的业务模式是更容易走通的?
我们的业务增长主要来自于能给客户带来可量化的数据价值的业务,包括基于翼方健数隐私计算平台的智能应用,当然也有先做应用再开发隐私计算平台的业务。
从中我们体会到的一般模式是,在开始接触和初期服务客户的时候,为了让客户对数据价值有更直观的感受,就需要从一个具体的数据场景切入。比如我们给上海瑞金医院做AI病历书写的应用,就会让客户产生比较强的直接感受,发现医院的数据利用效率明显提升了。
当客户尝到了数据价值的甜头后,就会有意愿让数据价值得到更大释放,比如说未来医院应该有怎样的数据基础设施才能成为更加智慧的医院,后续我们就可以为他们搭建更多的数据流通平台。(cis)
(文章来源:中国证券报·中证网)