照片: iStock / AntonioSolano

Less than a minute(0 words) Read

揭示数据的真实价格,可以将被动的用户转变为主动的数据供应者,使其可以主张合理的价值回报

数据是人工智能算法的“燃料”——这些算法承载着改变经济的承诺,已将股市推向历史高点。但是,我们该如何确定数据的价值呢?数据并非源自地下开采,也非出自工厂锻造,而是作为现代生活的副产品悄然积累:你的每一次网络搜索、每一次点击,或者当你口袋里揣着手机在晨间散步,都会留下信息痕迹,可被某处的某人使用。

当一种商品缺乏可观测的价格时(例如政府服务),我们通常以成本为其定价。但数据没有明确的成本。当零售商记录你的销售数据、地图应用标记你的位置信息时,数据便会生成。当然,企业会投入巨资对数据进行处理、分析和转化。它们聘请大批数据科学家,并投资计算基础设施,从海量噪音中寻找模式。但底层的原始数据恰似经济引擎运转时排出的废气。我们该如何为这些自然而然产生的事物定价呢?

事实是,数据并不是免费的。我们每个人都是被支付报酬的数据生产者。一旦我们意识到了数据是通过交易产生的,那么一套更深层的经济逻辑便会浮现。如果追求利润最大化的企业重视从客户那里获取的数据,就会有动机鼓励更多的交易,因为交易越多,数据就越多。而消费者在价格降低时,会购买更多商品。不提供折扣的企业就得眼睁睁地看着客户流向愿意提供折扣的竞争对手那里。因此,追求利润最大化的企业之所以就其商品和服务提供折扣,并非出于公平考量,而是为了促成更多销售、获取更多数据。

如今,大部分经济活动都在这种“隐性协议”下运作。你的每一次数字购买、每一次应用下载、每一次网络点击都是双重交易:消费者在购买商品或服务的同时,也在出售自己的数据。我们可以观测到的价格——即实际转手的金额——实际上是这两项交易的净价。企业获得了收入和数据;而消费者获得了产品和便利。

价格捆绑

问题在于:作为消费者,我们并不知道自己在出售数据时获得的价格和折扣。这使得我们根本无法知道自己是否得到了合理的回报。消费者通常无法选择在不出售其数据的情况下购买商品。这种需要同时进行两项交易的情况(在上述场景中,即出售数据和购买产品)就是经济学家所说的“捆绑销售”。通过隐藏数据的价格,捆绑销售导致消费者利益受损。

试想一下,你去了一个使用其他货币的国家。抵达后,您花了相当于18美元的钱买了一顿只值3美元的午餐。几天后,你学会了什么时候该讨价还价,什么时候该放弃交易,以及什么样的价格才算公平。在数字经济中,我们永远是那个“刚抵达的游客”。每次浏览网页或购物时,我们都在出售自己的数据。但由于交易被捆绑,我们永远不会看到数据的价格。这样我们也就无法从经验中学习。

如果监管当局要求企业将两项交易进行拆分——同时公布“允许使用交易数据的价格”与“将交易数据设为隐私的价格”,则将提高数据市场的透明度。消费者可以看到数据折扣的相关信息。有些人可能会认为目前的折扣物超所值;而其他人则可能选择保留自己的数据,除非折扣力度巨大。久而久之,消费者将从懵懂的“游客”转变为精明的数据供应者,争取自己在数据经济收益中应得的份额。

经济学家和政策制定者面临的挑战在于,如何将数据这种随处可见的无形资产转化为可计量、可管控、可定价的对象。目前,经济学家已开始开发数据计量工具包。工具包中的每种方法对“价值”的定义都各有侧重,适用于不同的情况。

Loading component...

五种方法

第一,市场价格法。部分数据在Snowflake或Datarade等公开市场上交易,在这里,数据集被直接买卖。但这类数据并非具有经济重要性的代表性样本。大多数企业不会出售其最有价值的数据,因为那是它们的核心竞争优势。但对于在上述市场中流通的一部分数据来说,价格仍是一个经过验证的可靠价值信号。

第二,收入法。这一方法将数据视为普通的生产性资产:数据的价值等于其所能创造的额外收入。该方法提出了一个反事实的问题:如果一家企业缺乏某些数据,其利润会是怎样的?这种方法需要构建一个模型来预测在缺乏数据的场景下利润的规模。在金融领域,这是具有可行性的,因为我们知道投资者会利用数据购买更多高回报的资产。而在其他领域,数据可能有多种用途,而这些用途更难被衡量和量化。

第三,互补投入法。推断企业数据存量价值的一种方法,是观察其用于管理和利用这些数据的资源投入。数据本身无法产生价值;只有与人力和工具相结合时,才会转化为生产力。如果已知一家企业在数据相关工作中投入的劳动力和计算能力的规模和成本,就可以推断出使这些投入“值得”的数据存量的相应隐含价值。虽然这种方法是间接性的,但企业愿意投入真金白银使用某项资产,本身就是其具有价值的最可靠的信号。

第四,关联行为法。如果数据可以优化决策,那么人们的决策行为与决策回报之间应当具有更强的一致性。经济学家可以通过衡量行为和收益之间的相关性,来估算决策者需要掌握的信息量。在消费者市场中,这可能意味着需要追踪消费者收到的购买建议与其实际购买行为之间的匹配准确度,或者企业对畅销商品的库存备货精准度。高协方差意味着高价值的数据正在背后发挥作用。该方法通过数据的“行为痕迹”来衡量其价值。

最后,成本核算法。会计师本能地仅仅通过账单汇总来获取数据。新版联合国《国民账户体系》通过将购买的数据集列为资产,来实现这种做法。但问题是,大多数数据并非通过购买获得,而是通过“物物交换”得来的。消费者在购买商品或使用数字服务时,使用信息来抵扣部分“支付”。这些隐性折扣很少体现在账面上。想要对真实的数据成本进行核算,就必须估算出在每次交易中,企业为鼓励更多交易、刺激更多数据披露而减免的金额。

这种方法在理论上最简单,但在实践中却最难操作,因为它要求我们识别那些从未被列明的数据交易。而通过要求企业对“允许使用交易数据”和“不允许使用交易数据”的交易进行分别定价,将数据交易和商品交易拆分开来,将使成本核算法具有可行性。

转向量化分析

这五种方法共同勾勒出了数据这种无形资产的范畴。每种方法都体现了数据价值的一个侧面,分别是:投入的劳动力、创造的收入、行为的精确度、市场价格和隐性成本。没有任何一个方法是绝对可靠、适用于所有场景,或能实现全面计量的。计量永远都不是完美的。然而,为了作出明智的决策并制定合理的政策,我们必须将数据从“直觉判断”推向“量化分析”。在此之前,我们经济的运转仍将继续依赖数据资源——它的价格只能依靠猜测,而其价值却可以被硅谷随意使用。

劳拉 • 维尔德坎普(Laura Veldkamp)是哥伦比亚大学商学院金融与经济学“莱昂·G·库珀曼”(Leon G. Cooperman)教授,也是《数据经济:工具和应用》的作者。

文章和其他材料中所表达的观点均为作者个人观点,不一定反映IMF的政策。