如果缺乏有关数据访问的监管要求,则人工智能时代的经济创新或将停滞
谷歌非常擅长在用户输入拼写错误的搜索词时判断其真正意图。这并非靠猜测:大约20年前,这家互联网巨头就使用了数十亿用户在搜索时出现的拼写错误训练了其拼写检查系统。没有任何竞争对手能够与之匹敌,因为没有哪家公司能够获得类似规模的相关数据。如今,全球90%的互联网搜索是通过谷歌进行的,但在近期的反垄断裁决宣布后,谷歌面临着新的限制。
像谷歌这样利用数据进行创新的方式,被称为“反馈效应”。大型科技公司从中受益最大,因为它们能够获得的数据最多:它们能够在自己的数据中心处理数据,将其转化为见解并用以改进其产品和服务。
人工智能让反馈效应如虎添翼,并正在加剧数据拥有者和数据匮乏者之间的不平衡。训练和优化人工智能模型需要海量信息和强大的处理能力,而大型互联网平台在这方面拥有丰富的资源。即便是没有的东西,也可以用寻求投向人工智能领域的巨额资本来购买。
这种主导地位带来的后果是显而易见的。六大科技公司——Alphabet(谷歌)、奈飞、Meta、苹果、亚马逊和微软——在全球互联网流量中几乎占据一半。其中,Alphabet、微软、Meta和亚马逊这四家公司在人工智能算力方面居主导地位。
随着数据增加,产品和服务质量也会随之提升,规模最大的公司因此能吸引更多用户,从而生成更多数据。这样的反馈效应会导致市场集中趋势不断自我强化,而缺乏数据的竞争者无法参与其中。
集中效应
长期以来,经济学家一直担心市场集中带来的影响。如约瑟夫·熊彼特(Joseph Schumpeter)在1942年提出的,规模经济和范围经济意味着大型企业的生产成本低于小型竞争对手的生产成本,这使大型企业能够扩大销量、左右价格,并攫取更高的利润。创新是解决市场集中问题的良方:更好的想法能够催生更好的产品,甚至会创造出全新的产品,这对于维持经济活力至关重要。
然而,对于传统企业来说,挑战数据经济主导者地位的难度如今变得越来越大。此类企业往往缺乏处理能力和技术技能,但最重要的是,它们缺乏数据思维,认识不到可以使用数据来创造价值。许多传统企业虽然会收集数据,但并未充分加以利用;调查显示,全球收集的数据中至少有80%从未得到使用。若企业只收集数据却不知道如何使用,其数字资源的价值会不断消失。企业的创新能力因此受损,在竞争中与擅用数据的企业之间差距越来越大。
创新的停滞不仅仅发生在传统企业内部。占主导地位的数据平台最终也会受到影响。芝加哥大学的乌富克·阿奇吉特(Ufuk Akcigit)等经济学家指出,一旦企业占据主导地位,往往会对创新失去兴趣,转而优先巩固其市场份额。没有强劲的竞争,便不再需要通过创新来保持领先。正如作家科利·多克托罗(Cory Doctorow)所说,这些公司可以削弱自己的产品或服务质量,但仍能维持可观的市场份额。
数据集中和经济活力丧失带来的威胁十分严峻,必须出台相关政策来预防、至少缓解这一问题。但要找出最佳的政策干预措施并不容易。
Loading component...
竞争监管
利用反垄断和竞争监管来拆分大型数据平台,这种做法只能治标,不能治本,无法消除数据集中问题的根源。例如,如果主管部门要拆分Meta,那么很可能会有另一家大型平台来补位。因为这种做法无法改变底层逻辑,即,谁能获取并利用最多的数据,谁就占得优势。
同样,欧盟《通用数据保护条例》等赋予个人更大数据控制权的政策通常无法解决数据集中问题。调查显示,虽然关心个人数据的人很多,但真正行使数据控制权的人却很少。这凸显了一种集体行动困境:人们必须投入时间来管理他人对其数据的访问,但获得的回报有限,真正获益的往往是集体。结果,“三个和尚没水喝”:强势平台依旧可以随意使用数据。
赋予数据法律上的所有权或类似排他性权利的政策也面临类似的实际障碍。考虑到授予许可的复杂性,这类政策可能会导致总体可获取的数据减少,从而对创新产生负面影响。此外,交易成本的分布并不均匀:围绕数据使用许可的谈判很复杂,给个人和小型初创企业带来的负担更大,使竞争环境进一步向大型平台倾斜。
相比之下,要求开放数据(尤其是非个人数据)访问权限的监管规定更有希望。如果设计巧妙,此类规定可以降低交易成本(因为无需再就授权许可进行谈判),从而帮助小型企业获取数据。而对于数据持有者来说,如果只能通过利用数据本身来获取价值,那么这会促使其使用数据,从而推动更多传统型企业成为擅用数据的企业。此类监管规定旨在促进数据使用而不是数据收集,前者正是目前所缺乏的。
创意与创新
创新也会因此受益。多个参与者能够将各自的想法应用于数据,让“生成创意”取代“囤积数据”成为获得回报的方式。数据访问要求也更加符合价值创造的经济原理:数据的价值往往来自于对数据的巧妙运用,而非单纯的收集。借用一个工业时代的比喻,数据访问要求促进的是价值提取,而非原材料占有。
“数据访问要求”听起来可能很新颖,实则不然,正如托马斯·拉姆什(Thomas Ramge)与我在2022年出版的《数据访问规则》中指出的那样。全球各国政府早已在法律上承担了向公众开放大量数据的义务。美国军方运营的GPS系统和欧盟的伽利略系统会向民众提供定位数据,这是最好的例子。这些定位数据不仅免费而且精确,不仅提高了飞机、船舶和汽车的安全性,还提升了物流运输的效率和可持续性。其催生了一个价值数十亿美元的产业。
许多辖区的法律要求企业公开某些数据,包括财务业绩和碳排放数据等。在欧盟,大型数字平台如今必须与小型竞争对手共享部分数据。与此同时,在美国,反垄断和解协议也多次要求企业向竞争对手开放其数据。按照最近的一起反垄断案的审判,谷歌也必须这样做。但最引人注目(却常常遭到忽视)的案例来自20世纪50年代的一项反垄断和解协议,该协议要求美国AT&T公司允许美国企业免费使用其晶体管专利。初创企业抓住了这个机会,投身集成电路的设计制造,为“硅谷”和数字时代的诞生奠定了基石。
更广泛而言,大多数国家专利制度的核心机制本身就是以信息公开为基础的:专利持有人只能在有限的时间内独占其发明的使用权,而且前提是必须公开发明细节,以便他人学习。
随着全球全面迈向数据经济,数据通过推动创新创造的价值将只增不减。但不幸的是,这也将强化数据集中趋势,给整体经济带来溢出成本。人们已经提出了许多政策干预措施。其中,数据访问要求最有希望。
文章和其他材料中所表达的观点均为作者个人观点,不一定反映IMF的政策。







