Sitemap

首页

数据垄断:怎样看 怎样办

陈永伟2019-08-12 18:34

图片根源:壹图网

【超级平台】

不知从什么时分开端,“数据垄断”成为了热门话题。种种研讨会上,专家们开端大道“数据垄断”;各大报刊杂志上,也有分明的版面议论“数据垄断”;而微博和微信大众号上,更是不乏大V和看法首领痛斥超级平台垄断数据,损害逐鹿和消费者长处。

那么,所谓的“数据垄断”终究是什么?它会给逐鹿、给消费者、给通通社会带来怎样的影响?关于“数据垄断”题目,我们又应当采用怎样的立场来加以应对?要答复这些题目,我们只怕还要从数据本身垂垂说起。

数据便是数据,不是当代的石油

英文中,“数据”(data)一词最初源自于拉丁语单词“材料”(datum)。单从词源上,我们就很容易晓得,它的本意是一种新闻的载体,其感化是对新闻举行存储和传达。假如依据这个定义,数据的历史确实便是通通人类的历史——自从人们开端结绳记事,它就发生了,那一个个用绳子编成的结便是最早的数据。盘算机发明之后,“数据”一词的寄义渐渐窄化,从本来的泛指垂垂变成了专指那些可供盘算机存储和传达的新闻。

无论是依据其本来寄义,照旧其当代寄义,数据都不是近来才有的。但很长时间内,人们不停没有对数据予以注重。数据人们眼中的感化,不过是为了帮人们保管一段记忆,或者讲述一段故事,其代价更众是文明的,而不是经济的。

直到近来几年,通通才爆发了改造。跟着盘算机技能的疾速开展和种种统计方法的呈现,人们垂垂掌握了通过开掘数据来获取新闻、指点实行的才能,本来被人无视的数据从此摇身一变,成为了主要的生产因素。为了从数据中拷问出更众新闻,数据的搜罗和剖析渐渐成为了独自的常识和生意。数据的范围(Volume)开端越来越庞大,数据的众样化(Variety)变得越来越高,数据的更新速率(Velocity)变得越来越速,而人们从数据中取得的代价(Val-ue)也变得越来越丰厚。4个“V”的加持之下,就连数据本身也不再被简单称为数据。人们开端它头上加上冠冕,尊称其为“大数据”(bigdata)。

因为当代经济中,数据变得越来越主要,以是有少许人开端将其比喻为新时代的石油。应当说,举措一种特出数据主要性的比喻,它确实十分生动。不过,假如从实质上将数据简单类比为石油,那就大错特错了。终究上,举措一种新时代的主要生产因素,数据有许众属于本身的特性,而这些特性是和石油保管着分明差别的。

其一,从运用要害看,石油是一种逐鹿性的资源,而数据则好坏逐鹿性的。逐鹿性是一个经济学的看法,若一种物品被一私人运用时,会妨碍或限制其他人运用,这种物品就被称为是逐鹿性的。很分明,依据这个定义,石油具有很强的逐鹿性——你众用一点,别人就只可少用一点。而数据则差别,一私人运用数据并不会妨碍其他人也对其举行运用。

其二,从生产要害看,石油具有很强的排他性,而数据的排他性则相对较少。什么叫排他性呢?便是一私人运用某物时,可以以较小资本扫除其他人运用。我们晓得,人们采挖石油的时分一般会划分出必定的区域,这个区域内,禁止其他人同时采挖。而数据的搜罗则差别。同一时间,差别的数据平台可以对同一私人的相同新闻举行搜罗,互相互不搅扰,也不会互相排斥。

其三,从储量上看,石油的量是给定的,用一点就少一点。而数据则差别,人们运用数据,并不会使其淘汰。恰恰相反,通过对依鳌有据的开辟和开掘,还可以生产出新的数据。

其四,关于像石油如许的古板资源来说,主要的是数目,除了数目除外,并没有维度的看法。而关于数据来说,维度则具有至闭主要的原理。假如一套数据只要一个维度,那么即使它的数目再大也没有原理。念象一下,即时ャ掌握了全中国通通人的体重数据,那又有众大用呢?可是假如你同时掌握了体重和消费开支这两个维度的数据,那就大不相同了。这时,你可以依据数据来推测差别的人乐意为减肥花费众少,并据此探究出相应的商业方式,从中开掘出经济代价。

其五,比较于石油等古板资源,数据具有更强的交换性。尽管从表面上讲,石油之类的古板资源也可以被交换,但其相对资本是很高的。比如要把一辆燃油动力的车改成燃气动力车,就需求花费很高的资本。而比较之下,数据之间的交换则比较容易。比如,我们念晓得每私人住哪儿,以便给他们定向投放广告。假设我们有相闭的住址新闻,那么很好,这个义务可以直接完毕;可是假如没有地址新闻,那也没联系,因为我们完备可以通过其他数据,比如出行数据来予以推测,从而可以抵达同样的目标。

归纳以上几点,我们可以看到,尽管从商业代价来看,数据确实和工业时代的石油具有很强的类比性,可是更众的实质上,它和石油等古板资源却保管着许众差别。数据并不是新时代的石油,数据便是数据。

数据可以被垄断吗

花费了大宗篇幅议论数据举措一种新型资源的属性后,让我们言反正传,将话题回到数据垄断上来。这里需求指出的是,所谓“数据垄断”,并不是一个厉谨的学术词汇,它主要风行于媒体报道和名流演讲。正因为云云,实这个风行词汇并没有十分准确的定义。我翻阅了近来两年来闭于“数据垄断”的许众作品,发明依据运用语境的差别,这个词实有两个差别的寄义。

第一个寄义是关于数据的垄断,即指某些数据被某个企业独自具有了。这一点,重假如针对数据的生产和储存而言的。第二个寄义则是,企业通过掌握的数据来获取,或者稳固本人的垄断位置。这一点,重假如针对数据的运用而言的。

先看第一种寄义。我私人看来,这个原理上的“数据垄断”实是一个伪命题。为什么这么说呢?主要有两个来由:

第一,数据资源并不是恒定稳定的,相反,它不时地发生出来。因为这个特征,即使有企业真的独吞了某一类数据资源,那也只可具有暂时,不行具有一世。我们晓得,大数据时代,数据的代价是和当时效性亲密挂钩的。于是,除非这个企业可以不时对新发生出来的数据加以垄断,否则其手中具有的存量数据将很速丢失其代价。

第二,正如我们前面夸张的,数据搜罗的排他性很弱,你可以搜罗,但也不妨碍别人搜罗。从这个角度看,某个企业也很难通过扫除他人搜罗来包管本人恒久具有最新发生的数据。

当然,少许特别的状况下,某些企业也可以通过技能手腕来增强对数据搜罗的排他性。比如,它们可以屏障掉第三方的爬虫软件,还可以用跟踪IP的手腕来识别手动爬取数据的方法,可是这些都是需求加入不小的资本的。思索到数据具有很强的交换性,一般的企业很少会有足够的鼓舞去对其他数据搜罗者厉防苦守,因为尽管这表面上可行,但经济上却未必划算。

数据可以帮帮企业完成垄断吗

“数据垄断”的两个寄义中,真正值得惹起人闭注的是其第二个寄义,即企业运用数据来获取、稳固垄断位置的方法。

许众人的直觉中,这一点确实是分明的。几年前,出名未来学家凯文·凯利一段演讲中就发外过相似看法。他说:“我认为大数据会缔制至公司,十年、二十年之后,全天下最大的公司便是有最大都据、最大数据的公司。未来谁数据方面能胜出,谁有最大的数据公司,谁便是最大的胜者……随之而来的是垄断,这意味着大脚色大企业会自然而然的变得更大,越做越大,越大越强。越众的人到场到收集当中,收集就越值钱、越有代价。”

而和未来学家比较,从实来垄断经济学研讨的专家对这一题目则要谨慎得众。举例来说,客岁11月时,美国联邦商业委员会曾对数据垄断题目举行过一次听证会,众位业内具有很跨过名度的经济学家都出庭作了证。确实通通的经济学家都认为,数据确实可以大幅添加企业的逐鹿力,但假如企业念仅仅依托数据来完成垄断,则好坏常艰难的。

为什么反垄断经济学家们更偏向于对数据深化垄断力气这一题目接纳更为谨慎的立场呢?其来由主要有以下两点:

第一个启事便是数据所具有的高度可交换性。关于同样的题目,可以应用许众差别的数据举行剖析,其得出的结论都是有代价的。从这个原理上讲,即使一个企业完备具有了某些数据也不行完备扫除逐鹿,从而完成垄断。

闭于这一点,2016年爆发的欧盟同意微软收购领英(LinkedIn)案是一个十分典范的例子。微软向欧盟反垄断机构提交申请后,欧盟委员会内部曾为是否通过这一申请爆发过不小的争议。少许人认为,微软收购领英之后,可以整合两边原有的数据库,这不光会消弭两个企业之间本来保管的基于数据的广告逐鹿,还会深化兼并之后的企业的墟市力气,从而起到扫除、限制逐鹿的感化。然而,颠末一系列审查之后,欧盟委员会最终认为这类逐鹿题目很难呈现。启事就于即使两家企业兼并之后,其他广告企业仍然可以通过许众渠道继续取得对广告有代价的互联网数据。

另一方面,尽管数据是一种有用的因素,可是这种因素是不会独自起感化的,必需配合上企业的技能气力和构造力气,才干真正发挥其感化。

假如没有相应的配套资源和方法,数据这种资源就不行有用地转化为真正的资本。当然,数据本身也就更不行够成为企业墟市力气的根源。经济学家兰布雷希特(AnjaLambrecht)和塔克(CatherineTucker)曾写过一篇论文对数据与墟市力气之间的闭系举行了议论,结果他们发明:“确实没有任何证据可以标明不时改造的数字经济中,仅仅依托数据就能充沛排斥更优的产品或效劳的供应。要念修立可继续的逐鹿优势,数字计谋的要点应当放怎样运用数字技能,给用户带来代价上面。”换言之,逐鹿中,数据虽然主要,但绝非闭键,期望用数据来修立或者稳固垄断位置,确实是不行够完成的。

终究上,许众墟市进入的例子也从反面阐清楚题目。经济学家杰弗里·曼恩(GeoffreyA.Manne)曾对不少互联网企业的兴起举行过剖析,结果发明胜利的互联网公司开端时都确实没稀有据,更不是什么数据驱动型的企业。他由此得出一个主要结论:数据更众的是互联网平台继续运转时的副产品,而不是创立互联网平台时的闭键。

数据垄断的“三宗罪”

现,且让我们暂时丢开闭于“数据垄断”是否可以的议论,假设某些企业依托本身的才能可以垄断数据资源,或者可以通过数据来对本身的垄断位置加以稳固,又会发生什么后果呢?

现有议论中,认为“数据垄断”带来的损害大约有三个方面:一是对逐鹿的摧毁;二是对消费者长处的损害;三是可以带来的隐私等方面的损害。假如我们细细剖析,这三个可以的损害仿佛也大有值得商榷之处。

先看对逐鹿的摧毁。为什么数据垄断会发生这个后果呢?归纳起来,可以的启事主要有两个:

第一个启事是具有更大都据资源的企业可以会应用手中的资源来接纳少许“妨碍性滥用”方法。比如,假如一个优势企业掌握了闭于商业对象的充沛数据,则它可以强迫对方承受本人的某些条件,一朝数据显示对方没有按本人的请求效劳,就中止与其商业。应当供认,如许的状况确实是保管的。不过,这种状况下,优势企业之以是可以强迫商业对象听从本人的意志,一般是因为它们其他方面所具有的优势,数据充其量只可算作它们施行相似方法的一个条件罢了。从这个原理上讲,认为数据容许企业施行“妨碍性滥用”方法,从而摧毁墟市逐鹿状况,这种看法起码是单方的。

第二个启事是具有丰厚数据的企业之间可以更好地举行交换,从而举行合谋。这一点看似有原理,但实并不准确。诚然,数字经济时代下,许众企业之间曾经可以应用算法来监控互相的经营数据,并以这些数据为依据,来调解本身产销,从而抵达合谋的目标。但这个进程中,更为闭键的实是算法,而非数据。终究上,通过算法的计划,企业之间即使借帮很少的数据和新闻也可以告竣交换,完成合谋。于是,算法合谋本身确实是一个题目,但这个题目的症结却算法,而无闭太大都据题目。

再看关于消费者长处的损害。这一点指控,最主要来自于对“特征化效劳”的埋怨。当企业具有了海量的数据之后,就可以对消费者举行精准的画像,从而对其供应“特征化效劳”。欧洲委员会的一份报告中,将“特征化效劳”分成了特征化广告、特征化搜寻,以及特征化订价这三个种别,并指出尽管这三种方式外现上保管着差别,但实质上都是经济学上所说的“价钱鄙视”的一种表示。

熟习经济学的朋侪都晓得,价钱鄙视,也便是对差别的消费者收取差别的价钱,会让部分的消费者盈余挪动到企业手中,从而让消费者盈余下降。从这个角度看,“特征化效劳”确实会损害消费者长处。可是,正如欧洲委员会的那份报告中指出的,“价钱鄙视”完成这种挪动的同时,还会有一种“墟市创制”(mar-ketopen)效应。通过精准地识别消费者的需求,企业可以让许众本来并不墟市中的消费者纳入到墟市中来,而这部分消费者,却是确确实实取得实惠、能完成本身福利的改良的。假如思索到这点,那么“特征化效劳”对消费者全体所发生的全体福利效应便是不确定的。终究作何判别,很洪流平上取决于我们怎样看待差别消费者群体的主要性,怎样对他们的效用状况举行加权。

着末再说说隐私方面的损害。不可否认,目前许众企业出于商业目标的需求,关于用户的私人新闻举行了过分的搜罗,从而发生了侵犯用户隐私的后果。更有甚者,还衍生出了“剑桥剖析门”那样的丑闻。这些题目当然都是值得注重和反思的,不过,假如将这些题目视为数据垄断的结果,那就可以显得牵强了。

诚然,从现有状况看,确实有许众业内具有较大墟市份额、较强墟市力气的企业侵犯了用户的隐私,比如Facebook便是一个典范事例。可是,这并不意味着企业的范围更大、具有的数据更众,就和侵犯隐私之间保管着因果闭系。一次集会上,我曾请教过诺贝尔经济学奖得主梯若尔(JeanTirole),问他怎样看“剑桥剖析门”事情,以及是否应当用拆分的方法来对Facebook举行惩办。梯若尔听完题目后重思半晌,反问道:“你认为拆分就能办理题目吗?假如将一个大的公司拆分成几个小公司,那么这几个小公司为了逐鹿的需求,不是会增强对用户新闻的搜罗和争夺吗?你认为这是会增进隐私维护,照旧相反?”梯若尔的这番评论颇值得玩味。假如企业对数据的争夺是为了逐鹿,那么逐鹿越强,消费者新闻被侵犯的概率就越大。从这个原理上讲,假如真的保管着“数据垄断”(当然,这很难抵达),那么从维护用户隐私和新闻平安的角度看,这当ボ够是一种最优的状况,因为这时人们只消管好一家企业的平安,就可以避免题目的爆发了。

理性看待“数据垄断”

通过如上冗长的剖析,我们可以看到,所谓“数据垄断”实并不是一个十分明确的看法。实行中,它仿佛很难保管,即使保管,其所谓的损害也是颇为值得商榷的。基于这个启事,我私人认为数字经济条件下,应当对所谓的“数据垄断”抱有一种更为理性、谨慎的立场。应当看到它所隐含的损害,但也不宜盲目烘托它的损害。

举措一种生产因素,数据具有很强的范围经济和外部经济。无论是用于预测,照旧用于企业内部办理,数据的范围越大、维度越众,其用途就越大。假如数据是孤单的、零星的,那么它的感化就完备不行发挥出来。从这个角度看,为了饱励企业晋升本身的服从,就应当容许它们合法合规的范围内搜罗、运用数据,而不应当用一个莫须有的“数据垄断”看法来束缚了它们的四肢。

当然,实行当中,企业搜罗、应用数据保管着许众的题目,也确实有不少企业应用数据来谋取私利,损害消费者长处。关于这些精细的题目,应当研讨精细的方法来加以办理。假如将通通题目都一概甩锅给“数据垄断”,然后祭出反垄断的大棒乱打一气,那可以非但无益于事故的办理,还会妨碍企业的平常开展。

 

陈永伟经济观察报专栏作家
《比较》研讨部主管