变革家,为您发现风险和商机!金融的核心,就是风险定价。
可惜,中国的征信体系一直没有建立起来。不知风险几何,又如何定价?
2013年才刚刚踏入历史正轨的征信行业,在互联网金融的倒逼下,正在变成风口行业,也因此成为各方夺利的草莽江湖。
部分征信和数据公司,直接从黑市上购买数据,甚至雇佣黑客去盗取数据,一家如此起家的公司,估值已达几十亿;
一些急于变现的公司,各地招聘代理,推销征信报告,年流水上亿;
而专门做这种备案交易的“中间人”已出现,并公开叫卖征信公司的备案。
这个敏感而核心的行业,正在经历它的野蛮时代。
1、数据黑产
黑客KK最近接的一单生意,是盗取“企查查”的数据。
企查查是一家企业工商信息查询平台,其核心数据服务器放在云端。
如果直接入侵云端,对抗的是整个云端的安全系统,难度有点高。
KK擅长出奇招,“能走后门,绝不走正门”。
他收拾好电脑,藏到企查查的楼下,利用小工具强行破解公司的WiFi。
进入内网后,所有人的电脑,就如KK的掌中之物。他很快找到了登陆云端服务器的用户名和密码,将200万的公司缓存数据库拖出来。
KK将数据出手,挣了几万元。
“这就是我的日常,隔几天干一单,挣几万到几十万不等”,KK最近两年的业务量,开始猛涨,月收入上百万。
KK认为,这和最近火了的征信风控行业有关。尽管在1988年,国内第一家专业信用评级机构就已成立,但因为那时政府数据还未提倡公开,行业只得龟速发展。
直到2013年,《征信业管理条例》发布,可算给民间征信机构画出了跑道——对于企业征信,采取备案制;对于个人征信,采取牌照制。目前,已有138家企业征信机构备案通过,而另外8家个人征信机构,正望眼欲穿,等待牌照下发,发令枪响。
中国的征信行业,至此才正式走上历史正轨。
在某种程度上,因为互联网金融的发展,也在倒逼征信行业尽快上道——试想,每家互联网金融公司,都得从无到有的搭建一套风控系统,成本何其高?
事实上,这个领域的玩家,远不止8家个人征信、138家企业征信。易观高级分析师李子川称,很多所谓大数据公司,其实也在做征信公司的事,“征信和数据公司的界限并不清晰”。也就是说,这个赛道上,涌入了三股势力:征信公司、大数据公司,以及各个金融公司的风控部门。
对于他们来说,第一步,就是获取数据。“得数据者得天下”,数据似乎拥有点石成金的魔力。对数据的极度渴求,让黑市无限繁华。目前,数据产业链分为两个部分,第一部分是黑客,他们负责盗取数据,是前方的入侵者。而后端,还有一个数据商,他们作为中介,对接客户和黑客。
周晓青就是如此的一个中间商。两年前,一个客户找到周晓青,要求购买车管所的数据。出价30多万,买400万条。周晓青通过手下的黑客军团,很快搞到了数据。除了车牌号码、所有人等基本信息外,连发动机号、车辆识别号、保险到期时间都有。
此后,客户又多次光顾,合作购买工商、房产信息等。
“对方对我信任后,才透露自己是一家大数据公司”,周晓青称,当购买一些敏感数据时,“就让我从一家皮包公司走账”。周晓青断断续续和他们做生意,获利几十万。
他也开始关注这家数据公司的新闻,“有意思的是,这家以黑市数据起家的公司,目前已估值几十亿。”
这绝非个案。周晓青在两年时间内,接到大量的“订单”。大部分都是数据公司、征信公司,或者是某公司的风控部门。周晓青称,有几类数据最吃香:工商、身份信息、车辆、房产、电商交易、银行、运营商等。
这几乎是征信行业必备的底层数据。
一般有数据的政府部门和机构,下面都会有一两家代理商,可供需要数据的企业,申请接口。一旦有人通过接口调取过数据,就会在接口本地缓存下来。而这部分缓存数据,就是黑客重点进攻目标。目前黑市上交易的,大部分也是缓存数据库。
“第一,是因为代理商的安全意识不强,比较好盗取;第二,如果直接攻陷政府部门数据,有违法风险,没有必要”,周晓青称。
目前,专门靠盗取数据为生的黑客并不多,大概几千人。而另外一部分数据的外流,来自内鬼。
但数据的中间商却多达几万人,数据的每一次流转,价值上万到百万不等,周晓青简单计算过,“地下黑市,早已形成万亿级别市场”。
2、数据污染
地下黑市为何如此繁华?
如果按照正常途径获取数据,价格将极为高昂。比如,从车管所调取一个人的数据,价格是2到3元,而黑市只需要2毛;从银联调取数据,一个人是1到2元,黑市只需要1毛——价格差距10倍不止,也难怪大家趋之若鹜。
尽管从商业逻辑上,有某种必然性,但黑市泥潭深不可测。
“通常黑市数据真假难辨,大家都是掺杂卖”,周晓青甚至自己都干过这种事,他把一份只有100万的银行VIP客户的数据,填充了900万的假数据。
银行将活期余额超过800万的用户,称为七星级用户;超过1000万的,称为八星级用户。“填充的,也是银行客户数据,只是级别很低,冒充高星级用户。但购买数据的公司,很难鉴别真伪”,周晓青称,一份黑市价值3万的数据,经过填充后,他卖了20万。
购买者一般事前会要求抽样检测,但数据一次销售,少则几万条,多则上亿,不可能完全鉴别真伪。
这个行业最大的隐患,其实来自“被污染的数据”。
周晓青除了接“盗数据”的活,也会接“放数据”的活。曾经一家保险公司,将一部分篡改后的数据放出,“故意将一些高净值用户,加入骗保的黑名单,将一些骗保的人,加入高净值用户名单,以搅乱市场上其他竞争对手的视线”。就像往数据流中不断注入污水,通过层层渗透,干净的数据也会被污染、发臭。
“我的任务,就是把这部分数据销售给其他保险公司,他们甚至愿意出比购买数据更高的价格推广污染数据”,商业战场上,人们似乎喜欢花更多的钱,去损人不利己。
黑市上交易的数据,完全没有进行过“脱敏”。
“你很难想象,根据现在的数据,我了解你的程度,可能超过你本人”,在黑产网络中,每一个人都被扒了底裤,毫无隐私可言。
参与讨论