大数据创业的价值、模式和挑战丨对话创业者

近几年来,大数据的应用场景扩展到几乎每一个垂直行业。在得到资本青睐的同时,也面临着如何将数据的价值最大化利用,如何面对信息监管等诸多问题。

在10月23日IT桔子·腾讯云沙龙“对话垂直行业大数据×创业”活动中,我们请到了三位大数据方向的创业者,他们告诉我们大数据创业者的动力和迷茫,也回答了诸多大家关心的问题。

本文根据现场提问环节整理,有删减。

#大数据到底有哪些价值?

如何通过产品和技术将这些价值最大化?

白冬立<热云数据>:我是三位当中,唯一一个专注在移动互联网用户行为的大数据创业者。我们有足够多用户行为的数据,这些数据也许有非常多的价值,但是我们对很多的行业并不了解,就很难发掘这些数据背后的价值。

所以我们愿意把我们的数据最大程度的开放给合作伙伴,尤其是一些热门的领域,比如征信、金融、电商、直播等。如果说数据最后没有落地到一个行业,不解决具体行业的客户需求,我认为数据就没有价值,这是我们的经验。

李超<黑格科技>:我也认为数据本身的价值需要落地在某一个场景下,这个场景可以有很大的想象空间。如何用大数据创造更多价值,实际上数据量积累到一定程度,就会产生质变的结果,就会切入到更新的领域。大数据的价值非常多,但是想最终变现,就要切入非常好的场景。

谷熠<星图数据>:对于场景化和行业化的聚焦是毋庸置疑的。仅仅拥有海量的数据并没有特别的价值,你需要跟行业的应用场景结合,需要看在这个行业里面,不管是个人或者是企业的实际操作者,它需要什么,你的数据是不是能够真正解决这些工作场景里面的问题,这是非常重要的。

数据最基础的本质是信息,它让你能够有更多的决策依据。如果仅仅就数据而说数据,你的价值其实仅限于此。

所以你需要往上走,比如通过一些预测或建模预算的方式,真正帮助企业或用户在做选择和做决策时提供更多的可选方案。

如果你真的能够通过大数据或人工智能的方式代替他做决策,这个又上升一步。所以做大数据是不希望就数据讲数据的,我们要跟行业做垂直的结合和应用,通过更先进的技术手段和更先进的思维方式,去思考如何把人从实际的工作和实际的抉择里面解脱出来。

#大数据创业如何优化自己的商业模式?

谷熠<星图数据>:怎么优化商业模式?其实很多投资人置疑我们离钱远。面对这个问题,我们也有一些思考和探索,比如我们帮助企业做产品的设计和策划。如果说按照最传统的方式来讲,无非是我收一个年费或者项目费。

现在我们的收费模式发生了进一步的变化,我们帮助企业设计或者是策划一款新的产品。前期我们收一定的成本,后期我们更倾向于按照销售结果付费的方案。通过收入分成的模式,企业的信心也会进一步加强,因为他认为既然你跟我签了分成的模式,你就会全力以赴做这个事情,前期支付的成本也不高,所以他们敢于尝试,我们在推广客户的时候也会有一定的帮助。

李超<黑格科技>:在优化商业模式上,首先要确定你的产品是2B还是2C的。我们公司是做2B的,在2B的商业模式中,首先在早期你先要明确哪些客户可能用你的产品,包括你的产品在客户的业务生态里面能占多大的作用。

第二,你也要很早考虑变现和规模化,一开始不需要你对这个事情带来很高的回报。但是你需要在一个场景或者在一个比较标杆的客户下,产生了比较大的作用,未来才很有可能规模化。

白冬立<热云数据>:关于商业模式,我觉得有两点。

第一是如何优化满足你的客户需求的过程。在这个过程当中,你是在帮客户创造价值,是在帮客户节约成本,是帮他做决策,还是节省了他的时间,这几点钟你抓住一个点,去优化你的产品,优化你的服务。

我们做的事情主要是优化我们的技术与产品的结合。其实说白了就是优化我们的产品,因为我们的产品主要是帮助客户去做决策,节省时间和沟通的成本。所以我们花了大量的时间去跟客户沟通,了解他们的需求。2B的公司有一个特点,它不像2C的企业,可能三到五个月就能估值好几十个亿。我们做的事情,需要有缓慢的积累,这样你的公司肯定是往上走的,

第二点是找到更多变现的方式。我们找到了一个能够挣钱的事情后,不管这个挣钱的事情能够帮助你创造多少利润,你要做的事情都是如何找到第二个能赚钱的产品或者是能赚钱的路。所以现在我们做的事情,就是怎么能让我们自己两条腿走路,第一条产品能帮我们找到客户,第二条产品能帮我们盈利。

#大数据创业过程中,最大的困难是什么?

白冬立<热云数据>:这个过程当中我们遇到两个最大的问题,第一个是关于人的问题,因为创业公司其实不像大公司有光环和背景,招人很容易,在这个过程当中为了吸引更好的人才其实是非常困难的。

第二个问题是关于中立性,因为我们做的事情是中立的第三方公司,我们往左边倾斜,可能就是赚很多钱,但是我们就不中立了,往右边倾斜可能我们就是一家不赚钱的公司,所以如何在离钱近和离钱远找到一个空间,这是我们目前遇到最大的挑战。

李超<黑格科技>:关于遇到的困难,其实创业过程当中困难非常多,包括技术、客户、资金等等。我们公司在发展的过程中一直存在着可能的风险,比如在于不确定的监管因素,所以我们在设计产品的时候都尽量避免和监管上靠的比较敏感的地方,尽量能保证我们的产品长期是比较安全的状态。

谷熠<星图数据>:关于困难,我觉得大数据各个环节和流程目前都不太成熟。举一个简单的例子,星图自己做数据供应链全流程,从数据的收集到数据的清洗、挖掘、建模、分析,到最后产品化的应用和交付,全流程我们只能自己做,就因为现在我们没有很好的大数据环境,我们无法更方便的获取数据源。

另外,每一个公司自己的业务场景需求其实是不一样的,现在也没有很好的通用化的产品和工具能够帮助你真正解决实际问题。比如说数据的可视化呈现,但是到实际应用场景里面能不能用好,这是一个问题。

第三,一定要坚定自己的认知和想法,不要跟着资本和媒体舆论的方向走,从我们的角度来讲,星图非常庆幸,我们一上来就认清了自己的方向和策略。等风转过来的时候,正好跟我们的方式相匹配。所以一定要认清自己最重要的目标客户群体是谁,不要因为外面的风向或者是困难发生摇摆。

#不同垂直行业大数据之间有哪些融合的点和机会?

白冬立<热云数据>:大数据行业的模式基本是两个,一是服务营销,既如何帮你在花钱的过程当中省钱。第二个就是决策,我到底要做什么,怎么做。

所以我们的目标是做通用型的产品,但是我们发现很难,做通用型的产品你就飘在上面不落地,离钱远,一旦你落地了就垂直了,但是就没有办法通用了。其实我们很欢迎跟其他领域的公司合作,因为我们那些数据不跟他们合作的话一分钱不值。

每一家大数据公司都有自己的壁垒和特点,开放、供应、多多探讨,未来才能探索出大数据未来的价值到底是什么。目前行业当中也缺乏标准,比如数据是如何定价的。所以我觉得大家多去交流和合作,才能知道你到底应该怎么通用,还是说应该怎么垂直。

李超<黑格科技>:因为我们公司做的本身就比较垂直,所以没有太往通用型考虑。我觉得做通用型平台,它底层的技术或者是各个方面在早期要做很大的投入,尤其是很长一段时间内可能看不到钱。

关于不同垂直行业的融合,其实目前在电商和金融领域,它的融合已经非常深入了。比如消费金融,因为做电商和支付的公司,先天就有很强的获客渠道,大家通过这个可以知道哪里要用钱,大家平时喜欢买什么东西,这时我来提供金融服务是非常简单和自然的事情,这样的形式可以在很多行业里面碰撞出一些火花来。所以我觉得未来这种不同行业的大数据或者是不同行业的机会融合会非常多。

谷熠<星图数据>:从星图的角度来讲,我们做的数据无非是两个维度,第一个维度是跟商品相关的,包括商品的基础属性,以及商品的售卖过程;第二个维度是人,就是跟消费者相关的,包括购买习惯,收货后评价的语义分析等等,在这两个维度上,我觉得其实是有想象空间和延展空间的。

从结合的角度来讲,未来一定有更多的结合空间,我们希望让更多专业的事情交给更多专业的人做,我们会自己的精力专注地放在主营业务上。

#优秀的大数据公司,其核心竞争力是什么?

李超<黑格科技>:创业公司要建立自己的壁垒:

首先,当这个市场不太成熟时,空白的机会要抓住;

第二,技术一定也是壁垒。这就是互联网公司和传统公司之间的差别,互联网公司更喜欢利用这些数据和技术,或者是用机械化的方法来做决策和辅助;

第三,壁垒就是你这块业务做到一定的量或者你的用户量达到一定的数量,你对这个行业和商业模式有了全新的认识时,你的壁垒就会非常的重。因为技术方面大家都看明白了,随着时间的推移大家最终都能做起来。

谷熠<星图数据>:从我自己的角度来讲,我觉得2B最大的门槛就是懂行业,其他的都不足以或者不那么足以构成门槛。因为你的技术牛,可能有人比你技术还牛,你算法厉害,可能有别的科学比你算法还厉害。

举个例子,2C相对来讲容易,因为我可以把我自己模拟成用户,我可以把我的亲戚朋友模拟成用户,只要他在我的目标群体用户圈子里面。但是企业不行,假设说我是美的,你假设不了;假设我是蒙牛,你也假设不了。如果你并不真的懂得他们的日常运转流程、工作场景、需求和问题,是没有办法拍脑袋做产品和服务的。所以我认为2B企业来讲最重要的门槛和核心竞争力就是懂行业,这是我个人的观点。

白冬立<热云数据>:我认为一个行业当中有壁垒的公司,除了刚才两位说的几点以外,我认为还有两点很重要,第一点是资源。

因为大数据公司它能够生存,一定有它特有的东西。比如征信公司能拿到运营商数据,是需要资源的;拿汽车违章的数据,可能也要有政府相关的资源。所以如果你在垂直领域做大数据的话,你在这个领域一定有独特的数据资源。

此外,你的数据也应该数量足够多,广度足够广或者是深度足够深,这个都能够让你在这个增面建立壁垒。

第二个是品牌,现在大数据垂直领域的公司已经非常多了。在这个领域建立起品牌,将是非常大的壁垒。当品牌做好后,比如突然间有一家公司说我要做征信,第一个想到的就是黑格,而不是其他的征信公司,这就是是非常好的壁垒的方式。所以一家2B的公司花很多钱到营销和品牌建设上去是有道理的。

#个人数据属于隐私范畴,未来的法律法规是否有利于这个行业的发展?

白冬立<热云数据>:关于隐私,我们碰到过这样的公司,我只能说真的很牛,但是我不知道这个怎么放到我们的模式当中做。因为我们是在台面上,在桌面上,虽然说他们有数据,但是没有办法拿出来用。所以说你未来要做什么样的企业,你的定位是怎么样的,你是要做大,还是要盈利和赚钱。

所以这个跟企业的定位有关,很多大数据公司可能都会有很多隐私数据,但是要明确涉及到隐私的事情我们是不能做的。未来监管是怎么样的不好说,只不过现在我们就拉一条红线,这条红线坚决不能碰,那就是售卖个人隐私数据。

李超<黑格科技>:数据安全方面,我们国家在这块的监管确实不是很完善,包括数据行业都是比较早期,包括我刚才说的征信涉及到很多隐私的数据,行业也比较混乱。

首先企业之间需要自律,你有很多的数据,你怎么拿它赚钱,企业要有道德标准,如果只是为了赚钱,数据投入到黑市倒卖肯定能赚很多钱。所以希望行业能有一个比较好的环境,包括一些标杆的企业,它能够建立自己的自律心态。但是这个事情可能需要两方面驱动,一方面是国家政策和法规能够逐渐完善,第二方面是这些企业能够形成比较好的标杆。

谷熠<星图数据>:关于个人数据的风险问题,一个是国家法律层面,一个是企业自律。其实很难讲,因为企业永远有自觉和不自觉的。个体的数据一定要授权,客户允许哪部分的数据你才可以收集。

不是个体的,我们要看这个数据怎么脱敏,比如说我把30岁男性住在北京的,喜欢买电子产品的这一群人的特征拿出来分析,我分析这些人除了买电子产品还喜欢买什么,这个不牵扯到隐私,但是张三、李四喜欢买电子产品,还喜欢买什么,这牵扯到隐私,这中间的规则其实很重要。虽然国家没有现成开放的标准,但是我相信企业自己,尤其是那些有良心、有道德的企业有自己企业的标准,未来我们也希望市场越来越规范。

#未来大数据,发展趋势是怎样的?

白冬立<热云数据>:记住马云一句话,谁有足够多的数据,谁就有未来。

李超<黑格科技>:对创业公司来讲,本身是没有能力创造数据的,数据基本上都在BAT、政府、银行和运营商手里面,创业公司只是通过技术采集到数据,把数据再做一次分析。现在大数据行业可能在数据层面还是以偏交易、采集为主,然后在这样的数据上逐渐有一些商业模式,能够给让企业提高它的销售和策略。未来我觉得会和企业内的商业模式或跟服务企业的业务更加深入的融合。

谷熠<星图数据>:我个人觉得有三点:一是未来大的数据环境越来越开放,现阶段大家为了获取一些基础的原始数据负担很大的成本,浪费很多的精力。但是我觉得未来大家获取数据的成本会越来越低,拿到数据的手段会越来越多。在先进和发达的地区,不管是北美还是欧洲,这样的趋势已经越来越明显了。

二是关于整个数据的监管和立法,我觉得未来整个市场会越来越规范,相关的法律法规,以及规范和准则也会越来越成熟。

三是真正能够意识到或者是了解到数据的价值,然后真正把数据变成驱动,不管是个人或者是企业的原动力会越来越多。大家对于数据的认知会越来越深刻和越来越具体。

#听众提问环节

听众:我问一下黑格科技李总,我感觉现在做互联网征信的公司挺多的,大家的产品同质化挺严重的,你觉得在互联网征信领域,我去选择这个公司的核心竞争力在哪儿呢?第二个问题,我感觉现在做互联网公司都是在贷前阶段,为什么没有一家公司做在贷中管理和贷后坏账预测。第三个问题,因为我之前有房屋抵押贷的征信,但是现在还没有一家公司做这方面的互联网征信工作,基本上都是信用贷和消费贷。我想知道为什么没有人做这个事情呢?因为我觉得这方面的需求量也是很大的,而且在房屋抵押贷上,如果说一家公司能够介入进去的话,里面应该有很强的利润点。

李超<黑格科技>:第一个问题其实征信这个概念在中国实际上虽然说多,但是大家多说它很不健全,这个也是事实,只要它不健全的话,而且我刚才讲了需求特别大,你说市场大不大呢?是很大的,比如说我放贷一千块钱,平台愿意出两到三块钱,甚至是五到十块钱通过购买我们的数据来降低风险。

再加上现在贷款的规模非常大,所以征信市场从数据上来讲还是很大的。

现在很多做征信的公司,其实比较多的公司,它还是在倒卖数据,只是做一个代理销售的事情。比如说国内至少有将近十家做征信的公司,他们是在采购我们公司的数据再卖给别人,他们就赚一个差价。我们公司其实在我们做的这些数据层面的研发已经超过一年时间。比如说运营商的数据,实际上运营商的数据你做分析的话,我们国家有三大运营商,每个运营商有三十多个省,每个省的网站信息是不一样的,数据清洗需要有七八十个不同的指标。再加上刚才谷总说的爬虫策略,这一块我们的感触太深了,因为我们公司靠的就是爬虫专家这套东西起家的,我们爬的淘宝,淘宝的反爬策略非常强,我们找了很多种登录方式二维码登录方式或者是APP登录方式,或者是PC网页上不断提交验证码,数起来可能有十几种。

比如说邮箱,我们分析邮箱帐单的时候,全国常用的邮箱可能有十几家,这些银行可能有二三十个银行卡信用中心,大概有上百种策略,这个需要有非常强大的技术能力和非常专注的人长期做才能做的稳定。实际上业内大部分的征信工作还是在导客户和数据,最终数据的输出方,其实国内只有很少几家能够真正稳定高效输出数据,我们很少讲我们是做征信的公司,我们一般来讲我们是以数据为基础的公司,因为征信的概念在中国还是比较重的。

我们国家征信是从2014年12月份才有个人征信准备的说法,但是到现在过了快两年了,还没有一家拿到牌照,所以征信行业目前是非常混乱的,但是机会也很多。

第二个问题,实际上这块业务,2B的业务你要想切入客户那一端,你上来都想把客户的全流程和全周期都做了,可能不会那么快。我们真正切入到银行系统里面,往往会提供相对比较简单的数据层面,我们完全替代银行策略层面,目前没有任何一家第三方公司,银行的决策由我来做。但是我们能提供的数据,在贷前、贷中、贷后的作用是非常大的。我们提供的报告在贷中没有吗?贷中一样可以做,贷中对地理位置可以做分析。贷后我们提供了常用的收货地址。尤其对于超过60天的,我们的客户可能不做上门催收,他们往往会做短信轰炸,我们分析到你常用的联系人,每隔几天不会骚扰你,而是骚扰你的联系人,给你压力,让你身败名裂。

其实在蓝领这个群体,他比我们很多大学生和白领更爱面子。我不能既欠了钱以后,我还失去了朋友,但是我们平台早期拿不到这些数据。如果单从APP里面采集到用户,通讯录可以随便造假。但是我们总运营商抓取他的通话记录是没有办法造假的。但是如果说我们把贷前、贷中、贷后整套系统都在我们公司做的做,早期的创业公司很难说什么事情都由我们公司来做,或许过几年我们公司有更好的产品能把整个周期都做好。

第三个是关于房屋抵押贷,我们早期创业的时候会找一个点,最好空间比较大,又比较容易标准化和规模化的方式,我们为什么要做量大呢?因为有一个大数定律,在量大的情况下,这个事情就能够用极其科学的方法做决策。比如我们管理一亿的资金规模,我们只投资一家公司,这不可能完全用标准化机器算法决策的,我们一定去这个公司做一份详细尽调,我们理解这个公司做什么样的业务,最后可能是说赌这一笔能够赚到高额回报。但是如果我投一百个公司,每个公司我投一百万,之间的关联性还是比较大的,但是我要投十万个用户,每个用户我就给他一千块钱,这样相互之间就非常独立,风险也非常的分散,他完全可以用标准化的机器算法做评估。

所以你刚才说的房屋抵押贷或者是贷款,涉及很多线下难以标准化的因素,额度也比较大,数据也可能是来源于很多其他的外部因素,早期互联网是很难介入的。我就从这三个层面回答这些问题。

— End —

原文链接:IT桔子&腾讯云:大数据创业的价值、模式和挑战丨对话创业者