大数据到底有什么用?
马云的回答是,未来可以用它抓小偷。在最近“未来社会治理”的学习讲座上,马云举例说明了大数据的妙用。他说,一个人买高压锅很正常,一个人买钟也很正常,一个人甚至买一个火药也正常,买个钢珠也正常,但是一个人合在一起买那么多东西,就一定不正常了。买火药是一个店,买高压锅是一个店,买其他是一个店,如果没有通过数据的结果,请问你怎么知道他在造炸药?
在马云眼中,数据时代是预测未来的时代。但数据和大数据是两回事,“这里的大,是大计算的大 。数据和大数据是两个概念,但中间隔着什么?隔着计算能力。”
那些拥有计算能力的大数据公司,可以说已经握住了未来的线索。
Splunk养成记
大数据到底能做什么?我们举几个简单直白的例子看看,当年Linkedin的老总,就曾提出经济图谱的概念,希望整合用户,公司,工作机会,技能,学校,帖子变成一个复杂而有蕴含无限可能的数字化社会。有个国外的极客,他抓取了dating网站的数据,根据有些指标如地理,年龄,兴趣,建立下面的3D模型找到真爱。阿里巴巴通过数据魔方,提炼出消费跟女生胸部成正比的结论。今日头条通过你的个人社会化信息,建立起兴趣图谱推荐文章,使用频次多高越懂你;MOOC在线教育、Wealthfront做大数据理财,23andMe提供个人基因组大数据等等。
其中,还有一家公司不得不提,它就是全球第一家上市的大数据公司,五年复合增长高达50%,市值80亿美元,没错,它就是Splunk。
2004年,美国旧金山诞生了一个做大数据的公司叫做Splunk。两年后,它发布了第一款产品,通过对大数据快速精准的分析能力,为客户带来巨大的商业价值。2008年,Splunk的业务开始扩张,第二年就开始盈利。在2012年上市前客户数已达3700家企业,其中包括30家中国企业。它就成为了大数据行业第一家IPO上市公司。据统计,从2011年到2015年,5年间Splunk的营收复合增长超过50%,营业收入从8000万美元做到6.8亿美元。在连续6年被《商业时代》评为旧金山湾区“最佳工作地点”之后,Splunk全球员工人数达到了1000人,在全球90个国家,拥有7000多个用户,在亚太的客户已高达1000个。值得一提的是,Splunk上海作为第一个海外研发中心,在2013年初入驻杨浦区创智天地三期,与美国总部的研发中心,形成了既互相独立又互相协作的工作模式。
Splunk的核心产品是处理大量数据,并通过图表呈现信息,便于使用者进行分析决策
回溯Splunk的发展模式,其不仅是产品功能强大,迭代速度快,快速对接新技术;而且也得益于日志分析市场快速发展的大背景。目前,企业越来越重视提升IT运营效率,降低成本,所以需要一款功能强大的软件来辅助其IT人员。Splunk主要分析的是日志等机器数据,通常为非结构化数据,可以为IT运维人员,找出网站、软件等运行问题。
所以说,Splunk的核心产品主要是处理大量数据,并通过图表等形式将信息呈现出来,便于使用者进行分析决策。由此可见,Splunk更像是一个数据搜索引擎。不仅可以作为一个可视化工具,还能具有实时机器数据分析能力。同时,Splunk产品适用范围极广,几乎可以处理所有日志数据,连接各类设备,不论是防火墙、交换机、路由器还是操作系统、应用程序,这种万能胶的特性,让它备受恩宠。同时,适应新技术,Splunk推出Splunk Storm和Hunk分别是针对云和Hadoop技术的分析平台,始终保持领先者地位。
产品驱动如何挣钱
目前,Splunk毛利率超过80%,营收稳步增长。其收入主要来自两方面,产品和服务。
第一,大部分客户都是直接买断产品,而且Splunk将近4万美元的客单价,已经把客户范围缩小至大中型企业。有很少部分的是按照每年使用产品的数据量进行计费,先预估一个数值,按照这个数值付费,如果有超出部分再加收费用。尽管Splunk在2015年推出了简化版产品,将基于云端产品的价格降低30%左右,但大型企业仍然是Splunk产品的主要客户群体。
第二,服务主要是包括产品安装部署、使用培训以及后期维护等,客户在购买产品的同时获得一年服务,之后如果需要在每年付费。考虑到Splunk的产品大多数都是永久买断式,累计客户数中一部分客户是不再购买产品,但客单价仍然逐年提升。说明除了新增客户之外,每年还有原有客户在追加购买产品,说明产品的用户体验很好,客户黏性大。
第三,Splunk所做的日志分析,除了用于运维监测外,同样适用于新兴的大数据安全市场。Splunk目前与IBM、Log Rhythm一同入围Gartner关于信息安全和事件管理方面的领导力象限,说明其已正式切入网络安全市场。
不过,也要客观看到,尽管高毛利率、营收稳步增长,Splunk还是逐年亏损,从2011年到2015年,各项费用支出的复合增长率为63%,超出营收增速10个百分点。因此,Splunk从上市时的亏损1100万美元增加至2015年亏损近2.8亿美元。考虑到公司每年要付给员工一定比例的股权激励,以2015年为例,公司员工股权奖励支出增加了8000万美元,去掉这部分后,公司实际亏损在2亿美元左右。
作为一家年增长50%、人均产能30万美元以上的公司,Splunk主要还是依靠产品驱动型公司,对人力依赖不大,产品附加值很高,竞争力强。根据IDC的测算,2014年日志分析市场规模在10亿美元,到2019年将达到25亿美元,复合增长率为19.34%。2015年,Splunk营收为6.68亿美元,占据28.5%的市场份额,霸主地位巩固。
在日志分析这一领域,除了Splunk之外,Sumo Logic以及Loggly两强还未上市。其中,Sumo Logic在2015年完成8000万美元的E轮融资,总融资金额达1.605亿美元,Loggly在2015年完成1050万美元的C轮融资。不过,另外两家产品更偏轻量级,主要是基于云端的SaaS型产品,所以对Splunk尚不能构成威胁。而据已经披露上半年财报显示,预计Splunk2016年全年营收增速在45%-48%之间,营收预计在9.69亿至9.89亿美元之间。
中国特色的日志易们
类似Splunk这样的,国内也有类似的企业,比如日志易,专门就是做实时搜索分析引擎处理日志的。研发团队,通过一种可编程的实时日志搜索分析引擎,实现了搜索处理语言,可以在搜索框里写脚本程序,几十行甚至上百行的脚本程序,非常灵活。
当然,企业在选择供应商服务时,会强调定制化而非标准化。就像我们每月选套餐一样,都希望能够满足个性需求。因此,日志易做的可编程搜索,就能定制化在搜索框里写脚本程序,完成它的分析,而且不妨碍提供一个标准的平台。
所谓的实时就是日志从产生到能够搜索,分析出结果就是几秒钟的延时,Fast Big Data。像乐视使用日志易的统计显示,每秒钟可以处理100万条日志,每天20TB,60秒内检索一千亿条日志。主要应用的场景就是运维监控、安全审计和业务分析三个方面。主要服务于中国移动、国家电网、小米、乐视等大客户。此外,日志易开发了中小企业的SaaS服务。当然,从业务角度,巩固于2B的市场当然不会错。但是,在投资领域,则是另一番光景。此前,VC更看重的却是2C的市场,除了BAT跟风的很多,在中国96%的风投是投向2C,只有4%的VC的钱是投到2B的。相比之下,在美国,60%投到2C。特别近年来硅谷投的更多的科技类创新基本上都是投2B。所以,目前在国内,2C这个市场主要都是抱BAT大腿的。
其实,关于2B和2C其实还是有个很形象的比喻。硅谷做SaaS的VC,曾经把客户的类别分成雷龙、大象、鹿、兔子、老鼠、苍蝇,甚至包括微生物。什么是微生物?其实做2C的就是做的微生物,像微信几亿用户,还有百度的搜索,阿里巴巴的淘宝,其实这种微生物的这种是靠走量的,能够从微生物里有个10%的能赚到钱,通过投放广告,做微生物的基本上都是靠后向收费,通过广告,通过其他的收费。
而真正的雷龙级别客户,指的是美国国防部,美国中央情报局,美国流行疾病中心等,他们的大单年费都在千万美元级别。当然,这种在中国也有但是一般很难拿到,有很多限制条件。所以,像日志易这样做大数据的企业,会更看重大象级的客户,股份制的大银行,一年有几百万。而鹿、兔子这种客户,比如城商行、农商行,基本上属于几十万级别。一旦超过50万就需要招标,但是招标,又会有很多人为因素在。所以,很多2B的经验是化整为零,把100万的单拆成两个50万,隔半年做一张。这样就可以循环下去,有稳定收入。这是目前国内的模式,当然还有像兔子几万块,老鼠几千块级别的,不一一列举。
投资人说:本土营销化手段更易带来生存空间
大数据领域国内公司起步较晚,但是发展很快。其中,BAT三家也是各领风骚,首先百度提出框计算,成立硅谷研究院,甚至挖来了机器学习的大咖Andrew Ng作为首席科学家,研究出了百度大脑,在语音,图片识别大幅提高精确度和召回率;腾讯,从最大的社交应用出发,自行研发了C++平台的海量存储系统。阿里巴巴,去年双十一主战场,2分钟突破10亿,交易额突破571亿,证明了OceanBase和阿里云的靠谱。
除了BAT之外,很多新兴的创业公司也如雨后春笋般呈现。比如,日志易在2015年完成6000万的A轮融资,HanSight瀚思在2016年完成3000万的A轮融资。不过,跟美国Splunk一家独大,其他Sumo Logic等靠细分领域做垂直的也很多。而在国内,技术驱动并非第一要素,本土化的营销手段,可能会更容易带来生存空间。如何能够了解企业用户需求,定制化功能,提供安装、培训及后期维护服务,才是国内公司创新的根本。当然,考虑到政府对于数据安全的重视,政府采购方面的本土优势更加明显。