谷歌本月收购Kaggle后,还是想不通大数据竞赛平台能火?竞赛平台这种商业模式似乎背离了“高频”、“痛点”、“刚需”三大优秀互联网产品的特色?不过竞赛平台做的可不仅仅是竞赛。
硅谷的喧嚣,总能带来大洋彼岸的悸动。
本月,谷歌宣布收购大数据竞赛平台企业Kaggle之后,中国的Kaggle们估值暴涨。尽管它们成立不过一两年,举办的竞赛也就二三十场,团队规模基本在30人以下,融资还处于从0到1的起步阶段,但却因为谷歌之举而备受关注。
大数据竞赛平台何以得到资本的关注?就优秀互联网产品的“高频”、“痛点”、“刚需”三大特点而言,竞赛平台貌似都不吻合,不少人也会质疑这种商业模式为什么也会火?
竞赛平台 | DataFountain | DataCastle | 科赛网 | 天池平台 |
上线时间 | 1.5年 | 1.5年 | 3年 | 2年 |
举办竞赛 | 24场 | 19场 | 16场 | 31场 |
公开企业用户 | 中国计算机学会、百度、腾讯、阿里、京东、搜狗、国家电网、中国移动、中国联通 | 成都市人民政府、融360、电子科技大学、优易数据、卧龙大数据、现金巴士、BBD、国家气象中心、贵阳市公安交通管理局、寻道科技 | IBM、EMC、华为、中国联通、携程、拍拍贷、华院数据、云从科技 | 除阿里巴巴外不详 |
人数 | 15 | 30 | 8 | 不详 |
1
Kaggle的传奇没那么简单
其实,Kaggle已经经历7年之痒,最初谁也没有想到它能得到资本的青睐。
随着大数据和人工智能的火热,大数据技术人员大都在这个竞赛平台上“比过武”“交过手”,再加上社区机制和评级体系,Kaggle在C端足足吸引了超过50万的数据开发者;另一方面,C端和B端也会相辅相成,大批顶尖企业为各类商业算法问题在Kaggle上发起竞赛,寻求解决方案,自然会吸引更多的优秀人员竞赛。
这样的企业也就自然成了谷歌必取的囊中物,但中国Kaggle们也能如此幸运吗?细究起来可没那么简单,比如:
中国数据人才无论从质量到数量目前都尚不能堪比美国;
为什么偏偏是数据竞赛平台,而不是其他同样火爆的技术,比如云计算、移动互联网;
竞赛平台和众包平台本质上都是一种众包,但区别在哪里?
大赛之外建立的社区,和垂直类技术社区甚至媒体又有什么区别?
如果针对数据人才做进一步培训招聘,又和在线培训机构已经招聘网站有什么区别?
……
如果不能从逻辑上清晰想通以上问题,在这个赢者通吃的市场,任何相邻领域的巨头都可能抢食kaggle刚刚创下的果实;如果能够想透以上问题,才会做出差异化产品,形成真正的行业门槛。
2
Kaggle模式中国也会水土不服?
茱比莉联系到了DataFountain联合创始人&COO陈娟。这家被业界认为最像Kaggle的中国创业企业,核心业务貌似Kaggle,都分为数据竞赛服务和大数据社区两个部分,但她却表示商业模式大为不同,或者说Kaggle只是其中一个子集。
一般,数据竞赛周期为一到三个月,而大数据社区的建立则解决了竞赛平台的低频问题。如何在社区中留住大数据技术人员则非常讲究:
是如垂直类技术媒体一样推送内容,还是如技术社区一样看重交流互动;
是做技术培训平台还是做猎头招聘生意;
是众包模式还是做评分体系……
到底做成什么样,得回到“痛点”和“刚需”这两个关键词。
虽然竞赛不是刚需,但中国数据人才的缺口却是整个行业的痛点,数据人才的培养也就成乐整个行业的刚需。
看看美国Indeed.com招聘网站刚刚发布的“2017最佳工作岗位”排行榜,软件工程师按照薪水排名的TOP10工作岗位中,与大数据、人工智能相关的职位抢占了前三位。不言而喻,所有软件技术人才会因为这样的市场需求而对趋之若鹜。
排名 | 职位 | 需求数/百万职位 | 平均薪资 | 2013-2016职位需求增长率 |
1 | 机器学习 | 58 | $134306 | 36% |
2 | 数据科学家 | 360 | $129938 | 108% |
3 | 计算机视觉工程师 | 20 | $127849 | 34% |
4 | 开发运维工程师 | 731 | $123165 | 106% |
5 | 云工程师 | 217 | $118878 | 67% |
6 | 高级审计经理 | 53 | $118692 | 52% |
7 | 渗透测试工程师 | 317 | $115557 | 52% |
8 | Oracle人力资本管理 | 44 | $113107 | 41% |
9 | 全栈开发人员 | 641 | $110770 | 122% |
10 | Salesforce开发人员 | 230 | $108089 | 83% |
而中国大数据软件人才起步晚于美国,如果说Kaggle上的人才叫做数据科学家,那么中国竞赛平台的入门门槛会从数据爱好者开始。他们在参赛之前恐怕更需要的是培训,并通过培训实现分级。针对大数据人员的不同,也造就了中美竞赛平台基因的不同,比如Kaggle就只需评分系统而无需培训系统。
只有了解中国大数据人才的需求才能做出他们需要的产品,这也决定了大数据竞赛平台社区内容的取舍。中国大数据人才在社区上打怪升级也好,参与竞赛也罢,归根结底为了两大刚需:考证和排名。
因此,DataFountain将主要精力放在培训工具和排名体系的构建上,而将培训内容作为竞赛平台的开放组成去吸引优质培训机构构成生态圈层,最吸引人的竞赛排名也只是评分体系中的一个指标,结合中国大数据人才现状,将工具、培训,评级,竞赛构成一体化社区内容,从而产生更强的粘性。
3
只有大数据才能让竞赛平台受到追捧?
再回到竞赛本身。
为什么只有大数据竞赛平台能够交付这样的商业模式?DataFountain道出了它的本质:
传统IT行业中,四五个人一个团队,开发一个APP或者是一个创新的商业模式,很快就会被大公司模仿。但在数据挖掘和算法领域,往往一个小团队甚至是一个人的研究成果,就可会比几百人团队的智慧结晶更为高效,这就是大数据的行业性质。
这就不难理解,从来没有一个细分的IT行业能让那么多大学教授“下海”来到企业当中,从美女人工智能专家李飞飞,到最近因为离职百度而刷爆朋友圈的吴恩达;谷歌、微软、IBM、百度都在全球抢夺最顶尖的数据科学家、人工智能专家。
这也使得大数据竞赛平台就如众包平台一样受到企业欢迎。因为对于2B端的企业而言,大数据竞赛一方面可以解决具体的实际问题,另一方面可以推广企业的自有品牌,还能够招聘到顶尖的大数据人才。
不过DataFountain做的又不是大数据领域的“猪八戒”(最火的众包平台)。
陈娟认为,传统的众包模式不是竞赛性质的平台,而是偏服务性的奖赏平台。尽管企业发出的任务都适合小团队运作,但众包平台偏重低价者胜;而竞赛平台中,企业愿意花重金悬赏最优质的项目。这是因为,与大数据竞赛平台的内容不同,众包项目多是体系成熟的大众化服务项目,比如设计logo和网页,重要的是要建立一套服务评价体系,使得小团队可以在平台上可以展现自身服务水平,从这点上看又有点像淘宝平台。
那么,到底2C端还是2B端才是竞赛平台的价值核心?
这和“鸡生蛋还是蛋生鸡”的问题并不相同。虽然两者联动明显,但只有优秀竞赛才能吸引优秀参赛者,至少竞赛平台早期的门槛应该是2B端有影响力的顶级客户合作。这样是为什么DataFountain一直强调它的优势在于早期正是抓住了行业制高点——CCF中国计算机学会,这里既有学术界泰斗,又有企业界精英,这为它后来签下BAT、京东、国家电网、中国移动、中国联通等大型企业树立了品牌口碑。
作为一个中国新生又被美国验证的全新商业模式,大数据竞赛平台才刚刚起步,还有很多路要走,很多坑要过。中国Kaggle们的命运如何,现在判断还为时尚早。
翔snowman 原创出品
科技茱比莉
有视角的科技观察 有态度的科技评论