游戏和大数据——第一章:为什么以及原因
大数据的概念一直都在炒作,每个供应商在他们的营销口号和重点标识上都会突出大数据。我已经在数据和消费者市场混迹20多年,当看到高德纳(Gartner)公司(一个美国咨询公司)大肆宣传对大数据的承诺后还是非常错愕的。这个系列文章的目的是希望围绕大数据并澄清这个问题,更重要的方面是大数据非常适用于数位游戏行业。 除了在Sonamine公司的一些工作经验,我的很多数据方面的知识都是在《大数据时代》(Big Data: a revolution that will transform how we live, work and think)这本书里学来的。这篇文章不会涉及大数据背后的技术,那是供应商的事情。 大数据是什么样子的? 相比提供一个定义来说,简单的描述特征会更有用。 • 海量——大数据最容易理解的一个特征。从所有设备所有应用程序跟踪各种类型事件的日志文件,游戏事件日志,游戏遥测,位置信息,所有结合起来创造大量的数据记录。 • 混乱且不完整——所有设备产生的数据可以很容易地被毁掉,出现错误,并非一切都是100%准确,但至少可能有50%是准确的。通过第三方服务的事件跟踪,由于网络波动和中断可能会丢失。用户也可能因为切换设备而导致孤立数据。 • 多元化的来源——结合网络访问数据和游戏遥测,包括来自政府和私人来源的人口数据,例如美国统计局和安客诚公司。 借力大数据的商业价值 在他们的书中,迈尔·舍恩伯格和Cukier指出,“在其核心,大数据是与预测相关的”(p.11)。常见的如:谷歌常用的预测哪些网页最相关的搜索、亚马逊预测哪些商品最有可能购买。对于大数据的预测包括以下几项: • 网站所有信息(海量) • 搜索历史记录(不完整的和混乱的) • 最近gmail消息(不相关的领域) • 所有在亚马逊上购买(海量) • 位置数据(不相关的领域) • 等等…… 在Sonamine工作的时候积攒的游戏开发经验,能够预测哪些免费用户准备转换或哪个用户愿意额外购买,这些经验为营销团队提供巨大的参考价值。用户预测营销活动导致更高的转化率,且在整个用户群中没有垃圾邮件。用来预测的数据包括以下几项: • 用户游戏自动测量记录(海量) • 用户网站浏览行为(混乱、不完整且量大) • 位置相关的属性(不相关的) • 设备属性(混乱、不完整) • 等等…… 学习的时候不要问为什么 当使用谷歌搜索或浏览亚马逊目录时,我们不在乎为什么某些网页更相关或为什么亚马逊推荐某些产品。但是书中讲述了一个有趣的故事… 亚马逊刚开始时通过增加产品评论来拉动销售,希望更好的评论带来更多的销售,他们有一个很大的编辑团队写这些评论。当时,格雷格•林登想出了另一种算法,产品严格与评论相比较,这些A/B test结果表明 “差的太远”。最后,该算法运行的非常好,致使亚马逊的销售收入提高了30%。 但是这个算法没有提供任何解释,为什么用户会购买某种产品。亚马逊是第一个意识到这点的公司,他们试图找出“为什么”用户会对某种产品感兴趣,“为什么”用户会感觉很愉快,这些都是比较琐碎的刺激销售方式。顺便说一句,他们撤消了编辑团队。如果亚马逊团队一直坚持解释为什么用户会购买特定产品的原因,那么,就不会出现格雷格•林登的这个算法,也不会提高当前的收入的30%。 一个消费者友好的例子是秩序。有一家名为Farecast的公司,搜集航班的历史价格,用它来预测价格是否会增长或者降低。如果机票价格预计将会下降,消费者可以等待一段时间。预测模型对于消费者的钱包来说是非常有用和有帮助的。航空公司改变价格的原因有很多,所有这些原因都是可用的,包括在预测模型里。所有预测模型用来判断历史价格。Farecast很快就被微软收购,整合到Bing搜索航班中。其他旅游网站,像Kayak等都拥有相似的价格预测模型。 Sonamine曾与许多游戏开发者预测哪些用户准备转换。在他们那里,我们遇到了“为什么”的问题。设计师和运营人员想知道为什么特定的用户是准备付费,而不是其他人。不幸的是,事实上没有人知道这个问题的答案,用户之间有很多不同,我们唯一知道的是,算法会比人类的直觉准确地多,我们所有的客户已经证明了这一点。一些客户从来没有能够克服他们不知其所以然的恐惧,从而错过了本可以从玩家中获得多达20%的收入的机会。 “了解现象,而不是原因,已经足够” 我并不是说我们不应该问为什么。而我说大数据,不需要知道“为什么”的答案,再采取行动。当然,决定采取行动的预测依赖于情况。这一决定的影响越重要,就更有理由采取行动。举个例子,多年前在纽约发生的沙井爆炸,似没有任何有逻辑的理由。行政人员可以先采取行动,换掉这些沙井,防止绝大多数的爆炸。知道原因后可能使我们能够防止未来的爆炸,更多的研究无疑是必要的。但与此同时寻找真正的答案,我们可以预防大部分的爆炸。 以同样的方式,当游戏开发人员发现大量的玩家在10级以后人数大量下降,他们可能马上试图以各种不同的方式改变这种现象,而不是去了解玩家“真正”放弃的原因。 在许多情况下, 不可能给我们现有的技术和约束来回答为什么的问题。我们从Sonamine中提出一些例子。当一个玩家准备放弃游戏的时候,不可能去调查他们所有的人,因为他们人数可能有成千上万。问卷调查这种方式用来招回用户是非常不明智的。 以相同的方式是不可能回答这个问题为什么用户准备第一次购买。有时,运营人员或者游戏设计者会争辩当玩家处于高等级或者准备“投资”游戏时,他们会付费。但问题是,很多玩家处于等级1的时候也会付费,而且很多高等级的玩家反而不会付费。这里,大数据就可以做出解释,甚至更加复杂的情况,因为更多的数据点使情况更加复杂,直到它变得使人们可以完全理解的时候。 换句话说,当真正的解释是不可能或不能的获得的时候,使用大数据的算法方法来指导分析。事实上,我们大多数人经常在不完整信息的基础上采取行动。唯一的区别是,我们更有信心和信任我们自己的决定,这通常是基于我们的“体验”和“专业”。人类经验是否比大数据算法更好或更坏这个问题悬而未决,但是有很多证据充分的个案证明算法好得多。我们已经在Sonamine的第一手资料中看到。 什么时候使用大数据进行预测(即使没有原因) 在游戏行业,许多决策是植根于创意和历史经验。这造成了采用大数据的一大挑战。的确,即使再大的数据分析也不会创造一个新的故事主线或者新的游戏类型。数据不会帮助我们创造,构思和想象的新事物。但是,当游戏一旦制作完成准备上线的时候,大数据可以帮助我们改善现状。所以,如果想要改善和提高游戏现状,大数据是可行的,可以让它帮助我们。大数据将适用于以下状况: • 当有大量需要理解的数据点,而且我们需要知道这种低频数据点为何要发生的时候。例如:(a)想要找出信用交易欺诈,这些会导致游戏虚拟财产流失。(b)想要找哪些账户被用于打金和线上非法交易。 • 昂有一个资源约束,利用大数据针对资源进行有效预测。例如:(a)赠送珍贵商品给某些准备流失的玩家。这里的珍贵商品为限量的资源则。(b)把那些没有垃圾邮件玩家作为目标玩家。这里的有限的资源是玩家的关注。 |
作者:eggg 2014-03-21
- ·外媒评选2016游戏界5大事件:PMGO席卷全球上榜 2016-12-15
- ·中手游CEO肖健:游戏推广借势IP无需复杂化 2016-12-15
- ·巨人副总裁吴萌:捷径都是弯路 弯路都是必经之路 2016-12-15
- ·易观:Q2移动游戏发行商格局 头部游戏排名均有变 2016-09-29
- ·新华社:电竞入高校小混混减少了 会引来报考热潮? 2016-09-13