作为人类我们不介意保持忙碌。事实上,我们大多数人都习惯于“先做某事”,然后再提问。换句话说,我们的忙碌往往是以一个深思熟虑的计划为代价来处理从平凡到复杂的项目。在大数据的世界里,这可能是一个可怕的策略,特别是考虑到投资通常以数十万美元起步,并且很容易超过 2-3 百万美元才能进行体面的部署。 在刘易斯·卡罗尔的《爱丽丝梦游仙境》中,狮鹫告诉爱丽丝;“不,不!首先是冒险,解释会花费如此可怕的时间。” 这不是人性吗,想要开始某事,然后担心事后如何/或应该如何? 更多阅读 图像 可能阻碍大数据投资回报率的 4 大业务风险 要避免的 3 个大数据坑洞 云相同性是否会危及竞争优势? 浪费口气:单靠数据无法令人信服 更少的教条等于更好的决策 上周我在旧金山参加了 Spark 峰会。按照惯例,我与客户讨论了他们的大数据计划。一个特定的人(将保持匿名)向我讲述了他的 Spark 实施(现在正在生产中)的故事,以及他如何制定更广泛的推广计划。

当我问他 Spark 如

何融入他更广泛的生态系统时,他不好意思地笑着说他真的不知道。事实上,当我进一步询问这位先生时,他承认他的组织连大数据生态系统的高级架构图都没有。在我们俩看来,他正在制定他的大数据计划。 在本周的另一次谈话中,我与一位为全球精英设计机场、高耸的建筑和大型住宅的人进 Whatsapp 手机号码列表 行了交谈。他提到让他感到震惊的是,客户会首先对地毯的颜色等细节大惊小怪,而不是对整个数十亿美元开发项目的设计/建筑和功能进行更广泛的讨论。 事实上,在围绕大数据的客户对话中,很少有人质疑 Hadoop 及其生态系统是否是一项正确的投资。不断出现的挑战围绕着“从哪里开始”,更重要的是“为什么”。 要回答大数据中的“为什么”,您需要了解您的用例。您需要了解您的业务案例。一个引人注目的大数据战略应该——至少——解释 Hadoop 将如何被用来推动可衡量的商业价值,有一个由业务和技术利益相关者签署的优先顺序路线图,然后包括一个架构定义(最好在一张餐巾纸)支持用例来推动业务向前发展。

Whatsapp 手机号码列表

然在大数据中疯狂

地“做某事”时,IT 和业务经理似乎都在不断地采用最新技术(今天是 Spark),因此成为 Gartner 有据可查的炒作周期的不可避免的案例研究。 请不要误解本专栏的意图。我对 Apache Spark 没有任何反对意见,我相信它对于现在和未来都是一项很棒的技术。Hadoop 生态系统中的所有引擎和 YARN 应 ASB目录 用程序也是如此。但是,没有用户接受、采用和商业价值计划的技术也只是一种技术。 想做大数据对吗?您将需要对您的分析优先级、体系结构、技术、技能集和支持模型得出合理的结论。对您的特定业务有意义的事情,而不是您在 X、Y 和 Z 公司正在做的会议上挑选的东西。 由于不了解 Hadoop 生态系统如何完全适合您,借用爱丽丝梦游仙境的柴郡猫的另一个俏皮话;“如果你不知道你要去哪里,任何道路都会带你去那里。