前几天一个球友在星球提出这样一个问题,大概意思如下:我们客户比较追新,老提到上数据湖之类的,为此我专门做了一番调研,网上对数据湖的说法众说纷纭,也没有一个统一的技术标准,我该怎么办?很苦恼...
其实关于数据湖这个话题,我之前在一期视频里面系统性讲过,或者说吐槽过,如果你有兴趣可以去翻翻我的视频号或者B站的视频,回顾一下。
我一直觉得吧,像这种问题,压根就不是什么技术问题,你苦恼的方向不对,一般遇到这种情况,你只需要一个能说会道的售前,善用当下技术圈里各种听上去高大上的名词、黑话,再配合各种销售技巧,保证把你这个客户迷的神魂颠倒。

根据这个解释,你能看出什么新鲜的技术或者新潮的思想吗?我反正看不出来,我觉得跟我们平时说的大数据平台没什么区别,至少技术上没有,你要非找出些不同点出来,那就是在业务要求上强调了数据源的多样性,以及数据处理上的复杂性。
请问这几点,哪个大数据平台不能做,我一个HDFS什么样格式的数据源不能装?我用spark什么样的数据不能处理,什么样的算法不能实现?
所以这里的核心根本不是什么技术问题,在于你如何在客户面前包装你的项目,以及如何展现你的团队实力、如何写出漂亮的文档、整出眼花缭乱的PPT,这些才是让客户满意的关键。
当年(2016年)我作为HortonWorks中国区的技术顾问(售前)时,遇到过很多类似这样的客户,这种客户的一大特点就是:你说他懂技术吧,当你跟他讲技术思路时,他听不懂或者不关心。
你说他不懂吧,他又能偶尔给你整几个跟技术相关的名词出来,而且会拿一些不知道从哪拼凑的奇怪技术理论,来跟你battle,你又不好意思当面揭穿他,让整个聊天过程一度非常尴尬。一般遇到这种场景,大部分人的做法都是顺着他,即便观点是错的,我也会点点头,谁叫他是客户呢,因为客户就是上帝嘛,他说的都对。但是回到技术实现上来,这个肯定不能让客户给牵着走,否则吃亏的一定是自己,该怎么设计怎么设计,一些不太重要的地方咱可以适当将就,但是一些影响大局观的部分一定要坚持。
比如当年我对接的一个客户,点名系统要用kafka,因为那段时间kafka比较火热,他就觉得这个技术肯定特别神奇,而我们当时系统也确实需要用到消息中间件,于是就随了他的意,你说用就用吧。再说回客户要上湖这件事情,这类客户一般的一大特点就是喜欢看那些跟行业相关的、标题抢眼、概念新潮的文章或者观点,然后被里面各种高大上的架构思想、理念,以及因此带来的企业成效所洗脑。
既然都是包装,新瓶装旧酒,那你也完全可以根据客户要求,把你当前的系统包装成一个数据湖,你想要什么都给你。
你要湖,给你上,你喜欢哪个技术,我就给你装,然后把架构图画的尽可能复杂,数据计算流程尽可能的绕,各种市面上新的技术、新组件都给写上。然后再在PPT上添加一些看似高大上,但其实没什么用的业务功能,或者直接把重复的功能给起不同名字,显得系统功能强大。再就是把各种流行的AI算法也写进文档里,然后对着PPT里面某个图说:看!这个就是我们用的某某AI算法实现的,老牛逼了。对了,还有最后一点,也是最重要的一点,系统的界面一定要做的炫酷,哪怕数据量很小,该展示的功能一个都不能落下,哪怕用造的假数据也行啊,因为这个往往是客户最看重的核心价值。至于你的技术落地实现,大可不必担心,你真正的技术架构该怎么设计还怎么设计,代码该怎么写还怎么写,谁规定真正做的东西要跟文档要求的一模一样了?客户又不会费力去检查,反正也不懂。
其实面对这种问题,大可不必苦恼,只要找对套路,非常好解决。