好久没有更新原创,关于文章内容最近很多粉丝朋友给了我很多好建议。大家觉得有些文章写的看不懂,可读性不强。我其实反思了很久,也摸不准大家想读到什么才能打动内心。今天分享几个我真实的故事给大家。
平安科技打开的一扇窗
2013年的时候,我加入了平安科技。一般稍正规的公司,新员工都会有一个统一的入职培训。那一期培训班我们技术一共110多人。其中有70多人是从阿里巴巴跳槽过来的。我们小组当时就有2个。一个花名叫“白杨”,我现在还记得。这70多人中呢,有40人是做大数据挖掘的,还有20个人是来自一个部门。当时他们跟我年龄相仿,但进来就是B类干部,title都是总监(副总监)的。我大学的时候是记者团团长,喜好跟新朋友打交道。脱产培训的三天中,我听课+不断跟大伙聊天。得到了两个信息:一、马明哲桌上会有一个苹果手机、苹果平板,一个Android手机和平板,每天都会把玩,因为移动互联网会是下一个时代;二、一锅端的部门是大数据挖掘组,他们主要职责是从0-1搭建平安的大数据平台。他们大部分人都是杭州的,工作日在上海,周末回杭州。他们的工资基本都double。
培训完我就开始琢磨大数据是一件什么事情。那个时候职场还没那么卷,有上班和下班的概念。但当时流行的一个思想就是:大学毕业五年后,人跟人的差距主要是下班后的8个小时造成的。有的人在这个八小时持续专注干一件事情,而有的人在吃喝玩乐中散尽年华。五年后,人与人之间的差距会比人跟狗的还大。
谷歌的大数据三篇论文
当时我一下班就看大数据的内容。最开始是顶着CSDN的网站看。不断搜,不断看。当时微信还没怎么流行,技术自媒体的平台就是CSDN。很多人开CSDN博客。我搞明白大数据是起源于谷歌。它会颠覆传统数据库,那些出门就要计费的DB2(或Oracle)的DBA,从此要成为历史了。
大数据最核心的就是谷歌的三篇论文:GFS(大数据存储系统),Mapreduce(大数据计算引擎),还有一个是BigTable。我当时把这三篇论文都打印了出来。想一口气全部读懂。发现学术论文的英语还是有门槛的。字词生硬到完全看不下去。我花了大概一个月的时间,把三篇论文的所有不懂得词都用有道词典查好,写好解释在纸上。却发现还是读不懂。因为其实一些学术名词,有道词典翻译的很差劲的。这段时间还是很有挫败感的。
没办法,还是慢慢来吧。就搜关于这方面的博客。发现有些博客的翻译做的很烂的。生硬的翻译出来的句子,读是读不通的,理解也是理解不了了。好不容易,发现了董西成(这人现在好像在快手负责整个大数据平台)的博客。这些架构的知识在他博客上我基本都搞明白了。这也是我坚持写技术分享文章的原因:我希望可以用很简单直接的文字把学术论文的内核顺畅的展现的读者。
(未完待续)
文章昨天发出来发现阅读量太低了。还掉粉。为了不影响公众号基本面就删了。后来有粉丝还来追要这篇文章。重新打出来了。感谢支持。希望大家多转发分享。
