mark-满满干货的大数据技术个人博客集合

正因为多个学科的交叉和融合,给数据领域的从业者和学习者在使用和学习上带来的巨大的困难。

为了从互联网获取更多相关经验,收集整理了相关领域有一定价值的博客和站点。

数据挖掘

1、王路情–数据科学家

涵盖的内容有,R语言,数据挖掘,机器学习等,大量的翻译和原创文章。


网址:http://www.wangluqing.com/

2、码农场

大量关于NLP(自然语言处理)和机器学习的文章,作者开源了中文分词器HanNLP。


网址:http://www.hankcs.com/

3、Licstar的博客

如果要了解在中文上的数据挖掘的相关问题,可以阅读此博客。


网址:http://licstar.net/

4、我爱自然语言处理

我爱自然语言处理的中文站点。同英文站点一样,文章优质,并且大多都是基于实践的内容。


网址:http://www.52nlp.cn/

5、我爱机器学习

该站点同”52nlp”一样,不同的只是更加专注机器学习。


网址:https://www.52ml.net/

6、Spark MLlib 机器学习

来自CSDN的一位博主,多是关于Spark Milb的文章。博主著有《Spark MLlib机器学习》一书,博客的文章同样质量很高。


网址:http://blog.csdn.net/sunbow0/article/category/2779609

7、alexminnaar

来自国外的一个博客,丰富的机器学习实践经验,包括:神经网络,深度学习,线性回归等。


网址:http://alexminnaar.com/

大数据

1、dongxicheng.org

作者董西成,著有《Hadoop技 术内幕:深入解析MapReduce架构设计与实现原理》和《Hadoop技术内幕:深入解析YARN架构设计与实现原理》。


网址:http://dongxicheng.org/

2、过往记忆

国内比较出名的大数据个人博客,围绕Hadoop生态圈和Spark的大量文章可供阅读。


网址:http://www.iteblog.com/

3、LXW的大数据田地

比较偏重于Hadoop生态圈,文章的质量很高,能够解决一些实际生产中遇到的问题。


网址:http://lxw1234.com/

4、极豆技术博客

个人博客,很多大数据和分布式的优质文章。


网址:http://www.geedoo.info/

5、datalab

比较综合的一个站点,很多大数据领域相关的文章,但偏重于资讯。


 

6、虾皮工作室

来自博客园虾皮工作室,文章围绕Hadoop,适合入门学习。


网址:http://www.xiapistudio.com/

7、粉丝日志

早期学习Hadoop时,阅读了许多粉丝日志的文章,文章的质量很高,大都是解决一些实际问题。


网址:http://www.hankcs.com/

8、数据分析网

数据分析网,国内领先的大数据门户,旨在帮助大数据从业人士、爱好者提供大数据新闻资讯、前沿技术、业界观点的信息平台。

网址:http://www.afenxi.com/

结语

数据科学领域的相关技术,近两年发展迅猛。有时仅凭个人的经验很难解决一些问题。互联网上遍布各类文章和资源,在学习时应该集万家之长,注重实践,并善于总结。同上面各博客的博主一样为知识的开源做一份贡献,让知识广为传播

请使用浏览器的分享功能分享到微信等