Hadoop不同文件格式的原理
从Hadoop框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)
开始使用Kafka和Flume(导入数据到HDFS)
MapReduce入门
与Impala的区别
文档
与Hive的区别
性能调优
Impala在Hulu中的优化和改进
使用PySpark和MLlib解决二分类机器学习问题
Kafka入门
对比Kafka和RabbitMQ
一致性哈希算法
Last updated 3 years ago