Spark SQL 性能调优实战指南
深入探讨 Spark SQL 的性能优化技巧,包括分区策略、缓存机制、广播变量等核心优化手段...
所有技术文章的归档
深入探讨 Spark SQL 的性能优化技巧,包括分区策略、缓存机制、广播变量等核心优化手段...
详解 Flink 的状态后端选择、状态 TTL 配置以及 Checkpoint 机制的最佳实践...
如何设计高效的分区策略,避免小文件问题,提升查询性能的实战经验分享...
总结 Kafka 生产环境常见的坑点和解决方案,包括副本同步、消费者组重平衡等...
从 ODS 到 ADS,详解数据仓库各层的设计原则、命名规范和实际应用案例...
小文件问题的危害分析,以及合并、压缩、Har 文件等多种治理方案对比...