明哥的IT随笔

明哥的IT随笔:CSDN认证博客专家

博客地址:https://blog.csdn.net/MichaelLi916

最新文章

为什么不能使用 datax 直接读写 hive acid 事务表?

线上 hive on spark 作业执行超时问题排查案例分享

Gartner 网络研讨会 “九问数字化转型” 会后感

大数据平台 CDP 中如何配置 hive 作业的 YARN 队列以确保SLA?

大数据生态安全框架的实现原理与最佳实践(下篇)

开启 Kerberos 安全的大数据环境中,Yarn Container 启动失败导致作业失败

JAVA 那些事 - 聊聊那些易混淆的概念:JVM/JRE/JDK,openJDK/oracleJDK,JAVA SE/JAVA EE/Jakarta EE

线上数据问题排查案例分享-因为 HMS 和底层 orc 文件中某字段的数据精度不一致造成的数据丢失问题

公共大数据集群中如何配置 YARN 的公平调度器和容量调度器

如何杜绝 spark history server ui 的未授权访问?

开启 Kerberos 安全的大数据环境中,Yarn Container 启动失败导致作业失败

一起架构-某实时分析项目云原生 serverless 架构的设计思路和poc代码实现

为什么不能使用 datax 直接读写 hive acid 事务表?

SPARK 应用如何快读应对 LOG4J 系列安全漏洞

如何杜绝 spark history server ui 的未授权访问?

HDFS3.X 系列的 EC 纠删码策略有个安全隐患 HDFS-16420,极端情况下会造成数据丢失

深入剖析 HIVE 的锁和事务机制

聊聊 JDBC 的 executeBatch || 对比下不同数据库对 JDBC batch 的实现细节

彻底理解大数据的列式存储

CDH/HDP/CDP等大数据平台中如何快速应对LOG4J的JNDI系列漏洞

彻底理解数据库的各种超时参数

彻底理解 HDFS 的安全模式

更改 HIVE 表字段数据类型有哪些注意事项?

彻底理解 HDFS 的安全模式

聊聊 kerberos 的 kinit 命令和 ccache 机制

HIVE3 深度剖析 (上篇)

彻底理解数据库的各种超时参数

大数据生态安全框架的实现原理与最佳实践(上篇)

CDH/CDP中开启kerberos后如何访问HDFS/YARN/HIVESERVER2 等服务的webui

一起架构-某实时分析项目云原生 serverless 架构的设计思路和poc代码实现

如何使用 DATAX 以 UPSERT 语义更新下游 ORACLE 数据库中的数据?

线上数据问题排查案例分享-因为 HMS 和底层 orc 文件中某字段的数据精度不一致造成的数据丢失问题

如何更改 datax 以支持hive 的 DECIMAL 数据类型?

CDH/CDP中开启kerberos后如何访问HDFS/YARN/HIVESERVER2 等服务的webui

大数据平台 CDP 中如何配置 hive 作业的 YARN 队列以确保SLA?

深入剖析 HIVE 的锁和事务机制

Gartner 网络研讨会 “九问数字化转型” 会后感

对比下 datax 的 OceanBase/MYSQL 不同数据同步方案的效率差异 || 聊聊参数 rewriteBatchedStatements

如何更改 datax 以支持hive 的 DECIMAL 数据类型?

公共大数据集群中如何配置 YARN 的公平调度器和容量调度器

HIVE3 深度剖析 (下篇)

大数据生态安全框架的实现原理与最佳实践(下篇)

数据平台发展史-从数据仓库数据湖到数据湖仓

大数据生态安全框架的实现原理与最佳实践(上篇)

聊聊 kerberos 的 kinit 命令和 ccache 机制

大数据集群节点磁盘负载不均衡怎么办?

记录一次 Hbase 线上问题的分析和解决,并分析总结下背后的知识点 - KeyValue size too large...

分享一个 hive on spark 模式下使用 HikariCP 数据库连接池造成的资源泄露问题

HIVE3 深度剖析 (上篇)

盘点下近几年退役的顶级 Apache 大数据项目 - 继 Sentry,Sqoop 之后,Ambari 正式退役

彻底理解大数据的列式存储

记录一次 Hbase 线上问题的分析和解决,并分析总结下背后的知识点 - KeyValue size too large...

Oracle 19c Centos7 静默安装记录整理

一篇文章掌握 FTP 和本地文件系统的桥梁 - CurlFtpFS || FUSE 介绍

线上会议精彩回顾 - Cloudera Sessions China 2021

从大数据平台CDP的架构看大数据的发展趋势

一篇文章彻底掌握 FTP 服务器的 ACTIVE 与 PASSIVE 工作模式

线上 hive on spark 作业执行超时问题排查案例分享

更改 HIVE 表字段数据类型有哪些注意事项?

分享一个 HIVE SQL 性能优化点-使用公共表表达式 CTE 替换临时表

数据平台发展史-从数据仓库数据湖到数据湖仓