2017DTC精彩重现Oracle和MySQL DBA的进阶之路
Posted 数据和云
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2017DTC精彩重现Oracle和MySQL DBA的进阶之路相关的知识,希望对你有一定的参考价值。
2017第七届数据技术嘉年华于11月18日落下了帷幕。关于DBA是否会失业的问题近期深受关注,大会上杨建荣老师根据自己的实践从Oracle和mysql的维度,探讨了DBA成长中的一些疑问和想法,也对DBA未来规划给了一些指导建议。感谢杨建荣老师授权,我们再次分享出来,希望对各位有所指导借鉴。
这个是参考了朱赟[yūn]的一段话,我觉得已经很透彻形象了,毕竟在短短的几十分钟里,你只能得到一些思想上的建议和思路,落到实处还是得靠自己。而参考和借鉴的过程也是自己修行的过程。第二句我关于坚持,有的同学说坚持是习惯,有的说是毅力,本质上来说,还是坚持的态度,是坚持做一件事情,还是坚持把一件事情做好,两者听起来相似,实则有很大的差别。
我分了几个层面来做了一些解读。在本文中会抽取重点列出一些来。
其实正如我开篇所说,目前国内的使用有两个比较明显的误区,一个是把Oracle当做MySQL用,主要表现就是把Oracle当做免费版来用;另外一个是把MySQL当做Oracle来用,一些复杂的查询,表关联放在MySQL里还想达到Oracle的性能标准,这个本身也是不合适的。找到自己最好的业务场景非常关键,不是为了上一个技术而用一个技术,结合不好,后期出了问题就很尴尬,本质来说不是某个技术方案不好,而是你没用好。
对于Oracle DBA来说,学习MySQL的话学习周期会相对短一些,入门也比较快,但是如果要深入学习MySQL,还是很难的,因为有很多方面都需要深入理解,深入的层次是在源码级,可以做定制,而对于MySQL DBA来说火,学习Oracle的周期会比较长,因为很多方面是MySQL不会关注,或者没有的功能,如果要深入学习Oracle,还是得有很长时间的积累,Oracle的体系太大,备份恢复,性能优化,数据迁移能够抓住几个面搞到精通就很不容易了,深度进阶的层级基本是到了调试,内核的程度。这方面国外其实做得很不错,氛围非常浓厚。
对于Oracle和MySQL,还是需要了解下他们目前的位置,最新的DB-Engines的报告()显示前三甲稳稳的是关系型数据库,而MySQL是作为开源数据库的第一阵营出现的,当然这个排行榜不要过度解读,本身只是一个流行度的标识,就是你在搜索引擎中搜索的关键字,反映的一个热度而已,绝非市场占有率。
Oracle目前最新的版本是开放的12.2.0.1.0,而12.2.0.2.0即是下一个版本18c.当前的版本中的变化更多是在CDB和IMO方面。尤其是在CDB部分,自己逼着自己琢磨了一段时间,还沉淀了一些经验和大家做了分享,而18c的亮点就在于自治了,本质上自治和自动化还是有一定的区别,可以简单理解自治是自动化的延伸。而MySQL的改进一个重大标志是在去年年底的MGR GA,本身从优化器层面和复制方面,MySQL是卯足了劲,现在MySQL 8.0的更新速度极快,到目前最新的是8.0.3,5.7版本是5.7.20
想起来容易但是落实起来难,因为有很多的因素需要考虑,而不是简单的找一个认为好的。比如MySQL的版本选型,到底用哪一个版本,5.5太旧,5.6相比5.7完善,5.7相对来说更加成熟,8.0又太新,那么问题来了,5.7的版本该选择5.7的具体哪个版本呢,这里就有很多的门道了,最后我们选择的是5.7.16作为基线版本,而分支选择的是也有需要的考虑因素,细节也很多,原则就是从把正面,反面的考虑点都列出来,综合评估。
对于Oracle的版本规划整体而言要清晰很多,目前的主流业务还是11gR2为主,12cR1和12cR2有一个较长的时间间隔,很多DBA的印象中R2是稳定版本已根深蒂固,要改变这种思维估计在18c之后才会有大的改观,毫无疑问,软件选型目前都基本是企业版的。
关于高可用方案,其实是一个永恒的热点话题,就是因为这是一把双刃剑,如果保证数据不丢失,如果保证业务的可持续性,要做出一个100%完美的方案是一个理想状态,但是至少可以朝着这个方向努力。
Oracle的数据架构是集中,本质上是集成共享,统一访问,能够达到数据强一致性,而MySQL的数据架构是复制,本质上是多个数据的副本,在数据的一致性方面还是有很多事情要做,或者说完善。MySQL的架构方式明显会限制它的集群规模,比如MGR是硬性限制是9个节点,而Oracle扩展节点来说还是相对容易的,因为本质数据是同一份,共享存储。
阿里的IOE架构陪伴他们走过了业务发展的黄金时期,也是在达到资源的使用瓶颈之后,他们全面拥抱了分布式方案。从早期使用MySQL到后期再次引入MySQL,出发点已然不同。MySQL的高可用方案我列举的是MHA,其实还有很多其他的方案,但是MHA目前是最流行的,经过的考验也最多。
要搞明白MHA需要做很多的细致工作,我分析了MHA的代码,发现里面的调用关系还是蛮复杂的,总是看起来不得要领,索性理了一份代码关系图,通过这种方式就能很快抓住重点了。中间的橙色框就是常用的一些命令和库文件了。
当然还有一个很经典的Oracle迁移方案,我们后续有时间再细聊,里面的细节问题比较多。
关于进阶的建议,本身会有很多的选择。比如大数据,开发,架构等方向,或者做一个更专业,技能精神的专家或者一个很全面的行业大咖。
进阶的思路总是一些建议,落实的时候会发现有一些落差,就如同下图所示的这样。
这个图怎么理解呢,其实是一个知乎有名的游戏,即100个人每个人手里有1块钱,大家随机交换,最后每个人手里剩下多少钱,经过真实的模拟,有一套理论。如果通过SQL来模拟,也是分分钟搞定,可以看到,绝大多数人都是原地踏步,但是只有极少数的人能够走出这个圈子来。
所以大家要多多加油。走出思维的桎梏。
职位名称:ETL开发
工作地点:南京
要 求: 从事岗位为ETL开发,具备一定的hive开发能力或存储过程开发经验。年限不限,薪资可谈。
联系方式:18791095386
以上是关于2017DTC精彩重现Oracle和MySQL DBA的进阶之路的主要内容,如果未能解决你的问题,请参考以下文章
2017年浙江中医药大学大学生程序设计竞赛(重现赛)D - CC的神奇背包
r R代码重现了Ed Hawkins在全球温度变化方面的精彩可视化,网址为http://www.climate-lab-book.ac.uk/2016/spirall
我在安装sql server 2005出现COM+警告后在网上找到:如下方法,照做后结果DTC服务没了,请问怎样恢复DTC