即日起在codingBlog上分享您的技术经验即可获得积分,积分可兑换现金哦。

中国数据库排行榜——2017年1月

微信 InsideMySQL 13℃ 0评论


姜承尧

IT界最会讲故事的男同学



DB-Engines想必大家都不陌生,该网站统计全球数据库的排行榜。一直困扰于我的是中国数据库的排行榜又是怎样的?为此,花时间用Python写了一爬虫,抓取国内数据库的一些统计数据,制作中国数据库排行榜


中国数据库排行榜的计算方式基本和DB-Engine类似,然而根据国内做了一些调整,统计的数据维度有:


  • 当月相关数据库网页数量:国内搜索引擎当月抓取的网页数量

  • 当月微信公众账号相关数据库发文量:国内大多通过微信公众账号取代传统的博客来进行技术传播

  • 当月微博相关数据库讨论数量:微博能反应国内对于相关数据库的讨论热度

  • 51job职位信息数据量:反应当前该数据库的就业情况,51job是老牌的猎头服务公司

  • 拉勾网职位信息数量:反应当前该数据库的就业情况,拉钩网是新兴的猎头服务公司


可以看出,所有数据都是第三方产生,不会因个人的喜恶而产生大幅的变化,因此该榜单的权威性不容忽视

先看中国数据库排行榜Top 20:


中国排名第一的数据库是MySQL,第二位是Oracle,但两者的分数还算比较接近。排名第三的是Microsoft SQL Server,与DB-Engines一样,但是在得分上落后前两者非常多,这与国内的形式来看也基本一致。排第4的是现大热的文档数据库MongoDB,也符合预期。


但是仔细看会发现,Top 10中总共有3个MySQL数据库版本,分别是MySQL(第1)、Percona(第7)、AliSQL(第8)。如果看Top 20,则总共有5个MySQL数据库版本,除了上述还有MariaDB(第12),InnoSQL(第18)。可见MySQL在国内的流行程度(InnoSQL竟然还能排18也是令人欣喜)。


Redis和Memcached也入选了Top 20,但Redis得分比Memcached高不少,这也反应当下这两类缓存的流行度。


比较出乎意料的是,Spark SQL排进了前十,超越好战友HBase(第14)和Hive(第17位)。看来国内大多数人和我的观点一致,看好Spark SQL,未来有希望成为大数据平台的一哥。


国产的数据库TiDB和巨杉也进入了Top 20,分别排名第11和15位。TiDB非常不错,希望能早日进入Top 10。身边也有好多朋友问我对TiDB的看法,的确最近比较火。


文艺男屌丝的心头好PG(PostgreSQL)排名第13,想比全球DB-Engines的榜单下降不少,这就是国内PG尴尬的现状。而PG的好基友GP(GreenPlum)未能入选Top 20,略感失望,排名25。


另外,因为针对国内,因此还单独只做了国产数据库排行榜,这份榜单如下:



另我比较意外的是OCeanbase的排名比较低,微信公众账号甚至当月没有一篇相关的技术文章。这是内部被淘汰的节奏嘛?双11已过,咋还不见出来晒太阳,吹牛逼呢?同样命运的还有之前浪潮的K-DB。


想要查看完整的榜单吗?请点击下方的阅读原文。本文由作者北乔峰授权于公众账号InsideMySQL发布,不得已任何形式转载,违者必究。

长期坚持原创真的很不容易,多次想放弃。坚持是一种信仰,专注是一种态度!点赞是对作者最好的褒奖哟


转载请注明:CodingBlog » 中国数据库排行榜——2017年1月

喜欢 (0)or分享 (0)
发表我的评论
取消评论

*

表情
(17)个小伙伴在吐槽
  1. 沙发坐稳、原来这就是姜老大说的大招!OMG
    Xbao2017-02-05 15:22 回复
  2. 神通怎么那么低,是因为文档比较完善的原因吗
    大漠2017-02-05 15:24 回复
  3. 求爬取的原站
    卑鄙的我2017-02-05 15:27 回复
  4. 国产的公开讨论都比较少
    大漠2017-02-05 15:33 回复
  5. 我说的国产不开源的那些,达梦,神通些
    大漠2017-02-05 15:38 回复
  6. 姜总,db engine sql server分有一千多的
    皱巴巴2017-02-05 15:44 回复
  7. 求review爬虫代码
    桂明月2017-02-05 15:47 回复
  8. 就关系型数据库oceanbase这东西吧就是鸡肋,阿里云上的都是小企业用得到这个玩意?大企业根本就不会用阿里云他们不会傻到刚摆脱了oracle 又被阿里绑住,前脚去ioe,接着再去bat,至少95%的应用是不需要并行数据库的,那东西现在还远做不到通用数据库,而且都是坑,维护成本更是惊人,现在硬件越来越强又有了mysql组复制这样的技术,想不出换ob理由,在发现两年现在看是问题的问题到时候就都不是问题啦,什么分布式数据库,并行中间件更像是一个过度性产品
    黎明奥德赛2017-02-05 15:51 回复
  9. google的spanner基于paxos算法在2012就很成熟而且是gps全球时钟解决一致性,所以国内的也别说自己是什么首创啦,另外像oracle这样的厂商要做个分布式数据库那是分分钟的是,想不想做也是基于商业考虑
    黎明奥德赛2017-02-05 16:18 回复
  10. K-DB现在是不是还只能在小型机上跑,自打浪潮集中吹过一阵子后就没下文了
    胤征2017-02-05 22:31 回复
  11. 建议帮主定期发布这样的好内容/微笑
    c@ini@o2017-02-05 23:39 回复
  12. oceanbase太大了,不适合中小企业用,而且比较封闭
    zerok2017-02-06 00:57 回复
  13. 我知道,很多人其实很关心得出这结论的python爬虫脚本。能得出这个榜单,这个爬虫脚本也很有技术含量
    leon2017-02-06 01:08 回复
  14. K-DB为何销声匿迹了?
    Q2017-02-06 04:33 回复
  15. 同求review爬虫代码,好想看看这个如何实现
    老查2017-02-07 01:35 回复
  16. 姜老师,我们觉得,应该将爬虫代码公开!
    李阳2017-02-07 01:57 回复
  17. 求介绍oceanbase情况
    林萌2017-02-07 04:39 回复