开发中如何选择数据库平台--Java免费学习网|电子爱好者

admin管理员组
文章数量:1609940

我的许多朋友，开发人员，应用和系统架构师，有时甚至是系统管理员经常问我同类型的问题：“bo，在我的应用中该使用sql server还是使用oracle数据库？”，“bo，我应该将我的sybase数据库迁移到sql server吗？”，“哪个数据库（平台）是最好的？”，“为什么我们不使用开源数据库，如mysql或postgresql？”。所有这些问题基本上都是相同的 —— 哪个数据库平台最适合某个应用程序，或是哪个数据库平台对it和业务最有意义？

为了回答这些问题，在我推荐任何数据库平台之前，我会问他们更多的问题（通常是十多个），很多时候人们不理解为什么一个简单的问题会引发这么多问题。

其实很多人不知道为什么他/她需要一个数据库，什么是关系数据库，数据库与电子表格之间的差异（以及各自的优缺点），该用access数据库还是sql server数据库，或应用程序能从数据库平台获得什么好处。

虽然我不是在这里宣传数据库是什么，但我知道对it和非it人员谈论数据库完全不是一回事，我不想被称为以数据库为中心的呆子，不过我认为在21世纪，人们一直在谈论bi（商业智能），我也认为最灵活，最复杂和最易维护的系统是由数据驱动的，产生的数据量多了就得用数据库来保存。下面我对最流行的数据库平台只做简要的介绍，并根据我的经验和与其它it界朋友的互动，介绍一下人们是怎么使用这些数据库的。

java免费学习 java自学网 http://www.javalearns

下面我19年来使用过的数据库：

• dbase/foxbase/foxpro in the dos/novell/windows 3.x world

• ms sql server (6.5,7.0,2000,2005 and 2008)

• oracle (7, 8/8i,9i,10g)

• sybase sql/ase servers (4.9.2, 10, 11, 11.9.2, 12/12.5, 15.x)

• sybase iq 12.6/12.7

• informix/dynamic (6, 7)

• mysql (4, 5/5.1)

• postgresql (8.3.5)/enterprisedb

此外，我参加了一系列的数据库选型评估，如vhayu和onetick，我在各行业也有过内存数据库使用经历，如oracle timesten和sybase ase内存版本（sybase rap商业版的一部分，它已成为时间序列数据库领域的一个强力竞争者，特别是去年初和cep集成后，影响越来越大）。

我曾经担任过公司全职员工或不同公司不同项目的顾问，真的觉得在数据库世界中确实没有银弹，选择什么数据库主要取决于以下几方面因素：

• 你是谁；

• 你要实现的目标（业务/功能要求，性能/可靠性/可扩展性/可用性要求）；

• 当前数据库存储了多少数据；

• 应用程序要选择的操作系统和语言平台；

• 你的预算有多少；

• 你是否想/需要构建一个数据仓库，bi或决策支持系统。

比较不同的数据库系统就象比较不同的开发平台和操作系统平台：

• java/j2ee与(c#, vb)/比较

• windows与linux/unix比较

• linux与私有unix系统如aix/hp-ux/solaris/tru64/irix比较

• unix与openmvs/unisys/tandem/ibm mainframe比较

如果我们在前端办公应用系统，如订单录入，银行或电信系统中不需要数据库（主要是担忧锁/阻塞，延迟和低i/o等），我们只希望使用数据库来存储事实数据，或使用数据库来备份数据。

当然，所有关系数据库都提供了不同的功能，即使它们都声称遵循ansi sql和sql-92标准，但实际上都有自己的一套sql语言，这就好比websphere/weblogic/oracle app server/sybase eserver/jboss之间的关系，它们是j2ee的不同实现，都兼容j2ee规范，但也有自己的扩展和变化。

关键任务（oltp）和高性能系统

如果我们需要数据库在关键业务系统中发挥更重要的作用，并希望做到无故障时间/高可用/集群，可靠性（性能和数据量），灾难复制和自动生成报告等目标，或需要实现极端高速和低延迟（hpc，高性能计算）效果，那么我们可能需要数据库的企业级功能，但这样的成本也更高。

ha（高可用）集群功能

各数据库平台的集群功能如下：

• oracle rac最适合ha集群，负载均衡和扩展；

• ms sql server提供ha故障转移功能，但无负载均衡；

• sybase ase 15集群与oracle rac功能相当；

• teradata本身就是一个分布式数据库平台；

• mysql集群声称tpc-c性能基准测试比oracle rac还高；

• ibm db2/udb在运行aix hacmp（高可用集群多处理）的ibm p系列/power服务器和veritas vcs/sun等集群上运行得很好。

高性能/低延迟/内存数据库

• oracle提供timesten内存数据库；

• mysql的集群使用内存存储引擎；

• sybase提供ase内存数据库；

• 另外，我们还可以使用ramsan/ssd（固态硬盘）安装sql server数据库，所有与数据库相关的磁盘i/o都发生在ssd上，而不是传统硬盘上，因此我们可以大大减少磁盘i/o延迟，提供i/o吞吐量，并提高数据库的整体性能；

• 还有其它的内存数据库，如sqlite或extremedb，但它们大多数要么只支持嵌入式系统，要么同一时间只支持单用户或单连接。

可扩展性/性能

• 使用oracle rac和sybase ase 15集群时，如果现有硬件不能满足性能要求，我们只需要向集群添加一台功能更强大的服务器，然后逐步替换掉其它节点；

• 使用sql server集群时，因为它仅仅支持主动/被动模式，在实例级没有可扩展性，如果现有硬件满足不了需要，我们必须更换整个集群；

• mysql集群也支持向所有节点都处于活动的集群添加节点，但它是一个无共享集群，节点越多意味着有更多的数据库副本，更多的存储和在所有节点之间复制数据时需要更多的网络流量。

复制

• sybase：首先澄清一下，我不是sybase的托儿。sybase拥有最好的复制解决方案，超过了oracle的数据卫士和sql server的复制解决方案（即使用它的镜像/日志传送/事务复制，sql server的复制仍然远远差于sybase的复制服务器）；

sybase的异构复制和同质复制是sybase公司上世纪90年代被华尔街排除但却受到许多大公司使用的主要原因之一。

sybase复制可以在数据库级（主动/主动复制，比sql server的镜像更好），事务级（与sql server的事务复制类似），表级，存储过程级，函数级，msa（多站点可用）以及通过日志传送（复制世界中穷人的解决方案）实现，它的镜像激活器结合emc/srdf可以真正保证在计划内和计划外停机时zdl（零数据丢失）。

• sql server：sql server复制可以通过日志传送和数据库镜像实现（主动/被动，r/w或只读），支持对象级（表）粒度事务复制。

• oracle：oracle的数据卫士是数据库克隆和灾难恢复最佳解决方案之一（使用rman）。

• mysql：mysql提供无共享集群，基本上所有活动节点都是同步复制的，它的异步复制也支持事务和对象级复制。

• 存储级解决方案：使用emc的bcv，netapp的快照管理器，日立的快照，veritas的卷复制器，数据复制可以发生在磁盘块级和卷级。

混合系统

通常情况下，后端数据库存储了大量的数据，在检索数据（数据排序，分组，汇总和计算）时会出现性能问题，当运行速度变慢时，会影响到数据写入过程。

因此，对于这些类型的应用程序，我们希望数据库能很好地处理大量数据，也可以很好地处理读/写阻塞问题。

oracle

oracle是这种系统的最佳选择，因为在oracle中，读/写程序不会相互阻止对方，数据在整个读取过程/会话/事务中都是一致的，系统开销主要发生了内存锁和重做日志上。

sql server

sql server 2005的新快照隔离使用了oracle同样的行版本化功能，但在tempdb中会产生更多的io。

sybase ase

sybase ase的读/写程序会相互阻塞对方，但sybase iq使用快照版本化管理解决了这个阻塞问题。

其它数据库

还有其它一些数据库也不存在阻塞问题，但其中一些甚至不遵从acid（原子性，一致性，隔离性和持久性）标准。

java免费学习 java自学网 http://www.javalearns

数据仓库

企业建立数据仓库存储/归档所有历史数据，以及他们认为需要放在数据库中的数据，通常，非规范化的数据进入数据仓库，多维度为olap和商业智能（bi）解决方案提供快速检索。

数据仓库也用于新的或增强的业务战略回溯测试，此外，数据仓库中的数据是呈指数增长而非线性增长的。

基于列的关系数据库优势

基于列的关系数据库具有很大的优势，因为它天生就是多维的，每一列都是自我索引的（b tree）。

典型的基于列的数据库有google的big table，sybase iq，vertica和基于mysql构建的kickfire。

平均而言，这些基于列的数据库比传统的基于行的关系数据库（如oracle，sql server，sybase ase，teradata，db2和mysql）在数据检索速度上要快60到100倍，但在基于行级进行数据更新时它们的速度较慢，到目前为止，sybase iq似乎是这一领域的领头羊，号称世界上最大的数据仓库（超过1p字节）就是用的sybase iq。

请访问这些数据库的网站了解更详细的信息：

• http://www.kickfire/solutions/resource-center
• http://www.sybase/products/datawarehousing/sybaseiq

更多有关基于列的关系数据库信息

用oracle和sql server作数据仓库时都需要建立多维数据立方体，需要的存储空间也会更多，我个人认为，用基于行的关系数据库作的数据仓库将会很快被基于列的数据仓库取代。

总体而言，基于行的关系数据（sql server，oracle，informix，db2/udb，mysql，sybase ase等）适合oltp应用，而基于列的关系数据库（sybase iq，kickfire，vertica等）更适合olap/dss和数据仓库应用。

注意：那些时间序列数据库如onetick，kdb+和vhayu都不能算是关系数据库，它们的存储结构是基于文件的，每一列的数据都使用一个单独的文件存储，基本上算是基于列的数据库，基于列的数据库也可用于回溯测试。此外，基于行的数据仓库（立方体）中的数据是呈指数级增长，但基于列的数据仓库中的数据是呈线性增长的。

传统上，oracle在数据仓库领域处于领先的优势，但现在在基于列的关系数据库（如sybase iq，vertica和kickfire）面前已经失去优势，google正在使用的big table也是一种基于列的数据库/存储系统。

迁移思考

承受能力和现有数据库上已有的投资是另一个需要考虑的事情。

我见过不少从sybase迁移到sql server的成功案例，反之亦然，但还很少看到从sybase/sql server迁移到oracle的，反之亦然。
根据数据库的规模和应用范围，要迁移sybase/sql server存储过程，重写应用程序并进行测试可能需要很长一段时间，即使有oracle迁移工作台的帮助（现在我们可以使用sql developer），每个存储过程都得重写，如果应用程序只使用了odbc/jdbc/ado，并且无存储过程/临时表，那么迁移会比较容易。

原生支持的编程语言

前面已经说过，oracle对java的支持是最好的，我们可以在oracle中存储java代码，并将其作为原生oracle功能使用，这使得oracle的扩展性非常好（有点象开放源码），此外，sybase也原生支持java代码。sql server和sybase支持扩展存储过程，基本上是指数据库中调用外部动态库的一个接口，它可以用不同的编程语言实现。

拥有成本

当我们在研究这些数据库的功能时，有一点必须要记住，那就是成本和时间范围，即使你有一个经验丰富的数据库团队，如果所选数据库平台超过了3个也就没有什么意义了，此外，将所有数据库合并到一个数据库平台也没有太大意义，因为大部分异构数据库都可以通过sql server的链接服务，oracle网关，或使用一些数据库复制和etl工具代替。当你在考虑数据库的维护成本时，不要孤立数据库成本，相反，要将其作为你的应用程序和基础设施的一部分看待。

我希望这篇文章对那些将要或正在为其应用程序挑选数据库的人们有所帮助，不会为自己做出的选择而后悔。

文章转载自 http://www.javalearns/Html/?1785

关注微信号：javaleanrs ，随时随地学Java

更多Java知识学习请访问 Java免费学习网 http://www.javalearns

本文标签：如何选择学习网数据库平台 Java

版权声明：本文标题：开发中如何选择数据库平台--Java免费学习网内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728583291a1164756.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

开发中如何选择数据库平台--Java免费学习网

更多相关文章

kafka远程连接失败 java.net.ConnectException: Connection refused: no further information

java api连接hbase一直卡住 java.net.ConnectException: Connection timed out: no further information

win10下安装Hadoop3.0.0后Caused by: java.net.ConnectException: Connection refused: no further information

【kafka】Java连接出现Connection refused: no further information

异常：java.net.ConnectException: Connection timed out: no further information

做淘淘商城第二天报的错 java.net.ConnectException: Connection refused: no further information

[Java Web]Error parsing HTTP request headerNote: further occurrences of HTTP header parsing errors

dbeaver连接MySQL数据库及错误Connection refusedconnect处理

2021-11-13 记录：Java连接远程Redis的报错信息和解决办法

java redis 重连_停止redis集群后清除数据重启，Redisson无法自动重连问题解决方法...

[HDFS篇]用java操作hdfs,由于没有开启hadoop集群而出现异常failed on connection exception

Java修仙之路，十万字吐血整理全网最完整Java学习笔记（高级篇）

java初中级面试题集锦

毕业设计分享----基于Java的个性化博客空间的设计与实现

制作的excel表格如何放到微信公众平台文章中？

关于java生成excel表格并发送给邮箱

网页版excel服务器,用excel当数据库，做个简单的网页

win10远程连接报错：这可能是由于CredSSP加密数据库修正解决方法

探索CVPR2023 Paper Code Interpretation：深度学习的互动式理解平台

三、基于alios things的esp32 devkitC学习笔记——接入阿里生活物联网平台天猫精灵

发表评论

推荐文章

面试必备！软件测试10个常见问题汇总

Fastchat UnicodeDecodeError utf-8 codec can‘t decode bytes in position invalid continuation byte解决方案

手机常用元器件介绍

解决PyCharm安装第三方库时出现“Error updating package list: Connect timed out”问题

解决Anaconda环境未激活的warning

热门文章

固态硬盘与机械硬盘使用寿命对比分析

法国工程师IMT联盟 密码学及其应用 2022年期末考试

《AI聊天类工具之四——ChatGPT》

网页制作练习

2022年ansys电脑配置要求，不同场景下的电脑硬件推荐

怎么查看电脑是不是禁ping_win10专业版电脑怎么取消禁ping

win10家庭版 远程桌面 oracle,Win10家庭版本系统无法远程桌面连接的怎么解决?

遥感图像处理笔记之【多模态遥感图像综述】

软件安全测试有哪些方法?

android 怎么获取root权限管理,安卓2.2怎么获取root权限

最新文章

win10系统激活相关知识

白嫖EarMaster Pro 7简体中文破解版下载永久激活

计算机登陆后如何防止自动注销,电脑取消自动注销_电脑怎么取消自动注销

PC设置电脑断电恢复后自动重启

计算机在未关机的情况下重启,电脑不能关机,详细教您电脑关机后总是重启怎么办...

win11实时保护怎么永久关闭？

如何通过BIOS设置自动开机

设置电脑每天几点自动关机 windows10系统

win7命令设置自动关机

ubuntu设置自动关机

MathType7.8中文破解版下载2024年最新图文安装激活教程

WIN10永久杜比音效安装指南（2021）

计算机如何设置来电启动,如何让计算机来电后自动启动.doc

雷迪司后备式UPS设置Centos Linux服务器停电自动关机（命令行文本界面）

如何使用计算机处理文件,如何设置电脑自动清理文件

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

法国工程师IMT联盟密码学及其应用 2022年期末考试

win10家庭版远程桌面 oracle,Win10家庭版本系统无法远程桌面连接的怎么解决?

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载