数据库的诞生和发展给计算机信息管理带来了一场巨大的革命。通过本文让我们看看数据库的发展。/数据库发展历史//
数据库技术从诞生到现在,在不到半个世纪的时间里,形成了坚实的理论基础、
成熟的商业产品和广泛的应用领域,吸引越来越多的研究者加入。数据库的诞生和发展给计算机信息管理带来了一场巨大的革命。三十多年来,国内外已经开发建设了成千上万个数据库,它已成为企业、部门乃至个人日常工作、生产和生活的基础设施。同时,随着应用的扩展与深入,数据库的数量和规模越来越大,数据库的研究领域也已经大大地拓广和深化了。30年间数据库领域获得了三次计算机图灵奖(C.W. Bachman, E.F.Codd, J.Gray),更加充分地说明了数据库是一个充满活力和创新精神的领域。就让我们沿着历史的轨迹,追溯一下数据库的发展历程。 一. 数据库发展简史 1. 数据管理的诞生 数据库的历史可以追溯到五十年前,那时的数据管理非常简单。通过大量的分类﹑比较和表格绘制的机器运行数百万穿孔卡片来进行数据的处理,其运行结果在纸上打印出来或者制成新的穿孔卡片。而数据管理就是对所有这些穿孔卡片进行物理的储存和处理。 然而,1951年雷明顿兰德公司(Remington Rand Inc)的一种叫做Univac I的计算机推出了一种一秒钟可以输入数百条记录的磁带驱动器,从而引发了数据管理的革命。1956年IBM生产出第一个磁盘驱动器——the Model 305 RAMAC。此驱动器有50个盘片,每个盘片直径是2英尺,可以储存5MB的数据。使用磁盘最大的好处是可以随机地存取数据,而穿孔卡片和磁带只能顺序存取数据。 1951: Univac系统使用磁带和穿孔卡片作为数据存储。 数据库系统的萌芽出现于60年代。当时计算机开始广泛地应用于数据管理,对数据的共享提出了越来越高的要求。传统的文件系统已经不能满足人们的需要。能够 统一管理和共享数据的数据库管理系统(DBMS)应运而生。数据模型是数据库系统的核心和基础,各种DBMS软件都是基于某种数据模型的。所以通常也按照 数据模型的特点将传统数据库系统分成网状数据库、层次数据库和关系数据库三类。 最早出现的是网状DBMS,是美国通用电 气公司Bachman等人在1961年开发成功的IDS(Integrated DataStore)。1961年通用电气公司(General Electric Co.)的Charles Bachman成功地开发出世界上第一个网状DBMS也是第一个数据库管理系统——集成数据存储(Integrated DataStore IDS),奠定了网状数据库的基础,并在当时得到了广泛的发行和应用。IDS具有数据模式和 日志的特征。但它只能在GE主机上运行,并且数据库只有一个文件,数据库所有的表必须通过手工编码来生成。 之后,通用电气公司的一个客户——BF Goodrich Chemical公司最终不得不重写了整个系统。并将重写后的系统命名为集成数据管理系统(IDMS)。 网状数据库模型对于层次和非层次结构的事物都能比较自然的模拟,在关系数据库出现之前网状DBMS要比层次DBMS用得普遍。在数据库发展史上,网状数据 库占有重要地位。 层次型DBMS是紧随网络型数据库而出现的。最著名最典型的层次数据库系统是IBM公司在1968年开发的IMS(Information Management System),一种适合其主机的层次数据库。这是IBM公司研制的最早的大型数据库系统程序产品。从60年代末产生起,如今已经发展到IMSV6,提供 群集、N路数据共享、消息队列共享等先进特性的支持。这个具有30年历史的数据库产品在如今的WWW应用连接、商务智能应用中扮演着新的角色。 1973年Cullinane公司(也就是后来的Cullinet软件公司),开始出售Goodrich公司的IDMS改进版本,并且逐渐成为当时世界上 最大的软件公司。 2. 关系数据库的由来 网状数据库和层次数据库已经很好地解决了数据的集中和共享问题,但是在数据独立性和抽象级别
上仍有很大欠缺。用户在对这两种数据库进行存取时,仍然需要明 确数据的存储结构,指出存取路径。而后来出现的关系数据库较好地解决了这些问题。 1970年,IBM的研究员E.F.Codd博士在刊物《Communication of the ACM》上发表了一篇名为“A Relational Model of Data for Large Shared Data Banks”的论文,提出了关系模型的概念,奠定了关系模型的理论基础。尽管之前在1968年Childs已经提出了面向集合的模型,然而这篇论文被普遍 认为是数据库系统历史上具有划时代意义的里程碑。Codd的心愿是为数据库建立一个(续致信网上一页内容)优美的数 据模型。后来Codd又陆续发表多篇文章,论述了范式理论和衡量关系系统的12条标准,用数学理论奠定了关系数据库的基础。关系模型有严格的数学基础,抽 象级别比较高,而且简单清晰,便于理解和使用。但是当时也有人认为关系模型是理想化的数据模型,用来实现DBMS是不现实的,尤其担心关系数据库的性能难 以接受,更有人视其为当时正在进行中的网状数据库规范化工作的严重威胁。为了促进对问题的理解,1974年ACM牵头组织了 一次研讨会,会上开展了一场分别以Codd和Bachman为首的支持和反对关系数据库两派之间的辩论。这次著名的辩论推动了关系数据库的发展,使其最终 成为现代数据库产品的主流。 1969: Edgar F。“Ted” Codd发明了关系数据库 1970年关系模型建立之后,IBM公司在San Jose实验室增加了更多的研究人员研究这个项目,这个项目就是著名的System R。其目标是论证一个全功能关系DBMS的可行性。该项目结束于1979年,完成了第一个实现SQL的DBMS。然而IBM对IMS的承诺阻止了 System R的投产,一直到1980年System R才作为一个产品正式推向市场。IBM产品化步伐缓慢的三个原因:IBM重视信誉,重视质量,尽量减少故障;IBM是个大公司,官僚体系庞大;IBM内部 已经有层次数据库产品,相关人员不积极,甚至反对。 然而同时,1973年加州大学伯克利分校的Michael Stonebraker和Eugene Wong利用System R已发布的信息开始开发自己的关系数据库系统Ingres。他们开发的Ingres项目最后由Oracle公司、Ingres公司以及硅谷的其他厂商所 商品化。后来,System R和Ingres系统双双获得ACM的1988年“软件系统奖”。 1976年霍尼韦尔公司(Honeywell)开发了第一个商用关系数据库系统——Multics Relational Data Store。关系型数据库系统以关系代数为坚实的理论基础,经过几十年的发展和实际应用,技术越来越成熟和完善。其代表产品有Oracle、IBM公司的 DB2、微软公 司的MS SQL Server以及Informix、ADABASD等等。 3. 结构化查询语言 (SQL) 1974年,IBM的Ray Boyce和Don Chamberlin将Codd关系数据库的12条准则的数学定义以简单的关键字语法表现出来,里程碑式地提出了SQL(Structured Query Language)语言。SQL语言的功能包括查询、操纵、定义和控制,是一个综合的、通用的关系数据库语言,同时又是一种高度非过程化的语言,只要求用 户指出做什么而不需要指出怎么做。SQL集成实现了数据库生命周期中的全部操作。SQL提供了与关系数据库进行交互的方法,它可以与标准的编程语言一起工 作。自产生之日起,SQL语言便成了检验关系数据库的试金石,而SQL语言标准的每一次变更都指导着关系数据库产品的发展方向。然而,直到二十世纪七十年 代中期,关系理论才通过SQL在商业数据库Oracle和DB2中使用。 1986年,ANSI把SQL作为关系数据库语言的美国标准,同年公布了标准SQL文本。目前SQL标准有3个版本。基本SQL定义是 ANSIX3135-89,“Database Language - SQL with Integrity Enhancement”[ANS89],一般叫做SQL-89。SQL-89定义了模式定义、数据操作和事务处理。SQL-89和随后的 ANSIX3168-1989,“Database
Language-Embedded SQL”构成了第一代SQL标准。ANSIX3135-1992[ANS92]描述了一种增强功能的SQL,现在叫做SQL-92标准。SQL-92包括 模式操作,动态创建和SQL语句动态执行、网络环境支持等增强特性。在完成SQL-92标准后,ANSI和ISO即 开始合作开发SQL3标准。SQL3的主要特点在于抽象数据类型的支持,为新一代对象关系数据库提供了标准。 4. 面向对象数据库 随着信息技术和市场的发展,人们发现关系型数据库系统虽然技术很成熟,但其局限性也是显而易见的:它能很好地处理所谓的“表格型数据”,却对技术界出现的 越来越多的复杂类型的数据无能为力。九十年代以后,技术界一直在研究和寻求新型数据库系统。但在什么是新型数据库系统的发展方向的问题上,产业界一度是相 当困惑的。受当时技术风潮的影响,在相当一段时间内,人们把大量的精力花在研究“面向对象的数据库系统(object oriented database)”或简称“OO数据库系统”。值得一提的是,美国Stonebraker教授提出的面向对象的关系型数据库理论曾一度受到产业界的青 睐。而Stonebraker本人也在当时被Informix花大价钱聘为技术总负责人。 然而,数年的发展表明,面向对象的关系型数据库系统产品的市场发展的情况并不理想。理论上的完美性并没有带来市场的热烈反应。其不成功的主要原因在于,这 种数据库产品的主要设计思想是企图用新型数据库系统来取代现有的数据库系统。这对许多已经运用数据库系统多年并积累了大量工作数据的客户,尤其是大客户来 说,是无法承受新旧数据间的转换而带来的巨大工作量及巨额开支的。另外, 面向对象的关系型数据库系统使查询语言变得极其复杂,从而使得无论是数据库的开发商家还是应用客户都视其复杂的应用技术为畏途。 5. 数据管理的变革 二十世纪六十年代后期出现了一种新型数据库软件:决定支持系统(DSS),其目的是让管理者在决策过程中更有效地利用数据信息。于是在1970年, 第一个联机分析处理工具——Express诞生了。其他决策支持系统紧随其后,许多是由公司的IT部门开发出来的。 1985年,第一个商务智能系统(business intelligence)由Metaphor计算机系统有限公司为Procter & Gamble公司开发出来,主要是用来连接销售信 息和零售的扫描仪数据。同年, Pilot 软件公司开始出售第一个商用客户/服务器执行信息系统——Command Center。 同样在这年,加州大学伯克利分校Ingres项目演变成Postgres,其目标是开发出一个面向对象的数据库。此后一年, Graphael公司开发了第一个商用的对象数据库系统—Gbase。 1988年,IBM公司的研究者Barry Devlin和Paul Murphy发明了一个新的术语—信息仓库,之后,IT的厂商开始构建实验性的数据仓库。1991年,W.H. \"Bill\" Inmon出版了一本“如何构建数据仓库”的书,使得数据仓库真正开始应用。 1991: W.H.“Bill” Inmon发表了”构建数据仓库” 二十世纪九十年代,随着基于PC的客户/服务器计算模式和企业软件包的广泛采用,数据管理的变革基本完成。数据管理不再仅仅是存储和管理数据,而转变成用 户所需要的各种数据管理的方式。Internet的异军突起以及XML语言的出现,给数据库系统的发展开辟了一片新的天地。 5. 数据库发展大事记 1951:Univac系统使用磁带和穿孔卡片作为数据存储。 1956:IBM公司在其Model 305 RAMAC中第一次引入了磁盘驱动器 1961:通用电气(GE)公司的Charles Bachman开发了第一个数据库管理系统——IDS 1969:E.F. Codd发明了关系数据库。 1973: 由John J.Cullinane领导Cullinane公司开发了 IDMS——一个针对IBM主机的基于网络模型的数据库。 1976: Honeywell公司推出了Multics Relational Data Store——第一个商用关系数据库产品。 1979: Oracle公司引入了第一个商用SQL关系数据库管理系统。 1983: IBM 推出了
DB2数据库产品。 1985: 为Procter & Gamble系统设计的第一个商务智能系统产生。 1991: W.H.“Bill” Inmon发表了”构建数据仓库”。
常见主流数据库分类
1、IBM 的DB2
DB2是IBM著名的关系型数据库产品,DB2系统在企业级的应用中十分广泛。截止2003年,全球财富500强(Fortune 500)中有415家使用DB2,全球财富100强(Fortune100)中有96家使用DB2,用户遍布各个行业。2004年IBM的DB2就获得相关专利239项,而Oracle仅为99项。DB2目前支持从PC到UNIX,从中小型机到大型机,从IBM到非IBM(HP及SUN UNIX系统等)的各种操作平台。
IBM绝对是数据库行业的巨人。1968年IBM在IBM 360计算机上研制成功了IMS这个业界第一个层次型数据库管理系统,也是层次型数据库中最为著名和最为典型的。1970年,IBM E.F.Codd发表了业界第一篇关于关系数据库理论的论文“A Relational Model of Data for Large Shared DataBanks”,首次提出了关系模型的概念。1974年,IBM Don Chamberlin和Ray Boyce通过System R项目的实践,发表了论文“SEQUEL:A Structured English Query Language”,我们现在熟知SQL就是基于它发展起来的。IBM 在1983年发布了DATABASE 2(DB2)for MVS(内部代号为“Eagle”),这就是著名的DB2数据库。2001年IBM以10亿美金收购了Informix的数据库业务,这次收购扩大了IBM分布式数据库业务。2006 DB2 9作为第三代数据库的革命性产品正式在全球发布。
作为关系数据库领域的开拓者和领航人,IBM在1977年完成了System R系统的原型,1980年开始提供集成的数据库服务器—— System/38,随后是SQL/DSforVSE和VM,其初始版本与SystemR研究原型密切相关。
DB2 forMVSV1 在1983年推出。该版本的目标是提供这一新方案所承诺的简单性,数据不相关性和用户生产率。1988年DB2 for MVS 提供了强大的在线事务处理(OLTP)支持,1989 年和1993 年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2 Universal Database 6.1则是通用数据库的典范,是第一个具备网上功能的多媒体关系数据库管理系统,支持包括Linux在内的一系列平台。
2、 Oracle
Oracle 前身叫SDL,由Larry Ellison 和另两个编程人员在1977创办,他们开发了自己的拳头产品,在市场上大量销售,1979 年,Oracle公司引
入了第一个商用SQL 关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一,其产品支持最广泛的操作系统平台。目前Oracle关系数据库产品的市场占有率名列前茅。
Oracle公司是目前全球最大的数据库软件公司,也是近年业务增长极为迅速的软件提供与服务商。IDC(Internet Data Center)2007统计数据显示数据库市场总量份额如下:Oracle 44.1% IBM 21.3%Microsoft 18.3% Teradata 3.4% Sybase 3.4%。不过从使用情况看,BZ Research的2007年度数据库与数据存取的综合研究报告表明76.4%的公司使用了Microsoft SQL Server,不过在高端领域仍然以Oracle,IBM,Teradata为主。
2007年7月12日,甲骨文公司在美国纽约宣布推出数据库Oracle 11g,这是Oracle数据库的最新版本。Oracle介绍说,Oracle 11g有400多项功能,经过了1500万个小时的测试,开发工作量达到了3.6万人/月。Oracle 11g在安全,XML DB,备份等方面得到了很大提升。Oracle发展历史见转载《书写历史的甲骨文--ORACLE公司传奇》一文。
3、 Informix
Informix是IBM公司出品(2001)的关系数据库管理系统(RDBMS)家族。作为一个集成解决方案,它被定位为作为IBM在线事务处理(OLTP)旗舰级数据服务系统。Informix在1980年成立,目的是为Unix等开放操作系统提供专业的关系型数据库产品。公司的名称Informix便是取自Information 和Unix的结合。Informix第一个真正支持SQL语言的关系数据库产品是Informix SE(StandardEngine)。InformixSE是在当时的微机Unix环境下主要的数据库产品。它也是第一个被移植到Linux上的商业数据库产品。
4、Sybase
美国Sybase公司研制的一种关系型数据库系统,是一种典型的UNIX或WindowsNT平台上客户机/服务器环境下的大型数据库系统。Sybase SQL Server 是 Sybase 公司产品。Sybase公司成立于1984年11月,产品研究和开发包括企业级数据库、数据复制和数据访问。
Sybase公司成立于1984年,公司名称“Sybase”取自“system”和“database” 相结合的含义。Sybase公司的创始人之一Bob Epstein 是Ingres 大学版(与System/R同时期的关系数据库模型产品)的主要设计人员。公司的第一个关系数据库产品是1987年5月推出的Sybase
SQLServer1.0。Sybase首先提出Client/Server 数据库体系结构的思想,并率先在Sybase SQLServer 中实现。
起初,为了在企业级数据库市场上与Oralce和IBM竞争,Sybase与Microsoft合作共同开发数据库产品。1988年,Sybase、Microsoft和Asbton-Tate联合开发了OS/2系统上的SQL Server 1.0,本质上和Sybase SQL Server 3.0是一样的。而后Microsoft致力于将SQL Server移值到Win NT平台上。Sybase与Microsoft的合作关系一直坚持到SQL Server 4.21(1993),随后各自开发相应平台的数据库系统。1995年,Sybase发布了SQL Server 11.0。为了区别于Microsoft SQL Server, Sybase将其11.5以及以上版本的SQL Server改名为Adaptive Server Enterprise (ASE)。2005年9月,Sybase强势发布Adaptive Server Enterprise 15。Sybase SQL Server与Microsoft SQL Server都使用T-SQL(Transact-SQL 由SQL扩展而来)做为数据库语言。
Sybase提供了一套应用程序编程接口和库,可以与非Sybase数据源及服务器集成,允许在多个数据库之间复制数据,适于创建多层应用。系统具有完备的触发器、存储过程、规则以及完整性定义,支持优化查询,具有较好的数据安全性。Sybase通常与SybaseSQLAnywhere用于客户机/服务器环境,前者作为服务器数据库,后者为客户机数据库,采用该公司研制的PowerBuilder为开发工具,在我国大中型系统中具有广泛的应用。
5、 SQL Server
Microsoft SQL Server是微软公司开发的大型关系型数据库系统。SQL Server的功能比较全面,效率高,可以作为中型企业或单位的数据库平台。SQL Server可以与Windows操作系统紧密集成,不论是应用程序开发速度还是系统事务处理运行速度,都能得到较大的提升。对于在Windows平台上开发的各种企业级信息管理系统来说,不论是C/S(客户机/服务器)架构还是B/S(浏览器/服务器)架构,SQL Server都是一个很好的选择。SQL Server的缺点是只能在Windows系统下运行。
1987 年,微软和IBM合作开发完成OS/2,IBM 在其销售的OS/2 ExtendedEdition 系统中绑定了OS/2Database Manager,而微软产品线中尚缺少数据库产品。为此,微软将目光投向Sybase,同Sybase 签订了合作协议,使用Sybase的技术开发基于OS/2平台的关系型数据库。1989年,微软发布了SQL Server 1.0 版。 Microsoft在与Sybase分道扬镳后,随后在其6.05和7.0版本中重写了核心数据库系统,如今SQLServer 2008即将到来。
6、 PostgreSQL
PostgreSQL是以加州大学伯克利分校计算机系开发的 POSTGRES,版本 4.2为基础的对象关系型数据库管理系统(ORDBMS)。 POSTGRES 领先的许多概念只是在非常迟的时候才出现在商业数据库中。
PostgreSQL 是一种特性非常齐全的自由软件的对象——关系性数据库管理系统(ORDBMS),它的很多特性是当今许多商业数据库的前身。PostgreSQL最早开始于BSD的Ingres项目。PostgreSQL 的特性覆盖了SQL-2/SQL-92和SQL-3。首先,它包括了可以说是目前世界上最丰富的数据类型的支持;其次,目前PostgreSQL 是唯一支持事务、子查询、多版本并行控制系统、数据完整性检查等特性的唯一的一种自由软件的数据库管理系统.
7、mySQL
mySQL是一个小型关系型数据库管理系统,开发者为瑞典MySQL AB公司。在2008年1月16号被Sun公司收购。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。MySQL的官方网站的网址是: www.mysql.com
8、Access数据库
美国Microsoft公司于1994年推出的微机数据库管理系统。它具有界面友好、易学易用、开发简单、接口灵活等特点,是典型的新一代桌面关系型数据库管理系统。它结合了 Microsoft Jet Database Engine 和 图形用户界面两项特点,是 Microsoft Office的成员之一。Access能够存取 Access/Jet、Microsoft SQL Server、Oracle,或者任何 ODBC 兼容数据库的资料。Access界面友好而且易学易用,作为Office套件的一部分,可以与Office集成,实现无缝连接Access提供了表(Table)、查询(Query)、窗体(Form)、报表(Report)、宏(Macro)、模块(Module)等用来建立数据库系统的对象。提供了多种向导、生成器、模板,把数据存储、数据查询、界面设计、报表生成等操作规范化。 Access是入门级小型桌面数据库,性能安全性都很一般。可供个人管理或小型网站之用。Access不是数据库语言,只是一个数据库程序。目前最新版本为Office 2007。其主要特点如下:
(1)完善地管理各种数据库对象,具有强大的数据组织、用户管理、安
全检查等功能。
(2)强大的数据处理功能,在一个工作组级别的网络环境中,使用Access开发的多用户数据库管理系统具有传统的XBASE(DBASE、FoxBASE的统称)数据库系统所无法实现的客户服务器(Cient/Server)结构和相应的数据库安全机制,Access具备了许多先进的大型数据库管理系统所具备的特征,如事务处理/出错回滚能力等。
(3)可以方便地生成各种数据对象,利用存储的数据建立窗体和报表,可视性好。
(4)作为Office套件的一部分,可以与Office集成,实现无缝连接。 (5)能够利用Web检索和发布数据,实现与Internet的连接。 Access主要适用于中小型应用系统,或作为客户机/服务器系统中的客户端数据库。
9、FoxPro数据库
最初由美国Fox公司1988年推出,1992年Fox公司被Microsoft公司收购后,相继推出了FoxPro2.5、2.6和VisualFoxPro等版本,其功能和性能有了较大的提高。 FoxPro2.5、2.6分为DOS和Windows两种版本,分别运行于DOS和Windows环境下。FoxPro比FoxBASE在功能和性能上又有了很大的改进,主要是引入了窗口、按纽、列表框和文本框等控件,进一步提高了系统的开发能力。
Visual FoxPro由FoxPro延伸而来,原名FoxBase,是美国Fox Software公司在1984推出的数据库产品。FoxPro在DOS上运行,与xBase系列相兼容。FoxPro是FoxBase的加强版,1992年Fox Software被微软收购。可以说,Visual FoxPro是在dBASE和FoxBase系统的基础上发展而成的。80年代初期,dBASE是PC机上最流行的数据库管理系统,当时大多数的管理信息系统采用了dBASE作为系统开发平台。后来出现的FoxBase几乎完全支持了dBASE的所有功能。 Visual FoxPro出现是xBASE系列数据库系统的一个飞跃,其不仅在图形用户界面的设计方面采用了一些新的技术,还提供了所见即所得的报表和屏幕格式设计工具。2002年,随着微软.NET口号的提出,发布了Visual Studio .NET。在这个版本的 Visual Studio中,微软将Visual FoxPro作为一个单独的开发环境(Visual FoxPro 7.0)单独销售,不再与Studio
集成。2007年3月,微软公司宣布Visual FoxPro 9将是微软的最后一款桌面数据库开发工具软件,今后将永远不会出现VFP 10。微软将会为VFP 9的普通用户提供支持到2010年1月12日,购买扩展支持服务的用户将可获得到2015年1月13号的服务。Visual FoxPro只能在Windows系统下运行。
10、Teradata
Teradata数据库是世界上最富盛名、功能最强大的数据仓库管理系统,是Teradata公司产品, 1991年被NCR收购。客户主要集中在电信,航空,物流,零售,银行等方面。Teradata在全球数据仓库领域处于领先地位。2007年,Teradata宣布推出Teradata 12解决方案,包括Teradata数据库12 (Teradata Database 12)、Teradata工具及实用程序12 (Teradata Tools and Utilities 12),以及通过应用集成和合作伙伴关系提供的专业和咨询服务。该方案是Teradata第十二次重大数据库产品改版。 TPC介绍
Transaction Processing Performance Council,事务处理性能委员会,是由数10家会员公司创建的非盈利组织,总部设在美国。该组织对全世界开放,但迄今为止,绝大多数会员都是美、日、西欧的大公司。TPC的成员主要是计算机软硬件厂家,而非计算机用户,它的功能是制定商务应用基准程序(Benchmark)的标准规范、性能和价格度量,并管理测试结果的发布。
TPC不给出基准程序的代码,而只给出基准程序的标准规范(Standard Specification)。任何厂家或其它测试者都可以根据规范,最优地构造出自己的系统(测试平台和测试程序)。为保证测试结果的客观性,被测试者(通常是厂家)必须提交给TPC一套完整的报告(Full Disclosure Report),包括被测系统的详细配置、分类价格和包含五年维护费用在内的总价格。该报告必须由TPC授权的审核员核实(TPC本身并不做审计),现在全球只有几个审核员,全部在美国。
TPC已经推出了四套基准程序,被称为TPC-A、TPC-B、TPC-C和TPC-D。其中A和B已经过时,不再使用了。TPC-C是在线事务处理(OLTP)的基准程序,TPC-D是决策支持(Decision Support) 的基准程序。TPC即将推TPC-E,作为大型企业(Enterprise)信息服务的基准程序。
几款主流数据库详细比较
开发数据库应用,选择一个好的数据库是非常重要的。目前,商品化的数据库管理系统以关系型数据库为主导产品,技术比较成熟。面向对象的数据库管理系统虽然技术先进,数据库易于开发、维护,但尚未有成熟的产品。国际国内的主导关系型数据库管理系统有SQL Server、ORACLE、SYBASE、INFORMIX和 DB2。本文从一些方面比较了SQL Server与Oracle、SYBASE、DB2、INFORMIX这些数据库,为您选择数据库提供一些参考。
1、性能
SQL Server
老版本多用户时性能不佳,新版本的性能有了明显的改善,各项处理能力都有了明显的提高。保持了多项TPC-C纪录。具体参见http://www.tpc.org/ Oracle
性能最高,保持Windows NT下的TPC-D和TPC-C的世界记录。 SYBASE
性能较高,支持Sun、IBM、HP、Compaq和Veritas的集群设备的特性,实现高可用性。性能接近于SQL Server,但在UNIX平台下的并发性要优与 SQL Server。适应于安全性要求极高的系统。 DB2
适用于数据仓库和在线事物处理,性能较高。客户端支持及应用模式。 INFORMIX
性能较高,支持集群,实现高可用性。适应于安全性要求极高的系统,尤其是银行, 证券系统的应用。
2、可伸缩性,并行性
SQL Server
以前版本SQL Server并行实施和共存模型并不成熟。很难处理大量的用户数和数据卷。伸缩性有限。新版本性能有了较大的改善,在Microsoft Advanced Servers上有突出的表现,超过了他的主要竞争对手。 Oracle
并行服务器通过使一组结点共享同一簇中的工作来扩展Window NT的能力,提供高可用性和高伸缩性的簇的解决方案。如果Windows NT不能满足需要, 用户可
以把数据库移到UNIX中,具有很好的伸缩性。Oracle的并行服务器对各种UNIX平台的集群机制都有着相当高的集成度。 SYBASE
新版本具有较好的并行性,速度快,对巨量数据无明显影响,但是技术实现复杂,需要程序支持,伸缩性有限。虽然有DB SWITCH来支持其并行服务器,但DB SWITCH在技术层面还未成熟,且只支持版本12.5以上的ASE SERVER。DB SWITCH技术需要一台服务器充当SWITCH,从而在硬件上带来一些麻烦。 DB2
DB2具有很好的并行性。DB2把数据库管理扩充到了并行的、多节点的环境。数据库分区是数据库的一部分,包含自己的数据、索引、配置文件、和事务日志。数据库分区有时被称为节点或数据库节点,伸缩性有限。 INFORMIX
采用单进程多线程的技术,具有较好的并行性。但是仅运行于UNIX平台,伸缩性有限。
3、安全性
SQL server
Microsoft Advanced Server 获得最高安全认证,服务器平台的稳定性是数据库的稳定性的基础,新版本的SQL的安全性有了极大的提高。 Oracle Server 获得最高认证级别的ISO标准认证。 SYBASE
通过Sun公司J2EE认证测试,获得最高认证级别的ISO标准认证。 DB2 获得最高认证级别的ISO标准认证。 INFORMIX 获得最高认证级别的ISO标准认证。 4、操作
SQL Server
操作简单,采用图形界面。管理也很方便,而且编程接口特别友好(它的SQL-DMO让编程变得非常方便!) ,从易维护性和价格上SQL Server明显占有优势。 Oracle
较复杂, 同时提供GUI和命令行,在Windows NT和Unix, Linux 下操作相同。
对数据库管理人员要求较高。 SYBASE
复杂,使用命令行操作,对数据库管理人员要求较高。同时提供GUI和命令行。但GUI较差,常常无法及时状态,建议使用命令行。 DB2
操作简单,同时提供GUI和命令行,在Windows NT和Unix下操作相同。 INFORMIX
使用和管理复杂,命令行操作。对数据库管理人员要求较高。
5、使用风险
SQL Server
完全重写的代码,性能和兼容性有了较大的提高,与Oracle,DB2的性能差距明显减小。该产品的出台经历了长期的测试,为产品的安全和稳定进行了全面的检测,安全稳定性有了明显的提高。经历了长期的测试,不断延迟,许多功能需要时间来证明,并不十分兼容。 Oracle
长时间的开发经验,完全向下兼容,得到广泛的应用,完全没有风险。可以安全的进行数据库的升级,在企业、政府中得到广泛的应用。并且如果在WINNT上无法满足数据的要求,可以安全的把数据转移到UNIX上来。 SYBASE
向下兼容, 但是ct-library 程序不益移植。开发时间较长,升级较复杂,稳定性较好,数据安全有保障。风险小。在安全要求极高的银行, 证券行业中得到了广泛的应用。
DB2
在巨型企业得到广泛的应用,向下兼容性好。风险小。 INFORMIX
开发时间较长,升级较复杂,稳定性较好,数据安全有保障。风险小。在安全要求极高的银行,证券行业中得到了广泛的应用。
6、开放性
SQL Server
只能在Windows 上运行,C/S结构,没有丝毫的开放性,操作系统的系统的稳定对数据库是十分重要的。只支持Windows客户,可以用ADO,DAO,OLEDB,ODBC连接。Windows9X系列产品是偏重于桌面应用,NT server适合各种大中小型型企
业。操作系统的系统的稳定对数据库是十分重要的。Windows平台的可靠性,安全性经过了最高级别的C2认证的。在处理大数据量的关键业务时提供了较好的性能。而且windows平台的可靠性,安全性和伸缩性是非常有限的。它不象unix那样久经考验,尤其是在处理大数据库。 Oracle
能在所有主流平台上运行(包括 Windows)。完全支持所有的工业标准。采用完全开放策略。多层次网络计算,支持多种工业标准,可以用ODBC,JDBC,OCI等网络客户连接。可以使客户选择最适合的解决方案。对开发商全力支持。 SYBASE
能在所有主流平台上运行,C/S结构,可以用ODBC、Jconnect、Ct-library等网络客户连接。在银行业中得到了广泛的应用。但由于早期Sybase与OS集成度不高,因此VERSION11.9.2以下版本需要较多OS和DB级补丁。在多平台的混合环境中,会有一定问题。 DB2
能在所有主流平台上运行(包括windows)。有较好的开放性,最适于海量数据。跨平台,多层结构,支持ODBC,JDBC等客户。在大型的国际企业中得到最为广泛的应用,在全球的500家最大的企业中,几乎85%以上采用DB2数据库服务器,而国内到97年约占5%。 IINFORMIX
仅运行在UNIX平台,包括SUNOS、HPUX、 ALFAOSF/1。在银行中得到广泛的应用。
7、易维护性和价格
SQL Server
从易维护性和价格上SQL Server明显占有优势。基于Microsoft的一贯风格,SQL Server的图形管理界面带来了明显的易用性,微软的数据库管理员培训进行的比较充分,可以轻松的找到很好的数据库管理员,数据库管理费用比较低,SQL Server的价格也是很低的,但是在License的购买上会抬高价格。总体来说SQL Server的价格在商用数据库中是最低的。 Oracle
从易维护性和价格体来说Oracle的价格是比较高的,管理比较复杂,由于Oracle的应用很广泛,经验丰富的Oracle数据库管理员可以比较容易的找到,从而实现Oracle的良好管理。因此Oracle的性能价格比在商用数据库中是最好的。 SYBASE
SYBASE的价格是比较低的,但是SYBASE的在企业和政府中的应用较少,很难找到经验丰富的管理员,运行管理费用较高。 DB2
价格高, 管理员少,在中国的应用较少,运行管理费用都很高,适用于大型企业的数据仓库应用。 INFORMIX
价格在这些系统中居于中间,与SYBASE一样,在企业和政府中应用较少,仅在银行中得到了广泛的应用。经验丰富的管理人员较少,运行管理费用高。
8、数据库二次开发
SQL Server
数据库的二次开发工具很多,包括Visual C++, Visual Basic等开发工具,可以实现很好的Windows应用。开发容易。 Oracle
数据库的二次开发工具很多,涵盖了数据库开发的各个阶段,开发容易。 SYBASE
开发工具较少,经验丰富的人员很少。 DB2
在国外巨型企业得到广泛的应用,中国的经验丰富的人员很少。 INFORMIX
在银行业中得到广泛的应用,但是在中国的经验丰富的人员很少。
经过以上比较,我们得出结论如下:一般的中小型企业或者中小型的应用中,采用MS SQL Server 作为数据平台,既可以节约资金,又便于维护管理。小型应用主要考虑的是资金问题,SQL Server的资金投入最小,是中小型应用的最佳选择。大型应用系统要求有较高的数据处理能力,一般应该采用了高性能的大型数据库管理系统——Oracle,大型高可靠性要求的系统安全稳定性是首要考虑的因素,Oracle 能够提供很高的安全稳定的性能,因此Oracle是在国内的大型数据库的必然的选择。在国外的巨型企业中很多采用全套IBM解决方案,使用DB2作为公司的数据仓库,可以达到几乎与Oracle相同的安全稳定性和相近的性能,但是国内使用DB2的人很少,经验丰富的管理员更少,很难实现很好的数据库管理。在银行和证券系统中,采用安全性较好的INFORMIX和SYBASE。随着SQL2000的发布和完善,在大型数据库应用中Microsoft也将占一席之地。 对于流动人口管理系统来说,由于区县的每个人都要有一条记录,一个市
或县的人口数量一般达到10万,有些大县甚至达到100万级,每一个人的记录包括出生年月,户口所在地,姓名,性别……,如果育龄妇女占1/3,则大约有30万条数据,因此系统数据量不是很大,属于中小型应用在此,我们建议采用Microsoft SQL Server数据库作为后台的数据库。这主要是考虑系统的性能价格比,和易于管理性,易维护性。
如前所述,Microsoft SQL Server是基于Windows 2000 Advanced Server服务器的,我们通过TPC的网站可以看到Microsoft SQL Server的性能已经稳居数据库应用的前几位,可以满足系统的稳定性和大数据量的要求。对于小县/区来说,系统的数据容量较小,采用WINNT平台安装数据库也可以较好的满足要求。当人口增加,数据量变大的时候,Microsoft SQL Server也可以很好的满足数据管理的要求
数据库的稳定是建立在操作系统稳定的基础上。Windows 2000 Advanced Server经过了最严格的安全认证,获得了最高的C2级别的安全认证标准。由此可以证明Windows 2000 Advanced Server的系统稳定性是极高的,他的代码经过检验,证明是稳定的。Microsoft SQL Server的性能我们已经在TPC网站上看到了,某些大型电信级的数据库也以Microsoft SQL Server作为数据支持。 数据库良好稳定的运行需要管理员的辛勤工作,管理员的经验直接关系到数据库的安全稳定,MS SQL SERVER在中国的企业和政府得到了广泛的应用,有大量经验丰富的管理员。MS SQL SERVER 数据库的管理和操作是最简单的,整个系统的安全性和稳定性也较好,而且性能价格比最高,完全满足人口管理的稳定安全的要求,同时节约资金,降低成本,是我们理想的选择。
因此,基于对人口管理系统的性能最优,安全稳定性和易于管理的综合要求,我们建议选择Microsoft SQL SERVER数据库作为后台数据服务基础。
数据库和多媒体的未来发展情况
数据库是为某种特殊目的组织起来的记录和文件的集合.传统的数据库管理系统在处理结构化数据文字和数值信息等方面是很成功的.但是在计算机辅助设计/制造和办公自动化等领域中处理大量的存在与各种媒体的非结构化数据如图形图像和声音等传统的数据库信息系统就难以胜任了因此需要研究和建立能处理非结构化数据的新型数据库多媒体数据库.多媒体数据库是建立多媒体信息管理系统与多媒体应用系统最重要的工具.多媒体数据库技术从作为传统数据库的一种高级应用开始到作为适用于多媒体数据的数据库管理系统历经近十年的研究与发展并将是未来数据库系统研究与发展的方向.
多媒体数据库的几种实现方法
3.1 从关系数据模型发展多媒体数据库
关系模型以其严密的关系理论和简明的用户界面在常规数据的信息管理中
发挥了巨大作用.但是面对应用领域所涉及到的图形图像文字声音动画等多媒体数据,传统的数据库技术在数据模型数据类型定义语言操纵语言存储结构和存取路径等方面都无法适应.例如, 关系模型的规范关系要求数据项具有原子性, 而上述复杂的应用对象大多具有层次结构, 要求一个数据项能存放一个递归的关系, 即存入一个具有层次结构的对象, 因此传统的关系模型是完全不能适应多媒体数据的处理要求的, 必须从概念和体系结构上做较大的扩展与修改才能建立相应的多媒体数据库管理系统.对关系模型作以下扩展
1) 扩展基本关系类型支持复杂对象.这一扩展必然导致违反传统关系模型是第一范式的要求即关系定义中的每个属性所定义的类型必须是系统所支持的内部类型.这样扩展后属性可以不是系统所支持的内部类型而是用户自定义类型.
2) 对关系模型提供的操作加以扩充.传统的关系数据模型的数据操作能力十分有限只适用于事务处理领域.把传统的关系模型上的操作作为系统的缺省功能加以实现并提供这样的机制使用户能根据所定义的数据类型扩展其功能如新的存取复杂查询和完整性约束等这样就可以很好地支持抽象数据类型的概念.
3) 扩展面向对象的风范.如继承和动态联编面向对象的风范.
多媒体数据库对关系模型作一定的扩充后就能在可扩充的数据库管理系统中支持具有面向对象功能的许多新的应用而且改造和开发成本也较少.由于多媒体数据模型是对传统关系模型的扩展这就意味着它不能丢掉传统关系数据模型所具有的数据操作功能因此多媒体数据库的数据操作分为两部分一部分是传统SQL 语言所支持的功能另一部分操作功能是通过用户自定义的方式实现的即用户采用一种高级语言如C++ 来定义某个类型所独具的数据操作功能.
3.2面向对象数据库
面向对象数据库模型中的对象属性方法消息及对象类的层次结构和继承等特点使其能较好
地解决多媒体信息管理面临的问题因而受到人们的重视.在面向对象的系统中将类似的对象组合在一起形成一个对象类.属于同一类的对象具有相同的属性名和定义在这些属性上的方法.他们响应同样的消息.系统中的对象除了具有聚合的联系外还有一种概括的联系.采用面向对象数据库的处理模式传统数据库所面对的许多难题可得到解决.它可以方便灵活地处理图形图像声音文字和动画等多媒体信息尤其是具有层次结构的复杂的对象.虽然面向对象数据库是实现多媒体数据处理较理想的途径然而面向对象的数据模型目前尚无一个统一的标难缺乏坚实的理论基础许多实际技术还不够成熟,目前应用此技术开发成功的例子并不多.为了更好地满足多媒体数据库管理的需求需做进一步研究和改进.
3.3分布式超媒体数据库
超文本技术提供了对多媒体对象的另一种管理方式.超文本Hypertext 是一种非线性的信息组织方式.传统的文本是线性组织方式即将信息按单一的顺序编排.超媒体Hypermedia 技术是超文本技术与多媒体技术的结合.即按超文本的思想来管理多媒体对象.
超媒体技术不同于传统的数据库技术.它对数据不要求有统一的定义统一的结构.超媒体系统由节点和链组成.节点上存储有各种媒体形式的信息通过链来建立媒体间的联系.超媒体技术能更真实地反映现实世界中信息的表现形式及其联系也更接近人们的发散式思维.
超媒体模型的主要功能特性有
1) 超媒体数据库是由声文图类的节点组成的信息网络, 它构成一个多媒体文档.
2) 用户可以方便地创建节点及链接新节点的链, 还可以利用不同的编辑工具生成各种媒体文档如文本视频图像等然后利用著作工具生成节点将节点加入到数据库中用链链接起来形成新的超媒体数据库.用户还可以进行删除节点编辑节点等操作.
3) 超媒体系统支持标准窗口操作屏幕中的窗口与数据库节点一一对应. 4) 支持对数据库的浏览与检索.浏览与检索是超媒体信息系统最重要的功能.
5) 做简单推理.超媒体网络也可以作为一种知识表示方法类似于人工智能中的语义网络.如果将超文本与推理机制结合起来可以构造出简单的推理系统设计出-些新颖的知识系统和专家系统.
可见多媒体信息要求我们开发浏览查找和显示多媒体数据库内容的新方法使得用户可以快速有效地查看大容量的多媒体数据库这是对下一代数据库系统的挑战.多媒体数据库应该支持同一媒体的多种表现形式支持复杂媒体的表示和处理能对多种媒体进行查询和检索.图像和语音信息基于内容的查询和检索是目前急需解决的难题.随着多媒体数据库研究工作的深入多媒体数据库的应用将逐步推向各行各业.
因篇幅问题不能全部显示,请点此查看更多更全内容