User Tools

Site Tools

Writing /home/data/cadweb/personal/zhx/DAM/2012/data/cache/b/b6c9d8dee54c1a47f16328601c82cb52.i failed
Unable to save cache file. Hint: disk full; file permissions; safe_mode setting.
Writing /home/data/cadweb/personal/zhx/DAM/2012/data/cache/b/b6c9d8dee54c1a47f16328601c82cb52.metadata failed
Writing /home/data/cadweb/personal/zhx/DAM/2012/data/meta/coursenote/003.meta failed

Page: coursenote:003 PDF
Writing /home/data/cadweb/personal/zhx/DAM/2012/data/cache/b/b6c9d8dee54c1a47f16328601c82cb52.i failed
Unable to save cache file. Hint: disk full; file permissions; safe_mode setting.
Writing /home/data/cadweb/personal/zhx/DAM/2012/data/cache/b/b6c9d8dee54c1a47f16328601c82cb52.xhtml failed

第三章 多媒体数据库与存储

从20世纪60年代末开始,数据库系统已从第一代层次数据库和网状数据库,进化到第二代的关系数据库系统,进而发展到第三代以面向对象模型为主要特征的数据库系统。但这些数据库系统主要是面向和支持商业与事务处理应用领域的数据管理。进入20世纪90年代以来,人们在从事电子商务、电子出版物等新数据库应用研究中发现,传统数据库的不足,因而提出了设计适应于多媒体特性的新型数据库想法。

多媒体数据库是数据库技术与多媒体技术结合的产物。多媒体数据库不是对现有的数据进行界面上的包装,而是从多媒体数据与信息本身的特性出发,考虑将其引入到数据库中之后而带来的有关问题。多媒体数据库从本质上来说,要解决三个难题:

  1. 信息媒体的多样化,不仅仅是数值数据和字符数据,要扩大到多媒体数据的存储、组织、使用和管理。
  2. 要解决多媒体数据集成或表现集成,实现多媒体数据之间的交叉调用和融合,集成粒度越细,多媒体一体化表现才越强,应用的价值也才越大。
  3. 多媒体数据与人之间的交互性。

本章将主要介绍多媒体数据库的设计难点,基本架构以及相关大数据存储等方面的内容。

3.1 无处不在的多媒体数据

3.1.1 常用多媒体数据的分类

在我们所遇到的数字媒体应用系统中,存在着多种多媒体数据。按照其信息的表达形式,主要包括文本、 图形、图像、动画、音频、视频等几种类型。

文本数据(text data):文本数据是使用最早,流行最广的数据, 它是用二进制编码表示的字符信息, 包括各种字符和汉字。主要采用文字编辑软件生成, 也可以使用扫描识别或语音识别技术获得。文字中的艺术字是通过图像图形软件所获得的非文本文件。常用的文本文件有 txt、 RTF、DOC、 WPS 等几种格式。

图形数据(graphic data :图形是由计算机按一定算法自动生成的数据。图形表示的不是一个像素阵列,而是一段体现绘画算法的程序及其数据结构。图形数据常见于CAD/CAM应用中,图形可分解为点、线、面等基本图元,所以图形的结构信息可被用于图形的检索。常用的图形文件有 CDR、 AI、WMF、 EMF、 DXB 等几种格式。

图像数据((image data):主要指具有23~232彩色数量的静态图像。可利用图像编辑软件、 扫描仪、 数码相机、 计算机抓屏等方法获得。针对图像管理的数据库研究开展得比较早,具有较成熟的结构,包含各种用于查找和检索的方式方法。常用的图像文件有 BMP、 JPG、 GIF、 PNG、 TIF、 PSD 等格式。

动画数据(animator):是指由二维或三维动画软件所制作出的具有动态感觉的画面。其实质是一系列内容连续的静态图像的连续播放。常用的动画文件有 GIF、 SWF、FLC、 AVI、 MOV 等格式。

音频数据(audio data):形式多样, 例如音乐数据(由符号表示,像五线谱、简谱),语音数据(由波形表示) 。获取的方法是利用计算机系统将模拟声音信号进行 A/D(模/数) 变换,进行数字化采集。对于符号形式的音乐数据,在存储和查找方面可以作为文本处理;而语音数据的检索则受限于语音识别技术的发展,暂时还存在较大困难。常用的音频文件有WAV 、VOC 、MIDI、MP3 、RA 、WMA 等格式。

视频数据(video data):是指由摄录设备所获得的数字视频数据。其实质是连续动态影像的播放。在多媒体数据中,视频数据最具有综合性和代表性,因为视频数据往往融合了声音、文字以及图像等多种媒体数据;且视频数据还引入了时间属性,给管理带来了一些新的问题,如媒体同步的要求。常用的视频文件有AVI、MOV 、MPEG 、WMA 、RMA 等格式。

上述媒体数据类型,还可以按其与时间的关系可分为两大类: 一类是独立于时间的数据, 例文本数据,图形数据,图像数据,此类数据也可称为不连续数据; 另一类是依赖于时间的数据,包括动画数据,音频数据以及视频数据,这类数据也称连续数据。

3.1.2 常用多媒体数据的特点

不同的多媒体数据在信息获取者的视听感官中都会产生不同的影响。充分了解和熟悉各种多媒体数据的特性及作用,掌握在信息技术应用中的规律,才能发挥出应有的作用。

文字的使用范围非常广泛,是多媒体数据中用量最多、 使用最频繁的主要信息。文字的抽象层次比较高, 可用于标示题目、 概括内容要点、 注明提示说明等。但是, 文字给观看者的感官刺激不强烈, 形式呆板不活泼, 长时间的使用容易引起视觉疲劳。

图形的色彩层次不丰富, 一般不支持真彩色, 其信息的真实性较差。当表现三维空间时, 空间透视效果较弱。图形多属于矢量文件, 具有文件数据量小、 网络传送速度快、 放大不变形等优点。图形在信息技术的应用中, 常用来抽象描述物体的形体特征,有时也用它来装饰和美化界面或网页。

图像的色彩层次丰富、表现力极强, 其效果比图形更加真实、 逼真、 生动、 形象, 对观看者产生的感官刺激比较强烈。在二维平面上的空间结构的透视效果比图形的要强的多。但图像文件具有数据量大、 放大易变形的特点。

动画是多媒体数据中最具有表现力的一种信息媒体, 对视觉感官刺激和冲击力最强。它可以忽略事物运动变化过程中的次要因素, 突出强化其本质要点, 忽略细节、 简化过程、 突出重点。在某些时候还可以对其进行艺术夸张处理, 达到渲染气氛和强化重点的作用。利用动画可以虚拟场景和故事情节, 动态地表现事物和现象的发展变化过程。但动画的设计制作过程比较繁杂, 内容除了要有创意外, 制作技术要求条件高, 所需时间长, 三维动画的制作对计算机软硬件配置的要求也比较高。

数字音频主要有语音、音乐和效果声三种类型。语音不仅是声音的载体, 而且还是一种带有情感的信息媒体,常用于朗读和解说。音乐是数字音频中使用最广泛、 作用也较大的一种信息媒体, 具有渲染环境气氛、增强作品感染力、 烘托主题的作用。在数字音频中所占的比例最大, 使用的几率也最多。效果声是一种模拟声响的专用数字音频, 能表达语音和音乐无法表达的特殊音响, 可模拟自然的或非自然的虚幻声响。

数字视频是一种声画同步的视听媒体。具有真实可信、 生动形象的特点, 对视听感官产生的刺激比较强烈,在视听并用的情况下有强化记忆的作用。缺点是文件的数据量很大, 有PAL 和NTSC等制式。文件的压缩编码方式多, 无统一的格式和标准, 文件格式的转换不方便, 不同格式的文件需要有专用的播放器。在设计制作特定的视频素材时, 所需投入的成本很大, 后期编辑制作过程也较费时费力。

3.1.3 多媒体数据的总体特征

从数据管理的角度来看, 多媒体数据主要具有如下几个特点:

(1) 数据量大 多媒体数据量一般都是庞大的。 虽然采取了数据压缩措施,但压缩后数据量依然庞大。以音频和视频为例,放5分钟的音乐,压缩后的数据约为7MB左右;一小时的录像,压缩后的数据约为700MB左右。这样大的数据全部放在磁盘里是不现实的。一般都要采用内存、硬盘、光盘三级存储器系统来存放。

(2) 等时性和同步性 多媒体数据中的连续数据在播放时必须按一定的稳定速率传送数据,称为等时性。 例如,播放音乐或讲话时,数据必须按规定速率连续传播,速率快了、慢了或抖动,则会引起声音的失真,更不能中断或发生较长时间的丢失。在播放电影时,每帧必须按时、按序列播放,不得前后混淆。 此外影视数据和配音数据、字幕数据必须同步,发音和口型在时间上必须对准。 当然,上述等时性和同步性并不一定要求十分准确,应以人的感觉器官不易察觉为准。

(3) 非解释性 声音、图像、影视等数据基本上都是二进制串。与纯文本不同,自身不具备解释含义。 所以多媒体数据如果不另外加一些描述和解释,很难利用。对数据的描述、解释不是数据本身,而是关于数据的数据,也就是元数据。 元数据有些很简单,例如,标识媒体类型(是音频文件还是图像文件)、编码和压缩方式、制作日期、所有者等,可以很方便地获得。有些则与数据内容有关,例如,图像的统计表、图中的物体及其位置、电视镜头的背景及活动对象等,需要到数据中提取,很费时间。而且这些元数据与多媒体数据类型以及应用有关,不可能事先生成所有元数据,有些还要在使用时生成。因此,元数据的生成是多媒体数据管理中一个重要而突出的问题。

(4) 非结构性 多媒体数据往往包含多种不同类型的媒体,而这些媒体信息的采集、存储、加工和传输都是通过不同的方式方法,每种媒体的处理都有自己的理论和技术。即使同一媒体也可以有不同的表示方式。例如,可以是编码形式表示,也可以是二进制非编码形式表示,可以用内部数据结构表示,也可采用无结构的位图表示形式,并且这些数据结构都随具体应用而变化。

(5) 特殊的用户接口及操作 对于音频、视频数据,除了应提供一般数据都有的增、删、改、查等操作外,还应提供与媒体有关的接口和操作。例如,在音视频数据的处理当中,播放、倒退、快进,按内容、序号或时间选播等接口与操作,都是非常重要的。

3.2 多媒体数据库

传统数据库以数字和字符数据为管理对象,一般不涉及诸如图像和声音等媒体信息。但随着近年多媒体数据的激增以及各种多媒体应用市场的崛起,对用于管理多媒体数据的多媒体数据库管理系统(Multimedia Database Management System,MDBMS)以及与其对应的多媒体数据库系统(Multimedia Database,MD)都提出了迫切需求。

3.2.1 多媒体数据库的挑战

相比传统的规范数据,多媒体信息具有数据不规则,没有一致的取值范围,没有相同的数量级,也没有相同的属性集等的特点,这使得在设计多媒体数据库管理系统时将面对多媒体的表示、存储、组织、访问、时空合成与同步、查询与索引机制、版本控制、用户接口等方面带来的问题。

(1) 数据库的组织和存储

媒体数据的数据量大,媒体间的差异也极大,从而影响数据库的组织和存储方式。为了保证磁盘的充分利用和应用的快速存取,必须组织好多媒体数据库中的数据,选择适合的物理结构和逻辑结构。数据量的巨大还反映在支持信息系统的范围的扩大,我们不得不通过网络以分布式存储的方式来存储庞大的多媒体数据,这对数据库在这种环境下进行存取也是一种挑战。

(2) 媒体种类的增加

每一种多媒体数据类型除了都要有自己的一组最基本的操作和功能、适当的数据结构以及存取方式等外,还要有一些标准的操作,包括各种多媒体数据通用的操作及多种新类型的集成。虽然主要的多媒体类型只有那么几种,但事实上,在具体实现时往往根据系统定义、标准转换等演变出很多不同的媒体格式。不同媒体类型对应不同数据处理方法,这就要求多媒体数据库管理系统能够不断扩充新的媒体类型及其相应的操作方法。新增加的媒体类型对用户应该是透明的。

(3) 数据库的查询问题

传统的数据库查询只处理精确的概念和查询。但在多媒体数据库中非精确匹配和相似性查询将占相当大的比重。例如人们常常会通过颜色或形状等本身就不容易精确描述的概念来查询图像和视频,很显然是一种模糊的非精确的匹配方式。多媒体数据复合、分散,及其形象化的特点,注定要使数据库不再是只通过字符进行查询,而应该是通过媒体的语义进行查询。但要了解并正确处理各种多媒体的语义信息相当困难。

(4) 用户接口的支持

多媒体数据库的用户接口肯定不能用一个表格来描述,对于媒体的公共性质和每一种媒体的特殊性质,都要在用户接口上、在查询的过程中加以体现。例如对媒体内容的描述、对空间的描述以及对时间的描述。多媒体要求开发浏览、查找和编辑多媒体内容的方法,以方便用户描述查询需求,并得到相应数据。在很多情况下,面对多媒体的数据,用户有时难以描述自己的查询需求。所以,多媒体数据库对用户的接口要求不仅仅是接受用户的描述,而是要协助用户描述出他的想法,找到他所要的内容。

(5) 长事务处理

传统的数据库处理的事务一般短小精悍,但多媒体数据库管理体系中需要处理一些长事务,如从动态视频库中提取并播放一段数字化影片,往往需要长达几个小时的时间,作为良好的数据库管理系统,应该保证播放过程中不会发生中断,因此不得不增加处理长事务的能力。

(6) 多媒体数据库对服务质量的要求

不用的应用对多媒体数据的传输、表现和存储方式的质量有不一样的要求。系统能提供的资源也要根据系统运行的情况进行控制。我们对每一类多媒体数据都必须考虑这些问题:如何按所要求的形式及时地、逼真地表现数据?当系统不能满足全部的服务要求时,如何合理的降低服务质量?能否插入和预测一些数据?能否拒绝新的服务请求或撤销旧的请求?等等。

(7) 多媒体数据的版本控制

  在具体应用中,往往涉及对某个处理对象的不同版本的记录和处理。版本有两种概念:一是历史版本,同一个处理对象在不同的时间有不同的内容;二是选择版本,同一处理对象有不同的表述或处理,一份合同文献就可以包含英文和中文两种版本。我们需要解决多版本的标识、存储、更新和查询,尽可能减少各版本所占存储空间,而且控制版本访问权限。但现有的数据库管理系统一般都没有提供这种功能,而由应用程序编制版本控制程序。

3.2.2 多媒体数据模型

3.2.3 多媒体数据模型分类

3.2.4 多媒体数据库查询

3.2.5 图像检索系统实例

基于内容图像检索已经发展二十多年,基本技术框架已经成熟,总结一下几个系统。下面的十款搜索引擎可以帮你实现,以图找图,以图搜图,以图片搜索相似的图片。

(1) Tineye (http://tineye.com/) Tineye是典型的以图找图搜索引擎,输入本地硬盘上的图片或者输入图片网址,即可自动帮你搜索相似图片,搜索准确度相对来说还比较令人满意。TinEye是加拿大Idée公司研发的相似图片搜索引擎。 TinEye主要用途有:

  1. 发现图片的来源与相关信息;
  2. 研究追踪图片信息在互联网的传播;
  3. 找到高分辨率版本的图片;
  4. 找到有你照片的网页;
  5. 看看这张图片有哪些不同版本。

(2) Gzopa (http://www.gazopa.com/) GazoPa搜索图片时,不依据关键词进行检索,而是通过图片自身的某些特征(例如色彩,形状等信息)来进行搜索。GazoPa搜索方式有四种: 传统的通过关键词搜索图片,但在传统图片搜索领域GazoPa与google等搜索引擎无法竞争。

  1. 创新的通过图片搜索图片,但在此领域GazoPa无法与TinEye相竞争。TinEye很容易就能搜索出与原图最接近的一些结果,而GazoPa很多时候的搜索结果则完全无法与原图匹配。
  2. 通过手绘图片搜索图片,这种方式其实没太大用处。GazoPa虽然有这样那样的不足之处,但也算是一个很有独创性的搜索引擎。GazoPa目前还处在内测阶段,想要加入测试的可以在官网上留下你的邮箱地址,收到邀请后你就可以测试使用了。
  3. 通过视频缩略图搜索视频,GazoPa仅凭一张视频缩略图就可找到相关视频。只要有截图,就可以找到截图的视频!

(3) Google图像搜索 (http://similar-images.googlelabs.com/) Google实验室的图片搜索:输入一个关键词后,例如“lake”,返回的页面里面点击某个图片下面的”Similar images”按钮,运用Google相似图片搜索功能引擎,即刻可把类似的图片全部搜索出来,展示给用户以便查看。其准确率、相似率相对比较高。

(4) Picitup (http://www.picitup.com/) Picitup是一个刚开始公测的专业图片搜索引擎,功能非常强大,并支持中文关键字的搜索,是国内图片爱好者的不错选择。Picitup主要 支持关键字的搜索,但在它的特色搜索项目——名人匹配搜索(Celebritymatchup)中,你可以通过上传本地照片来进行搜索,不过结果一般让人 失望。Picitup可以通过在搜索结果页选择过滤方式来筛选图片,比如可以按颜色、头像(人脸)、风景、产品四种类别来过滤搜索结果。 Picitup最大特点是提供相似图片搜索,即通过关键字找到初始图片,点击初始图片下面的similar pictures按钮,即可搜索与该张图片类似的图片。其实质和Google实验室类似图片搜索是一样的。

(5) 淘宝图像搜索 (http://imagine.taobao.com) 由淘淘搜的创业团队开发并维护,其搜索结果主要用于方便淘宝买家用户,可根据参考图像更为迅速地搜索到所需商品。

3.3 多媒体元数据

3.4 多媒体数据库系统结构

3.5 多媒体大数据存储

3.6 分布式多媒体数据库

分布式多媒体数据库是(Distributed Data Base,DDB)是数据库技术与计算机网络技术结合的产物。分布式多媒体数据库管理系统泛指能通过网络进行数据通信的、位置离散的、相互独立的多媒体数据库管理系统群组。在分布式数据库中,数据分别在不同的局部数据库中存储、由不同的DBMS进行管理、在不同的机器上运行、由不同的操作系统支持、被不同的通信网络连接在一起。但这种物理上的分布对用户而言是透明的,用户可以在任何地点执行全局操作,整个分布式数据系统在逻辑上是一个统一的整体,内部数据保持全局一致性。在这种系统中,一次交互可能会涉及来自不同物理位置上的多个信息仓库的信息,这在多媒体协作环境中是非常典型的。在一个大的多媒体网络中,数据流量大,合理地将多媒体数据分布与不同的子网中,可以减轻主干网的负载。

分布式数据有同构和异构之分。在同构分布式数据库(Homogeneous Distributed Database System)中,每个节点上都采用相同类型的数据库管理系统。在异构分布式数据库(Heterogeneous Distributed Database System)中,每个节点上的数据库管理系统可以是不同的。

分布式数据库的主要特点:

  • 物理上分布,逻辑上统一。数据存储在多个节点上,但是在逻辑上构成一个整体,被所有用户共享,被一个分布式的数据库管理系统统一管理(Distributed Database Management System)。
  • 节点自治又协作。各个节点上的数据被自己的数据库管理系统管理,完成该节点内的操作。同时各个节点又相互协作,以维持整个系统的一致性,完成全局操作,例如全局的事务(Global Transaction)。
  • 数据冗余度。通过保持多份数据拷贝,提高整个系统的容错能力。

分布式数据库的数据分片

  • 水平分片:按照一定的标准把全局关系的所有的元组划分成不相交的子集,每个子集是关系的一个片段。
  • 垂直分片:把一个全局关系的属性集分成多个子集,并在这些子集上做投影运算,每个投影称为一个垂直分片。
  • 混合分片:水平分片和垂直分片相结合。

数据分片必须保证如下性质:

  • 完备性:全局关系中的所有数据都必须被映射到片段中。绝不允许有数据不属于任何片段。
  • 可重建性:必须保证能够用各个片段重建整个全局关系。对水平分片的分段,用并操作来重建全局关系;对于垂直分片的片段,用连接操作来重建全局关系。
  • 不相交性:各个数据片段互不重叠(对垂直分片的主键除外)。

分布式数据库的数据分布方式:

  • 集中式:所有的数据片段在同一个节点上。
  • 分割式:数据只有一份,被划分为多个数据片段。每个数据片段被指派给一个特定的节点。
  • 全复制式:数据在每个节点上重复存储。每个节点上都有一个完整的数据副本。
  • 混合式:介于分割式和全复制式的分配方式。

分布式数据库的组成。分布式多媒体数据一般有两部分组成:一部分是关于应用所需要的数据的组合,称为物理数据库;另一部分是关于数据结构的定义,以及全局数据的分片、分布的描述,称为描述数据库,也称数据字典或数据目录。分布式数据库中,数据及描述它的数据目录,有全局与局部之分。处理一个用户请求时,分布式数据库管理系统需要访问数据目录,判定必须要访问哪些节点才能满足该请求。如果目标数据存储在多个节点上,就必须进行分布式处理。

分布式数据库的优点:

  • 更适合分布式的管理和控制。允许不同区域、不同级别的用户对自身数据进行局部控制,安全性更好。
  • 更高的可靠性。数据可以被复制为多份拷贝并保存在不同的节点上,使得某台节点故障不会导致整个数据库不可用。
  • 更好的扩展性。用户可以采用分布式数据库技术,在若干个数据库的基础上开发全局应用,这比重建一个大型数据库更简单,更省时。同时通过增加节点,能够提高整个系统的性能和容错性。
  • 更好的性能。如果大部分操作都能在本地节点完成,则能够大量减少数据的传输开销,获得更快的响应速度。

分布式数据库的缺点:

  • 通信开销大,故障率高。在网络传输很慢的情况下,系统响应速度慢。同时通信相关的因素以及系统本身的复杂性,容易导致较高的故障率。当故障发生后,系统恢复也很复杂。
  • 数据处理复杂。需要复杂的逻辑维持整个系统的一致性以及全局性事务的处理。
  • 数据安全性难以控制。不同节点的局部数据库管理员可以采取不同的安全措施,无法保证全局数据都是安全的。

3.7 小结

参考文献

  1. 信息技术中多媒体数据的类型及作用 贵阳学院学报(自然科学版) 2006年1期
  2. 《多媒体信息技术》机械工业出版社 2007年
  3. 《高级数据库技术》 高等教育出版社 2005年
  4. 《数据库系统设计与原理》 清华大学出版社 2004年

版权声明

浙江大学2008-2012版权所有,如需转载或引用,请与 作者联系

coursenote/003.txt · Last modified: 2014/05/22 08:20 (external edit)