<note important> 请各位同学注意:
by 张老师 2011-09-23 </note>
元数据(Metadata)被分为三层:
元数据的定义:data about data
标题,作者,语言,出版商,etc. 事件,情形,对象,时间,地点etc.
1、Domain-dependant Metadata Standards(非独立域的数据元标准)
by US Geographic Data Committee
by the European Environmental Catalog
an ANSI standard for the exchange of product model data
a lightweight XML vocabulary for describing websites, ideal for news syndication
provides specification for hospital records and medical information management accredited by ANSI
2、Domain-independent Metadata Standards(独立域的数据元标准)
此标准用于提供:
a 概念体系 b 逻辑描述 c 数据与元数据直接的交换
此标准把数据元素分为3个部分:
a 对象 b 属性 c 表现
更多信息参见:http://metadata-standards.org/11179/
broaden to other media with a link to the ISO/IEC 11179 standard
a 每个都柏林核元素由10个来自ISO/IEC 11179标准的属性定义, b 其中6个属性都柏林核元素中广泛存在(下图所示属性3,4,5,7,8,9)
a 被W3C提高而当作数据处理元数据的基础 b 允许多样元数据方案被人类阅读并且被机器从语法上分析 c 具体目标包括:
资源发现-提供更好的搜索引擎容量 目录-描述智能软件代理中目录和有效的关系 内容等级-描述代表独立的合乎逻辑的”文件”的页的合集 知识产权-描述网页的知识产权 隐私优先与政策-用于用户与站点 数字签名-建立一个用于商业贸易、合作和其他应用的”信任网页”资源描述的构架
a 包含以下集合:资源、文字、属性(资源的子集)、 声明(其中每个元素是形式如同<pred, sub, obj>的三元组,pred是属性,sub是资源,obj是资源或者文字) b 书写RDF计划的语言是XML
XML(Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)。Xml是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极其简单易于掌握和使用。
<bookstore> <book category="COOKING"> <title lang="en">Everyday Italian</title> <author>Giada De Laurentiis</author> <year>2005</year> <price>30.00</price> </book> <book category="CHILDREN"> <title lang="en">Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price> </book> <book category="WEB"> <title lang="en">Learning XML</title> <author>Erik T. Ray</author> <year>2003</year> <price>39.95</price> </book> </bookstore>
XML是可扩展标记语言 An XML document is a (Unicode) text with markup tags and other meta-information. XML是有标签和其他信息的纯文本:
■所有 XML 元素都须有关闭标签。
■XML 标签对大小写敏感。
■XML 必须正确地嵌套。
■XML 的属性值须加引号。
■实体引用:
在 XML 中,一些字符拥有特殊的意义。如果你把字符 ”<” 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。 这样会产生 XML 错误: <message>if salary < 1000 then</message>
为了避免这个错误,请用一个实体引用来代替 ”<” 字符: <message>if salary < 1000 then</message>
XML与Access,Oracle和SQL Server等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如:数据索引、排序、查找、相关一致性等,XML仅仅是展示数据。事实上XML与其他数据表现形式最大的不同是:它极其简单。这是一个看上去有点琐细的优点,但正是这点使XML与众不同。
XML与HTML的设计区别是:XML是用来存储数据的,重在数据本身。而HTML是用来定义数据的,重在数据的显示模式。 XML的简单使其易于在任何应用程序中读写数据,这使XML很快成为数据交换的唯一公共语言,虽然不同的应用软件也支持其它的数据交换格式,但不久之后他们都将支持XML,那就意味着程序可以更容易的与Windows、Mac OS, Linux以及其他平台下产生的信息结合,然后可以很容易加载XML数据到程序中并分析他,并以XML格式输出结果。 为了使得SGML显得用户友好,XML重新定义了SGML的一些内部值和参数,去掉了大量的很少用到的功能,这些繁杂的功能使得SGML在设计网站时显得复杂化。XML保留了SGML的结构化功能,这样就使得网站设计者可以定义自己的文档类型,XML同时也推出一种新型文档类型,使得开发者也可以不必定义文档类型。 因为XML是W3C制定的,XML的标准化工作由W3C的XML工作组负责,该小组成员由来自各个地方和行业的专家组成,他们通过email交流对XML标准的意见,并提出自己的看法 (www.w3.org/TR/WD-xml)。因为XML 是个公共格式, (它不专属于任何一家公司),你不必担心XML技术会成为少数公司的盈利工具,XML不是一个依附于特定浏览器的语言
XML英文解释 The Extensible Markup Language (XML) is a general-purpose specification for creating custom markup languages.It is classified as an extensible language, because it allows the user to define the mark-up elements. XML's purpose is to aid information systems in sharing structured data, especially via the Internet, to encode documents, and to serialize data; in the last context, it compares with text-based serialization languages such as JSON and YAML.XML began as a simplified subset of the Standard Generalized Markup Language (SGML), meant to be readable by people via semantic constraints; application languages can be implemented in XML. These include XHTML,RSS, MathML, GraphML, Scalable Vector Graphics, MusicXML, and others. Moreover, XML is sometimes used as the specification language for such application languages.XML is recommended by the World Wide Web Consortium (W3C). It is a fee-free open standard. The recommendation specifies lexical grammar and parsing requirements.
SGML常用来定义针对HTML的文档类型定义(DTD),同时它也常用于编写XML的DTD。SGML的问题就在于,它允许出现一些奇怪的语法,这让创建HTML的解析器成为一个大难题:
1 某些起始标签不允许出现结束标签,例如HTML中<img>标签。包含了结束标签就会出现错误。
2 某些起始标签可以选择性出现结束标签或者隐含了结束标签
3 某些起始标签要求必须出现结束标签,例如HTML中<script>标签。
4 标签可以以任何顺序嵌套。即使结束标签不按照起始标签的逆序出现也是允许的,例如,This is a sample string是正确的。
5 某些特性要求必须包含值,例如<img src=“picture.jpg”>中的src特性。
6 某些特性不要求一定有值,例如中的nowrap特性。
7 定义特性的两边有没有加上双引号都是可以的,所以<img src=“picture.jpg”>和<img src=picture.jpg>都是允许的。
这些问题使建立一个SGML语言的解析器变成了一项艰巨的任务。判断何时应用以上规则的困难导致了SGML语言的定义一直停滞不前。以这些问题作为出发点,XML逐渐步入我们的视野。
XML去掉了之前令许多开发人员头疼的SGML的随意语法。在XML中,采用了如下的语法:
1 任何的起始标签都必须有一个结束标签。
2 可以采用另一种简化语法,可以在一个标签中同时表示起始和结束标签。这种语法是在大于符号之前紧跟一个斜线(/),例如<tag />。XML解析器会将其翻译成<tag></tag>。
3 标签必须按合适的顺序进行嵌套,所以结束标签必须按镜像顺序匹配起始标签,例如this is a samplestring和</script><script>while(1){alert(“this is a samplestring”)}</script>这好比是将起始和结束标签看作是数学中的左右括号:在没有关闭所有的内部括号之前,是不能关闭外面的括号的。
4 所有的特性都必须有值。
5 所有的特性都必须在值的周围加上双引号。
这些规则使得开发一个XML解析器要简便得多,而且也除去了解析SGML中花在判断何时何地应用那些奇怪语法规则上的工作。仅仅在XML出现后的前六年就衍生出多种不同的语言,包括MathML、SVG、RDF、RSS、SOAP、XSLT、XSL-FO,而同时也将HTML改进为XHTML。
如果需要关于SGML和XML具体技术上的对比,请查看W3C的注解,位于:http:///TR/NOTE-sgml-xml.html
如今,XML已经是世界上发展最快的技术之一。它的主要目的是使用文本以结构化的方式来表示数据。在某些方面,XML文件也类似于数据库,提供数据的结构化视图。这里是一个XML文件的例子:
<?xml version=“1.0” encoding=“ISO-8859-1”?>
<bookstore>
<book catalog=“Programming”>
<title lang=“en”>C++ Programming Language</title>
<author>Bjarne Stroustrup</author>
<year>1998</year>
<price>98.0</price>
</book>
<book catalog=“Networking”>
<title lang=“en”>TCP/IP Illustrated</title>
<author>Richard Stevens</author>
<year>1996</year>
<price>56.0</price>
</book>
</bookstore>
XML和HTML的不同可以归纳为3点:
① XML扩展性比HTML强 XML(Extensible Markup Languages)是扩展标记语言的英语缩写,他可以创建个性化的标记语言,可以称之为元语言。XML的标记语言可以自定义,这样可以提供更多的数据操作,而不像HTML一样,只能局限于按一定的格式在终端显示出来。HTML的功能只有浏览器放入显示和打印,仅仅适合静态网页的要求。
② XML的语法比HTML严格 由于XML的扩展性强,它需要稳定的基础规则来支持扩展。它的严格规则为: 1、起始和结束的标签相匹配 2、嵌套标签不能相互嵌套 3、区分大小写 相对应XML的严格规则,HTML语言并没有规定标签的绝对位置,也不区分大小写,而这些全部由浏览器来完成识别和更正。
③ XML与HTML互补 XML可以获得应用之间的相应信息,提供终端的多项处理要求,也能被其他的解析器和工具所使用,在现阶段,XML可以转化成相应的HTML,来适应当前浏览器的需求。 XML 工具
XML如果有一个好的编辑器就能够减少很多麻烦
1 、XML Notepad 一种软件 软件大小: 1872 KB 软件语言: 英文 软件类别: 国外软件 / 共享版 / 字体工具 应用平台: Win9x/NT/2000/XP/2003 微软发布的XML Notepad,这是一个简单+好用的XML阅读和编辑工具,支持多种语法显示和数型结构排列并提供了大量编写XML所需的工具.
2、XML Spy
3、Xeena
4、Xmetsal
■多媒体内容描述接口
1.关于内容的信息
静止图片,图形,三维模型,音频,语音,视频以及它们的结合
2.目标
支持使用标准描述的多媒体内容的有效搜索 最好用文本信息的描述
■域名独立元数据标准
1.描述符(DS):描述的功能,属性或属性组的MM内容
2.描述方案(DSs):DS指定的结构和语义的组件 (可能是其他Dss,DS,或数据类型)
3.数据类型
4.分类计划(CS):列出了明确的条款及意义
5.系统工具
6.可扩展性:例如,新的DS’s和D’s,CS的注册权
* 存储和带宽要求
一幅图像大小为 480 x 600 (每个像素24比特), –864k 字节 (无压缩). –两秒内传送 => 3.456Mb/s. 1GB 硬磁盘 –1.5小时of CD音频 或者 –36秒电视播放质量的视频 –需要800秒传送时间 (10Mbits/s网络).
* 延迟和延迟颤动要求
* 其他要求
为了提供统一的构架去指定和保证那些各异的要求,一种叫做服务质量(QoS)的概念被引进来.
文件系统是操作系统中最显而易见的部分.
操作系统的可用性和便捷性中非常重要的因素.
传统文件系统的主要目标:
多媒体文件系统的主要目标:
数据管理:
磁盘数据跨盘:
根据定义RAID有三个性质:
RAID的目标:
八种不同性能的RAID:
以521字节为一组分布在设备中的数据叫做分段.多个分段组成数据块.
完全 冗余
RAID 3是使用了奇偶校验的并行传送技术。RAID 3以并行方式存放数据,校验码在写入数据时产生并保存在另一个磁盘上。需要实现时用户必须要有三个以上的驱动器,读写速率很高,因为校验位比较少,因此计算时间相对比较少。只提供查错而没有纠错功能。适合需要大量IO的设备。
RAID 4是带奇偶校验码的独立磁盘结构。RAID 4有与RAID3类似之处,不同之处在于它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。而RAID 3则是一次一个区块。它的特点和RAID 3类似。数据恢复比RAID 3困难。适合应用于高IO需求,不适合高数据传输率需求的设备。
RAID 5是采用分布式奇偶校验的独立磁盘结构。RAID 5与RAID 4的组织方式相似,但是避免了RAID 4中的瓶颈。RAID 5的奇偶校验码存在于所有磁盘上,读出效率很高,写入效率一般,块式的集体访问效率较高。因为奇偶校验码在不同的磁盘上,所以提高了可靠性,允许单个磁盘出错。适合应用于具有大量随机的IO访问,而较少有大块数据的设备。
RAID 6是采用两种存储的奇偶校验码的磁盘结构。在纠错能力上对RAID 5进行的改进,数据更可靠
RAID 7是优化的高速数据传送磁盘结构。RAID7所有的I/O传送均是同步进行的,可以分别控制,这样提高了系统的并行性,每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。具有很高的数据访问效率。
数据存储采用的策略依靠存储技术,存储设计和数据本身的特性. 任何存储都有以下几个特征:
作为电脑外围设备的存储技术, 光学媒质是多媒体环境中最流行的.
分布式(distributed)