什么是元数据?


  1. 名称的由来和概念的释义
  2. 单数还是复数?
  3. 特征和用途
  4. 元数据的类型
  5. 构成和设计
  6. 元数据标准
  7. 参考文献
你认为
什么是元数据?
(法语视频)
Metadata video


名称的由来和概念的释义

“meta”这一前缀来自希腊语,是“之中,伴随,之后”或者“改变”(韦氏字典)的意思。它指的是遵循另外某个概念、并把这个概念考虑在内的一个概念。 因此,元数据(metadata)是从数据发展而来,同时作为数据的一种功能。这就是为什么我们将其称为“数据的数据”或者“信息的信息”。在实际使用中,元数据以标签或标记的形式存在,用于标识所有类型的信息。“一条元数据记录由一组属性或元素组成,这些属性或元素对于描述被查询的资源是必需的。例如,一种在图书馆中常见的元数据系统——图书馆书目。它包含了一组含有多个元素的元数据记录,这些元素描述了一本书或图书馆里其它文献的如下属性:作者、题名、创作或出版日期、主题以及标明该文献排架位置的索书号。”( Hillmann)元数据也可以被理解为有关资源的形式和内容的概要信息。

Top


单数还是复数?

“data(数据)”一词来自于拉丁语,可以用datum (单数)或者data(复数)表示。但是,在英语中,data既可以表示单数也可以表示复数(韦氏字典)。例如,在表示“是什么元数据”的含义时,我们既可以用单数形式提问:“What is metadata?”(将元数据看成是一种事物),也可以用复数形式提问:“What are metadata?”(将元数据看成是可数的事物)。这两种用法都是正确的,但单数形式更常用,特别是在非学术性质的文章中。为符合不同语言用户的使用习惯,本网站在英语文本中采用单数形式,在法语文本中采用复数形式。

Top


特征和用途

元数据所描述的资源可以是电子形式的,也可以是非电子形式的,并且不局限于文本资源(例如,人工制品、视觉材料、肖像画、声音文件等等也包括在内)。此外,元数据可应用于不同层次(例如,它可以全局地描述整个资源集合,或者描述集合中的某一特定资源,或者描述某一资源中的一个特定元素,比如一件多媒体产品中的一种特殊声音)。

元数据有助于以一种统一和稳定的方式描述和组织存储在不同介质上的信息。通过这一功能,元数据还“提供了一种语境,使得过去的信息易于被获取、检索和理解,不会受时间和技术改变的影响。”(
Secretariat of the Treasury Board of Canada) 正如Weibel和Lagoze这两位元数据发展领域的权威专家指出的那样:“[元数据允许]对资源的替代内容进行存取,这与对资源本身的内容进行存取是截然不同的。”(Diane Hillmann)

因此元数据有助于查找和描述信息资源以促进和改善对资源的检索、管理和利用。“使用元数据的主要目的就是改进对信息的管理和检索。”(
National Library of Australia) 在那些需要制作或管理大量文件的环境下,元数据有多种不同的用途。例如,在图书馆里,使用标准工具生成的元数据被广泛用于资源描述,提高了检索的效率和可靠性。AACR2R和MARC21就是典型的例子。在网络环境下,元数据被用于尽可能地挑选出大量的可用信息,从而改进万维网上可用信息的可获取性。“描述标准的广泛使用和在电子资源上的应用,将改进对来自‘因特网平民’的相关信息的检索。”(Diane Hillmann) 因此,除了捕获和检索科研语境中的结构化信息之外,元数据还可以帮助组织电子资源,促进其互用性,验证其标识,以及确保对它们的长期保存。一般情况下,元数据的公认用途包括:(1) 描述和发现资源,(2)管理资源集合,以及(3)保存数字化资源。(Soft Expèrience)

Top


元数据的类型

人们设计了多种类型的元数据以适应不同的信息管理需要。描述性的元数据用于识别、发现和访问信息,也可以用于评价资源。文件保存型元数据用于整理、验证和存档某一机构的资源,随着电子信息的出现,这种元数据也被看作是“一种帮助保证记录及记录中信息的意义、易管理性和长期可用性的工具”(New South Wales Recordkeeping Metadata Standard)。此外,保存性的元数据还具有帮助长期保存数字化资源的特殊作用。但是,不论使用元数据的目的是什么,所有类型元数据的共同点就是对资源在物理上和智力上的管理,以确保在当前和未来长时间内都能使用这些资源。

Top


构成和设计

元数据被表示为一组必须或可选的元素和属性。它们使人们能够用较为标准化的方式给资源添加标签。属性的内容要与元数据的作用相关。元数据可以跟相应的数字对象存储在一起(如HTML文件)或者存储在独立的介质上(如图书馆书目)。将元数据和数字资源存放在一起的好处是它不会丢失,两者间的连接是可靠的,对两者的更新是同时进行的。关于这一主题的详细信息,参见Understanding Metadata

值得一提的是有时候元数据不能与某些特定的资源集成。此外,存储在一个单独的数据库中的元数据通常更易于被管理。尽管如此,随着时间的推移,我们将会看到越来越多的元数据与其所描述的资源被整合在一起。

此外,由于元数据通常是由不同的用户或机构共享的,因此它不能被随意使用。如果任何人都可以决定和撰写元数据内容,元数据就不能被共享和协同操作了。没有构建元数据的共同规则和原则,元数据及相应资源就不能被充分利用,或者根本就不能被利用(
Soft Expèrience)。这种对一致性的需要解释了为什么对元数据标准的采用很快就变得如此必要。

Top


元数据标准

由于多种专业团体都使用元数据来管理、描述和保存他们的丰富多样的资源,许多不同的标准考虑到了他们的需求。这些需求的多样性在元数据地图的不同线路上得以表示。因此,每个标准在一个网络的更宽广的语境中展示出来,这个网络是由一般的和专门的计划、倡议和标准组成。

Top


参考文献

Hillmann, Diane. Using Dublin Core. http://www.dublincore.org/documents/2001/04/12/usageguide/. Accessed 2005 03 23.

National Library of Australia. Meta Matters.
http://metabrowser.dtdns.net/dcanz2/mb.aspx. Accessed 2005 03 23.

New South Wales Recordkeeping Metadata Standard. New South Wales Recordkeeping Metadata Standard.
http://www.records.nsw.gov.au/publicsector/rk/rib/rib18-en.pdf. Accessed 2005 03 23.

Secretariat of the Treasury Board of Canada. The Draft Management of Government Information (MGI) Policy.

Soft ExpÉrience. Métadonnées : une initiation.
http://peccatte.karefil.com/Software/Metadata.htm. Accessed 2005 03 23.

Understanding Metadata.
http://www.niso.org/standards/resources/UnderstandingMetadata.pdf. Accessed 2005 03 23.


Top