语义网

 简介:

语义网(Semantic Web) 是一个由万维网联盟的蒂姆·伯纳斯-李(Tim Berners-Lee)在1998年提出的一个概念,它的核心是:通过给万维网上的文档(如:HTML)添加能够被计算机所理解的语义(Meta data),从而使整个互联网成为一个通用的信息交换媒介。语义万维网通过使用标准、置标语言和相关的处理工具来扩展万维网的能力。不过语义网概念实际上是基于很多现有技术的(某些技术甚至可以追溯到20世纪60年代末期), 也依赖于后来和text-and-markup与知识表现的综合.

Sir Tim Berners-Lee(Web创始者)关于语义网的观点成为人们的重要关注已经很长一段时间了。事实上,它已经象大白鲸一样神乎其神了。总之,语义网关涉到机器之间的对话,它使得网络更加智能化,或者象Berners-Lee描述的那样,计算机“在网络中分析所有的数据—内容,链接以及人机之间的交易处理”。在另一个时候,Berners-Lee把它描述为“为数据设计的似网程序”,如对信息再利用的设计。

  就象Alex在《通往语义网》中写道,语义网的核心是创建可以处理事物意义的元数据来描述数据,一旦电脑装备上语义网,它将能解决复杂的语义优化问题。

  因此,什么时候语义网时代才会到来呢?创建语义网的组件已经出现:RDF,OWL,这些微格式只是众多组件之一.但是,Alex在他文章中指出,将需要一些时间来诠释世界的信息,然后再以某种合适的方式来捕获个人信息。一些公司,如Hakia,Powerset以及Alex自己的adaptive blue都正在积极的实现语义网,因此,未来我们将变得关系更亲密,但是我们还得等上好些年,才能看到语义网的设想实现。

基本特征

(1)语义网不同于现在WWW,它是现有WWW的扩展与延伸;

(2) 现有的WWW是面向文档而语义网则面向文档所表示的数据;

(3) 语义网将更利于计算机“理解与处理”,并将具有一定的判断、推理能力。

虽然语义网给我们展示了WWW的美好前景以及由此而带来的互联网的革命,但语义网的实现仍面临着巨大的挑战:

(1)内容的可获取性,即基于Ontology而构建的语义网网页目前还很少;

(2)本体的开发和演化,包括用于所有领域的核心本体的开发、开发过程中的方法及技术支持、本体的演化及标注和版本控制问题;

(3)内容的可扩展性,即有了语义网的内容以后,如何以可扩展的方式来管理它,包括如何组织、存储和查找等;

(4)多语种支持;

(5)本体语言的标准化。

语义网与万维网的区别

语义网“不同于现存的万维网,其数据主要供人类使用,新一代WWW中将提供也能为计算机所处理的数据,这将使得大量的智能服务成为可能”;语义网研究活动的目标是“开发一系列计算机可理解和处理的表达语义信息的语言和技术,以支持网络环境下广泛有效的自动推理”。

目前我们所使用的万维网,实际上是一个存储和共享图像、文本的媒介,电脑所能看到的只是一堆文字或图像,对其内容无法进行识别。万维网中的信息,如果要让电脑进行处理的话,就必须首先将这些信息加工成计算机可以理解的原始信息后才能进行处理,这是相当麻烦的事情。而语义网的建立则将事情变得简单得多。

语义网是对万维网本质的变革,它的主要开发任务是使数据更加便于电脑进行处理和查找。其最终目标是让用户变成全能的上帝,对因特网上的海量资源达到几乎无所不知的程度,计算机可以在这些资源中找到你所需要的信息,从而将万维网中一个个现存的信息孤岛,发展成一个巨大的数据库。

语义网将使人类从搜索相关网页的繁重劳动中解放出来。因为网中的计算机能利用自己的智能软件,在搜索数以万计的网页时,通过“智能代理”从中筛选出相关的有用信息。而不像现在的万维网,只给你罗列出数以万计的无用搜索结果。

例如,在进行在线登记参加会议时,会议主办方在网站上列出了时间、地点,以及附近宾馆的打折信息。如果使用万维网的话,此时你必须上网查看时间表,并进行拷贝和粘贴,然后打电话或在线预订机票和宾馆等。但假如使用的是语义网,那么一切都变得很简单了,此时安装在你计算机上的软件会自动替你完成上述步骤,你所做的仅仅是用鼠标按几个按钮而已。

在浏览新闻时,语义网将给每一篇新闻报道贴上标签,分门别类的详细描述哪句是作者、哪句是导语、哪句是标题。这样,如果你在搜索引擎里输入“老舍的作品”,你就可以轻松找到老舍的作品,而不是关于他的文章。

总之,语义网是一种更丰富多彩、更个性化的网络,你可以给予其高度信任,让它帮助你滤掉你所不喜欢的内容,使得网络更像是你自己的网络。

语义网的实现

语义网虽然是一种更加美好的网络,但实现起来却是一项复杂而浩大的工程。

要使语义网搜索更精确彻底,更容易判断信息的真假,从而达到实用的目标,首先需要制订标准,该标准允许用户给网络内容添加元数据(即解释详尽的标记),并能让用户精确地指出他们正在寻找什么;然后,还需要找到一种方法,以确保不同的程序都能分享不同网站的内容;最后,要求用户可以增加其他功能,如添加应用软件等。

语义网的实现是基于XML(可扩展标记语言eXtensible Markup Langauge)语言和资源描述框架(RDF)来完成的。XML是一种用于定义标记语言的工具,其内容包括XML声明、用以定义语言语法的DTD (document type declaration文档类型定义)、描述标记的详细说明以及文档本身。而文档本身又包含有标记和内容。RDF则用以表达网页的内容。

"语义"网是由比现今成熟的网际搜索工具更加行之有效的、更加广泛意义的并且自动聚集和搜集信息的文档组成的。 其最基本的元素就是语义链接

通过下列方法可以提升万维网以及其互连的资源的可用性(usability)和有效性(usefulness):

1."标记"了语义信息的文档。这可以是机器可以理解的关于文档内容(例如文档的作者,标题,简介等)的描述, 或者是描述该网站所拥有的服务和资源.(注意:任何东西都是能被URI-统一资源定位符-所描述的,因此语义网能理解人物、地方、想法、类等等)

2.通用元数据词汇表(本体论)及词汇间的影射使得文档作者知道如何来标记文档方可让机器识别他想提供的元数据.

3.利用元数据为语义网用户执行任务的自动软件代理(agent).

4.为自动软件代理提供特定信息的网络服务 (例如, 可信度服务可以让软件代理查询某个在线商店是否曾经有过不良纪录或者发送过垃圾邮件).

guxing 2014-08-05