1.2. 网址

启动浏览器后,一般我们需要在浏览器的地址栏中输入一个地址来访问万维网中的某个资源,通常我们称该地址为“网址”。

1.2.1. URL

“网址”是通俗的说法,它的专业术语是统一资源定位符(Uniform/Universal Resource Locator,常缩写为URL),最初由 蒂姆·伯纳斯-李 发明,用来对万维网资源进行唯一标识,即每个有效的URL只能访问到唯一的资源。

一个比较完整的URL看上去是这样的:

http://zh.wikipedia.org:80/w/index.php?title=%E7%BB%9F%E4%B8%80%E8%B5%84%E6%BA%90%E5%AE%9A%E4%BD%8D%E7%AC%A6&printable=yes

其中,

  • http,是 协议
  • zh.wikipedia.org,是 域名
  • 80,是 端口
  • w,是目录名
  • index.php,是文件名
  • “?”及以后的字符,是用户请求信息

协议,指的是应用层 网络传输协议HTTP 最为常见,它定义了浏览器和Web服务器请求和应答的标准。HTTPSFTP 等也是常见的可以出现在URL中的协议名。

如果不是打开本地 文件系统 中的文件,浏览器需要从万维网的某台Web服务器(web server)上获取资源。Web服务器是互联网上一台安装了某种web服务器软件(如 ApacheInternet Information Services (IIS) )的计算机,它的作用是接受用户通过浏览器发出的请求,并将请求的结果发送到浏览器中。为了完成这种信息交互,我们需要在互联网中标识浏览器所在的客户端计算机和服务器,标识的方法是为它们指定不同的 IP地址,这就像电信语音通讯过程中两部电话的电话号码一样。为了便于计算机处理,IP地址是一串便于计算机处理的数字,用户很难对其进行记忆,所以人们发明了 域名(domain name) 这种简短、具有一定含义、便于记忆的名称来和IP地址进行对应。上例中,zh.wikipedia.org 就是域名,它标识了 维基百科 的某台服务器,在请求过程中该域名会被转换为类似 208.80.154.224 的IP地址。本例中,如果将URL中的域名部分替换为上述IP地址,这个URL仍然是有效、可用的。

由于80是HTTP协议的默认端口,所以此处“:80”可以省略;非80端口不可省略。

上面已经提到,web 服务器也是一台计算机,它的文件组织和我们平时用的计算机没有差别,上例中的 w 是一个文件夹名,其中存放了一个名称为 index.php 的文件,即 URL 中一般需要具体指定我们要访问的是哪个文件夹中的哪个文件。

在访问 web 服务器上的某个文件时,有时我们还可以附加一些参数作为文件名之外的请求信息,上例中“?”及以后的那些字符即是这种情况,它的具体形式及含义在 以后的章节 中会进行介绍。

在协议和服务器域名(或 IP地址)之间存在三个字符“://”,其它部分使用“/”分隔。有趣的是,蒂姆·伯纳斯-李 一次接受采访时承认双斜杠“//”事实上并非必要,但这一设计还是沿用至今。

如果聚齐了所有要素,一个 URL 会显得非常冗长,不利于分享,特别是在微博等存在字数限制的社交网络平台上。短网址服务 应运而生,比如,上述地址可以使用 百度短网址服务 缩短为 http://www.dwz.cn/rPzh9 。短网址会被 重定向 至原来的URL。但是,由于短网址表达的含义没有完整的URL明显,我们无法直接从一个短网址判断出任何关于其对应资源的信息。

1.2.2. 域名

URL中的域名(domain name)是互联网上人们熟悉、易于记忆的由一串用“.”分隔的名字组成的某一台计算机或计算机组的名称。域名转换为IP地址的过程称为 域名解析,这项工作是由 域名服务器(Domain Name Server,DNS)完成的。

域名中的字符不区分大小写。域名一般不能超过5级,从左到右域的级别越高,高的级域包含低的级域。域名在整个Internet中是唯一的,当高级子域名相同时,低级子域名不允许重复。多个域名可以指向同一IP地址。

常用的类别顶级域名有:

  • .com,原供商业机构使用
  • .net,原供网络服务提供商使用
  • .org,原供不属于其它类别顶级域名类型的组织使用
  • .edu.gov.mil

人们最熟悉的类别顶级域名是.com,互联网时代也经常被称为“.com时代”。今天,.com.net.org已经不限制给特定类型的机构使用;.edu.gov.mil由于历史遗留问题一般只供美国的教育机构、政府部门和军事机构专用。除此之外,.aero.biz.coop.cat.jobs等顶级类别域名也已经或正计划投入使用。

常见的顶级地理域名有:

顶级地理域名,一般适用于所在国家、地区内部各机构、企业。此类域名较顶级类别域名更为简短,两个英文字母的组合可能带来除了地理位置含义之外的丰富联想,如一家私营公司在2000年以5,000玩美元向太平洋小国 图瓦卢 购得 .tv 域名用于电视、视频、影音类网站域名进行运营 [1]。另外,结合顶级地理域名的使用,互联网上诞生了一些比较有创意的域名,比如书签类社交网站 Delicious 的域名del.icio.us,如果这是一个美食网站就更贴切了。

为了方便理解,可以结合顶级域名在设计时的用途的相关英文全称进行记忆。比如,com是commercial的缩写,cn是China的缩写。

除了顶级域名,还有二级域名如:zh.wikipedia.org中,wikipedia就是二级域名。再下来就是三级域名,即最靠近二级域名左侧的字段,从右向左便可依次有四级域名、五级域名等等 [1]。域名www.cumt.edu.cn中,cn是顶级地理域名,edu是二级域名,cumt则是三级域名,而此处的www作为一个前缀表明当前域名对应着万维网服务,每一级域名由英文半角句号分隔。

互联网名称与数字地址分配机构(Internet Corporation for Assigned Names and Numbers,ICANN) 控制根域并全面管理域名和IP地址的分配。 互联网信息中心(Internet Network Information Center,InterNIC) 负责登记域名与IP地址,与它对应,国内有一个 中国互联网络信息中心(China Internet Network Information Center,CNNIC) 作为中国大陆顶级地理域名cn的注册和管理。

域名的注册和使用不是免费的。用户可以到 Godaddy(https//www.godaddy.com)万网(http://www.net.cn) 等域名服务商的网站并进行在线域名注册,大部分域名的年使用费不超过人民币100元。域名注册之前应该确定待注册域名的可用性,不能使用已经被注册过的域名或商标作为自己的域名,域名服务商会在线提供一种被称为 WHOIS 的服务帮助用户筛选可用域名。

简单易记、代表一定含义是域名注册的主要原则。g.cn6.cn 这种四个字符的域名是世界上最短的域名。fund.com 在2008年以近1,000万美元的价格完成转让成为最贵域名 [1]