RFC3986 规定了 URL 中非保留字符,即无需转义的没有任何特殊含义的字符,其定义如下:unreserved = ALPHA / DIGIT / “-” / “.” / “_” / “~”其中 0xE698A5 是汉字“春”的 UTF8 码值,0xE88A82 是汉字“节”的 UTF8 码值。
如果一定需要一句话来总结本文的主要内容,那么RFC3986中的这句定义一定是最合适的:The term “Uniform Resource Locator” refers to the subset of URIs that, in addition to identifying a resource, provide a means of locating the resource by describing its primary access mechanism.
URL是统一资源定位符,对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。也可认为由4部分组成:协议。URL的一般语法格式为:协议 :// 主机名 / 路径 / #信息片段。
URL 优化就是指通过对URL各组成部分进行适当的调整,以提高URL搜索引擎的友好性。它包括三部分:第一、对域名、目录、文件的命名第二、分隔符的使用第三、URL长度及关键字词频的控制。这三部分相互制约、相互影响。
在指出这个问题之前,首先我们要清楚以下几点:互联网上的所有数据都是存储在主机上。21世纪的每个人应该都熟悉网上冲浪的过程,我们上网的实质就是获取网址对应主机上的数据并在用户主机上进行展示,那么我们就该怀疑一个问题:互联网中的任意两台主机通信是依靠IP地址进行的,而我们上网只是输入的网址,并不是IP地址,怎么就能找到对方主机并获取它的数据呢?