この記事では、当たり前のように使っている「URL」とは何を現しているのかをわかり易く紹介しています。身近な「URL」ですが、内容を理解している人は少ないでしょう。「URL」の細部を覚えなくても、一度わかればwebのモヤモヤも吹き飛びます。
URLは何を略したものなの?
URLは、Uniform Resource Locatorの頭文字です。ウェブサイトのアドレスで、ネットワーク上のファイル(リソース)の場所を示す標準的な表記法です。ただし、正式にはURI(Uniform Resource Identifier)でした。
正式名のURI は、URLが普通に使われるようになって一般化したため使われなくなったそうです。
URLの構成
URLの構成例を、日立製作所のホームページを例に紹介します。
日立製作所のホームページアドレスは「https://www.hitachi.co.jp/」ですが、個別のページの場合、例えば「ニュースリリース」のアドレスは、「https://www.hitachi.co.jp/New/cnews/index.html」になります。
httpsとは?
「https://www.hitachi.co.jp/New/cnews/index.html」の最初に表記されるhttpsはスキーム名と呼ばれるものです。
スキーム名は、ホームページなどを閲覧する時のソフトウェアがwebサーバにアクセスするためのプロトコル(手順や約束事)のことです。
httpsはHypertext Transfer Protocol Secureの頭文字で、従来のhttpを暗号化して通信を安全に行う仕組みを持っています。
日立製作所の元々のアドレスは、「http://www.hitachi.co.jp/」ですが、後にhttps化したため、どちらのアドレスでもアクセスできるようになっています。
://とは?
「:(コロン)」は、その後ろにあるリソース(ファイル)の場所を示し、「//」は、コロンに続く部分が「ホスト名」であることを示しています。ホスト名とは、数字の羅列を、人にも判るように文字列にしたものです。
www.hitachi.co.jpとは?
「www.hitachi.co.jp」は、ホスト名(www)とドメイン名(hitachi.co.jp)です。この後ろにはポート番号が続きますが、普通は省略されます。
「www」は、World Wide Webの頭文字で、インターネットで文書や画像、動画などを見ることや公開する仕組みのことです。普通は、wwwのことをウェブと呼びます。
ウェブは、インターネット上にある無数の文書同士を結びつけています。
New/cnewsとは?
「New/cnews」は、webサーバ内のどこにファイルがあるのかを示す「パス名」です。
index.htmlとは?
「index.html」は、ファイル名を表しています。
パス名を省略する場合は、webサーバ側で設定しているファイル名「index.html」になります。
以上をまとめると、「https://www.hitachi.co.jp/New/cnews/index.html」の意味は、「www.hitachi.co.jp」というwebサーバが、公開している「New/cnews」内にある「index.html」ファイルを「https」通信で、転送するように要求していることを表しています。
まとめ
以上で、普段何気なく使っている「URL」のことを分かって頂けたと思います。「URL」を一言で言うと、ネットワーク上のファイルの場所を示す標準的な表記法のことです。
この標準的な表記法のスキーム名は、当初「http」が主流でしたが、盗聴の危険などに対応するため、ネットバンキングやクレジットカードサービス、個人情報登録時に用いられていた「https」を使うようになりました。
「https」にすると、内容が暗号化されているので盗聴されても中身を開けられません。また、内容を改ざんされても異常として検出されます。
さらに、接続先のwebサーバが本物の情報かどうかを検証することもできるようになっています。
インターネットは、悪いことをする人がいる怖い世界ですが、一度使ったら便利で、とても手放せないでしょう。
ウェブの仕組みや用語は普段使っているものとは違いますが、努力を惜しまなければ、視界は広がります。