Ühtne ressursiidentifikaator: erinevus redaktsioonide vahel

Allikas: Vikipeedia
Eemaldatud sisu Lisatud sisu
Suwa (arutelu | kaastöö)
P pisitoimetamine
1. rida: 1. rida:
'''Ühtne ressursiidentifikaator''' ([[Inglise keel|inglise keeles]] ''Uniform Resource Identifier, URI'') on [[Sõne (andmetüüp)|sõne]], mida kasutatakse infoallika üheseks määramiseks [[veeb]]is.
'''Ühtne ressursiidentifikaator''' ([[inglise keel]]es ''Uniform Resource Identifier, URI'') on [[Sõne (andmetüüp)|sõne]], mida kasutatakse infoallika üheseks määramiseks [[veeb]]is.


== URL ja URN ==
== URL ja URN ==
14. rida: 14. rida:
* '''Volituse osa''', mis koosneb:
* '''Volituse osa''', mis koosneb:
** valikulisest [[Autentimine|autentimise]] osast, mis omakorda koosneb [[Kasutajanimi|kasutajanimest]] ja [[Parool (informaatika)|paroolist]] eraldatuna kooloniga (<code>:</code>),
** valikulisest [[Autentimine|autentimise]] osast, mis omakorda koosneb [[Kasutajanimi|kasutajanimest]] ja [[Parool (informaatika)|paroolist]] eraldatuna kooloniga (<code>:</code>),
** '''[[Host|hostist]]''', mis on kas registreeritud nimi (sealhulgas [[hostinimi]]) või [[IP-aadress]]. [[IPv4]] aadress peab olema kujul, kus arvud on eraldatud punktidega, IPv6 peab olema nurksulgude (<code>[</code> <code>]</code>) vahel,<ref>RFC 3986 (2005), §3.2.2.</ref>
** '''[[host]]ist''', mis on kas registreeritud nimi (sealhulgas [[hostinimi]]) või [[IP-aadress]]. [[IPv4]] aadress peab olema kujul, kus arvud on eraldatud punktidega, IPv6 peab olema nurksulgude (<code>[</code> <code>]</code>) vahel,<ref name="RFC 3986 2005, §3.2.2">RFC 3986 (2005), §3.2.2.</ref>
** valikulisest [[Port|pordi numbrist]], mis on eraldatud hostist kooloniga (<code>:</code>).
** valikulisest [[Port|pordi numbrist]], mis on eraldatud hostist kooloniga (<code>:</code>).
* '''Tee''', mis on tavaliselt hierarhiline struktuur, mille segmendid on eraldatud kaldkriipsudega (<code>/</code>). See struktuur võib olla sarnane [[Failisüsteem|failisüsteemi]] teega, aga sellest ei saa järeldada, et nad on omavahel seotud.<ref>RFC 2396 (1998), §3.3.</ref> Tee on alati defineeritud, kuigi see võib olla tühi (0 pikkusega).
* '''Tee''', mis on tavaliselt hierarhiline struktuur, mille segmendid on eraldatud kaldkriipsudega (<code>/</code>). See struktuur võib olla sarnane [[failisüsteem]]i teega, aga sellest ei saa järeldada, et nad on omavahel seotud.<ref>RFC 2396 (1998), §3.3.</ref> Tee on alati defineeritud, kuigi see võib olla tühi (0 pikkusega).
* Valikuline '''päring''', mis on eraldatud eelnevast osast küsimärgiga (<code>?</code>). Selle [[süntaks]] pole hästi defineeritud, aga tavaliselt koosneb päring võti-väärtus paaridest, kus võti ja väärtus on eraladatud võrdus märgiga <code>=</code> ning paarid on omakorda eraldatud kas [[Ampersand|ampersandiga]] (<code>&</code>) või semikooloniga (<code>;</code>).
* Valikuline '''päring''', mis on eraldatud eelnevast osast küsimärgiga (<code>?</code>). Selle [[süntaks]] pole hästi defineeritud, aga tavaliselt koosneb päring võti-väärtus paaridest, kus võti ja väärtus on eraladatud võrdus märgiga <code>=</code> ning paarid on omakorda eraldatud kas [[ampersand]]iga (<code>&</code>) või semikooloniga (<code>;</code>).
* Valikuline '''ankur''', mis on eraldatud eelnevast osast "trelli" ehk numbri sümboliga (<code>#</code>), mille ülesandeks on sekundaarse ressursi (näiteks pealkirja) poole suunamine. Kui ressurss on näiteks [[HTML]] dokument, siis ankur on tihti mõne elemendi <code>id</code> atribuut.
* Valikuline '''ankur''', mis on eraldatud eelnevast osast "trelli" ehk numbri sümboliga (<code>#</code>), mille ülesandeks on sekundaarse ressursi (näiteks pealkirja) poole suunamine. Kui ressurss on näiteks [[HTML]] dokument, siis ankur on tihti mõne elemendi <code>id</code> atribuut.
Eelnimetatud osade lubatud tähemärkideks on tänapäeva [[Inglise tähestik|inglise tähestiku]] väike- ja suurtähtedele vastavad [[Ameerika Informatsioonivahetuse Standardkood|ASCII]] tähemärgid, [[araabia numbrid]], sidekriips (<code>-</code>), punkt (<code>.</code>), allkriips (<code>_</code>) ja [[tilde]] (<code>~</code>).<ref>RFC 3986 (2005), §2.</ref> Ülejäänud sümbolid peavad olema [[Protsent-kodeerimine|kodeeritud protsendiga]] (<code>%</code>).
Eelnimetatud osade lubatud tähemärkideks on tänapäeva [[inglise tähestik]]u väike- ja suurtähtedele vastavad [[Ameerika Informatsioonivahetuse Standardkood|ASCII]] tähemärgid, [[araabia numbrid]], sidekriips (<code>-</code>), punkt (<code>.</code>), allkriips (<code>_</code>) ja [[tilde]] (<code>~</code>).<ref>RFC 3986 (2005), §2.</ref> Ülejäänud sümbolid peavad olema [[Protsent-kodeerimine|kodeeritud protsendiga]] (<code>%</code>).


ASCII sümbolid <code>: / ? # [ ] @</code> on reserveeritud piiritlejatena kasutuseks. Selleks, et neid väljaspool otstarvet kasutada, peavad nad olema protsent-kodeeritud. Näiteks sümbolile <code>?</code> vastab <code>%3F</code>.<ref>RFC 3986 (2005), §2.2.</ref> Tähemärgid <code>! $ & ' ( ) * + , ; =</code> võivad olla kodeerimata kasutajanime, parooli, hosti ja tee osades.<ref>RFC 3986 (2005), §3.2.2.</ref><ref>RFC 3986 (2005), §3.3.</ref> Sümbolid <code>:</code> ja <code>@</code> võivad olla kodeerimata tee, päringu ja ankru osades ning tähemärgid <code>?</code> ja <code>/</code> võivad olla kodeerimata päringu ja ankru sektsioonides.<ref>RFC 3986 (2005), §3.3.</ref><ref>RFC 3986 (2005), §3.4.</ref>
ASCII sümbolid <code>: / ? # [ ] @</code> on reserveeritud piiritlejatena kasutuseks. Selleks, et neid väljaspool otstarvet kasutada, peavad nad olema protsent-kodeeritud. Näiteks sümbolile <code>?</code> vastab <code>%3F</code>.<ref>RFC 3986 (2005), §2.2.</ref> Tähemärgid <code>! $ & ' ( ) * + , ; =</code> võivad olla kodeerimata kasutajanime, parooli, hosti ja tee osades.<ref name="RFC 3986 2005, §3.2.2"/><ref name="RFC 3986 2005, §3.3">RFC 3986 (2005), §3.3.</ref> Sümbolid <code>:</code> ja <code>@</code> võivad olla kodeerimata tee, päringu ja ankru osades ning tähemärgid <code>?</code> ja <code>/</code> võivad olla kodeerimata päringu ja ankru sektsioonides.<ref name="RFC 3986 2005, §3.3"/><ref>RFC 3986 (2005), §3.4.</ref>


== Näited ==
== Näited ==

Redaktsioon: 11. aprill 2019, kell 13:17

Ühtne ressursiidentifikaator (inglise keeles Uniform Resource Identifier, URI) on sõne, mida kasutatakse infoallika üheseks määramiseks veebis.

URL ja URN

Ühtne ressursinimi (ingilise keeles Uniform Resource Name, URN) on ühtne ressursi-indikaator, mis identifitseerib ressurssi ainult nime järgi. URN-i võib kasutada ressursist rääkimiseks ilma selle asukoha ja juurdepääsu mehhanismi mainimata.

Internetiaadress (inglise keeles Uniform Resource Locator, URL) on ühtne ressursi-indikaator, mis identifitseerib ressurssi nii asukoha kui ka peamise juurdepääsu mehhanismi abil.

Struktuur

Ühtsa ressursi-indikaatori struktuur on järgnev:

skeem:[//[kasutaja[:parool]@]host[:port]][/tee][?päring][#ankur]

  • Skeem on tähemärkide jada, mis algab tähega ning mis koosneb tähtedest, numbritest, plussidest (+), miinustest (-) ja punktidest (.). Kuigi skeemid on tõstutundetud, kombeks on neid kirjutada väiketähtedega. Sellele järgneb koolon (:). Tuntud skeemid on näiteks http(s), ftp, mailto, file, data ja irc.
  • Kaks kaldkriipsu (//), mida mõned skeemid nõuavad, mõned mitte. Kui volituse komponenti (kirjeldatud allpool) pole, siis tee komponent ei tohi alata kahe kaldkriipsuga.[1]
  • Volituse osa, mis koosneb:
  • Tee, mis on tavaliselt hierarhiline struktuur, mille segmendid on eraldatud kaldkriipsudega (/). See struktuur võib olla sarnane failisüsteemi teega, aga sellest ei saa järeldada, et nad on omavahel seotud.[3] Tee on alati defineeritud, kuigi see võib olla tühi (0 pikkusega).
  • Valikuline päring, mis on eraldatud eelnevast osast küsimärgiga (?). Selle süntaks pole hästi defineeritud, aga tavaliselt koosneb päring võti-väärtus paaridest, kus võti ja väärtus on eraladatud võrdus märgiga = ning paarid on omakorda eraldatud kas ampersandiga (&) või semikooloniga (;).
  • Valikuline ankur, mis on eraldatud eelnevast osast "trelli" ehk numbri sümboliga (#), mille ülesandeks on sekundaarse ressursi (näiteks pealkirja) poole suunamine. Kui ressurss on näiteks HTML dokument, siis ankur on tihti mõne elemendi id atribuut.

Eelnimetatud osade lubatud tähemärkideks on tänapäeva inglise tähestiku väike- ja suurtähtedele vastavad ASCII tähemärgid, araabia numbrid, sidekriips (-), punkt (.), allkriips (_) ja tilde (~).[4] Ülejäänud sümbolid peavad olema kodeeritud protsendiga (%).

ASCII sümbolid : / ? # [ ] @ on reserveeritud piiritlejatena kasutuseks. Selleks, et neid väljaspool otstarvet kasutada, peavad nad olema protsent-kodeeritud. Näiteks sümbolile ? vastab %3F.[5] Tähemärgid ! $ & ' ( ) * + , ; = võivad olla kodeerimata kasutajanime, parooli, hosti ja tee osades.[2][6] Sümbolid : ja @ võivad olla kodeerimata tee, päringu ja ankru osades ning tähemärgid ? ja / võivad olla kodeerimata päringu ja ankru sektsioonides.[6][7]

Näited

Absoluutsed URI-d

  • https://et.wikipedia.org/wiki/Internet
  • https://www.eesti.ee/et/index.html
  • file:///C:/Users/-/Downloads/ressurss.txt
  • mailto:John.Doe@example.com

Relatiivsed URI-d

  • ressurss.txt
  • /../../../ressurss.txt
  • /relatiive/tee/failini/ressurss.txt
  • #ankur2

Viited

  1. RFC 3986 (2005), §3.
  2. 2,0 2,1 RFC 3986 (2005), §3.2.2.
  3. RFC 2396 (1998), §3.3.
  4. RFC 3986 (2005), §2.
  5. RFC 3986 (2005), §2.2.
  6. 6,0 6,1 RFC 3986 (2005), §3.3.
  7. RFC 3986 (2005), §3.4.