Abreviado como URL, um Uniform Resource Locator é uma maneira de identificar a localização de um arquivo na Internet. Eles são o que usamos para abrir não apenas sites, mas também para baixar imagens, vídeos, programas de software e outros tipos de arquivos que estão hospedados em um servidor.
Abrir um arquivo local em seu computador é tão simples quanto clicar duas vezes nele, mas para abrir arquivos em computadores remotos , como servidores da web, devemos usar URLs para que nosso navegador saiba onde procurar. Por exemplo, abrir o arquivo HTML que representa a página da web explicada a seguir é feito inserindo-o na barra de navegação na parte superior do navegador que você está usando.
Outros nomes
Uniform Resource Locator são mais comumente abreviado como URLs , mas eles também são chamados de endereços de sites quando se referem a URLs que usam o protocolo HTTP ou HTTPS.
URL é geralmente pronunciado com cada letra falada individualmente (ou seja, u – r – l , não conde). Costumava ser uma abreviatura de Universal Resource Locator antes de ser alterado para Uniform Resource Locator em 1994.
Exemplos de URLs
Você provavelmente está acostumado a inserir um URL, como este para acessar o site do Google:
https://www.google.com<br>
Todo o endereço é chamado de URL. Outro exemplo é este site (primeiro) e o da Microsoft (segundo):
https://www.topgadget.com..br
https://www.microsoft.com
https://www.google.com.br
Você pode até ser superespecífico e abrir a URL direta para uma imagem, como esta longa que aponta para o logotipo do Google no site da Wikipedia. Se você abrir esse link, poderá ver que ele começa com https: // e tem um URL de aparência regular como os exemplos acima, mas tem muitos outros textos e barras para indicar a pasta e o arquivo exatos onde a imagem reside no servidor do site.
O mesmo conceito se aplica quando você está acessando a página de login de um roteador; o endereço IP do roteador é usado como URL para abrir a página de configuração.
A maioria de nós está familiarizada com esses tipos de URLs que usamos em um navegador da web como o Firefox ou Chrome, mas esses não são os únicos casos em que você precisa de um URL.
Em todos esses exemplos, você está usando o protocolo HTTP para abrir o site, que provavelmente é o único que a maioria das pessoas encontra, mas existem outros protocolos que você também pode usar, como FTP, TELNET, MAILTO e RDP. Um URL pode até apontar para arquivos locais que você tem em um disco rígido. Cada protocolo pode ter um conjunto único de regras de sintaxe para chegar ao destino.
Estrutura de um URL
Um URL pode ser dividido em diferentes seções, cada parte servindo a um propósito específico ao acessar um arquivo remoto.
Os URLs HTTP e FTP são estruturados da mesma forma, como protocol: // hostname / fileinfo. Por exemplo, acessar um arquivo FTP com seu URL pode ter a seguinte aparência:
FTP: //servername/folder/otherfolder/programdetails.docx
Que, além de ter FTP em vez de HTTP , se parece com qualquer outro URL que você possa encontrar na web.
Vamos usar o seguinte URL, que é o anúncio do Google de uma falha de CPU , como um exemplo de endereço HTTP e identificar cada parte:
https://security.googleblog.com/2018/01/todays-cpu-vulnerability-what-you-need.html
- https é o protocolo (como o FTP é um protocolo) que define o tipo de servidor com o qual você está se comunicando.
- security é o nome do host usado para acessar este site específico.
- googleblog é o nome do domínio.
- com é conhecido como domínio de nível superior (TLD , alguns dos quais incluem .net, .org, .info, etc.
- /2018/01/ representa os diretórios usados para organizar a página da web ou arquivo. No servidor da web que contém os arquivos do site, essas seriam as pastas reais nas quais você clicaria para localizar o arquivo que este URL está especificando.
- todays-cpu-vulnerability-what-you-need.html é o arquivo real para o qual a URL está apontando. Se você estivesse tentando carregar uma imagem, arquivo de áudio ou outro tipo de arquivo em vez de um arquivo HTML, o URL terminaria com essa extensão de arquivo (como PNG ou MP3 ).
- security.googleblog.com como um grupo é chamado de Fully Qualified Domain Name (FQDN).
Regras de sintaxe de URL
Apenas números, letras e os seguintes caracteres são permitidos em um URL: ()! $ -‘_ * +.
Outros caracteres devem ser codificados (traduzidos para o código de programação) para serem aceitos.
Alguns URLs têm parâmetros que os separam de variáveis adicionais. Por exemplo, quando você faz uma pesquisa no Google por topgadget:
https://www.google.com/search?q=topgadget
O ponto de interrogação que você vê está dizendo a um determinado script, hospedado no servidor do Google, que você deseja enviar um comando específico a ele para obter resultados personalizados.
O script específico que o Google usa para executar pesquisas sabe que tudo o que segue a parte ? Q = da URL deve ser identificado como o termo de pesquisa, de modo que tudo o que for digitado nesse ponto da URL é usado para pesquisar no mecanismo de pesquisa do Google.
Você pode ver um comportamento semelhante no URL nesta pesquisa do YouTube pelos melhores vídeos de gatos :
https://www.youtube.com/results?search_query=melhores+memes
Embora espaços não sejam permitidos em um URL, alguns sites usam um sinal + , que você pode ver nos exemplos do Google e do YouTube. Outros usam o equivalente codificado de um espaço, que é % 20 .
Alguns URLs podem alternar entre parâmetros dependendo do contexto. Um bom exemplo pode ser visto ao adicionar um carimbo de data / hora a um vídeo do YouTube. Alguns links exigem um e comercial e outros usam um ponto de interrogação.
URLs também podem usar âncoras. Eles estão situados no final e descrevem para onde, nessa página, saltar quando o link for selecionado. As âncoras são criadas ao adicionar links a uma página da web e usam o sinal de número ( # ).
URLs que usam múltiplas variáveis usam um ou mais e comercial após o ponto de interrogação. Você pode ver o exemplo aqui para uma pesquisa da Amazon.com para Windows 10:
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=windows+10
A primeira variável, url, é precedida por um ponto de interrogação, mas a próxima variável, palavras-chave do campo, é precedida por um e comercial. Variáveis adicionais também seriam precedidas por um E comercial.
Partes de um URL diferenciam maiúsculas de minúsculas – especificamente, tudo após o nome de domínio (os diretórios e o nome do arquivo). Você pode ver isso por si mesmo se colocar a palavra “necessidade” em maiúscula no URL de exemplo do Google que desconstruímos acima, fazendo com que o final do URL leia todays-cpu-vulnerability-what-you-NEED.html. Tente abrir essa página e você verá que ela não carrega porque esse arquivo específico não existe no servidor.
Mais informações sobre URLs
Se um URL aponta para um arquivo que seu navegador da web pode exibir, como uma imagem JPG, você não precisa realmente fazer o download para seu computador para vê-lo. No entanto, para arquivos que normalmente não são exibidos no navegador, como arquivos PDF e DOCX e , especialmente, arquivos EXE (e muitos outros tipos de arquivo), você será solicitado a fazer o download.
Os URLs fornecem uma maneira fácil de acessarmos o endereço IP de um servidor sem precisar saber qual é o endereço real. Eles são como nomes fáceis de lembrar para nossos sites favoritos. Esta tradução de um URL para um endereço IP é para o que os servidores DNS são usados.
Alguns URLs são realmente longos e complexos e são melhor usados se você clicar neles como um link ou copiar / colar na barra de endereços do navegador. Um erro em um URL pode gerar um erro de código de status HTTP da série 400 , sendo o tipo mais comum um erro 404 .
Um exemplo pode ser visto em gog.com . Se você tentar acessar uma página que não existe em seu servidor (como esta), receberá um erro 404. Esses tipos de erros são tão comuns que você geralmente encontrará versões personalizadas, muitas vezes engraçadas, deles em alguns sites. .
A maioria dos URLs não exige que o nome da porta seja fornecido. Abrir google.com , por exemplo, pode ser feito especificando seu número de porta no final, como http://www.google.com:80, mas não é necessário. Se o site estivesse operando na porta 8080, você poderia substituir a porta e acessar a página dessa forma.
Por padrão, os sites FTP usam a porta 21, mas outros podem ser configurados na porta 22 ou algo diferente. Se o site FTP não estiver usando a porta 21, você deve especificar qual está usando para acessar o servidor corretamente. O mesmo conceito se aplica a qualquer URL que usa uma porta diferente daquela que o programa usou para acessar, assume por padrão que está usando.