Что такое URL: понятия и особенности
URL — это уникальный адрес, с помощью которого есть возможность делиться с друзьями и знакомыми интересной информацией с сайтов и соцсетей.
Редакция Highload в этой статье разобралась, что такое URL, как его правильно генерировать, необходимые рекомендации при работе с ними.
Содержание
Хорошо продуманный URL-адрес — это мощный инструмент, помогающий улучшить взаимодействие с пользователями, что приводит к повышению SEO-оптимизации.
Что такое URL
URL-адрес — это тип универсального идентификатора ресурса, который обеспечивает доступ к информации с веб-серверов и облачных хранилищ.
URL-адреса, как правило, состоят из нескольких частей, включающих в себя сетевой протокол, имя домена и его расширение, а также субдомен.
URL — не совсем одно и то же, что и доменное имя, но эти понятия между собой тесно связаны. Доменное имя — это часть URL-адреса.
Пример адреса сайта c указанием пути на статью: https://highload.tech/web-archive/.
Пользователи используют URL-адреса, вводя их в адресную строку браузера или кликая на гиперссылку, найденную на веб-странице, в списке закладок, в электронном письме или в другом приложении. URL-адреса также могут направлять пользователей в определенный раздел на веб-странице.
История URL-адреса
Первый сайт в интернете появился в 1991 году. Посвящен он был проекту World Wide Web, где пользователи могли найти информацию о том, как создаются веб-страницы и что такое гипертекст. Это была просто инструкция по применению, демонстрация того, как человек может использовать сайт, чтобы узнать для себя что-то новое.
Еще в 1989 году британец Тим Бернерс-Ли предложил идею о том, как можно систематизировать и управлять информацией. Главная мысль заключалась в том, что документы, которые находятся на отдельных компьютерах, могут дополнять друг друга посредством гипертекста. К 1991 году появилась возможность реализовать такую идею. Началась работа. Тим Бернс-Ли создал HTML, HTTP и URL-адреса. Так началась история всемирной паутины.
Уже через год в интернете насчитывалось около десятка сайтов, а к 1994 году их было 3000. Попасть на их страницы можно было, используя URL-адрес.
Структура URL-адреса
Чаще всего URL состоит из нескольких частей. Чтобы лучше понять как все работает, давайте углубимся в структуру URL.
HTTP или HTTPS
HTTP и HTTPS — это сетевые протоколы связи между веб-серверами и веб-браузерами. Они передают сообщения, извлекают информацию через систему доменных имен (DNS) и возвращают ее в браузер.
Разница между HTTP и HTTPS в том, что последний шифрует процесс передачи данных. Именно HTTPS лучше защищает сайт и является важным фактором повышения рейтинга в результатах поиска.
Субдомен www
Субдомен — это набор любых слов или фраз, которые стоят перед первой точкой в URL-адресе. Наиболее распространенный тип — www. Это указывает на то, что сайт доступен в сети и использует HTTP для связи.
Доменное имя
Доменное имя — это то, что пользователи вводят в адресную строку своего браузера. Он состоит из названия сайта и расширения, например, highload.tech.
Каждое имя уникально. Уникальный IP-адрес указывает на сервер сайта. Другими словами, это помогает пользователям легко получать доступ к веб-ресурсам.
Расширение домена
Расширение следует сразу же за именем сайта и указывает на домен верхнего уровня. Самое популярное и часто используемое расширение — .com — используется примерно для 53% всех сайтов в интернете.
Путь к ресурсу
Путь к ресурсу — это структура папок сайта. Предоставляет серверу дополнительную информацию, позволяя ему направлять пользователей в конкретное место. Ряд путей к ресурсам может указывать на определенную страницу, запись или файл.
Параметры
Параметры — это строки запроса или переменные URL. Это часть URL-адреса, следующая за вопросительным знаком.
Параметры содержат ключи и значения, разделенные знаком равенства (=). Кроме того, URL-адрес может иметь несколько переменных. В этом случае символ амперсанда (&) будет их разделять.
Вот некоторые из наиболее распространенных вариантов использования параметров:
- Перевод. Код страны в строке запроса переводит веб-страницу на язык соответствующей страны.
- Поиск. Предоставляет результаты поиска из внутренней поисковой системы сайта.
- Фильтрация. Для разделения отдельных полей, таких как тема, цвет, ценовой диапазон и регион, владельцы сайтов могут использовать параметр фильтрации.
- Пагинация. Этот параметр особенно полезен для интернет-магазинов, позволяющий сортировать контент.
- Отслеживание. Обычно используется для отслеживания трафика из рекламных и маркетинговых кампаний.
Виды URL
Наиболее популярные виды URL — абсолютные и относительные:
- абсолютный URL содержит полную информацию — от протокола до пути к ресурсам или параметрам;
- относительный URL включает только путь к ресурсам.
Другие виды URL-адресов:
Канонические URL-адреса | Если в контенте есть дубли, владельцы сайтов могут использовать такой тип урла. Канонический URL сообщает поисковикам к индексации и сканированию какого адреса нужно приступить. |
URL-адреса обратного вызова | Callback URL-адреса относятся к возвращению в домашнюю сеть, когда пользователи завершают процесс во внешней системе. |
Тщеславные URL-адреса | Настраиваемые короткие URL-адреса, которые легко запомнить. Владельцы сайтов могут использовать инструмент сокращения URL-адресов для своих ресурсов. |
Форматы URL
Чтобы URL-адреса были читаемы, помогали выстроить понятную для пользователя структуру веб-ресурса, важно правильное использование их форматов.
Многие пользователи уже знают, что пробелы в URL запрещены. Важно, чтобы строка URL-адреса содержала исключительно буквенно-цифровые символы. Допустимы также и символы !$-_+*'(),.
. Любые другие символы в URL-адресе будут зашифрованы.
Транслитерация
Существуют разрешенные и запрещенные символы, которые можно использовать в URL-адресах. Нельзя использовать кириллицу и пробелы. Чтобы урлы были понятны и легче воспринимались большинством людей из разных стран, чаще всего для их создания используют транслитерацию.
Такие ссылки, как правило, напрямую указывают на содержимое контента. Пользователю достаточно прочитать URL и понять, стоит ли переходить на страницу, интересна ли ему будет информация, которая там размещена.
Для поисковиков транслитерация URL удобна тем, что в них они сразу распознают ключевые слова. Транслитерация очень благоприятно сказывается на SEO-продвижении сайтов.
Латиница
Поскольку кириллицу нельзя использовать в урлах, владельцы сайтов с не англоязычным контентом прибегают к еще одному лайфхаку — переводят текст URL-адреса на английский язык.
Например, адрес, ведущий на страницу раздела, посвященного истории и историческим фактам, может иметь вид не /istoriya/
, а /history/
.
Чаще всего этот формат используется для разделов и категорий сайта. Пожалуй, это один из наиболее универсальных способов использования текста в URL.
Кириллические URL
Выше мы написали о том, что использование кириллических символов в урлах запрещено. Но они нашли свое частичное распространение в кириллических доменах.
Кириллические URL удобны и просты для запоминания людям, знакомым с кириллической письменностью. Благодаря своей минимальной популярности владельцы сайтов имеют доступ к большому количеству свободных кириллических доменных имен.
В таких урлах легко использовать ключевые слова и фразы, которые так важны поисковым системам. Но у кириллического формата URL-адресов есть один огромный недостаток, который перечеркивает все его преимущества — копирование и вставка таких адресов превращает кириллицу в набор совершенно непонятных и нелогичных символов и знаков.
Пример: https://ru.wikipedia.org/wiki/%D0%94%D0%BE%D0%BC%D0%B5%D0%BD%D0%BD%D0%BE%D0%B5_%D0%B8%D0%BC%D1%8F
Объясняется это тем, что кириллица в распространенных форматах URL-адресов недопустима, а потому подлежит шифрованию. Кроме этого, поисковики не могут распознать такие адреса, от этого страдает поисковая оптимизация сайта.
URL-шифрование
Невозможность использования кириллических URL-адресов поставила вопрос о создании новой системы доменных имен. Но вместо этого была придумана специальная кодировка, которая шифрует символы в интернационализированных доменных именах, используя уже доступные алфавиты. Так появился Punycode, который постепенно был внедрен во все популярные веб-браузеры.
Punycode — метод для преобразования доменных имен из Unicode в ACE (ASCII Compatible Encoding). Используется для обеспечения корректного написания и отображения доменов в адресной строке. Возможно прямое и обратное преобразование.
Человекопонятные URL
Большинство поисковых систем подводит владельцев сайтов к использованию человекопонятных URL-адресов — ЧПУ.
Семантический или человекопонятный URL — это веб-адрес, который понятен и удобен для восприятия обычным человеком.
По такому адресу пользователь должен сразу понимать, в какой раздел или на какую веб-страницу он в следующую секунду попадет. Также он должен заранее догадываться о контентном содержимом, которое там размещено.
Например, адрес вида www.me.com/viewpage.php?page_id=56 вряд ли сообщает об информации, размещенной на такой странице. А если мы видим такой URL www.me.com/about/, то сразу понимаем, о чем пойдет речь после перехода.
Преимущества человекопонятных URL-адресов:
- возможность использования ключевых фраз и слов;
- оценка и понимание того, что содержится на странице еще до перехода на нее;
- удобны для понимания даже в устной речи;
- упрощают навигацию по сайту: достаточно в адресе убрать одну часть с конца, чтобы попасть на другую страницу ресурса, в необходимую категорию или раздел.
Правила создания ЧПУ:
- Неприменимо использование заглавных букв. Урлы чувствительны к регистру.
- Нельзя использовать знаки препинания и пробелы. Вместо них рекомендованы нижнее подчеркивание или дефис.
- Необходимо использовать правила транслитерации.
- Рекомендуется использование коротких URL-адресов.
Рекомендации по созданию URL
Удобность и понятность адреса сайта зависит от множества факторов. Ниже приводим некоторые рекомендации по созданию таких URL:
- Как мы уже знаем, доменное имя — это основная часть адреса сайта. К выбору адреса стоит подойти с ответственностью. Желательно, чтобы он не был слишком длинным и хорошо воспринимался на слух. Также лучше избежать использования букв, написание которых не всегда однозначное. В большей степени это касается буквы «я» — написание может быть разным: ya или ja.
- URL, созданный по всем правилам, обязательно должен включать в себя ключевые слова. Это очень полезно для ранжирования. Но здесь важна умеренность, иначе поисковая система может воспринять это как спам.
- Короткие URL-адреса в приоритете — не более 5 слов и не более 80 символов. Это связано с тем, что слишком длинный адрес не отобразится полностью в поисковой выдаче, что может сказаться на привлечении трафика.
- Очень важно учитывать кодировку URL, лучше не использовать символы, которые к ней не относятся. Например, адрес вида https://www.me.com/薄荷/杂货 для пользователя во многом непонятен.
- Используйте популярный формат URL — латиницу. Такие сайты — наиболее распространенные, к ним хорошо относятся поисковые системы и их гораздо проще продвигать.
- Если адрес состоит из нескольких слов, лучше разделять их при помощи дефиса. Нижнее подчеркивание используется в таких случаях гораздо реже.
- Если сайт рассчитан на локальную аудиторию, можно использовать домены, указывающие на конкретный регион или страну. Например, me.ua. Или же можно создать подкаталог me.com/ua.
- Важно настроить редирект 301. Это нужно для того, чтобы избежать дублей веб-страниц при изменении их адресов.
Чтобы сгенерировать красивое доменное имя, которое станет частью вашего URL-адреса и выделит его среди остальных, можно воспользоваться специальными онлайн-сервисами. Например, DomainWheel или Instant Domain Search.
Если ваше идеальное доменное имя уже кем-то занято, можно связаться с владельцем такого сайта и попробовать договориться о выкупе.
Вывод
В основе любого веб-поиска всегда стоит URL. Даже чтобы попасть на страницу поисковой системы, нам необходимо знать ее адрес. Все, что мы видим в выдаче — это урлы, переходя по которым у нас появляется возможность получить доступ к данным или информации, которая нас интересует.
URL — это веб-адрес, который ведет на определенную страницу сайта или же указывает на конкретный файл, размещенный в сети.
Структура URL состоит из нескольких частей:
- HTTP или HTTPS. Это протоколы для доступа к интернет-ресурсам. Последний протокол связи является более безопасным, чем первый.
- WWW. Субдомен, это часть URL перед первой точкой в адресе сайта. Вместо www также могут быть использованы любые слова или фразы, отвечающие целям корпоративного сайта, онлайн-журнала, интернет-магазина. Эта часть адреса уже не намного обязательна, ее можно не использовать при вводе.
- Доменное имя или адрес сайта. Это то, что пользователи вводят в адресную строку для перехода на нужный веб-ресурс.
- Расширение домена. Это часть, следующая за доменным именем, например, .ua и .com .
- Путь к ресурсу / файлу / изображению. Элемент, разделенный знаком косой черты (/), дает дополнительную информацию об адресе сайта.
- Параметры. Их часто называют строками запроса или переменными URL. Знак вопроса (?) указывает на присутствие в URL-адресе параметра.
У каждой страницы в интернете есть свой собственный URL. Чтобы создать адрес сайта, нужно выбрать регистратора и через него зарегистрировать домен. В качестве альтернативы можно сразу обратиться к надежному хостинг-провайдеру, который предоставит не только хостинг, но и предложит услуги по регистрации доменов.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: