PageRank
PageRank («пэйдж-ранк»; от англ . page rank — ранжирование или Пейджа) — один из алгоритмов ссылочного ранжирования. Алгоритм применяется к коллекции документов, связанных гиперссылками (таких, как веб-страницы из всемирной паутины), и назначает каждому из них некоторое численное значение, измеряющее его «важность» или «авторитетность» среди остальных документов. Вообще говоря, алгоритм может применяться не только к веб-страницам, но и к любому набору объектов, связанных между собой взаимными ссылками, то есть к любому графу.
Описание
PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем больше ссылок на страницу, тем она «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.
История
В 1996 году Сергей Брин и Ларри Пейдж, тогда ещё аспиранты Стэнфордского университета, начали работу над исследовательским проектом BackRub[1] — поисковой системой по Интернету, использующей новую тогда идею о том, что веб-страница должна считаться тем «важнее», чем больше на неё ссылается других страниц, и чем более «важными», в свою очередь, являются эти страницы.[2] Через некоторое время BackRub была переименована в Google. Первая статья с описанием применяющегося в ней алгоритма ранжирования, названного PageRank, появилась в начале 1998 года[3], за ней следом вышла и статья с описанием архитектуры самой поисковой системы.[4]
Их система значительно превосходила все существовавшие тогда поисковые системы, и Брин с Пейджем, осознав её потенциал, основали в сентябре 1998 года компанию Google Inc. для дальнейшего её развития как коммерческого продукта.
С тех пор алгоритмы и математические модели, применяемые при ранжировании в Google, значительно улучшились. В интервью в 2007 году Амит Сингхал, представитель отдела качества поиска Google, заявил, что их поисковая система использует более 200 ранжирующих сигналов, лишь одним из которых является PageRank,[5] но он до сих пор играет существенную роль в поисковых продуктах Google.[6] Стоит отметить, что алгоритм PageRank, в том виде, в каком он был изложен Пейджем в статье 1998 года[3], может быть улучшен в некоторых практических аспектах (например, ссылкам могут назначаться разные веса), и алгоритмы, применяемые в современных поисковых системах, являются скорее лишь его вариантами.
PageRank можно перевести с английского языка как «ранг страницы», однако Google Inc. связывает слово Page в названии алгоритма не с английским словом «страница», а с именем Ларри Пейджа (англ. Larry Page).[7]
Название «PageRank» является торговой маркой компании Google Inc. Алгоритм запатентован в США 4 сентября 2001 года[8], в качестве изобретателя алгоритма в патенте указан Ларри Пейдж. Официальным владельцем патента является не Google Inc., а Стэнфордский университет, в котором учились Ларри Пейдж и Сергей Брин в момент подачи заявки на патент.
В 1998 году Google был одной из первых поисковых систем, внедривших ссылочное ранжирование, благодаря чему добился значительного улучшения качества поиска по сравнению с конкурентами. В дальнейшем многие крупные поисковые системы разработали и внедрили свои аналоги PageRank и другие методы статического (то есть запросо-независимого) ранжирования документов.[9]
Последнее обновление Google PageRank произошло 6 декабря 2013 года.[10]
16 апреля 2016 года компания Google официально убирает этот показатель и обнуляет PageRank у всех сайтов.
10 января 2018 года истек срок действия патента на изобретение U.S. Patent 6 285 999, однако PageRank всё ещё охраняется как товарная марка.
Скульптурирование PageRank
Скульптурирование PageRank (англ. PageRank sculpting) — манипулирование количеством PageRank, передаваемого через конкретные ссылки страницей N другим страницам с помощью присвоения одной или нескольким ссылкам, идущим с этой страницы, атрибута nofollow, что приводит к удержанию большего PageRank («веса») на странице N с целью дальнейшей его передачи нужным страницам.
В 2009 году Мэтт Каттс заявил, что скульптурирование PageRank больше не работает, так как теперь постановка любых ссылок (как с атрибутом nofollow, так и без него) приводит к равномерному распределению передаваемого PageRank («веса») между исходящими ссылками.[11]
PageRank в продуктах Google
Надстройка для браузера Google Toolbar показывает для каждой веб-страницы целое число от 0 до 10, которое она называет PageRank, или важностью этой страницы с точки зрения Google. Однако механизм его расчёта и что в точности обозначает это значение, не раскрывается. По некоторым данным, эти значения обновляются лишь несколько раз в год (в то время, как внутренние значения PageRank пересчитываются непрерывно[12]) и показывают значения PageRank страниц на логарифмической шкале.[13] Каждый месяц Google обновляет алгоритмы,которые существенно повлияли на формирование выдачи. На основе этой информации вы сможете проанализировать состояние своего сайта и выявить проблемы, из-за которых возникают трудности в продвижении.[14]
С 2016 года Google официально отключил «тулбарный» показатель PageRank, после чего узнать значение PR из браузеров и других инструментов стало невозможно[15], однако можно узнать истории значения PR различных сайтов до этой даты.
См. также
Примечания
- Corporate Information — Google Milestones
- Wired: The Birth of Google (англ.)
- Lawrence Page, Sergey Brin, Rajeev Motwani and Terry Winograd. The PageRank Citation Ranking: Bringing Order to the Web. — 1998. (англ.)
- Sergey Brin, Lawrence Page. The Anatomy of a Large-Scale Hypertextual Web Search Engine. — 1998. (англ.)
- New York Times: Google Keeps Tweaking Its Search Engine (англ.)
- Corporate Information — Technology Overview
- Facts about Google and Competition . www.google.com. Архивировано 9 февраля 2012 года. (англ.)
- U.S. Patent 6 285 999
- Matthew Richardson, Amit Prakash, Eric Brill. Beyond PageRank: Machine Learning for Static Ranking. — 2006. Архивировано 13 января 2010 года. (англ.)
- PageRank Updates History .
- Pagerank sculpting — Matt Cutts blog
- Matt Cutts: More info on PageRank
- Google Answers: My Page Rank
- Алгоритмы Google: обзор апдейтов за последние 7 лет【EMBO Studio】 .
- Google Confirms Toolbar PageRank is No More | SEJ (англ.), Search Engine Journal (9 March 2016). Дата обращения 2 ноября 2018.
Ссылки
- Все о Google PageRank
- Шкондин А. PageRank: Больше ссылок хороших и важных. 2001
- Brin S., Page L. The Anatomy of a Large-Scale Hypertextual Web Search Engine. 1998.
- Брин С., Пейдж Л.,. Анатомия системы крупномасштабного гипертекстового интернет-поиска / перевод С. Неиленко и Р. Мурашов. — 1998. Архивировано 25 июня 2013 года.
- Растолкованный PageRank
- Развитие PageRank
- Инструмент для расчёта PageRank сайта