ПЕСОЧНИЦА - место для Ваших экспериментов!

Участник:Katy

Материал из ИнтеВики — обучающей площадкой для проведения тренингов программы Intel
Перейти к: навигация, поиск

Содержание

гидролиз информатики

когда-нибудь будет создан...


Источники в помощь

Для проведения исследования и представления результатов дополнительно вы можете использовать следующие сервисы:

Для хранения презентации

Для хранения текстовых файлов

Для хранения фото

Для накопления найденных в Интернете ссылок по исследованию

Для поиска информации

Для размещения видеоинформации

  1. Учебник, который поможет при работе в Вики-среде грамотно расставить ссылки, отформатировать текст, разместить изображение или любой другой мультимедийный файл...
  2. Обзор социальных сервисов (презентация)
  3. Мини-инструкция по работе в вики
  4. Правила работы в WIKI
  5. Видео-ролик

белка рулез Внешние факторы, влияющие на релевантность документа. Их особенности реализации в конкретных поисковых машинах.

Ссылочное ранжирование, или поиск по лексике ссылок, является, пожалуй, самым интересным из критериев, оказывающих влияние на ранжирование документов в результатах поиска. Именно ссылочное ранжирование является причиной многих скандалов вокруг поисковых систем, связанных с выдачей поисковыми системами известных сайтов в ответ на запросы по оскорбительным, нецензурным или близким к таковым выражениям.

Ссылочное ранжирование - влияние текста ссылок на документ на релевантность этого документа запросу. То есть если слова из запроса встречаются в тексте ссылки на документ с другого документа, то это повышает его релевантность данному запросу.

При введении этого фактора ранжирования в алгоритм поисковой системы разработчики руководствовались тем соображением, что если кто-то ссылается на страницу каким-либо текстом, то, значит, с большой долей вероятности можно быть уверенным, что эта информация содержится на странице, и чем больше таких ссылок, тем выше эта вероятность. А если страница, на которую ссылаются, популярна у многих пользователей, т.е. "авторитетна"? Тогда соответствие содержания страницы тексту ссылки должно быть ещё более вероятным - авторитетный сайт "плохого" не порекомендует. Значит, логично ввести зависимость от показателей "авторитетности" страницы. Рассмотрим показатель релевантности текста ссылок с других документов а запросу х (La(x)): La(x) = ([Сумма от i=1 до n] Lai(x)*f(PRi)), где

  • PRi - показатель авторитетности страницы i, константа относительно запроса х,
  • f(PRi) - некая неубывающая функция от PRi, для простоты можно принять ее линейной,

т.е. f(PRi) = k* PRi, где k - некий коэффициент,

  • Lai(x) - релевантность запросу х ссылок со страницы i на страницу а, если в тексте

ссылки нет ни одного слова из запроса, то Lai(x) = 0. Максимальное значение функция Lai(x) принимает, если в тексте ссылки встречается точное вхождение поисковой фразы.

  • Li(x) используется при определении релевантности документа запросу. Примерная

формула определения такой релевантности: Ra(x) = (m*Ta(x) + p*La(x)*F(PRa)), где

  • Ra(x) - итоговое соответствие документа а запросу х,
  • Тa(x) - релевантность текста (кода) документа а запросу х.
  • La(x) - релевантность текста ссылок с других документов на документ а, запросу

х,

  • PRa - показатель авторитетности страницы а, константа относительно х,
  • F(PRa) - монотонно неубывающая функция, причем F(0)=1, можно допустить, что F(PRa)=(1+q*PRa),
  • m,p,q - некие коэффициенты.

Из этой формулы видно, что на величину итогового соответствия кода страницы запросу Ra(х) оказывает влияние произведение величин La(x) и F(PRa).

Таким образом, величина эффекта от ссылочного ранжирования на релевантность страницы запросу напрямую зависит от 3 параметров:

  • • релевантности текста ссылок запросу;

• "авторитетности" страницы; • "авторитетности" ссылающейся страницы.

Зачастую при анализе позиций сайта в выдаче бывает трудно выделить влияние именно ссылочного ранжирования. Однако хорошо виден его эффект в "крайних" случаях, т.е. когда влияние остальных факторов крайне мало.

Также поисковые машины могут накладывать по той или иной причине ограничения на отдельные документы и даже сайты и вовсе не учитывать ссылки с них при ссылочном ранжировании, также как и при расчёте ранга документов, на которые они ссылаются (<<непот-фильтр>> в Яндексе, <> в Google)

Другой крайний случай - это когда на страницу без искомого текста и небольшим рангом ссылается текстом страница с рангом высоким. В этом случае внутренние динамические факторы влияния не оказывают, т.е. Тa(х)=0; "авторитетность" страницы, на которую ссылаются, мала, поэтому влияния практически не оказывает, т.е. F(РRa)имеет значение близкое к 1; ранг документа, ссылающегося на данный документ текстом, релевантным запросу, очень высока, т.е. значение La (x) довольно велико. В итоге страница, получившая такую ссылку, может получить неплохое значение Ra (х) и занять высокие позиции в результатах поиска по запросам, слова из которых содержатся в тексте ссылки.

Особо хочу пояснить один момент, из-за которого ссылочное ранжирование в плане повышения релевантности документа запросу намного привлекательнее внутренних факторов. Дело в том, что функция Тa (x), зависящая от внутренних факторов имеет максимум, достигаемый при некотором "идеальном" наборе своих параметров (каждый из которых у конкретного поисковика свой).

Функция ссылочного ранжирования La (x), в отличие от функции Тa (х), такого экстремума не имеет, так как любое появление новой содержащей ключевую фразу ссылки на страницу, будет увеличивать ее значение.

Поэтому время и силы, которые можно затратить для нахождении идеального набора значений для внутренних факторов (который, кстати, может довольно часто изменяться вследствие действий администраций поисковых машин, постоянно работающих над "улучшением качества поиска"), что по сути является сложной задачей многокритериальной оптимизации, лучше с гораздо большей эффективностью потратить на организацию новых ссылок на страницы сайта с текстами, содержащим необходимые ключевые слова.

Очень важным моментом, о котором, однако, часто забывают, является то, что ссылочное ранжирование работает и внутри одного домена. Хотя, возможно, и с некоторыми понижающими коэффициентами. Иногда приходится сталкиваться с заблуждением, что ссылочное ранжирование должно поднимать релевантность любой из страниц сайта в выдаче по запросу, текст которого содержится в запросе. Это не так. Ссылочное ранжирование действует на конкретные страницы - те, на которые указывают ссылки. [makulatura1]

Персональные инструменты
Образовательная галактика Intel Программа Intel 'Обучение для будущего' Программа 'Учимся с Intel' Летописи России Инициативы Intel в образовании