Статистический анализ данных, который работает на методе машинного обучения, позволяет выделить 4 кластера с особой валидацией полученных данных. Так называемый кластерный анализ — это процесс, при котором «google пингвин» выделяет ссылки с высоким показателем эффективности, эффективные ссылки, ссылки средней эффективности и неэффективные ссылки. Алгоритм google «пингвин», в первую очередь является некой технологической надстройкой над алгоритмом ранжирования, которая призвана производить наказания за «накрутку позиций» сквозь ссылочное продвижение.
Ко всему прочему действует она избирательно и очень осторожно. Волна негодования после появления «Пингвина» указывает лишь на качество тех ресурсов, где в их продвижении работают специалисты. Также назначение «Пингвина» состоит не только в изменении приоритетов в ранжировании, но и в обнаружении и пессимизации определенных групп сайтов, с сильными отрицательными признаками. В качестве примера, таким признаком является уровень вложенности страницы. Создание сайта подразумевает использование анализа структуры ссылочной массы при продвижении сайта. В этом случае точное вхождение текста запроса оказывает сильное негативное влияние на окончательные результаты продвижения.
Помимо сильных признаков, существует и слабые признаки, также оказывающее значимое влияние на производственную результативность продвижения сайта. Для продвижения, не следует использовать страницы с уровнем вложенности более 6. Также не стоит покупать ссылки на страницах с PR менее 1, оптимальным являет от 2 PR, и злоупотреблять абсолютно точными вхождениями текста запроса в анкоры.