- Любовные романы
- Фантастика и фэнтези
- Ненаучная фантастика
- Ироническое фэнтези
- Научная Фантастика
- Фэнтези
- Ужасы и Мистика
- Боевая фантастика
- Альтернативная история
- Космическая фантастика
- Попаданцы
- Юмористическая фантастика
- Героическая фантастика
- Детективная фантастика
- Социально-психологическая
- Боевое фэнтези
- Русское фэнтези
- Киберпанк
- Романтическая фантастика
- Городская фантастика
- Технофэнтези
- Мистика
- Разная фантастика
- Иностранное фэнтези
- Историческое фэнтези
- LitRPG
- Эпическая фантастика
- Зарубежная фантастика
- Городское фентези
- Космоопера
- Разное фэнтези
- Книги магов
- Любовное фэнтези
- Постапокалипсис
- Бизнес
- Историческая фантастика
- Социально-философская фантастика
- Сказочная фантастика
- Стимпанк
- Романтическое фэнтези
- Ироническая фантастика
- Детективы и Триллеры
- Проза
- Юмор
- Феерия
- Новелла
- Русская классическая проза
- Современная проза
- Повести
- Контркультура
- Русская современная проза
- Историческая проза
- Проза
- Классическая проза
- Советская классическая проза
- О войне
- Зарубежная современная проза
- Рассказы
- Зарубежная классика
- Очерки
- Антисоветская литература
- Магический реализм
- Разное
- Сентиментальная проза
- Афоризмы
- Эссе
- Эпистолярная проза
- Семейный роман/Семейная сага
- Поэзия, Драматургия
- Приключения
- Детская литература
- Загадки
- Книга-игра
- Детская проза
- Детские приключения
- Сказка
- Прочая детская литература
- Детская фантастика
- Детские стихи
- Детская образовательная литература
- Детские остросюжетные
- Учебная литература
- Зарубежные детские книги
- Детский фольклор
- Буквари
- Книги для подростков
- Школьные учебники
- Внеклассное чтение
- Книги для дошкольников
- Детская познавательная и развивающая литература
- Детские детективы
- Домоводство, Дом и семья
- Юмор
- Документальные книги
- Бизнес
- Работа с клиентами
- Тайм-менеджмент
- Кадровый менеджмент
- Экономика
- Менеджмент и кадры
- Управление, подбор персонала
- О бизнесе популярно
- Интернет-бизнес
- Личные финансы
- Делопроизводство, офис
- Маркетинг, PR, реклама
- Поиск работы
- Бизнес
- Банковское дело
- Малый бизнес
- Ценные бумаги и инвестиции
- Краткое содержание
- Бухучет и аудит
- Ораторское искусство / риторика
- Корпоративная культура, бизнес
- Финансы
- Государственное и муниципальное управление
- Менеджмент
- Зарубежная деловая литература
- Продажи
- Переговоры
- Личная эффективность
- Торговля
- Научные и научно-популярные книги
- Биофизика
- География
- Экология
- Биохимия
- Рефераты
- Культурология
- Техническая литература
- История
- Психология
- Медицина
- Прочая научная литература
- Юриспруденция
- Биология
- Политика
- Литературоведение
- Религиоведение
- Научпоп
- Психология, личное
- Математика
- Психотерапия
- Социология
- Воспитание детей, педагогика
- Языкознание
- Беременность, ожидание детей
- Транспорт, военная техника
- Детская психология
- Науки: разное
- Педагогика
- Зарубежная психология
- Иностранные языки
- Филология
- Радиотехника
- Деловая литература
- Физика
- Альтернативная медицина
- Химия
- Государство и право
- Обществознание
- Образовательная литература
- Учебники
- Зоология
- Архитектура
- Науки о космосе
- Ботаника
- Астрология
- Ветеринария
- История Европы
- География
- Зарубежная публицистика
- О животных
- Шпаргалки
- Разная литература
- Зарубежная литература о культуре и искусстве
- Пословицы, поговорки
- Боевые искусства
- Прочее
- Периодические издания
- Фанфик
- Военное
- Цитаты из афоризмов
- Гиды, путеводители
- Литература 19 века
- Зарубежная образовательная литература
- Военная история
- Кино
- Современная литература
- Военная техника, оружие
- Культура и искусство
- Музыка, музыканты
- Газеты и журналы
- Современная зарубежная литература
- Визуальные искусства
- Отраслевые издания
- Шахматы
- Недвижимость
- Великолепные истории
- Музыка, танцы
- Авто и ПДД
- Изобразительное искусство, фотография
- Истории из жизни
- Готические новеллы
- Начинающие авторы
- Спецслужбы
- Подростковая литература
- Зарубежная прикладная литература
- Религия и духовность
- Старинная литература
- Справочная литература
- Компьютеры и Интернет
- Блог
Раскрутка: секреты эффективного продвижения сайтов - Михаил Боде
Шрифт:
Интервал:
Закладка:
2. Канонизированный текст делится на фразы длиной от трех до десяти (примерно) слов. Разбивка осуществляется или встык, или внахлест, когда в последующую фразу включено одно или несколько последних слов из предыдущей. Малейшее изменение канонизированного текста – и возникают совсем другие шинглы. Чтобы конструкция не разрушилась как карточный домик, в тексте нужно задать четкие, но малоочевидные точки отсчета для членения на шинглы. В качестве примера приведем схожий алгоритм «Яндекса» под названием «Спамооборона», где устанавливаются границы, цитата: «от буквы “ю” до буквы “ю”; или от двухбуквия, сумма численных значений символов (букв) которого кратна 50, до следующего такого же».
3. Далее для каждого шингла вычисляется контрольная сумма (точнее, применяется хэш-функция). Проще говоря, последовательность слов превращается в последовательность цифр.
4. Затем формируется выборка шинглов, вернее, контрольных сумм и непосредственно сравнение и анализ документов. Из всех полученных контрольных сумм отбирается несколько десятков значений. Производится это путем случайной выборки, к примеру, 70 математических функций из заблаговременно составленного реестра, каждая из которых может описывать интересный для целей data mining параметр: пересечение, вложенность и т. д. Все шинглы документа пропускаются через каждое из 70 выражений, что дает на выходе значения, атрибутируемые тому или иному шинглу. Для каждой из 70 функций выбирается шингл с минимальным (возможны и иные критерии) значением контрольной суммы. В результате на базе анализируемого документа составляется сигнатура из 70 значений контрольных сумм. При сравнении с другим документом, который подвергся такой же операции, берутся шинглы, отобранные по совпадающим функциям. К примеру, если при отборе шинглов в обоих случаях было использовано 25 одинаковых функций из 70, то сравнение выполняется по 25 соответствующим контрольным суммам.
5. В результате анализа, если обнаружена высокая доля совпадения контрольных сумм двух документов, делается вывод о том, являются ли эти документы четкими (контент полностью совпадает) или нечеткими (контент претерпел некоторые изменения) дубликатами.
Конечно, алгоритм мы продемонстрировали лишь в общих чертах, чтобы дать представление о принципе поиска дубликатов методом шинглов.
Поисковики используют и другие сложные методы проверки текстов на уникальность. Среди них – статистический анализ частотности слов с использованием распределения Ципфа для поиска аномалий, наложение длинных пассажей (более длинных, чем шинглы, отрывков текста) для поиска совпадений в документах, которые подверглись ручному рерайту с разрушением шинглов, и другие методы.
Таким образом, избежать санкций поисковиков за использование чужого контента можно, лишь создавая оригинальный контент – самостоятельно ли, с привлечением ли копирайтера или рерайтера, способного качественно преобразовать заимствованный текст.
Семантическая разметка страниц
Индексируя страницы сайта, поисковый робот первым делом извлекает из них информацию. Чем более четко и организованно она подана «посланцу» Google или «Яндекса», тем быстрее и точнее он решит эту задачу.
На быстроту и корректность сбора данных для индексации влияет так называемая семантическая разметка страницы. Такое форматирование веб — документа призвано преподнести контент поисковику в предельно понятном, «съедобном» виде. Страница без семантической разметки будет так или иначе интерпретирована роботом, но ему придется самостоятельно структурировать извлеченную из нее информацию. А поскольку алгоритмы поисковых систем неидеальны, при отсутствии помощи со стороны сайтовладельца им не всегда удается безошибочно трактовать материалы и обеспечивать безупречный поиск по ключевым запросам.
Зато благодаря «семантической паутине», охватывающей все больше интернет — площадок, поисковики оказываются в состоянии давать пользователям точно и внятно сформулированные ответы на их запросы.
Микроформаты и микроданные
Семантическая разметка страницы осуществляется по специальным стандартам. Исторически сложилось так, что два гиганта поиска – Google и «Яндекс» изначально придерживались каждый своего формата. Разработчики из корпораций Google, Yahoo! и Microsof создали проект под названием Schema.org. Он основан на разметке с помощью тегов microdata («микроданные»). «Яндекс» присоединился к инициативе западных коллег осенью 2011 года, а до того начал продвигать в массы другую методологию – «микроформаты» (h p://microformats.org/wiki).
Очевидным образом веб — мастеров мягко подталкивают к тому, чтобы они прибегали к семантической разметке страниц. Администраторам сайтов в Рунете ради повышения привлекательности сайта для «Яндекса» и Google нужно учитывать оба формата и составлять две версии семантического описания контента.
Вот пример описания продукта с применением формата microdata:
(div itemscope itemtype="http://schema.org/Product")
(span itemprop="name")Микроволновая печь Samsung MW73VR(/span)
(img src="samsung — microwave — mw73vr.jpg" alt='Микроволновая печь Samsung MW73VR' />
(div itemprop="aggregateRating" itemscope itemprop="http://schema.org/AggregateRating">
Средняя оценка покупателей (span itemprop="ratingValue">4(/ span>
на основе (span itemprop="reviewCount">11(/span>отзывов(/div>
(div itemprop="offers" itemscope itemtype="http://schema.org/ Offer">
(span itemprop="price">2630 р.(/span>
(link itemprop="availability" href="http://schema.org/ InStock" />В наличии
(/div>
(span itemprop="description">Отдельностоящая микроволновая печь объемом 20 л и мощностью 800 Вт(/span>
(div itemprop="reviews" itemscope itemtype="http://schema.org/ Review">
(span itemprop="name">Отличная печка(/span> – от (span itemprop="author">Иван(/span>,
(meta itemprop="publishDate" content="2012 — 04 — 01">1 апреля 2012
(div itemprop="reviewRating" itemscope itemtype="h p:// schema.org/Rating">
(meta itemprop="worstRating" content = "1">
(span itemprop="ratingValue">4(/span>/
(span itemprop="bestRating">5(/span>stars
(/div>
(span itemprop="description">Легко чистить(/span>
(/div>
(/div>
Формат microformats hProduc «Яндекса» на текущий момент используется поисковиком для описания автомобилей в программе «Отзывы по автомобилям». Пример разметки микроформатами приведен на странице помощи в сервисе «Яндекс. Вебмастер» (http:// help.yandex.ru/webmaster/?id=1113265).
Насколько верна семантическая разметка с использованием микроформатов на вашем сайте, легко проверить соответствующим валидатором в «Яндекс. Вебмастере» (http:// webmaster.yandex.ru/microtest.xml).
CMS с поддержкой микроформатов
Для работы с большим количеством страниц рациональнее обеспечить семантическую разметку инструментами CMS. Среди готовых решений, которые поддерживают микроформаты, – Drupal, Wordpress, Movable type. Под «самописную» CMS придется создавать специальный модуль со сходной функциональностью.
Важно помнить, что предназначение семантической разметки – помочь поисковику проанализировать и структурировать созданный для посетителя и видимый ему контент. Любое отклонение от курса (например, попытка упорядочить скрытый текст и другие сомнительные элементы) может быть расценено как нарушения правил поисковой системы и грозит наложением санкций на ресурс вплоть до «пессимизации».
Семантическая разметка – это мало того, что большой шаг к улучшению результатов поиска, но и средство, делающее прозрачнее отношения между сайтами и поисковыми системами. А значит, процедура в равной мере коммерчески и «гигиенически» значимая.
Трафиковое продвижение
В действиях оптимизатора главный вектор – вывод проекта в топ. Но по достижении желаемых позиций очень важно закрепиться на них и обеспечить сайту прочное положение в выдаче. Удерживать занятые высоты и противостоять конкурентам в «Топ — 10» по средне– и высокочастотным запросам достаточно сложно. А значит, необходимы средства, которые помогут наладить неослабевающий приток целевых посетителей на сайт, если стандартных методов SEO окажется недостаточно.
На сегодняшний день в системе SeoPul реализованы два способа такой подстраховочной стабилизации. Первый – подключение синхронизированной кампании контекстной рекламы. Второй – трафиковое продвижение. О нем мы и поговорим.
Что это такое
Название метода говорит само за себя: его целью являются не позиции в топе, а сам трафик, или поток целевых посетителей. Иначе говоря, не качественный показатель продвижения, а количественный. При запуске SEO — кампании SeoPul прогнозирует посещаемость для каждого ключевого слова, но это лишь приблизительные величины. В случае с трафиковым продвижением количество посетителей известно заранее. Через какое — то время после запуска такой кампании можно провести анализ посещаемости и вычислить коэффициент конверсии. В итоге владелец площадки имеет на руках данные о том, какое количество посетителей ему требуется привлечь, чтобы обеспечить определенный уровень продаж. Чтобы «добыть» необходимое количество посетителей в SeoPult, достаточно пары кликов.

