Содержание
- 2. Что и для чего проходим? Апдейты ПС Текстовый спам Спам в коде страниц Дорвеи и редиректы
- 3. Машинное обучение Тематическая классификация
- 4. Инструкция Алгоритмы Машинное обучение
- 5. F3 F7 > 2 F3 > 2 F3 > 1 2 1 4 3 Деревья вариантов
- 6. Асессоры
- 7. Асессоры
- 8. Асессоры
- 9. Классификация текстов и запросов
- 10. Тематическая классификация
- 11. Тематическая классификация
- 12. Тематическая классификация http://tag4site.ru/classify
- 13. Тематическая классификация
- 14. BM25
- 15. Okapi BM25 — функция ранжирования
- 16. Okapi BM25 — функция ранжирования
- 17. Модификации BM25 BM25F LinkBM25
- 18. Задача Посчитайте BM25 для анкор-листа
- 19. Апдейты ПС
- 20. Апдейты
- 21. Что и для чего проходим? Может произойти изменение позиций без изменений индекса, т.е. вы обновили тексты,
- 22. Что и для чего проходим? tools.promosite.ru Виды апдейтов
- 23. Как определять апдейты По количеству изменений считается % шторма
- 24. Текстовый спам
- 25. Спам в тексте страниц — избыток ключевых слов в тексте страницы, некачественные, бесполезные тексты, размещенные для
- 26. Спам в тексте ссылок — большое количество ссылок с одинаковыми анкорами, с коммерческими анкорами.
- 27. Спам в мета-тегах слишком длинные мета-теги, редкие n-граммы (купить детская каша, низкая цена), использование спецсимволов, сгенерированные
- 28. Синонимайзинг, рерайт — создание новых текстов по образцу старых без добавления к ним новой смысловой ценности
- 29. Автогенерация текстов — автоматическое создание текстов по заранее заданным параметрам/формулам.
- 30. Спам в коде страниц
- 31. Манипулирование HTML-тегами Description Keywords H1, H2, H3, H4, H5, H6 STRONG, B EM, I
- 32. Скрытие текста от посетителей Белый текст на белом фоне 1 пиксельный текст Скрытие через CSS (display:none)
- 33. Скрытие текста от посетителей Белый текст на белом фоне 1 пиксельный текст Скрытие через CSS (display:none)
- 34. SEO-тексты Рерайт текстов Разные методы «уникализации» текста Генерация SEO-текстов Множественное употребление слов в тексте
- 35. Как определяется спам в почте Задачка: придумайте алгоритм определения спама в почте, на основе только текстовых
- 36. Дорвеи и редиректы
- 37. Дорвеи и редиреты — сайты, которые создаются для манипулирования поисковыми системами, с целью получения трафика и
- 38. Клоакинг и свопинг
- 39. Свопинг — создание страницы, контент на которой меняется сразу после выхода в ТОП, использовалось для продвижения
- 40. Клоакинг — показ разного контента роботу поисковой системы и пользователю (разные версии страниц, скрытые блоки, спамные
- 41. Заимствование контента
- 42. Заимствование контента — показ чужого контента на своем сайте (автоматическое/ручное заимствование/iframe).
- 43. Аффилиаты
- 44. Разные сайты одной компании — попытка монополизировать рынок через манипулирование поисковой выдачей. совпадение контактных данных, один
- 45. Сателлиты
- 46. Разные сайты одной компании
- 47. Ссылочный спам
- 48. Ссылочный спам факт размещения ссылки для накрутки результатов ранжирования, создание сайтов для продажи ссылок (отдельные или
- 49. Ссылочный спам взлом сайтов, использование вирусов (продажа ссылок с display:none), спам по форумам, гостевым книгам, доскам
- 50. Как идентифицировать ботов Задачка: придумайте самообучающийся алгоритм определения спама в комментариях для движка типа wordpress
- 51. Поведенческий спам
- 52. Поведенческий спам имитация действий пользователей на выдаче, имитация переходов по ссылке, имитация поведения внутри сайта.
- 53. Спам в рекламе
- 54. Спам в рекламе Pop-up реклама, Ссылки, ведущие на спамные сайты, Ссылки или реклама сайтов запрещенных тематик
- 57. Парсинг
- 58. Парсинг сервисы подбора запросов, поисковая выдача: URL сайтов, позиции, сниппеты, технические данные. сохраненные копии контекстная реклама
- 59. Уведомления
- 60. Настройка уведомлений
- 61. Антиспам
- 62. Последствия спама для ПС мусорный контент, медленная работа серверов, ущерб качественным ресурсам, потеря аудитории
- 63. Что искать? контент, ссылки, поведение
- 64. Что искать? 86% спама можно вычислить на основе анализа контента страниц.
- 65. Как искать?
- 66. Как искать? Обнаружение спам страниц как задача бинарной классификации: 1 – спам 0 – не спам
- 67. Как искать?
- 68. Как искать? Попытка №1
- 69. Как искать?
- 70. Как искать?
- 71. Как искать?
- 72. Как искать?
- 73. Как искать?
- 74. Как искать? Попытка №2
- 75. Как искать?
- 76. Как искать?
- 77. Как искать?
- 78. Как искать?
- 79. Как классифицировать сайт?
- 80. Как классифицировать сайт?
- 81. Как классифицировать сайт?
- 82. Как классифицировать сайт?
- 83. Как классифицировать?
- 84. Как классифицировать сайт?
- 85. Как классифицировать сайт?
- 86. Оценка качества поиска
- 87. Показатели качества поиска Полнота - отношение числа найденных релевантных документов, к общему числу релевантных документов в
- 89. Скачать презентацию