Артем Пилипець

Артем Пилипець
SEO7

Керівник відділу SEO SEO7 і засновник проекту Школа SEO​​

  • digital-спеціаліст
  • досвід понад 5+ років у сфері інтернет-маркетингу, веб-розробки, пошукового просування, аналітики.
  • Займається консультуванням приватних власників бізнесу та побудовою стратегій просування для сайтів.

Виступи спікера

img НаЗахід 25

Чому ви не знаєте що ваш контент вкрали

Відео конференції
Презентація

Артем Пилипець є одним з засновників сервісу перевірки унікальності https://candy-content.com/ і давно вже працює з темою плагіату. 

Деякі люди не завжди розуміють чому крадіжка контенту є проблемою. Google багато уваги приділяє цінності контенту і завжди звертає увагу на плагіат. Тому, такі сторінки будуть просідати, бо не несуть інформаційної цінності на думку Google.

Артем стверджує, що просто перевірити унікальність яким-небудь доступним вам сервісом — недостатньо. Артем з командою проводили багато тестів та виявили, що багато сервісів провалюють найпростіші перевірки:

https://plagiarismdetector.net/  

https://www.quetext.com/  

https://copywritely.com/ 

https://www.grammarly.com/plagiarism-checker/ 

Всі ці сервіси показували, що контент унікальний, хоча він був взятий просто з інтернету. Деякі сервіси провалюють вже першу перевірку, деякі — кожну третю чи п’яту. 

Інший цікавий тест проведений Артемом та командою також показав неочікувані результати. Вони брали фрагменти тексту з сайту Tripadvisor та збирали в один текст. Цей текст провалили навіть ті сервіси, які пройшли перший тест:

https://plagiarismcheck.org/  

https://my.plag.com.ua  

https://smallseotools.com/plagiarism-checker/ 

https://seranking.com/ 

Артем дає посилання на сторінку де ці результати можна перевірити самим: https://candy-content.com/uniq-result/d4080c8f-6ff9-4bab-8f0f-7642701a6e82/  

Чому так відбувається?

Для того, щоб зрозуміти, чому Артем отримав такі результати, треба розуміти, як працюють сервіси для перевірки тексту. Спочатку береться фрагмент тексту та по ньому проводиться пошук у вебі. Пошук знаходить копії та порівнює їх і таким чином, отримується відсоток збігів.

Проте, такого підходу недостатньо. Артем виділяє три основні проблеми: 

  1. Задовгі фрагменти. 
  2. Мала кількість фрагментів для перевірки в пошуку.
  3. Відсутність аналізу мови.

Багато сервісів найкраще працюють з англійською мовою. В роботі з іншими мовами, вони не враховують синтаксис та особливості конкретної мови, що не дає адекватного результату.

Для того, щоб відшукати скопійовані фрагменти, потрібно взяти достатньо довгу фразу у 20-30 слів. Проте, це збільшує можливість помилки. Якщо шукати текст маленькими фразами, то зникає баланс між якістю, швидкістю, та ціною. Якщо шукати кожні 5 слів тексті, то потрібно буде зробити дуже багато запитів для алгоритму. Це значно збільшить ціну перевірки та час. Врешті решт, це може привести до результату з тисячами потенційних дублікатів.

Якщо контент скопійований лише частково, то велика ймовірність, що сервіс не знайде дублікатів. Це стається через те, що багато сайтів обмежують доступ стороннім ботам та парсерам загалом. Вони також підміняють контент, коли це стосується сторонніх ботів. Таким чином, контент не отримується та плагіат не може бути знайдений.

Також, коли сервіс перевіряє плагіат, він робить багато запитів. І ці запити потрібно прорендерити, що вимагає величезних потужностей.

Чому це небезпечно?

Треба розуміти, що ця проблема накопичується і вона доволі велика. Артем наводить такий приклад: 19.1% всіх сайтів використовують Clouflare. Ось посилання на цю статистику:

https://w3techs.com/technologies/details/cn-cloudflare 

Це означає, що якщо контент буде скопійований з такого сайту, стандартні сервіси перевірки унікальності просто не знайдуть його.

Навіть, якщо ви не знаєте, що ваш контент вкрали, Google Про це знає і ви можете отримати негативні наслідки такі, як часткова втрата позицій. У Google є поняття основної копії (той, хто ранжується першим), але важливість цих копій може з часом змінюватись з різних причин. Таким чином можна випасти з індексу та більш ймовірно потрапити під апдейти, які тривають протягом останнього року.

Також варто відстежувати плагіат контенту через лінки. Якщо ви не знаєте всіх своїх копій, ви недоотримуєте посилання.

Соціальні мережі Артема:

https://www.facebook.com/artem.pilipec.seo   

https://candy-content.com/ 

img НаЗахід 17

Як оцінювати під теми в нішах: підхід і параметри оцінки

Методи вибору фокусних кейвордів (основні підтеми, навколо яких формується хороша семантика, за якими є плани вийти в топ):

  • Відбір за KD за Ahrefs і частотністю
  • Довжина запиту 3+ слова
  • Уточнення складності за медіаною Referring domains (медіана – це зважене середнє)
  • Перевірка “фокусного ключа конкурентів” (як багато конкурентів використовують той самий фокусний ключ, якщо якийсь ключ не використовується конкурентами – він не приносить грошей)
  • Оцінка середнього DR
  • Перевірка контенту конкурентів: кількість слів, кількість підзаголовків, наявність особливих складних елементів + розрахунок бюджету залежно від того, що необхідно клієнту.
  • Нюанси
  • Під час врахування входження фокусного запиту в title варто враховувати популярні синоніми та відкидати безглузді часто використовувані слова. Робити акцент на слова, що формують інтент запиту.
  • Зверніть увагу, до якої основної теми належить ваш потенційний фокусний ключ. Вибирайте теми з більшою семантикою і навколо неї будуйте текстову оптимізацію.

Підхід зміщеного фокусного ключа – з кластера необхідно вибрати невеликі запити з низькою складністю, і за цими запитами оптимізувати контент, будувати посилання, анкор-лист. Завдання – стати в топ-1 за нескладним ключем. Якщо ваша сторінка починає отримувати трафік за нескладним ключем, то ця сторінка отримує позитивний поведінковий досвід і починає зростати за всіма запитами кластера, навіть за ВЧ запитами кластера. Це дає змогу заощадити бюджет на посилальні.

2 напрямки перевірки

Оцінка кореляції показників у ТОП-10 і складності.

Вивантажив SERP з Ahrefs Keywords Explorer

Дозібрав дані через Netpeak Spider

Завантажив дані в orangedatamining.com

1436 рядків за 25 параметрами

Пошук кореляції між позиціями тестового сайту і показниками.

Вивантажив позиції з GSC

Зібрав за ними SERP з Ahrefs

Розмітив входження фокусних слів

Об’єднав дані в Data Studio

Завантажив дані в orangedatamining.com

Основна проблема – зв’язок показника складності з рівнем оптимізації.

Кореляція – не залежність, а статистичний збіг.

Оцінка кореляції в ТОП-10

Менше 0,3 – незначні.

Якщо подивитися на запити, які не корелюються зі складністю, наприклад, рейтинг домену і вік, то можна зробити висновок, що для аналізу ніші показники віку і рейтингу важливі, але під час аналізу КС, за якими потрібно отримати високі позиції, ці фактори на другому плані.

Це аналіз за топ-10, тому кореляція з позицією досить слабка (слайд нижче).

Аналіз кореляції віку і KD

За легкими запитами (за якими практично немає посилань) є кореляція між віком домену за Whois і складністю. Тобто за відсутності посилань конкуренти шикуються за віком. Що більше посилань – то менше вік і позиція мають статистичну закономірність.

У більш конкурентних нішах найпоказовішим елементом конкуренції залишаються Referring Domains.

Проміжний висновок

Основні показники складності це:

  • Кількість Referring Domains,
  • трафік,
  • кількість ключових слів,
  • видимість сторінки.

Схоже, що вік важливіший під час ранжування у видачах із невеликою кількістю Ref. Domains на сторінку. Вік краще визначати за WhoIs – дата першої реєстрації домену.

  • Аналіз даних після запуску тестового сайту
  • Цікавий факт про KD Ahrefs

KD – це переведений у логарифмічну шкалу показник медіани за Referring Domains. Позиція корелює краще саме з медіаною за Referring Domains, ніж з KD Ahrefs. Тобто використовувати медіану або середньоквадратичне за Referring Domains – більш правильний спосіб оцінки складності за посиланнями, ніж просто аналіз KD.

Кореляції з позицією

Позиція в прикладі нижче – це позиція тестового сайту за аналізованими запитами. А це означає, що позитивна кореляція з позицією свідчить про те, що показник відображає складність запиту.

Кореляції з позицією в різних діапазонах RD

Середній DR завжди трохи корелює з позицією. На практиці: якщо ви бачите великих конкурентів з високими рейтингами доменів, то можна вибудувати величезну кількість посилань і точно оптимізуватися під певний ключ і обігнати цих конкурентів. Це працює в білій ніші, оскільки можна бачити всю картину цілком.

Після нарізки запитів на діапазони з’явилася сильна залежність у низькоскладних запитах між оптимізацією під фокусний ключ і позицією. Що більше конкурентів топ-10 оптимізуються під фокусний ключ, то складніше буде вийти за ним у топ.

У зв’язку з великою кількістю текстових алгоритмів, які використовує пошукова система, точне входження під час оптимізації працює добре в разі конкуренції за сторінками, у яких до 50 RD (за цією вибіркою). Тобто якщо RD не сотні і не тисячі, то оптимізація сторінки (точно під ключ у важливих елементах) має велике значення, тобто ви отримаєте вищу позицію з більшою ймовірністю. І це хороший спосіб оцінити складність запиту.

Середні RD і RD для потрапляння в Топ-10 за вибіркою

Кількість RD добре корелює з наявністю оптимізації під фокусний ключ.

Другі висновки

Схоже, що складність запиту варто оцінювати каскадно:

  • Некоректно об’єднувати в одну оцінку складності показники посилань і рівень оптимізації сторінки, потрібно ділити КС на сегменти і після цього переходити до аналізу внутрішньої оптимізації. На різних рівнях складності за зовнішніми посиланнями діють різні закони щодо внутрішньої оптимізації.
  • Для більш точного аналізу за посиланнями краще ґрунтуватися на ref domains, відкидаючи рейтинг домену, і орієнтуватися на меридіану.
  • Для запитів конкуренти яких мають менше 50 ref domains, точна оптимізація під фокусний ключ працює краще, ніж у запитах 50+ ref domains.

Як показник складності медіана за ref domains показує себе краще, ніж KD.
Схоже, що точна оптимізація од фокусного ключа дає змогу істотно скоротити кількість необхідних ref domains на сторінку.
Фінальні висновки

Під час аналізу хибності окремих запитів, як і раніше, актуальні:

  • Відбір за KD і частотністю
  • Уточнення складності за середнім Referring domains
  • Перевірка “фокусного ключа конкурентів”
  • Оцінка середнього DR

Але їх не можна зводити в одну формулу, оскільки вплив цих чинників сильно залежить від кількості Referring domains конкурентів.

Схоже, що вік сайту слабо впливає на позиції в “нескладних” запитах.

Порада: Якщо ви хочете щось проаналізувати, зберіть дані, подивіться, як ці дані фактично корелюють на видачі, після цього можна серйозно ставитись до цих показників, адже ви розумітимете, що має статистичні закономірності, що – ні, і ваша аналітика ґрунтуватиметься на даних.