- LSI - латентно-семантичний індекс
- Як сформувати LSI-ядро для тексту?
- LSI: протипоказань немає
- LSI: чому це важливо?
Латентно-семантичний аналіз був запатентований в далекому 1988 році, так що в SEO, яке вже не перший рік помирає, не відбулося нічого нового. Про LSI-текстах активно заговорили років 2-3 тому, коли пошуковики почали лютувати, викочуючи нові і нові апдейти алгоритмів. У 2015 році компанії почали повально експериментувати з LSI. Про те, як і навіщо створювати LSI-тексти сьогодні для SEO завтра, розповіла Наталія Кирик з WordFactory в новому гостьовому пості.
Один з най-най FAQ, який нам не задавали до 2015 року, звучить так: - Ви робите LSI-тексти? - Що ???
LSI - латентно-семантичний індекс
LSI дозволяє пошуковим системам аналізувати тексти на сторінці з точки зору їх релевантності тематиці (ключові слова) і рекомендувати читачеві найбільш підходящі (що містять максимальну кількість ключових слів, але використаних в тексті без втрати сенсу і переспама). Наприклад, ви шукаєте в пошуковику «LSI-текст». Робот знайде сотні статей, в тому числі з однойменними назвами компаній, абревіатурами термінів з інших галузей науки. На перших місцях у видачі будуть всі тексти, пов'язані з LSI-копірайтінгом і SEO. А корпоративні сайти і інформація про терміни з інших галузей будуть десь на 101-й сторінці.
При цьому SEO-текст формату 2009 року зі високою щільністю ключових слів, часто не стосуються теми статті, в більшості тематик буде нижче у видачі, ніж якісний LSI-текст. Ми говоримо «в більшості тематик», тому що на сьогоднішній день в ТОПі все ще є сайти з SEO-текстами і з щільністю ключових слів 50%. А тепер науковий підхід.
В SEO є три основні підходи до цього:
- Використання подсветок.
- Частотний словник по топу.
- Аналіз з використанням всієї колекції документів Яндекса.
Розберемо їх докладніше.
1. Використання подсветок. Це те, що лежить на поверхні, тому легко використовується. Що підсвічує пошук? По-перше, синоніми. По-друге - геоуказаніе (для геозалежних запитів), по-третє, - якісь слова по темі. наприклад:
Зелена рамка виділені синоніми, жовтої - геоуказаніе, червоною - додаткові слова підсвічування.
Але скільки слів ми можемо витягти з висвітлює? 3-5? Іноді трохи більше, але менше десяти. Для повноцінного написання тематичного тексту це не годиться. Тому професіонали цей спосіб не використовують.
2. Частотний словник - це коли ми складаємо список слів, що зустрічаються в ТОПі і навпроти кожного з них пишемо, скільки разів воно зустрілося. Чим більше разів слово зустрілося в ТОПі (на більшій кількості сайтів), тим більше «тематичним» воно вважається. Цей метод вже значно краще простих подсветок. Якщо в ТОП-10 Яндекса містяться якісні тексти, то метод показує себе дуже добре. Наприклад, за запитом «пластикові вікна» майже всі тексти хороші і можна таким чином виділити необхідні для написання тексту слова.
3. Аналіз з використанням всієї колекції документів Яндекса. Цей спосіб був реалізований мною в модулі «Акварель» системи Just-Magic.org . Він полягає в тому, що аналізується ТОП-10 і навіть не ТОП-1000, а використовується мова запитів Яндекса для роботи з усією його колекцією цілком. Цей метод дає істотно кращі результати, ніж простий частотний словник. Ось приклад аналізу фрагмента тексту важким для попереднього методу запитом «сауна на двох»:
Тут, ніж більш «зелене» слово, тим більше воно відповідає запиту. Чим більше «червоне» - тим менше. Сірим кольором позначені службові слова. Як бачите, текст майже повністю «червоний». Не дивно, адже прибравши з нього слово «сауна», ми взагалі не зрозуміємо, про що мова. А ось як з цим же текстом справляється класифікатор, побудований на базі аналізу тільки ТОП-10: Тут багато нетематичні слова стали зеленими. Відбувається це тому, що якість текстів в ТОП-10 в цілому низька.
Те ж стосується «купити мобілку»: робот може видати сайти, просуваються по запиту «купити мобільний телефон».
Часто зустрічаються в пошуковій видачі синоніми. Завдяки LSI пошукові системи дуже швидко вловлюють нові тренди різних неологізмів і можуть формувати більш релевантну пошукову видачу, відповідаючи на потреби користувача. Цю систему практично можна назвати штучним інтелектом.
Як сформувати LSI-ядро для тексту?
- Аналізуємо запити читачів: що шукають ті, хто цікавляться вашою тематикою (наприклад, «як дізнатися, що мій кіт хоче мене вбити», «як дізнатися, що мій кіт любить мене»).
- Аналізуємо аналогічні сайти: дивимося, що вже зроблено, і робимо краще, ретельніше, детальніше.
- Аналізуємо статистику, отриману в ході контекстної реклами (можливі нестандартні, несподівані запити, за якими вас знаходять клієнти або читачі).
LSI-текст і SEO-текст зразка 2009 року: знайдіть відмінності
У ТЗ на створення LSI-тексту немає вимог про щільність LSI-ключів. LSI-ключ - це, скоріше, сигнал, що ось цей термін повинен бути, це питання є важливим для читача і ми повинні на нього відповісти. Не потрібно робити пряме входження LSI-ключового слова - пошуковик знайде його словоформу завдяки загальному контексту уривка, іншим словами і термінам. Так, пошуковик визначить, показувати вам сайт компанії LSI International або визначення LSI на сайті контент-студії.
LSI: протипоказань немає
Головний недолік методики, про який говорять експерти, - ціна. Для аналітики потрібні відповідні ресурси, фахівці і час. Правильний LSI-текст коштує дорожче звичайного SEO-тексту. Для повного розкриття теми часто потрібно не менше 10 000 символів, в порівнянні зі стандартними 2000 знаків без пробілів для SEO. та й написати лонгрід предметно, без води, можуть тільки автори з відповідною спеціалізацією (профільну вищу освіту, досвід роботи за фахом), а їхні послуги коштують дорожче. Найвимогливіші фахівці стверджують, що LSI - змагання з кращими, спроба їх наздогнати, але не перегнати.
Робота над контентом в SEO часто потокова, тому формувати ТЗ вручну занадто довго. Так люди і прийшли до автоматизації через LSI-аналіз, який дає відповіді на питання, які ключі і в якому обсязі потрібні. Проблема в тому, що цей метод призводить до моделі «Ахіллес і черепаха» (Одна з апорії давньогрецького філософа Зенона). Ми наздоганяємо тих, хто в ТОПі, але перегнати або відірватися від них не зможемо, тому що наш контент побудований на основі конкурентів і нічого додатково корисного або нового не додає. З іншого боку, цей підхід все ж дає ТОП-10 за запитами, тобто і цільовий трафік, а Яндекс все пропагує: дайте щось більше, ніж є зараз в інтернеті, і отримаєте високі позиції. Багато хто працює за принципом Парето - їх влаштовують ті 80%, отримані за 20% зусиль, витрачені на LSI.
LSI: чому це важливо?
Ми впевнені, що немає нічого кращого якісного тексту, написаного на підставі ретельної аналітики. Але зразковим можна назвати і текст, наприклад, для інтернет-магазину запчастин, написаний дипломованим інженером-машинобудівником або інженером СТО, добре структурований, вичитаний професійним редактором. По суті, збираючи LSI-ключі для тексту, SEO-експерт робить те ж, що і аналітик, який збирає дані для всебічного розкриття теми в статті. Те ж робить досвідчений експерт, коли пише значну статтю на підставі всього свого досвіду роботи по конкретній темі. Тільки він не говорить, що робить LSI-текст. Тому, коли ми запитали у експертів, чи працюють вони з LSI, отримали кардинально протилежні відповіді: «Так, активно працюємо», «Ні, ми пишемо якісні, предметні, детальні інформативні статті». При цьому мета і у перших, і в других одна - якісний контент, який відповідає на питання читача. Не дивно, що в 2015 році ми виконували ряд проектів для тематик, в яких сайти з LSI-текстами були в ТОП-10 своїх категорій.
Один з най-най FAQ, який нам не задавали до 2015 року, звучить так: - Ви робите LSI-тексти?Що ?
Що підсвічує пошук?
Але скільки слів ми можемо витягти з висвітлює?
Як сформувати LSI-ядро для тексту?
LSI: чому це важливо?