GOOGLE ТЕПЕРЬ ИНДЕКСИРУЕТ... ФЛЭШ!
Интервью Робин Ноблз с Майклом Маршаллом
Как вам, вероятно, известно, индекс-страница, выполненная во Флэше, делает сайт практически недоступным для индексации поисковыми роботами. Поисковый робот попросту не видит на такой странице контента, который он мог бы проиндексировать.
Поэтому когда я узнала, что Google теперь может индексировать ролики, выполненные в Macromedia Flash, была просто поражена. Однако это событие прошло практически незамеченным в среде оптимизаторов и вебмастеров.
Вам, вероятно, также известно, что Google был первым поисковиком, который начал индексировать документы различных форматов как то - PDF-документы, .doc-файлы и т. д. Google также совершил настоящий прорыв в индексировании динамических страниц.
А теперь, это еще и первый поисковик, который индексирует Флэш - еще один шаг вперед в развитии поисковой технологии. Но почему же Флэш был так труден для индексации в прошлом?
Macromedia Flash и поисковая оптимизация
С Флэш роликом на индекс-странице владелец сайта отказывается от размещения на ней текстовой информации, которая необходима поисковому роботу, для того чтобы проиндексировать сайт и отнести его к той или иной категории. В отсутствие текста поисковику попросту нечего индексировать. Хотя, такая индекс-страница все еще имеет шансы на хорошие позиции в результатах выдачи, благодаря, в основном, таким факторам как индекс цитирования и качество входящих ссылок.
В связи с таким отношением к Флэшу поисковиков, те компании (веб дизайн студии, фотографы, компании предоставляющие услуги по графическому дизайну), которые хотели представить информацию о себе или своих продуктах/услугах в наиболее выгодном свете, используя новейшие технологии для лучшей презентации, оказывались в не очень выгодной ситуации.
Поэтому, такие компании зачастую отказывались от хороших позиций в поисковиках, ради лучшей репрезентации своих услуг. Так как получить и то, и другое, не представлялось возможным.
Представляем Майкла Маршалла
Когда Майкл Маршалл, создатель ThemeMaster и один из модераторов форума online search engine marketing courses, сообщил мне, что Google индексирует Флэш сайты, я тотчас же захотела поподробнее узнать об этом и решила взять у него интервью. Давайте узнаем, что Майкл думает по поводу ситуации с Google и Флэш.
* * *
- Майкл, как можно узнать, что Google теперь индексирует Флэш сайты и прочие документы, выполненные с использованием этой технологии? Можно ли выполнить поиск только среди Флэш документов?
Да. Можно ввести обычный запрос совместно с оператором типа файлов с расширением '.swf'. Таким образом, поиск будет производится только среди Флэш документов. [FLASH] будет отображаться перед каждым из файлов представленных в результатах поиска.
Например, можно ввести такой запрос: Best Free Banner Exchange Market" filetype:swf
- Каким образом можно извлечь текст из Флэш сайта, для того, чтобы в точности узнать, что же видит Google?
Macromedia предоставляет для этих целей специальный поисковик SDK (http://www.macromedia.com/software/flash/download/search_engine/) - с помощью него можно получить нужную информацию. SDK включает в себя специальное дополнение под названием 'swf2html'. 'swf2html' сканирует Флэш документ на наличие ссылок и текста и возвращает переработанные данные в виде HTML документа. Swf2html - это своего рода компилятор, а также статическая библиотека файлов. Более подробную информацию о работе 'swf2html', можно узнать из файла Readme.htm, который входит в SDK.
- Располагаете ли вы примером Флэш файла и текста, который был извлечен из этого Флэш файла с помощью этой программы?
Да, конечно же, я экспериментировал с этой программой и могу сказать, что хотя извлеченный HTML файл выглядит, не очень симпатично, в нем все же есть вся необходимая информация для того, чтобы быть проиндексированным. Однако же исходный Флэш файл для использования пользователями подходит лучше, чем скомпилированный документ. Опять же, вы всегда можете сравнить эти два файла.
Пример Flash файла:
http://www.internet-marketing-analysts.com/flash_sample.html
Пример извлеченного текста:
http://www.internet-marketing-analysts.com/extracted_text.html
(Примечание1: В этом примере использован один из Флэш файлов созданных Майклом. Однако я выбрала именно этот документ по двум причинам: 1) из-за использования в нем многих функциональностей Флэша; 2) в этом Флэш документе, в отличие от многих других (можно даже сказать большинства) Флэш документов представлено достаточно большое количество текстовой информации.
Примечание2: Не забудьте выделить текст (Ctrl+A) во втором документе.)
В скомпилированном файле, можно заметить что несколько строк повторяются несколько раз подряд, а часть текста вообще невидима, однако же, это не спам, а на самом деле объясняется недостатками в работе компилирующей программы.
Другими словами, даже если такое и произойдет с вашим документом, это не будет расцениваться как спам и по настоящему скрытый текст.
- Но как мы можем знать, что Google видит Флэш файл именно таким?
Для этого можно выполнить простую проверку. Необходимо задать поиск среди Флэш документов, на точное соответствие, используя, отрывок текста из начала документа, потом из конца. Для того чтобы получить стопроцентную гарантию можно провести аналогичную операцию для текста представленного где-нибудь в середине документа. Это хороший способ, для того чтобы узнать, как именно видит ваш Флэш документ Google. Так как выполнить точную проверку на то, что видит Google на Флэш сайте, не представляется возможным - описанный выше способ является лучшим на данный момент.
- До какой степени Google распознает и сканирует Флэш документ? Другими словами, насколько глубоко поисковый робот проникает во Флэш сайт?
Исходя из моего личного опыта работы с этим приложением от Macromedia, я могу сказать, что Google распознает весь текст, включая ссылки... от начала до самого конца документа.
- Вы упомянули, что в извлеченном документе может появляться дублирующий текст, в том случае если какая-то часть ролика была ассоциирована с текстом.
Кое-кто возможно и представляет, как именно это работает, но кое-кто (вроде меня) не очень... Означает ли это то, что некоторые из способов анимации необходимо использовать с особой осторожностью дабы избежать повторения текста и таким образом избежать возможных проблем, когда такой документ будет признан содержащим определенное количество спама, и сведет на нет все усилия по оптимизации?
Да. Вид анимации, использующийся для представления текста, может создать подобные проблемы. Поэтому с этим надо работать предельно осторожно, для того чтобы не получить какого-либо рода пенальти за использование спаммерских технологий.
- Если просмотреть исходный код скомпилированного HTML документа (http://www.internet-marketing-analysts.com/Google-Flash_tutorial/), мы не увидим там тега 'title'. Какой именно текст использует Google в качестве title при отображении результатов поиска?
Опираясь на собственный опыт, могу сказать, что Google использует первую строчку во Флэш документе в качестве title. Для того, чтобы проверить какой именно текст будет использоваться как title для вашего документа, можно использовать swf2html и модифицировать файл, до тех пор, пока вы не получите нужного результата. Описание результатов поиска, которое предоставляет Google, создается динамически (в зависимости от запроса), для этого используется отрывки текста из Флэш сайта.
- Можете ли вы дать еще какие-либо советы по оптимизации Флэш документов?
Да. Я бы порекомендовал прочитать мой туториал по оптимизации Флэш документов...
(Полная версия статьи опубликована в "РВ" - расширенном выпуске нашей рассылки)
Подписаться на "РВ" можно здесь - http://www.optimization.ru/subscribe/money.html
См. также О преимуществах платной подписки
Русский перевод под ред. И. Гурова