Web-аудит позиций сайта
Аудит позиций сайта по ключевым словам
Словарь SEO терминов
Новости
Полезные статьи
Информация о проекте
Услуги оптимизаторам
Услуги владельцам сайта
Оплата услуг
SEO сервисы
SEO справочник
Статьи и публикации
Архив новостей

 
Пн Вт Ср Чт Пт Сб Вс
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30  1  2  3  4  5


пример: ключевые слова


Рекомендуем посетить:



продвижение сайтов любой сложности

Новости Новости

18.02.2007

Независимый обзор "внутренностей" Google

Независимый исследователь Тоби Ди Паскуале представил инфраструктуру Google в виде веб-презентации. В ней содержится информация о ключевых технологиях ндексации, хранения и обработки информации, содержащейся в интернете, а также выполнения поисковых запросов.

Презентация была представлена на витруальной конференции PLUG – Philadelphia Linux User Group (филадельфийская группа пользователь Linux)в августе 2006 года, а выложена в Сети совсем недавно. На тот момент г-н Ди Паскуале работал в корпорации Symantec главным специалистом по программному обеспечению, поэтому в фокусе его внимания оказалась именно поисковая архитектура Google и такие её элементы, как: файловая система, аппаратная составляющая, алгоритмы параллельной обработки данных и др. В презентации описываются следующие технологии:

MapReduce – технология распределенного выполнения программных инструкций, при которой команды выполняются параллельно на множестве компьютеров.
BigTable - система управления сверхбольшими базами данных
Sawzall – язык для создания скриптов параллельной обработки данных на основе Map Reduce
Указываются также данные о количестве и мощности серверов и другого оборудования. В частности, г-н Ди Паскуале сообщает, что у Google 450 000 дата-серверов, организованных в кластерную структуру. В зависимости от выполняемых задач серверы делятся на:

- обрабатывающие индексную базу
- поддерживающие документацию
- сервера проверки орфографии
- другие.

Ди Паскуале акцентировано дистанцируется от аспектов работы Google, связанных с поисковой оптимизацей, таких, как ссылочное ранжирование и Page Rank. Также он заявляет, что ни сам, ни кто-либо из его знакомых в штате Google не состоят, вся информация получена им благодаря двухгодичным исследованиям поискового гиганта. Публикуемые им цифры и факты помогают понять, как высоки информационные мощности Google, а также составить представление о сложности конкурирования с ним.

Так, синхронизация и параллелизация процессов накопления и выдачи информации позволяет Google избежать феноменов, подобных апдейту у Яндекса, когда выдача поисковика меняется в течение нескольких часов. Яндекс также применяет технологию распараллеливания, но у отечественного сервиса она ограничивается одновременным поиском информации в специализированных базах (коллекциях), предлагаемых поисковой системой. Поиск осущесвляется по отдельным базам небольшого размера, отличная от "большой" базы документов. Подразумевается, что документы, индексируемые в такой базе, имеют некоторую регулярную структуру.

Репликация (размножение) коллекции по машинам у Яндекса не производится, тогда как у Google, согласно наблюдениям г-на Ди Паскуале, реплицирована вообще вся база проиндексированных документов. Кроме того, Google реализует алгоритм одновременной записи данных в файл индексирующим роботом, и чтения из этого файла при выполнении поискового запроса.

Источник: www.seonews.ru



Независимый обзор "внутренностей" Google: распечатать распечатать






Словарь SEO терминов :: Новости :: Полезные статьи :: Информация о проекте :: Услуги оптимизаторам :: Услуги владельцам сайта :: Оплата услуг :: SEO сервисы :: SEO справочник :: Статьи и публикации :: Реклама :: Полезные ссылки :: Обратная связь :: Карта сайта

Аудит позиций сайта по ключевым словам

© 2006—2024 UpWard.ru
Ваши позиции сайта в поисковых системах
Задать вопрос | старая версия сайта
Проект: InWind.ru - продвижение сайтов