Страниц: 1 2 [3]
  Печать  
Автор Тема: Google  (Прочитано 11225 раз)
0 Пользователей и 1 Гость смотрят эту тему.

//текст доступен после регистрации//


18 200 000 результатов за 0,14 сек.
Объясните, как это возможно!

Маша
Гений-Говорун
*
Offline Offline

Сообщений: 1450

СПАСИБО
-вы поблагодарили: 239
-вас поблагодарили: 593


Я просто умница

617631966
Просмотр профиля Email
Ответ #30 : Март 30, 2010, 20:33:20 �

Это все болезненные вопросы LaughА вот научиться ходить на зубах, это посерьезней  вопросик Cheesy
Записан

Мама твердила мне, что самое важное в жизни — быть счастливой. Когда я пошла в школу, меня спросили, кем я хочу стать. Я написала "счастливой". Мне сказали " "ты не поняла задание", я им сказала — "вы не поняли жизнь".(с)
Lkob
Умник
****
Offline Offline

Сообщений: 625

СПАСИБО
-вы поблагодарили: 56
-вас поблагодарили: 62


Будь проще, и люди к тебе потянутся.

499789811
Просмотр профиля Email
Ответ #31 : Март 30, 2010, 20:35:36 �

Согласен. Smiley
Записан

Третий закон Ньютона даже наша партия не сумела отменить. Не успела. А зря...
gruvy
Новенький
*
Offline Offline

Сообщений: 1

СПАСИБО
-вы поблагодарили: 0
-вас поблагодарили: 0


Просмотр профиля
Ответ #32 : Март 31, 2010, 00:23:37 �

ну  не знаю что вы так заморочились
для начало  нужно понимать что  у серверов гугла террабайты  оперативной памяти ( она  в  раз в 100 быстрее, но и это мало )))
 
я все же могу  быть неправ но вряд ли  сильно грубо
гугл  это большой мнемонический мозг )))
он неделями  - месяцами обрабатывает и индексирует страницы, переводя в удобный ему язык на  кучу  параллельных серваков, фактически  поисковики  копируют ВЕСЬ интернет к себе на серваки постоянно , т.е.   если у вас   есть текст на странице - то он хранится во всех поисковиках,  избыточность   хранения просто ,а то что  поисковые серверы используют рейды меня вообще пугает, по ощущениям  у нас винты покупаются в мире 50 на 50 - всеми пользователями и несколькими поисковыми компаниями ( добавлю к ним  ютуб и контакт например)
дальше  - у гугла нет вариантов работать быстро кроме самообучения и повторения
как ни странно букв  у нас  всего 33 , и  вы представьте - гугл взял всю  инфу инета  засунул себе в "память" сортировал, считал  всё месяц, но к моменту когда вы  посылаете запрос   - буква О - он успел посчитать что это  пол миллиарда  упоминаний  - и выдал вам  готовый ответ
и как ни странно  слов и словочетаний в принципе не много, настолько немного что  можно  дажи отдать часть ресурсов на слова  с ошибками  например
и именно популярные списки есть  та самая тайна )) скорее всего вы наберете  словно  порно, гугл каждый день выдает сотни тысяч подборок к этому слову - оно у него в самом удобном месте оперативной памяти на серверах всех языков ))))
и поверьте 99,999% ваших глупых вопросов гугл уже обрабатывал долгими зимними вечерами )))  гугл как бы отдает 90% своей мощности на  учебную тревогу постоянно ища  инфу в своих хранилищах - оптимизируя и готовя ответы заранее )))
в общем  с помощью кучи денег, гениальных алгоритмов все возможно
а предугадывание это  вообще  кульный развод  - вы  начали набирать слово  - а это целые секунды до нажатия кнопки поиск
удачи  всем ))
Записан
metalim
Новенький
*
Offline Offline

Сообщений: 1

СПАСИБО
-вы поблагодарили: 0
-вас поблагодарили: 0



Просмотр профиля
Ответ #33 : Апрель 02, 2010, 01:58:48 �

Ребят, вы б, прежде чем умничать и глупые догадки строить, поискали в том же гугле и википедии, а?

//текст доступен после регистрации//

Никаких суперкомпьютеров там нет. Основной критерий выбора железа - производительность на доллар. Доллар здесь - как покупка железа, так и его энергообеспечение (которое в перспективе больше цены самого железа). Поэтому все сервера - вполне обычные компы: от celeron-ов до core i7. Думаю они даже на серверные процы (всякие Xeon-ы) не тратятся, т.к. там железо в разы дороже без какого-либо существенного выигрыша в производительности.

А скорость поиска достигается во-первых индексацией (представьте себе обыкновенный словарь - найти любое слово в нём ведь труда не составляет?), во-вторых огромным количеством этих серверов. В 2000 году их было 6 тысяч, в 2006 году - уже 450 тысяч. Сколько сейчас - остаётся только догадываться. Где-то я слышал цифру в 2 миллиона. Состав постоянно пополняется.

В обработке наших запросов косвенно участвует сразу куча серверов.
Один сервер думает у кого про что спрашивать, собирает ответы и считает их релевантность;
Другие ищут у себя номера документов, в которых искомые слова упоминаются и говорят сколько таких нашли (так что цифры "Результаты 1 - 10 из примерно 240 000 000" вполне реальные, а не с потолка взятые);
Третьи выдают сами документы (тот самый десяток, а не 240 миллионов);
Четвёртые запоминают наиболее частые вопросы и найденные ответы, чтобы не искать всё заново;
И т.д., и т.п.

Ну и разумеется при обработке вашего запроса гугл не лезет на чужие сайты и не ищет там слова из вашего запроса. Всё уже есть у него в индексах. А информация обновляется быстро, потому что серверов, которые прочёсывают интернет на предмет обновления (Web crawler-ы, spider-ы или харвестеры), тоже дикое количество. Частота проверки конкретного сайта зависит от истории его обновления. Если предыдущие проверки показали, что сайт не обновляется, частота проверок постепенно снижается с минут до часов/дней.

Так что всё там шоколадно, и никто не рвёт пупок листая интернет в поисках вашего вопроса и не передаёт терабайты данных на каждый запрос. Smiley
Последнее редактирование: Апрель 02, 2010, 02:08:12 от metalim Записан
Страниц: 1 2 [3]
  Печать  
 
Перейти в: