?
Свой человек
Offline
Сообщений: 288
СПАСИБО
-вы поблагодарили: 39
-вас поблагодарили: 41
|
|
� Ответ #15 : Март 23, 2010, 10:37:15 � |
|
Установил Google Desktop - фигня полная. Недоделанный, как и, к сожалению, все продукты Google
|
|
� Последнее редактирование: Март 23, 2010, 10:53:30 от ? �
|
Записан
|
|
|
|
Л.К.Вольфхарт
Умник
Offline
Сообщений: 631
СПАСИБО
-вы поблагодарили: 50
-вас поблагодарили: 28
|
|
� Ответ #16 : Март 23, 2010, 18:49:06 � |
|
Я так думаю по теме. 1. Для начала определяется сегмент интернета. Заметили что сразу нас переводят на гугл.ком.уа, гугл.ру? 2.Хотя информации и петабайты (тысяча терабайтов), но у гугл просто ОГРОМНЫЕ вычислительные мощности, супер компьютеры и т.д. некорректно сравнивать с поисковиком на компе - Винда есть Винда)
|
|
|
Записан
|
|
|
|
?
Свой человек
Offline
Сообщений: 288
СПАСИБО
-вы поблагодарили: 39
-вас поблагодарили: 41
|
|
� Ответ #17 : Март 25, 2010, 13:03:54 � |
|
Хотя информации и петабайты (тысяча терабайтов), но у гугл просто ОГРОМНЫЕ вычислительные мощности, супер компьютеры и т.д. некорректно сравнивать с поисковиком на компе - Винда есть Винда) А то что компьютером одновременно пользуется один-три человека, а гуглом десятки-сотни тысяч тебя не смущает?
|
|
|
Записан
|
|
|
|
Л.К.Вольфхарт
Умник
Offline
Сообщений: 631
СПАСИБО
-вы поблагодарили: 50
-вас поблагодарили: 28
|
|
� Ответ #18 : Март 25, 2010, 20:42:29 � |
|
Хотя информации и петабайты (тысяча терабайтов), но у гугл просто ОГРОМНЫЕ вычислительные мощности, супер компьютеры и т.д. некорректно сравнивать с поисковиком на компе - Винда есть Винда) А то что компьютером одновременно пользуется один-три человека, а гуглом десятки-сотни тысяч тебя не смущает? Ну нет) Я же пишу - огромные компы и другое ПО
|
|
|
Записан
|
|
|
|
Lkob
Умник
Offline
Сообщений: 625
СПАСИБО
-вы поблагодарили: 56
-вас поблагодарили: 62
Будь проще, и люди к тебе потянутся.
|
|
� Ответ #19 : Март 26, 2010, 01:46:10 � |
|
Эту тему можно закрыть. Изначально, это был интересный вопрос, но теперь.... нет.... Все дело в том, что гугл не ищет сразу 4 589 985 356 результатов... У него есть база данных, из которой он выбирает только 10, соответствующих вашему запросу (для этого не надо очень много итераций). Как оказалось, все очень просто. Если кому интересно, я докажу, что количество запросов, которые пишет гугл - глупость. Он сам не знает, сколько результатов в итоге будет...
|
|
|
Записан
|
Третий закон Ньютона даже наша партия не сумела отменить. Не успела. А зря...
|
|
|
buka
Гений
Offline
Сообщений: 960
СПАСИБО
-вы поблагодарили: 4
-вас поблагодарили: 120
|
|
� Ответ #20 : Март 26, 2010, 01:53:00 � |
|
Эту тему можно закрыть. Изначально, это был интересный вопрос, но теперь.... нет.... Все дело в том, что гугл не ищет сразу 4 589 985 356 результатов... У него есть база данных, из которой он выбирает только 10, соответствующих вашему запросу (для этого не надо очень много итераций). Как оказалось, все очень просто. Если кому интересно, я докажу, что количество запросов, которые пишет гугл - глупость. Он сам не знает, сколько результатов в итоге будет... А как он находит эти десять? Особенно, если ищется фраза? Ещё более простой вопрос. Как он убеждается, что конкретной фразы нет, если все слова присутствуют в миллионе ссылок?
|
|
|
Записан
|
|
|
|
Lkob
Умник
Offline
Сообщений: 625
СПАСИБО
-вы поблагодарили: 56
-вас поблагодарили: 62
Будь проще, и люди к тебе потянутся.
|
|
� Ответ #21 : Март 26, 2010, 02:00:28 � |
|
Buka, все весьма просто. Гуглу не надо находить сразу 5 543 474 485 результатов. Он делает проще. Он сравнивает перую букву, которую вы ввели, далее втору, третью и т.д. Этот запрос можно решить на самом "не быстром" компьютере очень быстро. Вот в чем секрет. Как написал мой знакомый программист, так работает любой дадасет.
|
Третий закон Ньютона даже наша партия не сумела отменить. Не успела. А зря...
|
|
|
buka
Гений
Offline
Сообщений: 960
СПАСИБО
-вы поблагодарили: 4
-вас поблагодарили: 120
|
|
� Ответ #22 : Март 26, 2010, 02:48:57 � |
|
Buka, все весьма просто. Гуглу не надо находить сразу 5 543 474 485 результатов. Он делает проще. Он сравнивает перую букву, которую вы ввели, далее втору, третью и т.д. Этот запрос можно решить на самом "не быстром" компьютере очень быстро. Вот в чем секрет. Как написал мой знакомый программист, так работает любой дадасет.
Ну, скажем, сравнил 1-ю букву (напр. Й), взял К первых попаданий, сравнил вторую букву (напр. У), взял К первых попаданий, сравнил 3-ю букву (напр. Х), взял К первых попаданий, допустим далее, что все 3 буквы присутствуют в М ссылок из К. Как ему убедиться, что он нашёл ЙУХ, а не наоборот? Качать все М ссылок и сравнивать он не вложится ни в какие рамки. Я уже не говорю о "ХАПУГОЙ" или "моЙ мУж ХУлиган"
|
|
|
Записан
|
|
|
|
Илья
Высший разум
Offline
Сообщений: 7695
СПАСИБО
-вы поблагодарили: 520
-вас поблагодарили: 1030
Терпение, мой друг, терпение...
|
|
� Ответ #23 : Март 26, 2010, 07:33:40 � |
|
что количество запросов, которые пишет гугл - глупость. И тут развод.
|
|
|
Записан
|
Рост воровства у нас неудержим, И мы кривою роста дорожим: Раз все воруют, значит, все при деле! На этом-то и держится режим!
|
|
|
Deaduwka
Новенький
Offline
Сообщений: 30
СПАСИБО
-вы поблагодарили: 2
-вас поблагодарили: 3
|
|
� Ответ #24 : Март 26, 2010, 12:56:13 � |
|
Buka, все весьма просто. Гуглу не надо находить сразу 5 543 474 485 результатов. Он делает проще. Он сравнивает перую букву, которую вы ввели, далее втору, третью и т.д. Этот запрос можно решить на самом "не быстром" компьютере очень быстро. Вот в чем секрет. Как написал мой знакомый программист, так работает любой дадасет.
Ну я не так писал) сам запрос строится аццкой машиной смерти гугла, благодаря умам сумасшедших профессоров, которые сгенерили алгоритмы. но если говорить проще, то при первом заходе на страницу клиенту (тоесть браузеру) сервер отдают по факту 11 записей (10 ссылок и количество). Что касается по поводу "вхождений" и "попаданий". Тут все решается на уровне сервера БД + ихняя хитрая структура данных. Вы же не думаете, что гугл при вашем запросе начинает заходить на сайты и искать постранично ваш текст? )) У него своя БД, которая наполняется благодаря граммотному СЕО, sitemap'ам, структуре сайта... наполняет эту БД гугл-бот... Ну и да.. lkob, побуквенно никто никогда нигде не сравнивал) сравнение идет по словам конечноже .. select .. from .. where title like %Леша - клевый чувак% выберет сайты у которых в заголовке написано, что Леха - клевый чувак )
|
|
|
Записан
|
|
|
|
Алекс Г
Новенький
Offline
Сообщений: 22
СПАСИБО
-вы поблагодарили: 2
-вас поблагодарили: 2
|
|
� Ответ #25 : Март 26, 2010, 23:56:07 � |
|
я седня зарегился и еще не знаю, умный я или нет, но позвольте маленький коммент. если я правильно понял, что гугл сравнивается с поиском на жестком диске, то это конечно не совсем корректно. У стандартного средства Винды нет базы данных с индексами всех слов, которые могут подлежать поиску, поэтому происходит реальный просмотр всех файлов, что конечно очень медленно. А у Гугла как выше и написали всё уже проиндексировано. Если на локальный комп поставить Гугл Десктоп (который тоже выше упоминался), то поиск и на локальном компе будет занимать доли секунды. Правда база очень большая - несколько гигов минимум.
|
|
|
Записан
|
Я тут новенький, поэтому умный я, или нет, еще не определился. Прошу простить, если что-то не так!
|
|
|
buka
Гений
Offline
Сообщений: 960
СПАСИБО
-вы поблагодарили: 4
-вас поблагодарили: 120
|
|
� Ответ #26 : Март 27, 2010, 00:55:58 � |
|
Вопрос в том, на каком уровне происходит индексирование. Если на уровне слов, то можно вложиться в гигабайты, но тогда как искать фразы? Если на уровне фраз, то ни в гига ни в тера, ни в пета не вложиться...
|
|
|
Записан
|
|
|
|
Алекс Г
Новенький
Offline
Сообщений: 22
СПАСИБО
-вы поблагодарили: 2
-вас поблагодарили: 2
|
|
� Ответ #27 : Март 27, 2010, 01:06:16 � |
|
Вопрос в том, на каком уровне происходит индексирование. Если на уровне слов, то можно вложиться в гигабайты, но тогда как искать фразы? Если на уровне фраз, то ни в гига ни в тера, ни в пета не вложиться...
понятно. думаю, что на уровне слов и все. если поиск одного слова занимает например 0,1 сек. то фраза из N слов будет искаться в базе 0,1N секунд + затраты на аггрегацию данных. Учитывая, что N в среднестатистическом запросе порядка 1-5, время не сильно меняется при умножении на N. Аггрегация в принципе тоже может быть подготовлена заранее наверное. Хотя как? да, вот это интересный вопрос. Например число парных комбинаций (для образования связей между хотя бы двумя понятиями) при словаре в 30000 слов составит 30000!=10^121287 (калькулятор Винды подсказал). Очень много. Вопрос действительно интересный, актуальный, и наверное сложный.
|
|
|
Записан
|
Я тут новенький, поэтому умный я, или нет, еще не определился. Прошу простить, если что-то не так!
|
|
|
Маша
Гений-Говорун
Offline
Сообщений: 1450
СПАСИБО
-вы поблагодарили: 239
-вас поблагодарили: 593
Я просто умница
|
|
� Ответ #28 : Март 30, 2010, 20:04:18 � |
|
Просто к слову
|
|
|
Записан
|
Мама твердила мне, что самое важное в жизни — быть счастливой. Когда я пошла в школу, меня спросили, кем я хочу стать. Я написала "счастливой". Мне сказали " "ты не поняла задание", я им сказала — "вы не поняли жизнь".(с)
|
|
|
Lkob
Умник
Offline
Сообщений: 625
СПАСИБО
-вы поблагодарили: 56
-вас поблагодарили: 62
Будь проще, и люди к тебе потянутся.
|
|
� Ответ #29 : Март 30, 2010, 20:28:56 � |
|
Из той же серии. //текст доступен после регистрации//
|
|
|
Записан
|
Третий закон Ньютона даже наша партия не сумела отменить. Не успела. А зря...
|
|
|
|