Страниц: 1 2 [3]
  Печать  
Автор Тема: сборная солянка  (Прочитано 12474 раз)
0 Пользователей и 1 Гость смотрят эту тему.

Нетривиальная задача, достойная великих мужей

Пусть у нас есть текст, написанный на неизвестном языке. Предположительно - художественное произведение. Текст существует в электронном виде. Кроме текста, у нас еще есть внушительная библиотека словарей, написанная на том же непонятном языке. Задача: восстановить содержание текста, как можно более полно и точно, вытянуть из текста максимальное количество информации. В идеале - полностью восстановить текст.

Для того, чтобы показать что это возможно, пожалуй, я начну.

1. Первое что мы можем сделать, это взять телефонный справочник или словарь имен, если такой есть, и составить список персонажей произведения. Мы можем судить о сложности нашего произведения исходя из количества персонажей. Каждый персонаж, встречающийся в произведении, мы пока назовем привычными нам именами. Такими как Иван, Петр и т.д.
2. Далее, мы посчитаем сколько раз встречается каждое имя в тексте. Например, у нас есть два имени: Иван(120) и Петр(100), которые встречаются чаще всего. Поэтому мы видим, что как Иван так и Петр может быть главным героем. Нам нужно уточнить этот момент.
3. Давайте сразу создадим шкалу времени, на которой будет развиваться наш сюжет. Для этого мы запускаем алгоритм, который поделит текст на абзацы. Видим – 200 абзацев. Откладываем прямую и делим ее на 200 частей.
4. Далее, мы можем рассуждать примерно так. Если имя исчезает на половине книги, это не главный герой. Если имя возникает не с начала текста, то это тоже не главный герой. Если же имя возникает сразу же и равномерно распределено по тексту до самого конца, - это и есть главный герой. То есть нам нужно исследовать как по тексту распределены имена персонажей.
Для этого, мы откладываем прямую Х по-горизонтали, и делим ее на 200 частей. Откладываем прямую У по-вертикали, и делим ее на 60 частей (количество упоминаний Петра). То же самое мы делаем с Иваном.
Потом мы пишем алгоритм (функцию), который будет чертить график. И запускаем его. Затем берем графики с кривыми, и изучаем-сравниваем.
Итак, мы видим, что у нас главный герой – Иван, его кривая равномерна. Кривая Петра появляется сразу в первых абзацах, но на 100 абзаце «тухнет». Таким образом, мы обрабатываем все имена и расставляем их на прямой времени, разделенной на 200 частей (абзацев).

В итоге, что мы видим:
Вначале присутствуют Марья, Василий, Иван и Кощей.
Затем Марья и Василий исчезают, зато появляется Петр.
Долгое время присутствуют только Иван и Петр.
Потом, всего на несколько абзацев появляется Ольга.
На половине книги исчезает Петр.
Через пару абзацев, появляются сразу двое: Кузьма и Зигмунд, и оба быстро исчезают.
Появляется и исчезает Ольга.
В конце текста появляется Кощей, Кузьма и Зигмунд
Кощей исчезает, и в последних абзацах остаются Иван и Ольга.

5. Идем дальше. Мы знаем, что в процессе написания текста, автор, сменяет персонажей, события и обстановку. Так, автор ничего не говорит о персонажах, событиях и обстановке которые еще не появились. Затем, при появлении нового персонажа, события, обстановки, он как раз тут о них больше всего и говорит, так как именно с ними связанны происходящие здесь и сейчас события. Ну и переходя к следующим событиям, персонажам, обстановке, автор реже и реже упоминает прошлые события, так как их вытесняют новые.
Опираясь на этот факт, мы можем построить хитрый алгоритм, который позволит нам, выделить конкретные «сцены» в тексте. Когда меняется сцена, происходят некоторые закономерности – возникают массово персонажи, события и обстановка. Уходят старые персонажи, события, признаки обстановки, графики резко падают, а затем медленно затухают, сходя на нет. Ну представте, например главный герой Иван играет в баскетбол, будут постоянно повторяться некоторые уникальные слова и термины а также имена персонажей: кольцо, баскетбол, пасс, Игорь, Динис, 3 очка, прыжок и т.д. Потом герой идет в бар и тут массово появляются иные термины а предыдущие исчезают. Итак, мы делим текст на сцены. Это нам пригодится дальше.

ну и т.д. и т.д.

Итак, есть ли тут кто-то, достойный называться великим мужем? Который может продолжить "вытягивать" информацию из нашего текста?
P.S. Так как ответа в этой задаче фактически нет, побеждает тот, кто сможет вытянуть из нашего Х-текста, максимальное колличество информации.
sek140675
Гений-Говорун
*
Offline Offline

Сообщений: 1861

СПАСИБО
-вы поблагодарили: 283
-вас поблагодарили: 108



Просмотр профиля Email
Ответ #30 : Май 06, 2010, 18:07:47 �

черный ящик - в самолете он оранжевый и круглый(т.е. шар) Пиво
Записан
sek140675
Гений-Говорун
*
Offline Offline

Сообщений: 1861

СПАСИБО
-вы поблагодарили: 283
-вас поблагодарили: 108



Просмотр профиля Email
Ответ #31 : Май 06, 2010, 18:08:32 �

6. Он ЛЕЖИТ в холоде и СИДИТ в интернете.
    Он СЫПЕТ за окном и СЫПЕТ на веб-страницах.
    Он БЕЛЕЕТ от солнца и БЕЛЕЕТ от страха.
Кто он такой.

почемучка??
Записан
House Fox
Гений-Говорун
*
Offline Offline

Сообщений: 2005

СПАСИБО
-вы поблагодарили: 26
-вас поблагодарили: 125


"Everybody lies"


Просмотр профиля
Ответ #32 : Май 06, 2010, 18:08:41 �

6.Снег Wink

Ты что-то на нем зациклился Laugh
Записан

Не всегда то, что нелогично глупо, а то что логично верно.
sek140675
Гений-Говорун
*
Offline Offline

Сообщений: 1861

СПАСИБО
-вы поблагодарили: 283
-вас поблагодарили: 108



Просмотр профиля Email
Ответ #33 : Май 06, 2010, 18:18:34 �

7.  Жил-был царь. Царь посоветовался со своими знатными людьми и решил облететь на аэроплане свою страну и посмотреть на ее границы. Сказано — сделано. Он решил взять с собой одного из приближенных и наутро должен был лететь. Но в эту ночь сторожу дворца приснился сон, будто во время полета аэроплан загорелся и царь погиб.
На следующий день сторож рассказал царю о своем сне, и царь отказался в этот день от полета.
Царский чиновник, который должен был лететь с царем, сел на аэроплан и улетел один. Как только аэроплан поднялся в воздух, начался пожар и чиновник погиб.
Царь убедился, что сторож был прав. Он наградил его, дав столько золота, сколько тот весил, но затем выгнал его из дворца.

ВОПРОС: почему царь выгнал сторожа?
Записан
Pachemychka Pacman
Гость
Ответ #34 : Май 06, 2010, 18:19:15 �

6.Снег Wink

Ты что-то на нем зациклился Laugh
Ну и надо как-то сбить эту навязчивость!
Записан
Pachemychka Pacman
Гость
Ответ #35 : Май 06, 2010, 18:20:13 �

7.  Жил-был царь. Царь посоветовался со своими знатными людьми и решил облететь на аэроплане свою страну и посмотреть на ее границы. Сказано — сделано. Он решил взять с собой одного из приближенных и наутро должен был лететь. Но в эту ночь сторожу дворца приснился сон, будто во время полета аэроплан загорелся и царь погиб.
На следующий день сторож рассказал царю о своем сне, и царь отказался в этот день от полета.
Царский чиновник, который должен был лететь с царем, сел на аэроплан и улетел один. Как только аэроплан поднялся в воздух, начался пожар и чиновник погиб.
Царь убедился, что сторож был прав. Он наградил его, дав столько золота, сколько тот весил, но затем выгнал его из дворца.

ВОПРОС: почему царь выгнал сторожа?

На посту спать не положено...
Последнее редактирование: Май 06, 2010, 18:22:54 от Pachemychka Pacman Записан
House Fox
Гений-Говорун
*
Offline Offline

Сообщений: 2005

СПАСИБО
-вы поблагодарили: 26
-вас поблагодарили: 125


"Everybody lies"


Просмотр профиля
Ответ #36 : Май 06, 2010, 18:20:54 �

7. Он выгнал сторожа, т.к. он видел сон, след. он спал, а сторож не должен был спать Wink
Записан

Не всегда то, что нелогично глупо, а то что логично верно.
House Fox
Гений-Говорун
*
Offline Offline

Сообщений: 2005

СПАСИБО
-вы поблагодарили: 26
-вас поблагодарили: 125


"Everybody lies"


Просмотр профиля
Ответ #37 : Май 06, 2010, 18:22:03 �

На посту спать не положено...
Уже БЫЛО!!!

Слушай, не хами "взрослым дяденькам"
Записан

Не всегда то, что нелогично глупо, а то что логично верно.
Pachemychka Pacman
Гость
Ответ #38 : Май 06, 2010, 18:22:21 �

7. Он выгнал сторожа, т.к. он видел сон, след. он спал, а сторож не должен был спать Wink
Считаем, что я первый ответил..
Но не положено на форуме задачи дубликовать!
Записан
Pachemychka Pacman
Гость
Ответ #39 : Май 06, 2010, 18:22:38 �

На посту спать не положено...
Уже БЫЛО!!!

Слушай, не хами "взрослым дяденькам"
На посту спать не положено...

Слушай, не хами "взрослым дяденькам"
В каком смысле?
Записан
Илья
Высший разум
*****
Offline Offline

Сообщений: 7695

СПАСИБО
-вы поблагодарили: 520
-вас поблагодарили: 1030


Терпение, мой друг, терпение...


Просмотр профиля
Ответ #40 : Май 06, 2010, 21:16:32 �


2. В компании форд дают эту задачу при приеме на работу.


donald + gerald = robert
d = 5


526485+197485=723970
Записан

Рост воровства у нас  неудержим,
И мы кривою роста дорожим:
Раз все воруют, значит, все при деле!
На этом-то и держится режим!
colezhanka
Новенький
*
Offline Offline

Сообщений: 26

СПАСИБО
-вы поблагодарили: 0
-вас поблагодарили: 2


Просмотр профиля
Ответ #41 : Май 10, 2010, 11:46:48 �

 может ответ на 1 вопрос  Миллард Филлмор, у него и программы не было
Записан
sek140675
Гений-Говорун
*
Offline Offline

Сообщений: 1861

СПАСИБО
-вы поблагодарили: 283
-вас поблагодарили: 108



Просмотр профиля Email
Ответ #42 : Май 10, 2010, 11:48:41 �

 Пиво Браво Пока Браво
Записан
Страниц: 1 2 [3]
  Печать  
 
Перейти в: