Страниц: 1 [2]
  Печать  
Автор Тема: В суд нельзя  (Прочитано 7410 раз)
0 Пользователей и 1 Гость смотрят эту тему.

Нетривиальная задача, достойная великих мужей

Пусть у нас есть текст, написанный на неизвестном языке. Предположительно - художественное произведение. Текст существует в электронном виде. Кроме текста, у нас еще есть внушительная библиотека словарей, написанная на том же непонятном языке. Задача: восстановить содержание текста, как можно более полно и точно, вытянуть из текста максимальное количество информации. В идеале - полностью восстановить текст.

Для того, чтобы показать что это возможно, пожалуй, я начну.

1. Первое что мы можем сделать, это взять телефонный справочник или словарь имен, если такой есть, и составить список персонажей произведения. Мы можем судить о сложности нашего произведения исходя из количества персонажей. Каждый персонаж, встречающийся в произведении, мы пока назовем привычными нам именами. Такими как Иван, Петр и т.д.
2. Далее, мы посчитаем сколько раз встречается каждое имя в тексте. Например, у нас есть два имени: Иван(120) и Петр(100), которые встречаются чаще всего. Поэтому мы видим, что как Иван так и Петр может быть главным героем. Нам нужно уточнить этот момент.
3. Давайте сразу создадим шкалу времени, на которой будет развиваться наш сюжет. Для этого мы запускаем алгоритм, который поделит текст на абзацы. Видим – 200 абзацев. Откладываем прямую и делим ее на 200 частей.
4. Далее, мы можем рассуждать примерно так. Если имя исчезает на половине книги, это не главный герой. Если имя возникает не с начала текста, то это тоже не главный герой. Если же имя возникает сразу же и равномерно распределено по тексту до самого конца, - это и есть главный герой. То есть нам нужно исследовать как по тексту распределены имена персонажей.
Для этого, мы откладываем прямую Х по-горизонтали, и делим ее на 200 частей. Откладываем прямую У по-вертикали, и делим ее на 60 частей (количество упоминаний Петра). То же самое мы делаем с Иваном.
Потом мы пишем алгоритм (функцию), который будет чертить график. И запускаем его. Затем берем графики с кривыми, и изучаем-сравниваем.
Итак, мы видим, что у нас главный герой – Иван, его кривая равномерна. Кривая Петра появляется сразу в первых абзацах, но на 100 абзаце «тухнет». Таким образом, мы обрабатываем все имена и расставляем их на прямой времени, разделенной на 200 частей (абзацев).

В итоге, что мы видим:
Вначале присутствуют Марья, Василий, Иван и Кощей.
Затем Марья и Василий исчезают, зато появляется Петр.
Долгое время присутствуют только Иван и Петр.
Потом, всего на несколько абзацев появляется Ольга.
На половине книги исчезает Петр.
Через пару абзацев, появляются сразу двое: Кузьма и Зигмунд, и оба быстро исчезают.
Появляется и исчезает Ольга.
В конце текста появляется Кощей, Кузьма и Зигмунд
Кощей исчезает, и в последних абзацах остаются Иван и Ольга.

5. Идем дальше. Мы знаем, что в процессе написания текста, автор, сменяет персонажей, события и обстановку. Так, автор ничего не говорит о персонажах, событиях и обстановке которые еще не появились. Затем, при появлении нового персонажа, события, обстановки, он как раз тут о них больше всего и говорит, так как именно с ними связанны происходящие здесь и сейчас события. Ну и переходя к следующим событиям, персонажам, обстановке, автор реже и реже упоминает прошлые события, так как их вытесняют новые.
Опираясь на этот факт, мы можем построить хитрый алгоритм, который позволит нам, выделить конкретные «сцены» в тексте. Когда меняется сцена, происходят некоторые закономерности – возникают массово персонажи, события и обстановка. Уходят старые персонажи, события, признаки обстановки, графики резко падают, а затем медленно затухают, сходя на нет. Ну представте, например главный герой Иван играет в баскетбол, будут постоянно повторяться некоторые уникальные слова и термины а также имена персонажей: кольцо, баскетбол, пасс, Игорь, Динис, 3 очка, прыжок и т.д. Потом герой идет в бар и тут массово появляются иные термины а предыдущие исчезают. Итак, мы делим текст на сцены. Это нам пригодится дальше.

ну и т.д. и т.д.

Итак, есть ли тут кто-то, достойный называться великим мужем? Который может продолжить "вытягивать" информацию из нашего текста?
P.S. Так как ответа в этой задаче фактически нет, побеждает тот, кто сможет вытянуть из нашего Х-текста, максимальное колличество информации.
Наталия
Сплошной мозг
***
Offline Offline

Сообщений: 3696

СПАСИБО
-вы поблагодарили: 168
-вас поблагодарили: 186



Просмотр профиля
Ответ #15 : Май 01, 2010, 14:09:40 �

от сглаза ?
Записан
sek140675
Гений-Говорун
*
Offline Offline

Сообщений: 1861

СПАСИБО
-вы поблагодарили: 283
-вас поблагодарили: 108



Просмотр профиля Email
Ответ #16 : Май 01, 2010, 14:10:24 �

амулеты, ладанки ?
горячо горячо Плач Плач Плач
Какие амулеты

и Россия??
Неа Нет
Кстати ужасно интересно Embarrassed Ты из России или Украины
[/quote]

я на границе
одна часть - укр.
др- росс.
Записан
Маша
Гений-Говорун
*
Offline Offline

Сообщений: 1450

СПАСИБО
-вы поблагодарили: 239
-вас поблагодарили: 593


Я просто умница

617631966
Просмотр профиля Email
Ответ #17 : Май 01, 2010, 14:11:35 �

Цитировать
я на границе
одна часть - укр.
др- росс.
Интересно Embarrassed а какая часть в Украине Grin Grin Grin
Записан

Мама твердила мне, что самое важное в жизни — быть счастливой. Когда я пошла в школу, меня спросили, кем я хочу стать. Я написала "счастливой". Мне сказали " "ты не поняла задание", я им сказала — "вы не поняли жизнь".(с)
Pachemychka Pacman
Гость
Ответ #18 : Май 03, 2010, 20:44:34 �

Есть на Украине пограничное село, стоящее на границе между Украиной и Россией.
Уникальное место, но налоги туда и туда платить надо Sad
Записан
colezhanka
Новенький
*
Offline Offline

Сообщений: 26

СПАСИБО
-вы поблагодарили: 0
-вас поблагодарили: 2


Просмотр профиля
Ответ #19 : Май 09, 2010, 20:50:22 �

может сушёных лягушек???
Записан
Кадила???
Давненько
**
Offline Offline

Сообщений: 115

СПАСИБО
-вы поблагодарили: 10
-вас поблагодарили: 12



Просмотр профиля
Ответ #20 : Май 09, 2010, 20:55:32 �

Вудовские куклы
Записан
sek140675
Гений-Говорун
*
Offline Offline

Сообщений: 1861

СПАСИБО
-вы поблагодарили: 283
-вас поблагодарили: 108



Просмотр профиля Email
Ответ #21 : Май 09, 2010, 20:58:59 �

может сушёных лягушек???

а  живые интереснее Ха ха
Записан
Маша
Гений-Говорун
*
Offline Offline

Сообщений: 1450

СПАСИБО
-вы поблагодарили: 239
-вас поблагодарили: 593


Я просто умница

617631966
Просмотр профиля Email
Ответ #22 : Май 09, 2010, 21:00:10 �

 Grin Grin Grin
Ответ уже дан
 колдовские амулеты
Записан

Мама твердила мне, что самое важное в жизни — быть счастливой. Когда я пошла в школу, меня спросили, кем я хочу стать. Я написала "счастливой". Мне сказали " "ты не поняла задание", я им сказала — "вы не поняли жизнь".(с)
House Fox
Гений-Говорун
*
Offline Offline

Сообщений: 2005

СПАСИБО
-вы поблагодарили: 26
-вас поблагодарили: 125


"Everybody lies"


Просмотр профиля
Ответ #23 : Май 09, 2010, 21:02:15 �

Grin Grin Grin
Ответ уже дан
 колдовские амулеты

Ага, причем тобой же Wink
Записан

Не всегда то, что нелогично глупо, а то что логично верно.
Страниц: 1 [2]
  Печать  
 
Перейти в: