Загадка “теоремы о бесконечных обезьянах”: могут ли макаки написать Гамлета

Одно из самых необычных исследований в истории математики было проведено учеными из Университета Плимута в Англии. В эксперименте участвовали шесть хохлатых макак из зоопарка Пейнтон. С 1 мая по 22 июня 2002 года этим животным предоставили клавиатуру, и их случайные нажатия на клавиши передавались в интернет. Целью исследования было проверить “теорему о бесконечных обезьянах”: утверждение, что обезьяна, случайно печатающая на клавиатуре, со временем напечатает любой текст, включая произведения Шекспира.

Однако результаты оказались далеки от ожидаемых. За более чем семь недель макаки напечатали только один пятистраничный документ, почти полностью состоящий из буквы “S”. Этот результат был опубликован в виде книги .

Хотя эксперимент не опроверг теорему о бесконечных обезьянах, он показал, что обезьяны не являются идеальными кандидатами для генерации случайного текста. Теорема , предложенная математиком Эмилем Борелем в 1913 году, использует обезьян в качестве метафоры для иллюстрации теории вероятностей. Идеи, лежащие в основе теоремы, гораздо старше. В древности римский философ и политик Марк Туллий Цицерон писал, что даже если бросить на землю большое количество букв, они вряд ли сложатся в текст эпической поэмы.

Пример с макаками из зоопарка Пейнтон демонстрирует, что математики предпринимают креативные шаги для исследования этого вопроса. Современные исследования показывают, что, в отличие от Цицерона, стихи могут возникнуть из случайности, если у вас достаточно времени.

Вероятность появления конкретного слова

Для простоты рассмотрим вероятность случайного появления слова “banana” при наборе букв. Если нажать шесть клавиш подряд, вероятность того, что получится слово “banana”, составляет (1/52)^6, что примерно равно пяти миллиардным долям процента. Это делает появление слова крайне маловероятным. Но если увеличивать количество нажатий, вероятность появления слова возрастает.

Например, при нажатии 10 миллиардов клавиш вероятность появления слова “banana” приближается к 40%. Чем больше нажатий, тем выше вероятность появления искомого слова. Этот принцип применим и к другим последовательностям букв, словам и даже целым предложениям и книгам.

Практическое применение теоремы о бесконечных обезьянах

В 2024 году аналитик данных Эргон Куглер де Мораес Силва из Университета Сан-Паулу в Бразилии решил выяснить , сколько времени потребуется для случайного появления произведения Шекспира. Вместо обезьян он использовал генератор случайных символов. Его программа генерировала сотни псевдослучайных пробелов, знаков препинания и букв в секунду, пока не появлялась знаменитая фраза из “Гамлета”: “To be, or not to be, that is the Question”.

Куглер начал с определения времени, необходимого для появления буквы “T”. Затем он последовательно исследовал, сколько символов требуется для появления “To”, “To ” и так далее. Для генерации первых двух слов “To be” программа генерировала в среднем 345 380 940 символов, что заняло около 18 минут.

Однако Куглер столкнулся с проблемой: увеличение времени для генерации следующих символов делало задачу практически бесконечной. Поэтому он разработал программу, которая использовала ранее собранные данные для экстраполяции времени и количества символов, необходимых для генерации всей фразы.

Расчеты Куглера показали, что для появления фразы “To be, or not to be, that is the Question” потребуется около 2,68 x 10^69 символов, что займет около 9,35 x 10^58 лет. Это почти в 7 x 10^48 раз дольше, чем время существования Вселенной, оцениваемое в 13,8 миллиардов лет. Таким образом, Цицерон был прав: вероятность случайного появления даже одного читаемого стиха чрезвычайно мала.

Это исследование подчеркивает, что, хотя теоретически возможно появление сложных текстов из случайных последовательностей, практически это требует невообразимо большого времени.

Public Release.