Страницы Миллбурнского клуба, 1 - Слава Бродский
Шрифт:
Интервал:
Закладка:
Свои соображения, почему именно Шолохов оказался (был выбран) автором «Тихого Дона», приводят Бар-Селла [1], Михаил Аникин, М.А.Марусенко [2] и другие исследователи. В этих исследованиях на ключевых ролях два персонажа – известный чекист Леон Мирумов и главный человек в РАППе, редактор «Октября» Александр Серафимович, сотрудничавший с ГПУ и имевший «героическую» дореволюционную биографию: он был приговорен к ссылке за поддержку группы, в которую входил Александр Ульянов. Однако ответ на вопрос, почему большевицкие управители приняли роман в целом и поддержали кандидатуру Шолохова, не является предметом настоящей работы. Но мы знаем, что по той или иной причине они и роман поддержали, и показали всем, что кандидатура Шолохова как автора этого произведения их вполне устраивала. И в тот момент, когда доводы сомневающихся в авторстве Шолохова стали казаться слишком весомыми, большевики привели один свой довод, который оказался весомее всех других, вместе взятых. Они заявили, что будут привлекать к судебной ответственности сомневающихся в авторстве их кандидата. На простом языке это означало расстрел, и все разговоры об авторстве «Тихого Дона» сразу же прекратились.
В середине 70-х годов прошлого столетия, когда критическое исследование «Тихого Дона» вряд ли уже было опасно для жизни исследователей (хотя и грозило им крупными неприятностями), споры возникли вновь. Сомневающиеся изучали «Тихий Дон», стараясь найти всё новые подтверждения своих гипотез. Первыми серьезными исследователями здесь были А.И.Солженицын, И.Н.Медведева-Томашевская, П.А.Медведев, А.Г.Макаров и С.Э.Макарова, В.П.Фоменко и Т.Г.Фоменко. Наконец, уже в последние годы, Зеев Бар-Селла опубликовал подробнейшее и необычайно глубокое исследование текстов «Тихого Дона» [1]. Он же проанализировал так называемые «черновики» рукописи «Тихого Дона» и нашел много указаний на то, что они были написаны после опубликования романа.
Когда исследователи «Тихого Дона» стали приходить к выводу, что Шолохов не является его автором, они стали анализировать и другие его произведения, резонно полагая, что они смогут обнаружить проблемы и там. Небезосновательные сомнения в авторстве Шолохова других произведений, им опубликованных, придавали больше уверенности и в справедливости выводов относительно «Тихого Дона».
Зеев Бар-Селла, анализируя две части повести «Путь-дороженька», опубликованной Шолоховым, стал приходить к выводу, что повесть написана разными авторами. В беседе с одним из авторов настоящей работы Зеев Бар-Селла, зная о проводящихся этими авторами математико-статистических исследованиях по определению авторства, предложил применить этот метод для определения разницы в авторских стилях двух частей этой повести.
Настоящая статья представляет результаты такого небольшого исследования.
Методика исследования
Рассматривается новый стилометрический атрибутор, независимый от контекста – кусочная условная сложность сжатия (CCC) литературных текстов (ССС-атрибутор). CCC-атрибутор (непараметрический критерий однородности), навеянный невычислимой условной сложностью Колмогорова [3] и впервые определенный в работе М.Малютова [4] в 2005 году, асимптотически минимален для истинного автора, если изучаемые тексты являются достаточно большими, сжатие – достаточно хорошим и выборочное смещение отсутствует. Он может быть успешно использован там, где другие методы стилометрии могут не различить похожих авторов. Этот критерий состоятелен при аппроксимации большого текста как стационарной эргодической последовательности.
Надлежащие параметры нашего критерия определены авторами Malyutov, M.B., Wickramasinghe, C.I., and Li, S. [5] в 2007 году. Ими приводятся методологические результаты предварительного испытания метода для успешной атрибуции поэм Елизаветинского периода и многих десятков «федералистских статей».
Нами метод был успешно опробован на примере анализа переводов сонетов Шекспира разными авторами [6]. Другое подтверждение добротности метода связано с анализом двух художественных произведений одного из авторов данной работы. Метод не дискриминировал эти два произведения несмотря на то, что они были написаны в разное время, в разном стиле и, казалось бы, совершенно разнились языком [6].
Более подробное описание методики можно найти в работе [7]. Обзор методов математической статистики для обоснования CCC-атрибутора дан в книге B.Ryabko, J.Astola and M.B.Malyutov [8].
Предыстория
Краеугольный камень наших построений – великая идея Колмогорова о связи сложности и случайности. Накануне тяжелой фатальной болезни он, параллельно с далекими от математики Соломоновым и Чейтиным, дополнил ее вместе с Л.Левиным наброском «Абстрактной Теории» (ЧейКоЛеСо) Колмогоровской сложности (КС). ЧейКоЛеСо вдохновила Д.Хмелева [9] предложить ядро ССС-метода вне статистической модели. Для стационарной эргодической последовательности xN и фиксированного универсального сжатия (УС), длина сжатой последовательности xN – это аппроксимация условной КС. Однако длина сжатого участка генома (четырехбуквенной последовательности) превосходит длину участка в несколько раз и приближением условной КС не является. Кроме статистических моделей, нам не известны нетривиальные содержательные области, где для невычислимой КС можно построить сближающиеся вычислимые мажоранту и миноранту хотя бы теоретически. Поэтому замена КС на величину, полученную с помощью УС в работе [10], требует обоснования. Для последовательностей, приближаемых статистической моделью, вместо аналогий с КС нужно применять статистическую теорию УС, далекую от очевидности. Историю родственных работе [8] подходов (до [4], где появилась наша работающая версия ССС), можно найти в работе [10]. Все авторы следуют Хмелеву, некоторые добавляют преобразования из соображений, не имеющих отношения к статистике и только ухудшающих различающую способность метода, как в [10]. Замена ими КС на величину, полученную с помощью УС, не обоснованна. Поэтому их приложения сомнительны. Их классификатор плохо различает одноязычные литературные тексты [5] и зависит от энтропий текстов, что не было упомянуто в работе [10]. Их парадоксальное утверждение, что Л.Толстой – отдельная ветвь на дереве русских писателей, скорее всего, вызвано плохой подготовкой текстов: они не убрали для анализа значительные вкрапления французского с другой энтропией.
Разница в стиле частей повести «Путь-дороженька»
Метод использован нами для анализа первой повести, опубликованной М.Шолоховым, «Путь-дороженька». Она была напечатана в 1925 году в московской газете «Молодой ленинец» (## 93-97, 99, 101-104, 106, 107, 109-114). Шолохову в это время было двадцать лет (если считать верным его официальный год рождения – 1905). За его плечами были четыре года начальной сельской школы во время войны и краткие счетоводческие курсы в Ростове в 1920 году, где, надо полагать, завязалась его многолетняя дружба с видным чекистом Мирумовым. Потом – короткое пребывание в тюрьме по обвинению в коррупции во время его службы по сбору продналога. Он покинул Дон и приехал в Москву в конце 1922 года. Работал под крылом Мирумова, даже жил иногда в его квартире. Согласно Бар-Селле, Мирумов мог передать Шолохову рукописи диссидентского редактора местной газеты Вениамина Краснушкина, автора многочисленных статей и двух повестей, писавшего под псевдонимом Виктор Севский и принадлежавшего к кругу известного поэта Бальмонта. Виктор Севский был арестован и ликвидирован большевиками в Ростовской тюрьме (как считается, в 1920 году).
Шолохов публикует первый рассказ в конце 1924 года. Он покидает Москву и едет в свою родную деревню. Там он остается в течение нескольких лет с перерывами на сравнительно короткие визиты в Москву, где он время от времени живет в квартире Мирумова и посвящает ему свои первые произведения.
Какие-либо изменения в писательском стиле Шолохова между первой и второй частями повести «Путь-дороженька», опубликованной в 1925 году, представляются маловероятными.
После предварительной обработки текста повести «Путь-дороженька» (включающей, в частности, удаление имен собственных) мы разбили каждую часть повести на 30 равных частей по 2000 байт каждая. Средние безусловные сложности были статистически одинаковы. Средняя интра-CCC в каждой части была сравнена со средней интер-CCC каждого куска, обучаемого на другой части. Их среднеквадратичные отклонения статистически не различались. Разность между средней интер-CCC и средней интра-CCC оказалась значимой, превышая в четыре раза ее среднеквадратичное отклонение.