ОБЩЕЛИТ.NET - КРИТИКА
Международная русскоязычная литературная сеть: поэзия, проза, литературная критика, литературоведение.
Поиск по сайту  критики:
Авторы Произведения Отзывы ЛитФорум Конкурсы Моя страница Книжная лавка Помощь О сайте
Для зарегистрированных пользователей
логин:
пароль:
тип:
регистрация забыли пароль
 
Анонсы

StihoPhone.ru

Квантитативный анализ алфавита в русской поэзии и в произведениях древнерусской литературы

Автор:
Автор оригинала:
Климов Юрий Николаевич
КВАНТИТАТИВНЫЙ АНАЛИЗ АЛФАВИТА В РУССКОЙ ПОЭЗИИ И В ПРОИЗВЕДЕНИЯХ ДРЕВНЕРУССКОЙ ЛИТЕРАТУРЫ
Ю.Н. Климов
В будущем цифры рассеют мрак.
Цифры не умира.
Только меняют порядок, как
Телефонные номера.

Сонм их, вечным пером привит
К речи, расширит рот,
длинит собой алфавит,
ибо наоборот.

И. Бродский, 1974-1975 [1]






Основой для наукометрического анализа алфавита в поэзии и произведениях древнерусской литературы были поэмы ˝Евгений Онегин˝ А.С. Пушкина (ЕО), ˝Германия. Зимняя сказка˝ Г. Гейне (перевод В.В. Левика, ГЗС), ˝Паломничество Чайльд-Гарольда˝ Дж. Г. Байрона (перевод В.В. Левика, ПЧГ), стихи И. Бродского (ИБ): ˝Горбунов и Горчаков˝, ˝Речь о пролитом молоке˝, ˝Исаак и Авраам˝, ˝Полевая почта˝, ˝Пришла весна…˝, ˝Einem alten Architekten in Rom˝, ˝Разговор с небожителем˝, ˝В Англии˝, ˝Строфы˝ и ˝Вертумн˝, ˝Русский стих начала ХХ века (РС)˝, Псалтирь (ПС), ˝Слово о полку Игореве˝ (СОПИ), ˝Задонщина˝ (ЗДН) и ˝Феврония˝ (ФВР) [2-10].
Целью данного исследования является обоснование, применение, квантитативный и сравнительный анализ алфавита в поэзии и произведениях древнерусской литературы по следующим позициям:
• динамика числа букв и кумулятивное число букв алфавита (ЧБА, КЧБА);
• отношение гласных: и/ы, а/я, у/ю, о/е, звонких и глухих согласных, так как это признанные классические отношения букв алфавита;
• отношение ЧБА к КЧБА;
• отношение КЧБА к кумулятивному числу слов (КЧС);
• моделирование ЧБА и КЧБА по линейной, степенной, логарифмической, экспоненциальной зависимостям и полиному второй степени на основе электронных таблиц Excel, которое определяет статистические свойства русских текстов;
• вычисление энтропии и исследование ее свойств в поэзии и произведениях древнерусской литературы;
• моделирование энтропии алфавита поэзии и произведений древнерусской литературы;
• исследование распределения Бредфорда;
• исследование закона Ципфа;
• сравнительный анализ полученных результатов с литературными данными.
Методологической основой данного исследования явились теоретические работы видного информатика В.И. Горьковой [11] и практическая реализация Ю.Н. Климовым [12-20].
Применение методики частотного лингвистического анализа текстов показало широкие возможности исследования прозаических и поэтических текстов [12-15,19,21-24].
Рассмотрим динамику ЧБА. Так, наибольшее число ЧБА в ЕО приходится на гласную о (11023), наименьшее ЧБА – на ъ (24); в ГЗС – о (3777), ъ (32); в ПЧГ – о (12007), ъ (32); в ИБ – о (11083), ъ(27); в РС – о (11085), ъ (26); в ПС – о (17218), ъ (7); в СОПИ – о (1264), ф (2); в ЗДН – о (1365), ф (15); ФВР – о (1870), й (8).
50% всех ЧБА ЕО приходится на согласную с (54649,5); в ГЗС – с (18757,5); в ПЧГ – с (63812,5); в ИБ – и (55591,0); РС – с (59190,5); ПС – н (74329,0); СОПИ – р (7164,0); ЗДН – р (72375,0), ФВР – т (7526,5).
Изменение отношения гласных а/я, о/е, и/ы, у/ю составило, соответственно, для ЕО – 3,76, 1,14, 2,65 и 4,26; для ГЗС – 3,27, 1,22, 2,72 и 3,99; для ПЧГ – 3,94, 1,12, 2,57 и 3,67; для ИБ – 3,50, 1,14, 3,09 и 4,57; для РС – 3,39, 1,08, 2,45 и 3,70; для ПС – 2,63, 1,36, 5,24 и 3,33; для СОПИ – 1,94, 1,08, 2,70 и 2,36; для ЗДН – 2,87, 1,06, 4,11 и 2,77; для ФВР – 2,49, 0,74, 6,59 и 2,75.
Отношение звонких и глухих согласных: б/п, в/ф, ф/в, г/к, д/т, ж/ш, ш/ж и з/с показало, что начиная с наибольшей величины, эти соотношения имели следующие значения:
а/я ПЧГ, ЕО, ИБ, РС, ГЗС, ЗДН, ПС, ФВР, СОПИ (от 3,94 ПЧГ до 1,94 СОПИ);
о/е ПС, ГЗС, ЕО=ИБ, ПЧГ, РС=СОПИ, ЗДН, ФВР (от 1,36 ПС до 0,74 ФВР);
и/ы ФВР, ПС, ЗДН, ИБ, СОПИ, ГЗС, ЕО, ПЧГ, РС (от 6,59 ФВР до 1,08 РС);
у/ю ИБ, ЕО, ГЗС, ПЧГ, ПС, ЗДН, ФВР, СОПИ (от 4,57 ИБ до 2,36 СОПИ);
б/п ПЧГ, ФВР, ЕО,ЗДН, ПС, ГЗС=РС, ИБ, СОПИ (от 0,87 ПЧГ до 0,67 СОПИ);
в/ф СОПИ, ПС, ЕО, ЗДН, РС, ИБ, ФВР, ПЧГ, ГЗС (от 326,50 СОПИ до 9,23 ГЗС);
ф/в ГЗС, ПЧГ, ФВР, ИБ, РС, ЗДН, ЕО, ПС, СОПИ (от 0,049 ГЗС до 0,003 СОПИ);
г/к РС, ПЧГ, ЕО, ГЗС, ИБ, ПС, ФВР, СОПИ, ЗДН (от 1,57 РС до 0,39 ЗДН);
д/т ПС, ЕО=ФВР, ГЗС, ПЧГ=ЗДН, РС, СОПИ, ИБ (от 0,70 ПС до 0,41 ИБ);
ж/ш ФВР, ЕО, ПЧГ, ИБ, ЗДН, РС, СОПИ, ПС, ГЗС (от 2,19 ФВР до 0,75 ГЗС);
ш/ж ГЗС, ПС, СОПИ, РС, ЗДН, ИБ, ПЧГ, ФВР, ЕО (от 1,33 ГЗС до 0,18 ЕО);
з/с ЗДН, РС, СОПИ, ПЧГ, ЕО, ГЗС, ФВР, ПС, ИБ (от 0,42 ЗДН до 0,30 ИБ).

Если вычислить средние значения отношения гласных, звонких и глухих согласных, то для ЕО – РС, ПС – ФВР они составят для а/я 3,57 и 2,40, о/е 1,14 и 1,06, и/ы 2,70 и 4,66, у/ю 4,04 и 2,80, б/п 0,75 и 0,77, в/ф 33,76 и 141,77, ф/в 0,030 и 0,015, г/к 0,77 и 0,74, д/т 0,53 и 0,58, ж/ш 1,15 и 1,32, ш/ж 0,81 и 0,85, з/с 0,34 и 0,35. Сумма средних значений для отношений гласных ЕО – РС, ПС – ФВР равно 11,45 и 10,92, а отношения звонких и глухих согласных, соответственно, 38,14 и 146,40. То есть налицо выявленное отличие поэзии от прозы.
Отношение числа букв к числу слов, начиная с наибольшей величины, располагалось следующим образом, СОПИ, ЗДН – по 4,99; ГЗС – 4,90; РС – 4,73; ЕО - 4,68; ИБ – 4,65; ПЧГ – 4,61; ПС – 4,38; ФВР – 4,28. При этом среднее значение для ЕО – РС было равно 4,71, а для ПС – ФВР – 4,66, что указывает на общее свойство алфавита русского литературного и древнерусского языков.
В исследованных текстах отношение ЧБА к КЧБА, начиная с наибольшей величины, колебалось. Так в ЕО оно составило от 0,101(о) до 0,0002 (ъ); в ГЗС – от 0,100 (о) до 0,0001 (ъ); в ПЧГ – от 0,094 (о) до 0,0001(ъ); в ИБ – от 0,100 (о) до 0,0002 (ъ); в РС – от 0,094 (о) до 0,0002(ъ); в ПС – от 0,116 (о) до 0,0004 (ъ); в СОПИ – от 0,088 (о) до 0,0001 (ф); в ЗДН – от 0,094 (о) до 0,0010 (ф); в ФВР – от 0,124 (е) до 0,0005 (й). Нулевые значения отношение ЧБ к КЧБ отмечаются для СОПИ (й, э), ЗДН и ФВР (э, i).
Отношение ЧБ к КЧС в указанных текстах, начиная с наибольшей величины, колебалось и было выше, чем отношение ЧБ к КЧБ: в ЕО – 0,472 до 0,001 (ъ); в ГЗС – от 0,493 (о) до 0,001 (ъ); в ПЧГ – от 0,433 (о) до 0,001(ъ); в ИБ – от 0,464 (о) до 0,001 (ъ); в РС – от 0,443 (о) до 0,001(ъ); в ПС – от 0,508 (о) до 9,0•10-7 (п); в СОПИ – от 0,440 (о) до 0,0007 (ю); в ЗДН – от 0,470 (о) до 0,005 (ф); в ФВР – от 0,531 (е), 0,392 (о) до 0,002 (й). Нулевые значения отношениия ЧБ к КЧС отмечаются для СОПИ (й, э), ЗДН и ФВР (э, i).
Таким образом, показано изменение динамики ЧБА и КЧБА: наибольшее ЧБА, 50% ЧБА, изменение отношения гласных, отношения звонких и глухих согласных, их средние значения, отличие поэзии от произведений древнерусской литературы, отношения ЧБА к КЧСл, наличие нулевых значений букв для СОПИ, ЗДН и ФВР.
Моделирование по алгебраическим зависимостям КЧБА русской поэзии и в произведениях древнерусской литературы
По полученным данным было проведено моделирование КЧБА на основе линейной, степенной, экспоненциальной, логарифмической зависимостей и полинома второй степени. Так, величина а в линейной зависимости (y=ax+b), начиная с наибольшего значения КЧБА, изменялась от 3533,50 (ПС) до 2439,80 (ПЧГ), а величина b (прирост КЧБА) – от 49373,00 (ПС) до 3955,30 (СОПИ) с вычисленным коэффициентом множественной корреляции R2 от 0,86 (ЗДН) до 0,89 (ГЗС, РС и СОПИ).
Исходная величина а в степенной зависимости (y=axb), начиная с наибольшего значения КЧБА, изменялась от 22752,00 (ПС) до 1700,10 (СОПИ); относительная скорость КЧБА (величина b) – от 0,82 (ПЧГ) до 0,56 (ФВР) с вычисленным коэффициентом множественной корреляции R2 от 0,91 (ЕО) до 0,97 (РС).
Для ЕО, ГЗС, ПЧГ, ИБ и РС относительная скорость (величина b) колебалась от 0,82 (ПЧГ) до 0,65 (РС), а для ПС, СОПИ, ЗДН и ФВР – от 0,66 (СОПИ) до 0,56 (ФВР), что наглядно показывает отличие поэзии (ЕО – РС) от произведений древнерусской литературы (ПС – ФВР). Однако относительная скорость СОПИ была близка РС, а относительная скорость – ЗДН – РС, что говорит о близости СОПИ и ЗДН к поэзии.
В логарифмической зависимости (y=a•lnx+b) исходная величина а, начиная с наибольшего значения КЧБА, изменялась от 52150,00 (ПЧГ) до 4402,20 (ФВР); величина b была во всех случаях отрицательной с вычисленным коэффициентом множественной корреляции R2 от 0,97 (СОПИ) до 0,99 (ЕО, ГЗС, ПЧГ).
Величина а в экспоненциальной зависимости y=a•ebx изменялась от 48465,00 (ПС) до 4004,70 (СОПИ). При этом относительная экспоненциальная скорость КЧБА (величина b) ЕО, ГЗС, ПЧГ, ИБ и РС была от 0,50 (РС) до 0,48 (ЕО, ИБ), а ПС, СОПИ, ЗДН и ФВР – от 0,50 (СОПИ) до 0,42 (ФВР).
Следует отметить, что относительная экспоненциальная скорость b КЧБА СОПИ была одинаковой с РС (по 0,050). Характер этой величины похож на относительную скорость КЧБА в степенной зависимости, что подтверждает отношение СОПИ к поэзии.
В большинстве случаев относительная экспоненциальная скорость КЧБА в экспоненциальной зависимости несколько отличалась для поэзии и произведений древнерусской литературы. Хотя она скорее характеризовала общее свойство русского литературного и древнерусского языков.
В полиноме второй степени (y=ax2+bx+c) величина а при х2 имела отрицательные значения от – 179,80 (ПС) до 15,53 (СОПИ); величина b при х (средний абсолютный прирост КЧБА для ЕО, ГЗС, ПЧГ, ИБ и РС), начиная с наибольшей величины, была от 9005,40 (ПЧГ) до 2606,30 (ГЗС), а ПС, СОПИ, ЗДН и ФВР – от 9766,90 (ПС) до 923,88 (ФВР).
В этой зависимости величина с, характеризующая уровень ряда КЧБА в начальный период, была отрицательной для ЕО, ГЗС, ПЧГ и положительной – для ИБ, РС, ПС, СОПИ, ЗДН и ФВР.
Следует отметить, что значение КЧБА (величина b при х) ПС было выше, чем КЧБА ПЧГ. В этом случае ПС были похожи на поэзию ПЧГ.
Таким образом, моделирование КЧБА по линейной, степенной, экспоненциальной, логарифмической зависимостям и полиному второй степени показало сходство относительной скорости (степенная зависимость) с относительной экспоненциальной скоростью (экспоненциальная зависимость), а также нелинейность свойств КЧБА, которые характеризуют общее свойство русского литературного и древнерусского языков и являются составной картиной мира [32].
Моделирование ядерной зоны букв алфавита русской поэзии и произведений древнерусской литературы (распределение Бредфорда)
Известно, что для каждой предметной области, представляемой основными потребителями информации, можно определить минимальное и максимальное число журналов или книг по распределению Бредфорда [26, 27].
Поэтому этот закон нами применено к тематическим разделам русских стихов начала ХХ-го века для выявления минимального числа букв алфавита (ядерная зона) и их распределение по трем неравномерным зонам [28].
Определение ядерной зоны слов алфавита русских стихов проводили по точкам пересечения кривых логарифмической зависимости и полинома второй степени [28].
Для ЕО I-я (ядерная) зона содержала три буквы (о, е, а) с общей частотностью 28825, II-я зона – 12 букв (н, и, т, е, п, в, р, д, м, н, к, у, ь) с общей частотностью 58627, III-я зона – 13 букв (ы, й, п, я, г, б, з, ч, ж, х, ш, ю, ц) с общей частотностью 21385, IV-я зона четыре буквы (щ, э, ф, ъ) с общей частотностью 462 и соотношением частотностей по зонам 1:2,03:0,74:0,016;
• для ГЗС I-я (ядерная) зона – две буквы (о, е, ) с общей частотностью 6868, II-я зона – 13 букв (а, н, и, т, с, р, я, в, м, к, д, у, п) с общей частотностью 22947, III-я зона – 13 букв (я, ы, ь, г, б, й, з, ч, ш, х, ж, ю, ц) с общей частотностью 7430, IV-я зона – четыре буквы (щ, ф, э, ъ) с общей частотностью 270 и соотношением частотностей по зонам 1:3,34:1,08:0,039;
• для ПЧГ I-я (ядерная) зона – три буквы (о, е, а ) с общей частотностью 31768, II-я зона – 12 букв (н, и, т, с, р, в, л, я, м, к, ы, у) с общей частотностью 69501, III-я зона – 14 букв (ь, п, й, б, г, з, я, ч, х, ж, ш, ю, ц, щ) с общей частотностью 25981, IV-я зона – три буквы (ф, э, ъ) с общей частотностью 375 и соотношением частотностей по зонам 1:2,19:0,82:0,012;
• для РС I-я (ядерная) зона – две буквы (о, е) с общей частотностью 21379, II-я зона – 12 букв (а, н, и, т, с, л, р, в, к, м, д, у) с общей частотностью 69372, III-я зона – 14 букв (ы, п, я, й, ь, з, г, б, ч, х, ж, ш, ю, ц) с общей частотностью 26916, IV-я зона – четыре буквы (щ, ф, э, ъ) с общей частотностью 714 и соотношением частотностей по зонам 1:2,19:0,82:0,012;
• для ПС I-я (ядерная) зона – две буквы (о, и) с общей частотностью 30458, II-я зона – 11 букв (е, а, с, н, в, т, л, д, м, р, п) с общей частотностью 83291, III-я зона – 15 букв (у, г, я, к, б, з, ы, ь, х, й, ю, ш, ч, ж, ш) с общей частотностью 34212, IV-я зона – четыре буквы (ц, э, ф, ъ) с общей частотностью 717 и соотношением частотностей по зонам 1:2,14:1,12:0,024;
• для СОПИ I-я (ядерная) зона – две буквы (о, е) с общей частотностью 2439, II-я зона – 13 букв (и, а, с, л, т, р, в, н, п, ъ) с общей частотностью 8658, III-я зона – 15 букв (п, ы, д, ь, г, з, б, ю, ч, ж, ш, х, ц, i, щ) с общей частотностью 3229, IV-я зона – три буквы (ф, й, э) с общей частотностью два и соотношением частотностей по зонам 1:3,55:1,32:0,0008;
• для ЗДН I-я (ядерная) зона – две буквы (о, и) с общей частотностью 2655, II-я зона – 11 букв (е, а, в, н, р, т, с, л, к, м, у) с общей частотностью 8390, III-я зона – 15 букв (я, д, п, ы, з, б, г, ч, ь, ю, х, й, ж, ш, ц) с общей частотностью 3371, IV-я зона – три буквы (щ, ъ, ф) с общей частотностью 59 и соотношением частотностей по зонам 1:3,16:1,27:0,022;
• для ФВР I-я (ядерная) зона – две буквы (е,о) с общей частотностью 3251, II-я зона – 12 букв (и, а, н, т, с, в, р, м, д, у, я, л) с общей частотностью 3455, III-я зона – 14 букв (к, п, ж, б, г, з, ы, ь, ш, ю, х, щ, ц) с общей частотностью 3271, IV-я зона – три буквы (ъ, ф, й) с общей частотностью 76 и соотношением частотностей по зонам 1:2,60:1,01:0,023.
Если рассмотреть средние значения соотношения ЧБА по зонам для ЕО – РС и ПС – ФВР, то наблюдается следующая картина неравномерного распределения ЧБА по зонам: для первого случая – 1:2,68:0,98:0,025, а для второго случая – 1:3,01:1,18:0,07. Т.е. имеются различия поэзии и произведений древнерусской литературы.
Таким образом, моделирование ядерной зоны букв алфавита в поэзии и произведениях древнерусской литературы (распределение Бредфорда) выявило I-е ядерные зоны КЧБА, начиная с наибольшей величины, для ЕО, ГЗС, РС и СОПИ, в состав которых входят две буквы (о, е); для ИБ – три буквы (о, е, т), для ПЧГ – три буквы (о, е, а), а для ЗДН, ПС – по о, и, ФВР – е, о. Показано, что для русской поэзии характерно наличие в ядерной зоне двух основных букв о, е, а для прозы древнерусской литературы – о, и (ПС, ЗДН). СОПИ можно отнести к лиро-эпическому (поэтико-прозаическому) произведению. II-я зона распределения КЧБА отличалась многообразием расположения букв: первые две-три буквы: н, и (ЕО, ПЧГ), а, н, и (ГЗС, РС), и, а (СОПИ, ФВР), е, а (ЗДН). На основе средних значений отношения ЧБА по зонам показано отличие ЕО – РС от ПС – ФВР: соответственно, 1:2,68:0,98:0,25 и 1:3,01:1,18:0,07, т. е. подтверждена неравномерность распределения букв алфавита по зонам.
Анализ алфавита русской поэзии и произведений древнерусской литературы и закон Ципфа
Закон Ципфа гласит, что, если к какому-либо достаточно большому тексту составить список ранжированных в порядке убывания всех встречающихся слов, то произведение ранга на частоту слова будет величиной постоянной: f•r = c, где f – частота встречаемости слова в тексте, r – ранг слова в списке, c – эмпирическая постоянная величина [26].
Можно применить закон Ципфа для анализа алфавита в поэзии и произведениях древнерусской литературы. Результаты данного исследования показывают, что для ЕО – произведение ранга буквы на убывающую ее частоту есть величина непостоянная, которая растет для ЕО от 11023 (о, ранг 1) до 47210 (р, ранг 10), затем падает до 768 (ъ, ранг 32); для ГЗС – от 3777 (о, ранг 1) до 16710 (в, ранг 10), затем снижается до 256 (ъ, ранг 32); для ПЧГ – от 12007 (о, ранг 1) до 59460 (л, ранг 10), падает до 608 (ъ, ранг 32); для ИБ – от 11083 (о, ранг 1) до 44506 (д, ранг 7), снижается до 864 (ъ, ранг 32); для РС – от 11085 (о, ранг 1) до 55210 (в, ранг 10), снижается до 832 (ъ, ранг 32); для ПС – от 17218 (о, ранг 1) до 64280 (т, ранг 8), падает до 224 (ъ, ранг 32); для СОПИ – от 1264 (о, ранг 1) до 6500 (н, ранг 10), уменьшается до 62 (ф, ранг 31); для ЗДН – от 1365 (о, ранг 1) до 7008 (м, ранг 12), падает до 465 (ф, ранг 31); для ФВР – от 1870 (е, ранг 1) до 6147 (р, ранг 9), снижается до 248 (й, ранг 31).
При этом логарифм произведения ранга буквы на ее частотность также будет изменяемой величиной: для ЕО – 4,042 (о, ранг 1) до 4,659 (у, ранг 14) и от 4,583 (ь, ранг 15) до 4,080 (ц, ранг 28) и от 3,774 (щ, ранг 29) до 2,885 (ъ, ранг 32); для ГЗС – от 3,577 (о, ранг 1) до 3,991 (н, ранг 4), от 4,061 (и, ранг 5) до 4,223 (в, ранг 10), от 4,171 (м, ранг 11) до 4,036 (ш, ранг 24), от 3,996 (х, ранг 25) до 3,311 (э, ранг 31) и 2,408 (ъ, ранг 32); для ПЧГ – от 4,079 (о, ранг 1) до 4,774 (л, ранг 10), от 4,691 (д, ранг 11) до 4,703 (я, ранг 22), от 4,593 (ч, ранг 23) до 4,111 (щ, ранг 29) и от 3,742 (ф, ранг 30) до 2,784 (ъ, ранг 32); для ИБ – от 4,045 (о, ранг 1) до 4,670 (р, ранг 9), от 4,600 (ч, ранг 21) до 4,041 (ц, ранг 29), от 3,905 (э, ранг 30) до 2,937 (ъ, ранг 32); для РС – от 4,045 (о, ранг 1) до 4,742 (в, ранг 10), от 4,661 (к, ранг 11) до 4,408 (ю, ранг 27), от 4,060 (щ, ранг 29), от 3,644 (ф, ранг 30) до 2,920 (ъ, ранг 32); для ПС – от 4,236 (о, ранг 1) до 4,808 (т, ранг 8), от 4,772 (л, ранг 12) до 4,224 (ц, ранг 29), от 3,380 (э, ранг 30) до 2,350 (ъ, ранг 32); для СОПИ – от 3,102 (о, ранг 1) до 3,813 (м, ранг 10), от 3,779 (ъ, ранг 11) до 3,810 (ы, ранг 17), от 3,787 (д, ранг 18) до 3,320 (i, ранг 29), от 3,079 (щ, ранг 30) до 1,792 (ф, ранг 31); для ЗДН – от 3,135 (о, ранг 1) до 3,846 (м, ранг 12), от 3,805 (у, ранг 13) до 3,203 (ц, ранг 28), от 2,824 (щ, ранг 29) до 2,667 (ф, ранг 31); для ФВР – от 3,272 (о, ранг 1) до 3,789 (р, ранг 9), от 3,724 (м, ранг 10) до 3,125 (ъ, ранг 29), от 2,820 (ф, ранг 30) до 2,394 (й, ранг 31).
Однако, несмотря на изменение логарифма произведения ранга на частотность ЧБА, ее кумулятивная величина показала, что поэтические произведения (ЕО – РС) имели эти значения выше, чем произведения древнерусской литературы (СОПИ – ФВР). Этот высокий показатель имели ПС, который можно отнести к поэзии.
Следует отметить, что произведение убывающей ЧБА на ранг буквы в поэзии и произведениях древнерусской литературы хорошо аппроксимируется полиномом второй степени:
Тема Полином второй степени Тема Полином второй степени
ЕО y = -158,68х2+4531,30х+13241,00, R2=0,95; ПС y=-196,68х2+5379,50х+22250,00, R2=0,93;
ГЗС y =-54,53х2+1585,70х+4327,80, R2=0,95; СОПИ y=-24,62х2+739,04х+980,71, R2=0,97;
ПЧГ y = -185,03х2+5325,60х+15508,00, R2=0,93; ЗДН y=-21,26х2+585,50х+1959,50, R2=0,93;
ИБ y = -151,11х2+4281,00х+15188,00, R2=0,93; ФВР y=-19,73х2+557,01х+2002,50, R2=0,93.
РС y = -177,21х2+5145,90х+13184,00, R2=0,95;


Графически произведение убывающей ЧБА на ранг буквы в поэзии и произведениях древнерусской литературы представляет собой одновершинную параболу. Произведение ранга КЧБА на ее частотность, взятую в виде логарифма, хорошо аппроксимируется линейной, степенной зависимостями и полиномом второй степени (см. графики).
Таким образом, применение закона Ципфа при анализе поэтических текстов и произведений древнерусской литературы показало, что произведение ЧБА на ее ранг, а также логарифм ее есть величина изменяемая. Следует отметить, что поэтические произведения (ЕО – РС) имели эти значения выше, чем произведения древнерусской литературы (СОПИ – ФВР). ПС на основе этого высокого показателя можно отнести к поэзии. При этом произведение убывающей ЧБА на ранг буквы в поэзии и произведениях древнерусской литературы хорошо аппроксимируется полиномом второй степени.
Энтропия алфавита и ее моделирование по алгебраическим зависимостям (русская поэзия и произведения древнерусской литературы)
Известно, что объективный анализ поэтических текстов представляет собой множество слов, которые образуют по какому-либо признаку группы слов, например по тематическим разделам русского стиха ХХ-го века. То это можно применить к русской поэзии и прозе [28].
Если КЧБА обозначить через Ni, а ЧБА – через ni, то можно определить относительную частотность появления конкретной буквы: рi = ni/Ni. По набору относительных частотностей появления буквы или слова на данные i-ю слова или буквы можно вычислить энтропию информации по известной формуле Шеннона: Нi = – Σрi log2рi, которая измеряется в битах.
Поэтому вначале были определены относительные частотности букв алфавита к КЧБА и КЧС в русской поэзии [28] и прозе. Так, относительная частотность отношения буквы алфавита к КЧБА, начиная с наибольшей величины, составит в: ЕО – от 0,101 (о) до 0,0002 (ъ); ГЗС – от 0,100 (о) до 0,0001 (ъ); ПЧГ – от 0,094 (о) до 0,0001 (ъ); ИБ – от 0,100 (о) до 0,0002 (ъ); РС – от 0,094 (о) до 0,0002 (ъ); ПС – от 0,116 (о) до 0,00005 (ъ); СОПИ – от 0,088 (о) до 0,0001 (ф); ЗДН – от 0,094 (о) до 0,001 (ф); ФВР – от 0,124 (е) до 0,0005 (й).
Для поэзии и произведений древнерусской литературы произведение относительной частотности букв на КЧС, начиная с наибольшей величины, имело следующие значения: ЕО – от 0,472 (о) до 0,0,001 (ъ); ГЗС – от 0,493 (о) до 0,001 (ъ); ПЧГ – от 0,433 (о) до 0,001 (ъ); ИБ – от 0,464 (о) до 0,001 (ъ); РС – от 0,443 (е) до 0,001 (ъ); ПС – от 0,508 (о) до 0,9•10-6 (п); СОПИ – от 0,440 (о) до 0,0007 (ф); ЗДН – от 0,470 (о) до 0,005 (ф); ФВР – от 0,531 (е) до 0,0023 (й).
Таким образом, показано, что относительная частотность буквы алфавита к КЧБА, начиная с наибольшей величины, изменяется для наибольшей величины – буквы о для ЕО – РС от 0,493 (ГЗС) до 0,433 (ПЧГ), а для ПС – ФВР буквы о – от 0,470 (ЗДН) до 0,440 (СОПИ), что указывает на отличие поэзии от произведений древнерусской литературы.
Расчет энтропии по отношению ЧБА к КЧБА (КЭТР-1) показал следующее: ГЗС – 4,524, РС – 4,522, ПЧГ – 4,514, ИБ – 4,494, ЕО – 4,488, в среднем – 4,500, а для ЗДН – 4,624, СОПИ – 4,571, ФВР – 4,434, ПС – 4,430, в среднем – 4,515, что указывает на общее свойство русского литературного языка и близость ЕО – РС и ПС – ФВР.
Перейдем к моделированию энтропии в русской поэзии и прозе по линейной, степенной, логарифмической, экспоненциальной зависимостям и полиному второй степени.
Так по линейной зависимости начальная энтропия (величина а, КЭТР-1) имела следующие значения, начиная с наибольшей величины, колебалась: для ЕО – РС от 0,35 (ГЗС) до 0,12 (ПЧГ), а для ПС – ФВР – от 0,14 (СОПИ) до 0,12 ФВР; соответственно, величина b (прирост КЭТР-1) – для ЕО – РС от 1,40 (ЕО) до 0,94 (РС), а для ПС – ФВР – от 1,08 (ФВР) до 0,86 (СОПИ) с коэффициентом множественной корреляции R2 от 0,96 (ЕО) до 0,88 (ПЧГ) и 0,92 (ПС – СОПИ).
В примененной степенной зависимости исходная значение КЭТР-1 (величина а) изменялось, начиная с наибольшей величины, для ЕО – РС от 0,64 (ЕО) до 0,41 (РС), а для ПС – ФВР – от 0,48 (ФВР) до 0,39 (СОПИ); соответственно, величина b (относительная скорость КЭТР-1) – для ЕО – РС от 0,88 (ЕО) до 0,65 (ПЧГ), а для ПС – ФВР – от 0,76 (СОПИ) до 0,68 (ФВР) с коэффициентом множественной корреляции R2 от 0,99 (ЕО) до 0,96 (ПЧГ) и 0,98 (ПС – СОПИ).
В логарифмической зависимости исходная значение КЭТР-1 (величина а) изменялось, начиная с наибольшей величины, для ЕО – РС от 3,71 (ГЗС) до 1,44 (ПЧГ), а для ПС – ФВР – от 1,51 (СОПИ) до 1,41 (ФВР); соответственно, величина b (прирост КЭТР-1) была отрицательной: для ЕО – РС от – 2,51 (ГЗС) до – 0,25 (ПЧГ), а для ПС – ФВР – от – 0,71 (СОПИ) до – 0,48 (ФВР) с коэффициентом множественной корреляции R2 от 0,93 (ГЗС) до 0,98 (ПЧГ) и 0,95 (СОПИ) до 0,97 (ФВР).
В экспоненциальной зависимости исходное значение КЭТР-1 (величина а) для ЕО – РС изменялась, начиная с наибольшей величины от 1,93 (ЕО) до 1,03 (РС), а для ПС – ФВР – от 1,14 (ФВР) до 0,99 (СОПИ) с относительной экспоненциальной скоростью КЭТР-1 (величина b) для ЕО – РС 0,068 (ЕО) до 0,049 (ПЧГ) и для ПС – ФВР – от 0,060 (СОПИ) до 0,052 (ФВР) и коэффициентом множественной корреляции R2 от 0,75 (ЕО) до 0,68 (ПЧГ) и 0,75 (СОПИ) до 0,72 (ПС, ЗДН).
В полиноме второй степени величина а при х2 для КЭТР-1 имела следующие значения от – 0,008 (ЕО, ГЗС) до – 0,004 (РС), ПС – ФВР – от – 0,005 (ПС, ЗДН) до ПС –0,004 (СОПИ, ФВР); величина b при х (средний абсолютный прирост КЭТР-1) для ЕО – РС, начиная с наибольшей величины, была от 0,62 (ГЗС) до 0,28 (ИБ, РС), а для ПС – ФВР – от 0,28 (ПС, СОПИ, ЗДН) до 0,27 (ФВР). Величина с, характеризующая уровень ряда КЭТР-1 в начальный период, для ЕО – РС была равна от – 0,29 (ГЗС) до – 0,17 (ЕО) и от 0,34 (ПЧГ) до 0,12 (РС); для ПС – ФВР – от 0,24 (ФВР) до 0,08 (СОПИ) с вычисленным коэффициентом множественной корреляции R2 во всех случаях равным 0,99.
Таким образом, определены начальная энтропия (линейная зависимость) и ее прирост по относительной частотности ЧБА к КЧБА (КЭТР-1), относительная скорость и относительная экспоненциальная скорость КЭТР-1 (степенная и экспоненциальная зависимости), средний абсолютный прирост КЭТР-1 (полином второй степени) для ЕО – РС, которые были выше, чем для ПС – ФВР.
Значения КЭТР-2, рассчитанные по отношению частотности ЧБ к КЧС, составили: 10,646 (ПЧГ), 10,590 (ИБ), 10,524 (РС) 10,340 (ГЗС), 10,310 (ЕО), в среднем для ЕО – РС 10,482, а для ПС – ФВР: 10,966 (СОПИ), 10,667 (ЗДН), 9,999 (ФВР), 9680 (ПС), в среднем 10,329.
Величина а (исходное значение КЭТР-2) в линейной зависимости для ЕО – РС, начиная с наибольшей величины, изменялась от 0,33 (ИБ, РС) до 0,13 (ЕО, ПЧГ), для ПС – ФВР – от 0,34 (СОПИ) до 0,30 (ПС, ФВР). Прирост КЭТР-2 (величина b) для ЕО – РС был равен от 1,40 (РС) до 0,94 (ГЗС), для ПС – ФВР – от 1,57 (ПС) до 0,86 (СОПИ) с вычисленным коэффициентом множественной корреляции R2 для ЕО – РС от 0,96 (ИБ, РС) до 0,93 (ЕО, ГЗС, ПЧГ), для ПС – ФВР – от 0,95 (СОПИ, ЗДН) до 0,94 (ПС, ФВР).
Исходное значение КЭТР-2 (величина а) в степенной зависимости для ЕО – РС, начиная с наибольшей величины, составило от 0,63 (РС) до 0,41 (ПЧГ), для ПС – ФВР – от 0,66 (ПС) до 0,63 (СОПИ). Относительная скорость (величина b) КЭТР-2 для ЕО – РС была равна от 0,86 (ИБ) до 0,73 (ЕО), для ПС – ФВР – от 0,87 (СОПИ) до 0,83 (ФВР) с вычисленным коэффициентом множественной корреляции R2 для ЕО – РС от 0,99 (в остальных случаях) до 0,98 (ЕО, ГЗС, ПЧГ, ПС).
В логарифмической зависимости величина а (исходное значение КЭТР-2) для ЕО – РС, начиная с наибольшей величины, изменялась от 3,66 (ИБ) до 1,46 (ЕО), для ПС – ФВР – от 3,82 (СОПИ) до 3,32(ПС). Прирост КЭТР-2 (величина b) для ЕО – РС был равен от – 2,33 (ИБ) до – 0,59 (ЕО), для ПС – ФВР – от – 5,59 (СОПИ) до – 1,91 (ПС) с вычисленным коэффициентом множественной корреляции R2 для ЕО – РС от 0,96 (ЕО, ПЧГ) до 0,93 (ИБ), для ПС – ФВР – от 0,97 (ФВР) до 0,93 (СОПИ, ЗДН).
По экспоненциальной зависимости величина а начального КЭТР-2 для ЕО – РС, начиная с наибольшей величины, составила от 1,85 (РС) до 1,04 (ПЧГ), для ПС – ФВР – от 1,89 (СОПИ) до 1,86 (ПС). Относительная экспоненциальная скорость (величина b) КЭТР-2 для ЕО – РС была равна от 0,071 (ГЗС) до 0,057 (ЕО), для ПС – ФВР – от 0,068 (СОПИ) до 0,064 (ФВР) с вычисленным коэффициентом множественной корреляции R2 для ЕО – РС от 0,76 (ЕО) до 0,73 (РС) и для ПС – ФВР – от 0,76 (СОПИ) до 0,74 (ПС). Практически относительные экспоненциальные скорости КЭТР-2 для ЕО – РС и ПС – ФВР были одинаковыми.
В полиноме второй степени величина а при х2 для КЭТР-2 имела следующие значения для ЕО – РС от – 0,009 (РС) до – 0,004 (ЕО), для ПС – ФВР – от – 0,009 (СОПИ, ЗДН) до – 0,008 (ФВР); величина b при х (средний абсолютный прирост КЭТР-2) для ЕО – РС, начиная с наибольшей величины, составила от 0,62 (РС) до 0,27 (ЕО, ПЧГ), а для ПС – ФВР – от 0,65 (СОПИ) до 0,58 (ФВР). Величина с в полиноме второй степени, характеризующая уровень ряда КЭТР-1 в начальный период, для ЕО – РС была положительной для ЕО, ГЗС, ПЧГ (0,15, 0,13, 0,12) и отрицательной для ИБ и РС по – 0,20. Для ПС – ФВР эта величина была отрицательной от – 0,38 (СОПИ) до – 0,13 (ФВР) с вычисленным коэффициентом множественной корреляции R2 во всех случаях равным 0,99.
Таким образом, прирост КЭТР-2 (линейная зависимость), относительная скорость, кроме ИБ (степенная зависимость) для ПС – ФВР были выше, чем для ЕО – РС. Относительная экспоненциальная скорость КЭТР-2 была практически одинаковой для ЕО – РС и ПС – ФВР.
Энтропии (КЭТР-1 и КЭТР-2) и распределение Бредфорда
Исследование КЭТР-1 (энтропия отношения числа букв к числу всех букв алфавита) и КЭТР-2 (энтропия отношения числа букв к числу всех слов литературного произведения) на основе распределения Бредфорда проводится впервые.
Так для ЕО I–я (ядерная зона) содержала две буквы (о, е) с КЭТР-1 0,644, II–я зона – 14 букв (а, н, и, т, с, л, в, р, д, м, н, у, ь, ы) с КЭТР-1 2,769 и III–я зона – 16 букв (й, п, я, г, б, з, ч, ж, х, ш, ю, ч, щ, э, ф, ъ) с КЭТР-1 1,075 с соотношением КЭТР-1 по зонам: 1:4,28:1,67; для ГЗС I–ая (ядерная зона) – две буквы (о, е) с КЭТР-1 0,630, II–ая зона – 14 букв (а, н, и, т, с, р, я, в, м, н, д, у, п, я) с КЭТР-1 2,780 и III–я зона – 16 букв (ы, ь, г, б, й, з, ч, ш, х, ж, ю, ц, щ, ф, э, ъ) с КЭТР-1 1,114 с соотношением КЭТР-1 по зонам: 1:4,41:1,77; для ПЧГ I–ая (ядерная зона) – две буквы (о, е) с КЭТР-1 0,621, II–ая зона – 12 букв (а, н, и, т, с, р, в, л, д, м, к, ы) с КЭТР-1 2,523, III–я зона – 14 букв (у, в, п, й, б, г, з, я, ч, х, ж, ш, ю, ц) с КЭТР-1 1,310 и IV–я зона – четыре буквы (щ, ф, э, ъ) с КЭТР-1 0,060 с соотношением КЭТР-1 по зонам: 1:4,06:2,11:0,97; для ИБ I–ая (ядерная зона) – две буквы (о, е) с КЭТР-1 0,639, II–ая зона – 14 букв (т, а, н, с, и, в, р, л, к, м, д, у, п, в) с КЭТР-1 2,794 и III–я зона – 16 букв (я, ы, з, б, ч, г, й, ж, ш, х, ю, щ, ц, э, ф, ъ) с КЭТР-1 1,061 с соотношением КЭТР-1 по зонам: 1:4,37:1,66; для РС I–ая (ядерная зона) – две буквы (о, е) с КЭТР-1 0,625, II–ая зона – 14 букв (а, н, и, т, с, л, р, в, к, м, д, у, ы, п) с КЭТР-1 2,788 и III–я зона – 16 букв (я, й, ь, з, г, б, ч, х, ж, ш, ю, ц, щ, ф, э, ъ) с КЭТР-1 1,096 с соотношением КЭТР-1 по зонам: 1:4,46:1,75; для ПС I–ая (ядерная зона) – две буквы (о, и) с КЭТР-1 0,670, II–ая зона – 13 букв (е, а, с, н, в, т, л, д, м, р, п, у, г) с КЭТР-1 2,640 и III–я зона – 15 букв (я, й, к, б, з, ы, ь, х, й, ю, ш, ч, ж, щ, ц, э) с КЭТР-1 1,108 с соотношением КЭТР-1 по зонам: 1:3,91:1,65; для СОПИ I–ая (ядерная зона) – две буквы (о, е) с КЭТР-1 0,605, II–ая зона – 15 букв (и, а, с, л, т, р, в, н, ъ, я, у, м, к, п, ы) с КЭТР-1 2,285 и III–я зона – 15 букв (у, ь, г, з, б, ю, ч, ж, ш, х, ц, i, щ, ф, й) с КЭТР-1 1,169 с соотношением КЭТР-1 по зонам: 1:4,60:1,93; для ЗДН I–ая (ядерная зона) – две буквы (о, и) с КЭТР-1 0,631, II–ая зона – 14 букв (е, а, в, н, р, т, с, л, к, м, щ, у, я, д) с КЭТР-1 2,895 и III–я зона – 17 букв (п, ы, з, б, г, ч, ь, ю, х, й, ж, ш, ц, ъ, ф, э) с КЭТР-1 1,093 с соотношением КЭТР-1 по зонам: 1:4,57:1,73; для ФВР I–ая (ядерная зона) – две буквы (е, о) с КЭТР-1 0,690, II–ая зона – 15 букв (и, а, н, т, с, в, р, м, ф, у, я, л, к, п, ж) с КЭТР-1 2,696 и III–я зона – 16 букв (б, г, з, ы, ч, ь, ш, ю, х, щ, ц, ъ, ф, й, э, i) с КЭТР-1 1,049 с соотношением КЭТР-1 по зонам: 1:3,91:1,52.
Исследование КЭТР-2 показало, что: для ЕО I–я (ядерная зона) составила две буквы (о, е) с КЭТР-2 1,038, II–я зона – 16 букв (а, н, и, т, с, л, в, р, д, м, к, у, ь, ы, й, п) с КЭТР-1 2,769 и III–я зона – 16 букв (я, г, б, з, ч, ж, х, ш, ю, ц, щ, э, ф, ъ) с КЭТР-2 2,414 с соотношением КЭТР-2 по зонам: 1:6,61:2,33; для ГЗС I–я (ядерная зона) – две буквы (о, е) с КЭТР-2 1,031, II–я зона – 16 букв (а, н, и, т, с, р, л, в, м, к, д, у, п, я, ы, ь) с КЭТР-2 7,192 и III–я зона – 14 букв (г, б, й, з, ч, ш, х, ж, ю, ц, щ, ф, э, ъ) с КЭТР-2 1,867 с соотношением КЭТР-2 по зонам: 1:6,98:1,81; для ПЧГ I–я (ядерная зона) – две буквы (о, е) с КЭТР-2 1,052, II–я зона – 15 букв (а, н, и, т, с, р, в, л, д, м, к, ы, у, ь, п) с КЭТР-2 7,016 и III–я зона – 15 букв (й, б, г, з, я, ч, х, ж, ш, ю, ц, щ, ф, э, ъ) с КЭТР-2 2,578 с соотношением КЭТР-2 по зонам: 1:6,67:2,45; для ИБ I–я (ядерная зона) – две буквы (о, е) с КЭТР-2 1,042, II–я зона – 16 букв (т, а, н, с, и, в, р, л, к, м, д, у, п, ь, я) с КЭТР-2 6,700 и III–я зона – 15 букв (ы, з, б, ч, г, й, ж, ш, х, ю, щ, ц, э, ф, ъ) с КЭТР-2 2,848 с соотношением КЭТР-2 по зонам: 1:6,43:2,73; для РС I–я (ядерная зона) – две буквы (а, е) с КЭТР-2 1,056, II–я зона – 16 букв (н, и, о, т, с, л, р, в, м, д, у, ы, п, я, й, ь) с КЭТР-2 7,302 и III–я зона – 14 букв (з, г, б, ч, х, ж, ш, ю, х, ц, щ, ф, э, ъ) с КЭТР-2 2,163 с соотношением КЭТР-2 по зонам: 1:6,91:2,05; для ПС I–я (ядерная зона) – две буквы (е, и) с КЭТР-2 1,059, II–я зона – 15 букв (а, с, н, о, в, т, л, д, м, р, у, г, я, к, б) с КЭТР-2 6,449 и III–я зона – 15 букв (з, ы, ь, х, й, ю, ч, ж, щ, ц, э, ф, ъ, п) с КЭТР-2 2,159 с соотношением КЭТР-2 по зонам: 1:6,09:2,04; для СОПИ I–я (ядерная зона) – две буквы (и, а) с КЭТР-2 1,058, II–я зона – 16 букв (а, е, о, с, л, т, р, в, н, ъ, я, у, м, к, п, ы, д) с КЭТР-2 7,340 и III–я зона – 15 букв (ь, г, з, б, ч, ж, ш, х, ц, i, щ, ф, ю, й, э) с КЭТР-2 2,557 с соотношением КЭТР-2 по зонам: 1:6,94:2,42; для ЗДН I–я (ядерная зона) – две буквы (а, е) с КЭТР-2 1,098, II–я зона – 16 букв (и, о, в, н, р, т, с, л, к, м, у, я, д, п, ы, з) с КЭТР-2 7,199 и III–я зона – 14 букв (б, г, ч, ь, ю, х, й, ж, ш, ц, щ, ъ, ф, э, i) с КЭТР-2 2,447 с соотношением КЭТР-2 по зонам: 1:6,86:2,30; для ФВР I–я (ядерная зона) – две буквы (и, о) с КЭТР-2 1,059, II–я зона – 15 букв (а, н, е, т, с, в, р, м, д, у, я, л, к, п, ж) с КЭТР-2 6,320 и III–я зона – 16 букв (б, г, з, ы, ч, ь, ш, ю, х, щ, ц, ъ, ф, й, э, i) с КЭТР-2 2,620 с соотношением КЭТР-2 по зонам: 1:5,97:2,47.
Таким образом, распределение Бредфорда при исследовании энтропии КЭТР-1 и КЭТР-2 выявило отличие и сходство в отношении I-й (ядерной) зоны для КЭТР-1: две буквы о, е (ЕО, ГЗС, ПЧГ, ИБ, РС и СОПИ), о, и (ПС, ЗДН), е, о (ФВР), а для КЭТР-2 – две первые буквы о, е (ЕО, ГЗС, ПЧГ, ИБ), а, е (РС, ЗДН), е, и (ПС), и, а (СОПИ), и, о (ФВР). II-я зона отличается числом букв (15,16) и достаточным многообразием двух-трех первых и последующих букв: а, н, и (ЕО, ГЗС, ПЧГ, РС), т, а, н (ИБ), е, а, с (ПС), и, а, с (СОПИ), е, а, в (ЗДН), и, а, н (ФВР). КЭТР-2 во II-й зоне имел три первые буквы а, н, и (ЕО, ГЗС, ПЧГ), т, а, н (ИБ), н, и, о (РС), а, с, н (ПС), а, е, о (СОПИ), и, о, в (ЗДН), а, н, е (ФВР). III-я зона имела от 17 до 15 букв с различным сочетанием первых и последующих букв для ЕО – РС и ПС – ФВР. Полученные средние значения КЭТР-1, КЭТР-2 и по зонам показали, что для КЭТР-1 оно составило 4,506 и 4,505, для КЭТР-2 – 10,431 и 10,319 (ЕО – РС, ПС – ФВР) и для КЭТР-1 –1:4,32:1,79 и 1:4,25:1,70 для КЭТР-2 – 1:6,72:2,27 и 1:6,47:2,31 (ЕО – РС, ПС – ФВР). Полученные результаты показывают сходство и отличие поэзии от произведений древнерусской литературы.
Обсуждение полученных результатов
Представленная в работах [29-31] относительная частотность алфавита русского языка имела следующие значения: от 0,003 (э, щ) до 0,062 (а); от 0,002 (ф) до 0,095 (о). Полученные нами значения относительной частотности на примере первых 10 букв алфавита русского языка в поэзии и произведениях древнерусской литературы были выше), чем указанные литературные данные: о в ЕО – РС, ПС – ФВР (0,094 – 0,101; 0,092 – 0,116), е в ЕО – РС, ПС – ФВР (0,082 – 0,089; 0,082 – 0,124), а в ЕО – РС, ПС – ФВР (0,070 – 0,074; 0,066 – 0,170), н в ЕО – РС, ПС – ФВР (0,063 – 0,073; 0,045 – 0,055), и в ЕО – РС, ПС – ФВР (0,059 – 0,064; 0,071 – 0,091), т в ЕО – РС, ПС – ФВР (0,056 – 0,073; 0,049 – 0,054), с в ЕО – РС, ПС – ФВР (0,050 – 0,061; 0,050 – 0,059), л в ЕО – РС, ПС – ФВР (0,040 – 0,049; 0,026 – 0,050), в в ЕО – РС, ПС – ФВР (0,044 – 0,048; 0,045 – 0,055), р в ЕО – РС, ПС – ФВР (0,043 – 0,050; 0,034 – 0,049).
Выводы
1. Показано изменение динамики ЧБА и КЧБА: наибольшее ЧБА, 50% ЧБА, изменение отношения гласных, отношения звонких и глухих согласных, их средние значения, отличие поэзии от произведений древнерусской литературы, отношения ЧБА к КЧСл, наличие нулевых значений букв СОПИ, ЗДН и ФВР.
2. Моделирование КЧБА по линейной, степенной, экспоненциальной, логарифмической зависимостям и полиному второй степени показало сходство относительной скорости (степенная зависимость) с относительной экспоненциальной скоростью (экспоненциальная зависимость), которые характеризуют общее свойство русского литературного и древнерусского языка, а также нелинейность свойств КЧБА, которые характеризуют общее свойство русского литературного и древнерусского языков и являются составной картиной мира.
3. Проведенное моделирование ядерной зоны букв алфавита в поэзии и произведениях древнерусской литературы (распределение Бредфорда) выявило I-е ядерные зоны КЧБА, начиная с наибольшей величины, для ЕО, ГЗС, ПЧГ, РС и СОПИ, в состав которых входят две буквы (о, е); для ИБ – три буквы (о, е, т), для ПЧГ – три буквы (о, е, а), а для ЗДН, ПС – по о, и, ФВР – е, о. Показано, что для русской поэзии характерно наличие в ядерной зоне двух основных букв (о, е), а для произведений древнерусской литературы – о, и (ПС, ЗДН). СОПИ можно отнести к лиро-эпическому (поэтико-прозаическому) произведению. II-я зона распределения КЧБА отличалась многообразием: две-три первые буквы: н, и (ЕО, ПЧГ), а, н, и (ГЗС, РС), и, а (СОПИ, ФВР), е, а (ЗДН). На основе средних значений отношения ЧБА по зонам показано отличие ЕО – РС от ПС – ФВР: соответственно, 1:2,68:0,98:0,25 и 1:3,01:1,18:0,07.
4. Анализ поэтических текстов и произведений древнерусской литературы (закон Ципфа) показал, что произведение частотности буквы на ее ранг, а также логарифм ее есть величина изменяемая. Следует отметить, что поэтические произведения (ЕО – РС) имели эти значения выше, чем произведения древнерусской литературы (СОПИ – ФВР). ПС на основе этого высокого показателя можно отнести к поэзии. При этом произведение убывающей ЧБА на ранг буквы в поэзии и произведениях древнерусской литературы хорошо аппроксимируется полиномом второй степени, т.е. характеризует нелинейность ЧБА.
5. Определены начальная энтропия (линейная зависимость) и ее прирост по относительной частотности ЧБА к КЧБА (КЭТР-1), относительная скорость и относительная экспоненциальная скорость КЭТР-1 (степенная и экспоненциальная зависимости), средний абсолютный прирост КЭТР-1 (полином второй степени) для ЕО – РС, которые были выше, чем для ПС – ФВР.
6. Прирост КЭТР-2 (линейная зависимость), относительная скорость, кроме ИБ (степенная зависимость) для ПС – ФВР были выше, чем для ЕО – РС. Относительная экспоненциальная скорость КЭТР-2 была практически одинаковой для ЕО – РС и ПС – ФВР.
7. Распределение Бредфорда при исследовании энтропии КЭТР-1 и КЭТР-2 выявило отличие и сходство в отношении I-ой (ядерной) зоны для КЭТР-1: две буквы о, е (ЕО, ГЗС, ПЧГ, ИБ, РС и СОПИ), о, и (ПС,ЗДН), е, о (ФВР), а для КЭТР-2 – две первые буквы о, е (ЕО, ГЗС, ПЧГ, ИБ), а, е (РС,ЗДН), е, и (ПС), и, а (СОПИ), и, о (ФВР). II-я зона отличается числом букв (15,16) и достаточным многообразием двух-трех первых и последующих букв: а, н, и (ЕО,ГЗС,ПЧГ,РС), т, а, н (ИБ), е, а, с (ПС), и, а, с (СОПИ), е, а, в (ЗДН), и, а, н (ФВР). Для КЭТР-2 – а, н, и (ЕО, ГЗС, ПЧГ), т, а, н (ИБ), н, и, о (РС), а, с, н (ПС), а, е, о (СОПИ), и, о, в (ЗДН), а, н, е (ФВР). III-я зона имела от 17 до 15 букв с различным сочетанием первых и последующих букв для ЕО – РС и ПС – ФВР. Полученные средние значения КЭТР-1, КЭТР-2 и по зонам показали, что для КЭТР-1 оно составило 4,506 и 4,505, для КЭТР-2 – 10,431 и 10,319 (ЕО – РС, ПС – ФВР) и для КЭТР-1 –1:4,32:1,79 и 1:4,25:1,70 для КЭТР-2 – 1:6,72:2,27 и 1:6,47:2,31 (ЕО – РС, ПС – ФВР). Полученные результаты показывают сходство и отличие поэзии и произведений древнерусской литературы, а также нелинейность свойств КЧБА, которые характеризуют общее свойство русского литературного и древнерусского языков и являются составной научной картиной мира.
Список литературы
1. Бродский И. Урания: Стихотворения. – СПб.: Изд-во ˝Азбука˝, ˝Азбука-Аттикус˝, 2010. – 224с.
2. Гаспаров М.Л. Русский стих начала ХХ века в комментариях. 3-е изд. М.: КДУ, 2004. – 312с.
3. Пушкин А.С. Евгений Онегин. Собр. соч. Т. 1-10. Т. 4. М.: ГИХЛ. 1959.
4. Левик В.В. Избранные переводы. Гейне Г. Германия. Зимняя сказка: В 2т. Т.1. / Состав. В. Брагин. – М.: ТЕРРА–Книжный клуб. 2007. С.182-240.
5. Левик В.В. Избранные переводы. Байрон Дж. Г. Паломничество Чайльд-Гарольда
6. : В 2т. Т.2. / Состав. В. Брагин. – М.: ТЕРРА–Книжный клуб. 2007. С.160-275.
7. Бродский И. Назидание. Стихи 1962-1989. – Ленинград: СП "Смарт". 1990. – 260 с.
8. Псалтирь.
9. Мещерский Н.А., Бурыкин А.А. Слово о пълку Игореве, Игоря сыня Святъславля внука Ольгова. Реконструкция древнерусского текста.
// http: //russbalt.rod1. org/index. php?PHPSESSID =9aad11ee1c38d62,06.08.2010
10. Климов Ю.Н. Сравнительный наукометрический анализ трех древнерусских текстов: ″Феврония″, ″Задонщина″ и ″Беседа отца с сыном о женской злобе″. http://obshelit.net.2011/01/10.15:15
11. Повесть от житиа святых новых чудотворець муромских, благовернаго и преподобнаго и достохвальнаго князя Петра, нареченнаго в иноческом чину Давида, и супруги его благоверныя и преподобныя и достохвальныя княгини Февронии, нареченныя в иноческом чину Еуфросинии.
12. Горькова В. И. Информетрия. Итоги науки и техники. – М.: ВИНИТИ. – 1988. – Т. 10. – 190с.
13. Климов Ю.Н. Наукометрический анализ двух редакций текстов древнерусских рукописей "Беседа отца с сыном о женской злобе". //http://obshelit.net/users/-rr/23.09.2010,12:01; http//e-lingvo.net/library.list 24 dowload13318html.
14. Климов Ю.Н. Наукометрическое исследование 151-го псалма на церковно-славянском и литературном русском языках. http://obshelit.net.2010.11/14.16:37.
15. Климов Ю.Н. Сравнительный наукометрический анализ трех древнерусских текстов: ″Феврония″, ″Задонщина″ и ″Беседа отца с сыном о женской злобе″. http: obshelit.net.2011/01/10,15:1
16. Климов Ю.Н. Наукометрический анализ гласных в ″Слове о полку Игореве″. http: obshelit.net.2011/02/16;15:07.
17. Климов Ю.Н. Разработка методологических основ анализа информационных потоков в процессе создания перспективных технологий и новых знаний (Депонирована в ФГУП ВИМИ, ДО № 8883, Москва, 2001).
18. Климов ЮН. Разработка организационных принципов генерации и анализа информационных ресурсов в процессе создания перспективных технологий (Депонирована в ФГУП ВИМИ, ДО № 8977, Москва, 2005).
19. Климов Ю.Н. Методы анализа потоков научно-технической информации в процессе эффективной реализации функционирования информационных технологий. – М.: ФГУП ″ВИМИ″, ДО № 9040, 2008. – 302с.
20. Климов Ю.Н. Квалиметрическое исследование русского стиха на основе наукометрического подхода. Informetrics.ru/articles/sn.php? id=74, 30.07.2010.
21. Климов Ю.Н. Системная методология исследование реальных потоков научно-технической информации в среде мирового информационного пространства. – М.: 2009. – 312 с. http://www.rags. ru/node/2751.
22. Кирносов В.В. Применение статистических методов в сравнительных исследованиях художественных текстов. //˝ИТО-Сибирь-2008˝, http://ito/edu/ru/2008/Kursk/
23. Анализ текстов http://www statsoft.ru/home/portal/exchange/text analysis html. 20.04.2011.
24. Применение частотных характеристик текстов. http://lag-web chat.ru/texts.html.
25. Частотный анализ поэтических текстов по всем буквам. http://mgpu.ru/download.pdp?id=2414.
26. Солтон Дж. Динамические библиотечно-информационные системы. – М.: Изд-во ˝Мир˝. 1979. – С. 186,198.
27. Климов Ю.Н. Моделирование распределений Бредфорда и Ципфа. // Межотраслевая информационная служба. 2008. № 4. С. 60-62.
28. Климов Ю.Н. Наукометрический анализ алфавита в русских стихах начала ХХ-го века // http: obshelit.net.19-07-2011;17:42.
29. Нечаев В.И. Элементы криптографии (Основы теории защиты информации). – М.: Высшая школа. 1999. – 109с.
30. Вентцель Е.С. Теория вероятностей. – М.: ˝Наука˝. 4-е изд., 1969. – С. 504.
31. Пиотровский Р.Г., Бектиев К.Б., Пиотровская А.А. Математическая лингвистика // М.: Высшая школа.1997.- 983с.
32. Климов Ю.Н. Наукометрическое исследование нелинейности в информатике (Information
Science) – от слова до документального потока научно-технической информации. // Межотраслевая информационная служба. 2010, № 4, с. 30-35.

Автор приносит благодарность Николаю Юрьевичу Климову за помощь в реализации расчета энтропии текста.

Дескрипторы: Наукометрия. Анализ текстов. Частотный анализ. Алфавит. Стихи. Русские поэты. Древнерусская литература. Динамика букв алфавита. Отношение гласных. Отношение звонких и глухих согласных. Алгебраические зависимости. Моделирование. Энтропия. Свойства энтропии. Распределение Бредфорда. Закон Ципфа.



Читатели (1348) Добавить отзыв
 

Литературоведение, литературная критика