ОБЩЕЛИТ.NET - КРИТИКА
Международная русскоязычная литературная сеть: поэзия, проза, литературная критика, литературоведение.
Поиск по сайту  критики:
Авторы Произведения Отзывы ЛитФорум Конкурсы Моя страница Книжная лавка Помощь О сайте
Для зарегистрированных пользователей
логин:
пароль:
тип:
регистрация забыли пароль
 
Анонсы

StihoPhone.ru

КВАНТИТАТИВНАЯ ЛЕКСИКОЛОГИЯ И КОРПУСНАЯ ЛИНГВИСТИКА РОМАНОВ В.Г. СОРОКИНА «ДЕНЬ ОПРИЧНИКА» И «ГОЛУБОЕ САЛО»

Автор:
Автор оригинала:
Климов Юрий Николаевич
Исследована квантитативная лексикология и корпусная лингвистика романов В.Г. Сорокина «День опричника» [1] и «Голубое сало» [2] на основе методики [3] по следующим квантитативным характеристикам:
• Свойства графем (Гр),
• Число словоформ (СФ),
• Объем словаря (V),
• Число словоупотреблений (СУ), объем текста (N),
• Отношение объема словаря к объему текста (V/N),
• Натуральные логарифмы объемов словаря Ln V и текстов Ln N
• Индексы Хердана [4], АD [5], исключительности [6], постоянства [6],
• Точка компьютерного лексического кроссинговера (ККЛК),
• Индекс приблизительного богатства словаря (1-Fh) по Попеску-Альтманну[7],
• Индекс уточненного богатства словаря (1-Fh) по Попеску-Альтманну [7],
• Hapax legomena (HL-1, объем Ципфа [8]),
• Hapax dislegomena (HL-2),
• Hapax trislegomena (HL-3),
• Доля hapax legomena в словаре (HL-1/V),
• Доля hapax dislegomena в словаре (HL-2/V),
• Доля hapax trislegomena в словаре (HL-3/V),
• Доля hapax legomena в тексте (HL-1/ N),
• Доля hapax dislegomena в тексте (HL-2/ N),
• Доля hapax trislegomena в тексте (HL-3/ N),
• Сумма hapax legomena и hapax dislegomena (HL-1+ HL-2),
• Сумма hapax legomena, hapax dislegomena и hapax trislegomena (HL-1+ HL-2+HL-3),
• Доля hapax legomena и hapax dislegomena в словаре (HL-1+ HL-2/V),
• Доля hapax legomena, hapax dislegomena и hapax trislegomena в словаре (HL-1+HL-2+ HL-3/V),
• Доля hapax legomena и hapax dislegomena в тексте (HL-1+ HL-2/N),
• Доля hapax legomena, hapax dislegomena и hapax trislegomena в тексте (HL-1+ HL-2+ HL-3/N),
• Отношение объема текста к объему словаря,
• Моделирование кумулятивных частоты слов и длин слов по линейному, экспоненциальному, логарифмическому и степенному уравнениям, полиномам второй и третьей степени.
Перейдем к анализу квантитативных характеристик графем в романах В.Г. Сорокина «День опричника» [1] и «Голубое сало» [2], представленных в табл. 1-3.



Таблица 1.

Квантитативные характеристики графем в романе В.Г. Сорокина «День опричника» [1]

ГРАФЕМЫ, ДО
Гр ЧГр КЧГр LN_ЧГр LN_КЧГр Доля ЧГр Доля ЧГр, % Доля КЧГр Доля КЧГр, %
А 39853 39853 10,5930 10,5930 0,3212 32,12 0,3212 32,12
О 9302 49155 9,1380 10,8027 0,0750 7,50 0,3961 39,61
Е 7191 56346 8,8806 10,9393 0,0580 5,80 0,4541 45,41
И 5877 62223 8,6788 11,0385 0,0474 4,74 0,5015 50,15
Т 5495 67718 8,6116 11,1231 0,0443 4,43 0,5457 54,57
Н 5126 72844 8,5421 11,1961 0,0413 4,13 0,587 58,70
Р 5019 77863 8,5210 11,2627 0,0404 4,04 0,6275 62,75
С 4958 82821 8,5088 11,3244 0,0400 4,00 0,6675 66,75
Л 4124 86945 8,3246 11,3730 0,0332 3,32 0,7007 70,07
В 4024 90969 8,3000 11,4183 0,0324 3,24 0,7331 73,31
К 3322 94291 8,1083 11,4541 0,0268 2,68 0,7599 75,99
П 3188 97479 8,0671 11,4874 0,0257 2,57 0,7856 78,56
М 3109 100588 8,0421 11,5188 0,0251 2,51 0,8106 81,06
У 2936 103524 7,9848 11,5476 0,0237 2,37 0,8343 83,43
Д 2580 106104 7,8555 11,5722 0,0208 2,08 0,8551 85,51
Ы 2224 108328 7,7071 11,5929 0,0179 1,79 0,873 87,30
Я 2119 110447 7,6587 11,6123 0,0171 1,71 0,8901 89,01
Б 1586 112033 7,369 11,6265 0,0128 1,28 0,9029 90,29
З 1568 113601 7,3576 11,6404 0,0126 1,26 0,9155 91,55
Ь 1542 115143 7,3408 11,6539 0,0124 1,24 0,9279 92,79
Г 1512 116655 7,3212 11,6670 0,0122 1,22 0,9401 94,01
Й 1328 117983 7,1914 11,6783 0,0107 1,07 0,9508 95,08
Ч 1161 119144 7,0570 11,6881 0,0094 0,94 0,9602 96,02
Ю 1144 120288 7,0423 11,6976 0,0092 0,92 0,9694 96,94
Х 1053 121341 6,9594 11,7064 0,0085 0,85 0,9779 97,79
Ж 888 122229 6,7890 11,7137 0,0072 0,72 0,985 98,50
Ш 861 123090 6,7581 11,7207 0,0069 0,69 0,992 99,20
Ц 420 123510 6,0403 11,7241 0,0034 0,34 0,9954 99,54
Щ 351 123861 5,8608 11,7269 0,0028 0,28 0,9982 99,82
Ф 141 124002 4,9488 11,7281 0,0011 0,11 0,9993 99,93
Э 50 124052 3,9120 11,7285 0,0004 0,04 0,9997 99,97
Ъ 31 124083 3,4340 11,7287 0,0002 0,03 1 100
Ё 2 124085 0,6931 11,7287 2·10-05 0 1 100

Количество ЧГр в романе В.Г. Сорокина «День опричника» снижается от 39853 (А) до 2 (Ё), как и его натуральный логарифм от 10,5930 (А) до 0,6931 (Ё), доля ЧГр и доля ЧГр (в %), соответственно, от 0,3212 (А) до 2·10-05 (Ё) и от 32,12 (А) до 0 (Ё), а кумулятивное количество ЧГр растет от 39853 (А) до 124085 (Ё) и его натуральный логарифм от 10,5930 (А) до 11,7287 (Ё), доля КЧГр и доля КЧГр (в %), соответственно, от 0,3212 (А) до 1 (Ё) и от 32,12 (А) до 100 (Ё).
В работе П. Гржибека и Е. Келиха [9] показано, что основными графемами в русском языке являются четыре Гр Е, О, И, А или О, Е, А, И, которые могут быть разделенными Гр Н, Т и вместе Т, Н.
Однако, Гр в романе В.Г. Сорокина «День опричника» имеют другие четыре последовательные Гр А, О, Е, И, число которых в сумме составляют 50,15 %.
Таблица 2.
Квантитативные характеристики графем в романе В.Г. Сорокина «Голубое сало» [2],

ГРАФЕМЫ, ГС
Гр ЧГр КЧГр LN_КЧГр LN_ЧГр Доля ЧГр Доля ЧГр, % Доля КЧГр Доля КЧГр, %
А 76035 76035 11,2389 11,2389 0,3219 32,19 0,3219 32,19
О 17286 93321 11,4438 9,7577 0,0732 7,32 0,3950 39,5
Е 13425 106746 11,5782 9,5049 0,0568 5,68 0,4519 45,19
И 12092 118838 11,6855 9,4003 0,0512 5,12 0,5031 50,31
Н 10667 129505 11,7715 9,2749 0,0452 4,52 0,5482 54,82
Р 9758 139263 11,8441 9,1858 0,0413 4,13 0,5895 58,95
С 9480 148743 11,9100 9,1569 0,0401 4,01 0,6297 62,97
Л 9329 158072 11,9708 9,1409 0,0395 3,95 0,6691 66,91
Т 9270 167342 12,0278 9,1345 0,0392 3,92 0,7084 70,84
Ы 7450 174792 12,0714 8,9160 0,0315 3,15 0,7399 73,99
П 6077 180869 12,1055 8,7123 0,0257 2,57 0,7656 76,56
К 5978 186847 12,1380 8,6958 0,0253 2,53 0,7910 79,1
М 5930 192777 12,1693 8,6878 0,0251 2,51 0,8161 81,61
У 5632 198409 12,1981 8,6362 0,0238 2,38 0,8399 83,99
Д 4345 202754 12,2197 8,3768 0,0184 1,84 0,8583 85,83
В 3934 206688 12,2390 8,2774 0,0167 1,67 0,8749 87,49
Я 3872 210560 12,2575 8,2615 0,0164 1,64 0,8913 89,13
Ь 3099 213659 12,2721 8,0388 0,0131 1,31 0,9045 90,45
З 3003 216662 12,2861 8,0074 0,0127 1,27 0,9172 91,72
Б 2900 219562 12,2994 7,9725 0,0123 1,23 0,9294 92,94
Г 2803 222365 12,3121 7,9384 0,0119 1,19 0,9413 94,13
Й 2698 225063 12,3241 7,9003 0,0114 1,14 0,9527 95,27
Ч 1881 226944 12,3325 7,5396 0,0080 0,80 0,9607 96,07
Х 1864 228808 12,3406 7,5305 0,0079 0,79 0,9686 96,86
Ш 1838 230646 12,3486 7,5164 0,0078 0,78 0,9764 97,64
Ж 1610 232256 12,3556 7,3840 0,0068 0,68 0,9832 98,32
Ю 1516 233772 12,3621 7,3238 0,0064 0,64 0,9896 98,96
Щ 849 234621 12,3657 6,7441 0,0036 0,36 0,9932 99,32
Ц 791 235412 12,3691 6,6733 0,0033 0,33 0,9965 99,65
Ф 512 235924 12,3713 6,2383 0,0022 0,22 0,9987 99,87
Э 210 236134 12,3722 5,3471 0,0009 0,09 0,9996 99,96
Ъ 73 236207 12,3725 4,2905 0,0003 0,03 0,9999 99,99
Ё 23 236230 12,3726 3,1355 1E-04 0,01 1 100


Частота Гр в романе В.Г. Сорокина «Голубое сало» (табл. 2) снижается от 76035 (А) до 23 (Ё), как и его натуральный логарифм от 11,2389 (А) до 3,1355 (Ё), доля ЧГр и доля ЧГр (в %), соответственно, от 0,3219 (А) до 1·10-04 (Ё) и от 32,19 (А) до 0,01 (Ё), а кумулятивное количество ЧГр растет от 76035 (А) до 236230 (Ё) и его натуральный логарифм от 11,2389 (А) до 12,3726 (Ё), доля КЧГр и доля КЧГр (в %), соответственно, от 0,3219 (А) до 1 (Ё) и от 32,19 (А) до 100 (Ё).
Таблица 3.
Квантитативные характеристики и корпусная лингвистика графем в романах В.Г. Сорокина «День опричника» [1] и «Голубое сало» [2] (табл. 3).

ГРАФЕМЫ, ГС и ДО
Гр ЧГр КЧГр LN_КЧГр LN_ЧГр Доля ЧГр Доля ЧГр,% Доля КЧГр Доля КЧГр,%
А 103770 103770 11,5499 11,5500 0,3228 32,28 0,3228 32,28
О 23571 127341 11,7546 10,068 0,0733 7,33 0,3961 39,61
Е 18358 145699 11,8893 9,8178 0,0571 5,71 0,4532 45,32
И 16177 161876 11,9946 9,6913 0,0503 5,03 0,5036 50,36
Н 14249 176125 12,0789 9,5644 0,0443 4,43 0,5479 54,79
Р 13254 189379 12,1515 9,4921 0,0412 4,12 0,5891 58,91
Т 13114 202493 12,2185 9,4814 0,0408 4,08 0,6299 62,99
С 12918 215411 12,2803 9,4664 0,0402 4,02 0,6701 67,01
Л 12083 227494 12,3349 9,3996 0,0376 3,76 0,7077 70,77
В 10313 237807 12,3792 9,2412 0,0321 3,21 0,7398 73,98
П 8366 246173 12,4138 9,0319 0,026 2,60 0,7658 76,58
К 8277 254450 12,4469 9,0212 0,0257 2,57 0,7915 79,15
М 7988 262438 12,4778 8,9857 0,0248 2,48 0,8164 81,64
У 7022 269460 12,5042 8,8568 0,0218 2,18 0,8382 83,82
Д 6019 275479 12,5263 8,7027 0,0187 1,87 0,8570 85,70
Ы 5498 280977 12,5460 8,6121 0,0171 1,71 0,8741 87,41
Я 5412 286389 12,5651 8,5964 0,0168 1,68 0,8909 89,09
Ь 4130 290519 12,5794 8,3260 0,0128 1,28 0,9037 90,37
З 4107 294626 12,5935 8,3204 0,0128 1,28 0,9165 91,65
Б 3998 298624 12,6069 8,2935 0,0124 1,24 0,9290 92,90
Г 3811 302435 12,6196 8,2456 0,0119 1,19 0,9408 94,08
Й 3483 305918 12,6311 8,1556 0,0108 1,08 0,9516 95,16
Ч 2700 308618 12,6399 7,9010 0,0084 0,84 0,9600 96,00
Х 2613 311231 12,6483 7,8683 0,0081 0,81 0,9682 96,82
Ш 2430 313661 12,6561 7,7956 0,0076 0,76 0,9757 97,57
Ю 2418 316079 12,6637 7,7907 0,0075 0,75 0,9833 98,33
Ж 2207 318286 12,6707 7,6994 0,0069 0,69 0,9901 99,01
Щ 1118 319404 12,6742 7,0193 0,0035 0,35 0,9936 99,36
Ц 1065 320469 12,6775 6,9707 0,0033 0,33 0,9969 99,69
Ф 619 321088 12,6795 6,4281 0,0019 0,19 0,9988 99,88
Э 242 321330 12,6802 5,4889 0,0008 0,08 0,9996 99,96
Ъ 102 321432 12,6805 4,6250 0,0003 0,03 0,9999 99,99
Ё 30 321462 12,6806 3,4012 9E-05 0,01 1 100

Графемы в романе В.Г. Сорокина «Голубое сало» имеют такие же четыре последовательные Гр А, О, Е, И, как и в «Дне опричника», число которых в сумме составляют 50,31 %.
В современных русских текстах «День опричника», «Голубое сало» и их корпусе графемы А, О, Е, И составляют 50,15; 50,31 и 50,36 %, что указывает на принадлежность текстов одному автору.
Перейдем к квантитативным характеристикам и корпусной лингвистике графем в романах В.Г. Сорокина «День опричника» [1] и «Голубое сало» [2] (табл. 3).
Количество ЧГр в корпусе романов «День опричника» [1] и «Голубое сало» (табл. 3) снижается от 103770 (А) до 30 (Ё), как и его натуральный логарифм от 11,5500 (А) до 3,4012 (Ё), доля ЧГр и доля ЧГр (в %), соответственно, от 0,3228 (А) до 9·10-05 (Ё) и от 32,28 (А) до 0,01 (Ё), а кумулятивное количество ЧГр растет от 103770 (А) до 321462 (Ё) и его натуральный логарифм от 11,5499 (А) до 12,6806 (Ё), доля КЧГр и доля КЧГр (в %), соответственно, от 0,3228(А) до 1 (Ё) и от 32,28(А) до 100 (Ё).
Гр в корпусе романов «День опричника» и «Голубое сало» имеют такие же четыре последовательные Гр А, О, Е, И, как в «Дне опричника» и в «Голубом сале», число которых в сумме составляют 50,36 %, что подтверждает наши результаты в предыдущих исследованиях [12-13].
Перейдем к исследованию квантитативных характеристик романов В.Г. Сорокина и их корпуса (табл. 4).
Таблица 4.
Квантитативные характеристики романов В.Г. Сорокина «День опричника» и «Голубое сало» и их корпуса

Характеристика ДО ГС ДО и ГС Характеристика ДО ГС ДО и ГС
СФ 12264 22434 30303 HL-2 1728 3283 4619
СУ 33174 77423 110595 HL-3 699 1373 1957
V/N 0,3697 0,2898 0,2740 HL-1/V 0,6996 0,6582 0,6429
N/V 2,7050 3,4512 3,6496 HL-2/V 0,1409 0,1461 0,1524
LN V 9,4144 10,0180 10,3190 HL-3/V 0,0570 0,0612 0,0616
LN N 10,4095 11,2570 11,6136 HL-1/N 0,2586 0,3192 0,1762
Индекс Хердана 0, 9044 0,8900 0,8885 HL-2/N 0,0521 0,0710 0,0418
Индекс AD 1,1057 1,1240 1,1255 HL-3/N 0,0210 0,0297 0,0180
Индекс исключительности (%) 69,96 65,82 64,29 HL-1+ HL-2 10308 18050 24101
Индекс постоянства (%) 15,95 13,38 20,47 HL-1+ HL-2+HL-3 11007 19423 25058
Точка ККЛК* 1694 5037 7439 HL-1+ HL-2/V 0,8405 0,8050 0,7953
1-F(h) 0,9990 0,9990 0,9990 HL-1+ HL-2+HL-3/V 0,8975 0,8658 0,8599
1-F(h) 1,0940 1,1310 1,1388 HL-1+ HL-2/N 0,3107 0,3901 0,2179
HL-1 8580 14767 19482 HL-1+ HL-2+HL-3/N 0,3318 0,4198 0,2356
Кумулятивная длина слов 92044 174590 238312 V/КДС 0,1332 0,1295 0,1272
*ККЛК – компьютерный квантитативный лексический кроссинговер

Количество СФ, СУ, отношение объема словаря к объему текста, натуральный логарифм объема словаря и объема текста, индекс АD, точка ККЛК, уточненное богатство словаря по Попеску-Альтманну, кумулятивная длина слов, количество hapax legomena, hapax dislegomena, hapax trislegomena, отношение hapax dislegomena и hapax dislegomena к объему словаря, сумма hapax legomena, hapax dislegomena, сумма hapax legomena, hapax dislegomena и hapax trislegomenа в обоих романах и корпусе увеличивался, соответственно, от 12264 до 30303, от 33174 до 110595, от 2,7050 до 3,6496, от 9,4144 до 10,3190, от 10,4095 до 11,6136, от 1,1057 до 1,1255, от 1,0940 до 1,1388, от 1694 до 7439, от 92044 до 238312, от 8580 до 19482, от 1728 до 4619, от 699 до 1957, от 0,1409 до 0,1524, от 0,0570 до 0,0616, от 10308 до 24101 и от 11007 до 25058.
Отношение объема словаря к объему текста, индекс Хердана, индекс исключительности, отношение hapax dislegomena к объему словаря, hapax dislegomena и hapax dislegomena к объему словаря отношение hapax dislegomena, hapax dislegomena и hapax trislegomena к объему словаря и отношение объема словаря к кумулятивной длине слов в обоих романах и корпусе уменьшалось, соответственно, от 0,3697 до 0,2740, от 0,9044 до 0,8885, от 69,96 до 64,29 %, от 0,6996 до 0,6429, от 0,8405 до 0,7953, от 0,8975 до 0,8599 и от 0,1332 до 0,1272.
В некоторых случаях квантитативные характеристики текстов романов увеличивались, а в корпусе снижались. Это относится к следующим показателям: отношение hapax legomena к объему словаря, отношение hapax legomena и hapax dislegomena к объему текста, отношение суммы hapax legomena, hapax dislegomena и hapax trislegomenа к объему текста: от 0,6996, 0,6582 до 0,6429, от 0,2586, 0,3192 до 0,1762 и от 0,0521 и 0,0710 до 0,0418, от 0,0210 и 0,0297 до 0,0180, от 0,3107 и 0,3901 до 0,2170, от 0,3318 и 0,4198 до 0,2356.
Единственный случай равенства текстов романов и корпуса относится к приблизительному богатству словарей по Попеску-Альтманну (0,9990) и по индексу постоянства – наблюдается с начала уменьшение, а затем увеличение этой характеристики от 15,95 и 13,38 до 20,45 %
Затем нами было проведено моделирование натуральных логарифмов кумулятивных длин и частот слов по романам «День опричника» и «Голубое сало» и их корпуса (рис. 1-3).



Рис. 1. Зависимость натуральных логарифмов кумулятивных длин и частот слов по роману «День опричника», начиная с наибольшей величины, от их последовательности

Зависимость натуральных логарифмов кумулятивных длин и частот слов от их последовательности, начиная с наибольшей величины, в романе «День опричника» представлена следующими простыми алгебраическими уравнениями: для LN КД yLN КДС = 9,4705e2E-05x, R² = 0,6283, y = 0,0002x + 9,4986, R² = 0,7071, y = -3E-08x2 + 0,0006x + 8,7500R² = 0,8730, y = 6E-12x3 - 1E-07x2 + 0,0011x + 8,2357,R² = 0,9289, y = 5,1981x0,0853, R² = 0,9781, y = 0,8224ln(x) + 3,7748R² = 0,9974, а LN КЧС представлен следующими алгебраическими уравнениями: yLN КЧС= 9,7881e6E-06x, R² = 0,7176, y = 6E-05x + 9,7891,R² = 0,7437, y = -7E-09x2 + 0,0001x + 9,6095,R² = 0,8560, y = 2E-12x3 - 4E-08x2 + 0,0003x + 9,4573,R² = 0,9136, y = 8,2728x0,0242,R² = 0,9867 и y = 0,2392ln(x) + 8,1340, R² = 0,9926 и описываются полиномом второй и третьей степени, степенным и логарифмическим уравнениями.
Зависимость натуральных логарифмов кумулятивных длин и частот слов от их последовательности, начиная с наибольшей величины, в романе «Голубое сало» представлена следующими простыми алгебраическими уравнениями (рис. 2): для LN КДС: yLN КДС = 10,0820e1E-05x, R² = 0,6311, y = 0,0001x + 10,1090R² = 0,7059, y = -9E-09x2 + 0,0003x + 9,3480, R² = 0,8721, y = 9E-13x3 - 4E-08x2 + 0,0006x + 8,8240, R² = 0,9283, y = 5,4159x0,0814, R² = 0,9797 и y = 0,8351ln(x) + 3,7932, R² = 0,9974, а для LN КЧС: yLN КЧС = 10,7490e2E-06x,
R² = 0,6855, y = 3E-05x + 10,7500, R² = 0,7063, y = -2E-09x2 + 7E-05x + 10,5860, R² = 0,8358, y = 2E-13x3 - 1E-08x2 + 0,0001x + 10,4460, R² = 0,9024, y = 9,3203x0,0188, R² = 0,9855, y = 0,2032ln(x) + 9,2135, R² = 0,9913 и описывается полиномом второй и третьей степени, степенным и логарифмическим уравнениями, как и для романа «День опричника».



Рис. 2. Зависимость натуральных логарифмов кумулятивных длин и частот слов по роману «Голубое сало», начиная с наибольшей величины, от их последовательности

Зависимость натуральных логарифмов кумулятивных длин и частот слов от их последовательности, начиная с наибольшей величины, в корпусе романов «День опричника» и «Голубое сало» представлена следующими простыми алгебраическими уравнениями (рис. 3): для LN КДС: yLN КДС = 10,3950e7E-06x, R² = 0,6355, y = 8E-05x + 10,4210, R² = 0,7076, y = -5E-09x2 + 0,0002x + 9,6621, R² = 0,8731, y = 4E-13x3 - 2E-08x2 + 0,0004x + 9,1412, R² = 0,9288, y = 5,5649x0,0788, R² = 0,9812 и y = 0,8335ln(x) + 3,8675, R² = 0,9976, а LN КЧС: yLN КЧС = 11,1250e2E-06x, R² = 0,6876, y = 2E-05x + 11,1260, R² = 0,7066, y = -1E-09x2 + 5E-05x + 10,9660, R² = 0,8400, y = 1E-13x3 - 5E-09x2 + 0,0001x + 10,8320, R² = 0,9064, y = 9,6909x0,0175, R² = 0,9871, y = 0,1959ln(x) + 9,5868, R² = 0,9923 и описываются полиномом второй и третьей степени, степенным и логарифмическим уравнениями.



Рис. 3. Зависимость натуральных логарифмов кумулятивных длин и частот слов по романам «День опричника» и «Голубое сало», начиная с наибольшей величины, от их последовательности

Средние длины слов в натуральных логарифмах исследованных текстов различались: для «Дня опричника» – от 8,2357 до 9,4705, для «Голубого сала» – от 8,8240 до 10,1030 и для корпуса «День опричника» и «Голубое сало» – от 9,1412 до 10,3590.
Т.е. показано сходство и различие исследованных текстов и их корпуса.
Относительная и относительная экспоненциальные скорости в исследованных текстах и в корпусе значительно отличались друг от друга (табл. 5).

Свойства графем

Зависимость натуральных логарифмов числа графем (LN ЧГр) и кумулятивного их числа (LN КЧГр) от последовательности, начиная с наибольшей величины (рис. 4) в романе «День опричника» для LN ЧГр ДО представлена следующими алгебраическими уравнениями: yLN ЧГр ДО = 13,9680x-0,2800, R² = 0,2624, y= 11,6360e-0,0320x, R² = 0,4265, y = -1,604ln(x) + 11,3940, R² = 0,5525, y = -0,1645x + 10,0570, R² = 0,7376, y = -0,0068x2 + 0,0653x + 8,7168, R² = 0,8276, y = -0,0009x3 + 0,0409x2 - 0,5923x + 10,7170, R² = 0,9470 и описывается полиномом третьей степени, а LN КЧГр ДО: yLN КЧГр = 11,0230e0,0024x, R² = 0,7658, y = 0,0272x + 11,0230, R² = 0,7758, y = -0,0016x2 + 0,0811x + 10,7090, R² = 0,9674, y = 10,6100x0,0306, R² = 0,9864, y = 0,3453ln(x) + 10,5950, R² = 0,9877, y = 7E-05x3 - 0,0052x2 + 0,1304x + 10,5590, R² = 0,9933 и описывается полиномом второй степени, степенным и логарифмическим уравнениями, полиномом третьей степени.
Зависимость натуральных логарифмов числа графем (LN ЧГр) и кумулятивного их числа LN КЧГр) от последовательности, начиная с наибольшей величины (рис. 5) в романе «Голубое сало» для LN ЧГр ГС представлена следующими алгебраическими уравнениями: y LN ЧГр ГС = 12,9760x-0,1970, R² = 0,4820, y= -1,485ln(x) + 11,8250, R² = 0,6483, y = 11,1260e-0,0210x, R² = 0,6842, y = -0,1480x + 10,5140, R² = 0,8174, y = -0,0044x2 + 0,0022x + 9,6378, R² = 0,8701, y = -0,0007x3 + 0,0309x2 - 0,4852x + 11,1210, R² = 0,9599 и описывается полиномом третьей степени, а LN КЧГр ГС: yLN КЧГр ГС = 11,6720e0,0023x, R² = 0,7592, y = 0,0270x + 11,6720, R² = 0,7687, y = -0,0016x2 + 0,0816x + 11,3540, R² = 0,9654, y = 11,257x0,0289, R² = 0,9847, y = 0,3445ln(x) + 11,2430, R² = 0,9861, y = 7E-05x3 - 0,0053x2 + 0,133x + 11,1970, R² = 0,9936 и описывается полиномом второй степени, степенным и логарифмическим уравнением и полиномом третьей степени.



Рис. 4. Зависимость натуральных логарифмов числа графем и кумулятивного их числа от последовательности, начиная с наибольшей величины, в романе «День опричника»



Рис. 5. Зависимость натуральных логарифмов числа графем и кумулятивного их числа от последовательности, начиная с наибольшей величины, в романе «Голубое сало»

Зависимость натуральных логарифмов числа графем (LN ЧГр) и кумулятивного их числа (LN КЧГр) от последовательности, начиная с наибольшей величины (рис. 6) в корпусе романов «День опричника» и «Голубое сало» для LN ЧГр в корпусе ДО и ГС представлена следующими алгебраическими уравнениями: yLN ЧГр ДО и ГС = 13,2510x-0,1900, R² = 0,4853, y = -1,491ln(x) + 12,1440, R² = 0,6430, y = 11,4220e-0,0200x, R² = 0,6883, y = -0,1489x + 10,8320, R² = 0,8136, y = -0,0046x2 + 0,0064x + 9,9254, R² = 0,8690, y = -0,0007x3 + 0,0316x2 - 0,4930x + 11,4450, R² = 0,9617 и описывается полиномом третьей степени, а LN КЧГр ДО и ГС: yLN КЧГр ДО и ГС = 11,9810e0,0022x, R² = 0,7609, y = 0,0270x + 11,9810, R² = 0,7701, y = -0,0016x2 + 0,0812x + 11,6640, R² = 0,9656, y = 11,5670x0,0281, R² = 0,9851, y = 0,3436ln(x) + 11,5540, R² = 0,9864, y = 7E-05x3 - 0,0053x2 + 0,1323x + 11,5090, R² = 0,9936 и описывается полиномом второй степени, степенным и логарифмическим уравнениями, полиномом третьей степени.



Рис. 6. Зависимость натуральных логарифмов числа графем и кумулятивного их числа от последовательности, начиная с наибольшей величины, в корпусе романов «День опричника» и «Голубое сало»

Распределение кумулятивного числа графем от их последовательности

Рассмотрим распределение кумулятивного числа графем от их последовательности, начиная с наибольшей величины, по трем неравномерным зонам.
Распределение кумулятивного числа графем в романе «День опричника» от их последовательности, начиная с наибольшей величины, по трем неравномерным зонам было следующим:
- I-я зона КГр А, О, Е, И, Т, Н c КГр 72844;
- II-я зона КГр Р, С, Л, В, К, П, М, У, Д, Ы, Я, Б, З, Ь, Г, Й, Ч, Ю, Х с КГр 48497;
- III я зона КГр Ж, Ш, Ц, Щ, Ф, Э, Ъ, Ё с КГр 2744.
Отношение КГр между зонами было неравномерным и составило 1:0,6657:0,0377.
Распределение кумулятивного числа графем в романе «Голубое сало» от их последовательности, начиная с наибольшей величины (рис. 8), по трем неравномерным зонам было следующим:
- I-я зона КГр А, О, Е, И, Н, Р c КГр 139263;
- II-я зона КГр С, Л, У, Ы, П, К, М, У, Д, В, Я, Ь, З, Б, Г, Й, Ч, Х, Ш с КГр 91383;
- III я зона КГр Ж, Ю, Щ, Ц, Ф, Э, Ъ, Ё с КГр 5584.
Отношение КГр между зонами было неравномерным и составило 1:0,6562:0,0401.
Распределение кумулятивного числа графем в корпусе романов «День опричника» и «Голубое сало» от их последовательности, начиная с наибольшей величины (рис. 9), по трем неравномерным зонам было следующим:
- I-я зона КГр А, О, Е, И, Н, Р, Т, С c КГр 215411;
- II-я зона КГр Л, В, П, К, М, У, Д, Ы, Я, Ь, З, Б, Г, Й, Ч, Х, Ш, Ю, Ж с КГр 102875;
- III я зона КГр Щ, Ц, Ф, Э, Ъ, Ё с КГр 3176.
Отношение КГр между зонами было неравномерным и составило 1:0,4776:0,0147.
Рассмотрим относительные степенные и экспоненциальные скорости кумулятивных графем (табл. 5).
Данные для проведенного анализа взяты из [9] для Ol'chin (1907), Proskurin (1933), Кalinina (1968), Grygor'ev (1980 a), Grygor'ev (1980 b), Dietze (1982) и пересчитаны нами [12-13].
Наибольшей была относительная скорость по степенному уравнению у стихов А.С. Пушкина [4], равная 0,0759, а наименьшей – у «Общей химии» Н.Л. Глинки [8], равная 0,0281.
Наиболее близкими по относительной скорости по степенному уравнению были: P. Ol'chin (1907), Н.В. Гоголь «Тарас Бульба» [5], V.I. Grygor'ev (1980 a, проза), V.I. Grygor'ev (1980 b, проза) и E.A. Кalinina (1968) «Электротехника», соответственно, 0,0661, 0,0616, 0,0601, 0,0561 и 0,0558.
Близкими по относительной скорости по степенному уравнению были J. Dietze (1982), N. Proskurin (1933), А.С. Пушкин «Сказка о мёртвой царевне» и А.С. Пушкин «Медный всадник», соответственно, 0,0493, 0,0456, 0,0427 и 0,0395.
Тенденция по относительной экспоненциальной скорости для наибольшей и наименьшей величины была сходной для относительной скорости исследованных текстов, т.е. наибольшей была относительная экспоненциальная скорость по экспоненциальному уравнению у стихов А.С. Пушкина, равная 0,0058х, а наименьшей - у «Общей химии» Н.Л. Глинки, равная 0,0022х.
Наиболее близкими по относительной экспоненциальной скорости по экспоненциальному уравнению были: стихи А.С. Пушкин и P. Ol'chin (1907), соответственно, 0,0058х и 0,0054х.
Близкими по относительной экспоненциальной скорости по экспоненциальному уравнению были: V.I. Grygor'ev (1980 a, художественная проза), Н.В. Гоголь «Тарас Бульба», E.A. Кalinina (1968) «Электротехника» и V.I. Grygor'ev (1980 b, художественная проза), соответственно, 0,0046х, 0,0045х, 0,0043х и 0,0043х.
Почти одинаковыми по относительной экспоненциальной скорости по экспоненциальному уравнению были: J. Dietze (1982), А.С. Пушкин «Сказка о мёртвой царевне», N. Proskurin (1933) и А.С. Пушкин «Медный всадник», соответственно, 0,0037х, 0,0034х, 0,0033х и 0,0031х.
Таблица 5.
Относительные степенные и экспоненциальные скорости кумулятивных графем
Текст Относительная степенная
скорость Текст Относительная экспоненциальная
скорость
А.С. Пушкин Стихи 0,0759 А.С. Пушкин Стихи 0,0058х
P. Ol'chin (1907) 0,0661 P. Ol'chin (1907) 0,0054х
Н.В. Гоголь «Тарас Бульба» 0,0616 V.I. Grygor'ev (1980 a, проза) 0,0046х
V.I. Grygor'ev (1980 a, проза) 0,0601 Н.В. Гоголь «Тарас Бульба» 0,0045х
V.I. Grygor'ev (1980 b, художественная проза) 0,0561 E.A. Кalinina (1968)
«Электротехника» 0,0043х
E.A. Кalinina (1968) «Электротехника» 0,0558 V.I. Grygor'ev (1980 b,
художественная проза) 0,0043х
J. Dietze (1982) 0,0493 J. Dietze (1982) 0,0037х
N. Proskurin (1933) 0,0456 А.С. Пушкин «Сказка о мёртвой царевне» 0,0034х
А.С. Пушкин «Сказка о мёртвой царевне» 0,0427 N. Proskurin (1933) 0,0033х
А.С. Пушкин «Медный всадник» 0,0395 А.С. Пушкин «Медный всадник» 0,0031х
В.Г. Сорокин «День опричника» 2006 0,0306 В.Г. Сорокин «День опричника» 2006 0,0024х
В.Г. Сорокин «Голубое сало» 2009 0,0289 В.Г. Сорокин «Голубое сало» 2009 0,0023х
Н.Л. Глинка «Общая химия» 0,0281 Н.Л. Глинка «Общая химия» 0,0022х
В.Г. Сорокин «День опричника» и «Голубое сало» (корпус) 0,0281 В.Г. Сорокин «День опричника» и «Голубое сало» (корпус) 0,0022х

Таблица 6.
Распределение 50% графем по исследованным текстам
Текст Распределение 50% графем Распределение гласных по трем неравномерным зонам по Бредфорду
I-я зона II-я зона III-я зона
А.С. Пушкин «Медный всадник» А,О,Е, Н А,О,Е,Н,С,И Л Р,Т,Ы,М,Д,У,П,К,В,Й,Б,З,Я,Ь,Г,Ч,Ш,Ж Х,Ю,Ц,Щ,Ф,Э,Ё,Ъ
Н.Л. Глинка «Общая химия» А,О,Е,И А,О,Е,И, Н,Т Р,С,Л,В,М,К,П,Д,Я,Ы,У,З,Г,Й,Ч,Х Ь,Б,Ю,Щ,Ж,Ц,Ф,Ш,Э,Ь,Ё
А.С. Пушкин «Сказка о мёртвой царевне» А,О,Е, Л,С А,О,Е, Л,С Т,И,Р,Н,Ы,У,Д,П,К,М,Я,Ь,Б,Г,З,Й,Ч,В,Ж Ш,Х,Ю,Ц,Щ,Ё,Ъ,Э
P. Ol'chin (1907) Е,О,И,А, Н,Т Е,О,И,А,Ф,Н,Т С,В,Р,Л,К,М,Д,У,Я,Ы,Г,Б,П,Ч,Й Х,Ж,З,Ю,Ш,Щ,Ц,Ф
J. Dietze (1982) О, И, Е,А, Н,Т О,И,Е,А, Н,Т С,Р,В,Л,К,М,П,Д,Я,Ы,У,З,Б,Ч,Х,Й,Г Ц,Б,Ф,Ю,Ж,Щ,Ш,Э,Ъ
E.A. Кalinina (1968) «Электротехника» О,Е,И, Т,А,Н О,Е,И, Т,А, Н Р,С,Л,В,К,П,М,Д,Я,Ы,У,Ч,З,Ь,Ъ,Г,Б Х,Й,Э,Ж,Ю,Ц,Щ,Ф,Ш
Н.В. Гоголь «Тарас Бульба» О,Е,И, С, Н, Л, Т О, Е, И, С,Н,Л Т,Р,Ы,П,У,К,М,Д,Я,В,Ь,З,Б,Г,Ш,Ч,Х,Й Ж,Ю,А,Ц,Щ,Ф,Э,Ъ,Ё
N. Proskurin (1933) О,Е,А,И, Т, Н,С О,Е,А,И, Т,Н С,Р,В,Л,К,М,Д,П,У,Я,Ы,Ь,З,Б,Г,Ч,Й,Х Ж,Ю,Ш,Щ,Ц,Э,Ф,Ё,Ъ
V.I. Grygor'ev (1980 a) О,Е,А,И, Н,Т,С О,Е,А,И, Н,Т С,Л,В,Р,К,М,У,Д,П,Ы,Я,Б,Ь,Г,Ч,З,Й Ж,Х,Ш,Ю,Щ,Э,Ц,Ф,Ъ
V.I. Grygor'ev (1980 b) О,Е,А,И, Н,Т,С О,Е,А,И, Н,Т С,Л,В,К,Р.У,М,Д,П,Я,Ы,Б,Ь,Г Ч,З,Й,Ж,Х,Ш,Ю,Щ,Э,Ц,Ф,Ъ
А.С. Пушкин Стихи О,Е,А,И, Л,Р,С,Т О,Е,А,И, Л,Р Т, С, Р, Н, В, У, Д, М, П, К, Ь, Я, Ы, Г,Й, Б, З, Ч Ж, Х, Ш, Ю ,Ц, Щ, Ф, Э, Ъ
В.Г. Сорокин «День опричника» А,О,Е,И А,О,Е,И, Т,Н Р,С,Л,В,К,П,М,У,Д,Ы,Я,Б,З,Ь,Г,Й,Ч,Ю,Х Ж,Ш,Ц,Щ,Ф,Э,Ъ,Ё
В.Г. Сорокин «Голубое сало» А,О,Е,И А,О,Е,И, Н,Р С,Л,У,Ы,П,К,М,У,Д,В,Я,Ь,З,Б,Г,Й,Ч,Х,Ш Ж,Ю,Щ,Ц,Ф,Э,Ъ,Ё
В.Г. Сорокин «День опричника» и «Голубое сало» А,О,Е,И А,О,Е,И,Н,Р,Т,С Л,В,П,К,М,У,Д,Ы,Я,Ь,З,Б,Г,Й,Ч,Х,Ш,Ю,Ж Щ,Ц,Ф,Э,Ъ,Ё

Доли графем

Рассмотрим распределение долей числа графем (в %) от их последовательности, начиная с наибольшей величины, по трем неравномерным зонам.
Распределение долей числа графем (в %) в романе «День опричника» от их последовательности, начиная с наибольшей величины, по трем неравномерным зонам было следующим:
- I-я зона КГр А, О, Е, И, Т, Н, Р c КГр 62,78 %;
- II-я зона КГр С, Л, В, К, П, М, У, Д, Ы, Я, Б, З, Ь, Г, Й, Ч, Ю, Х, Ж с КГр 35,75 %;
- III я зона КГр Ш, Ц, Щ, Ф, Э, Ъ, Ё с КГр 1,50 %.
Распределение долей числа графем (в %) в романе «Голубое сало» от их последовательности, начиная с наибольшей величины, по трем неравномерным зонам было следующим:
- I-я зона КГр А, О, Е, И, Н, Р, С, Л c КГр 66,91%;
- II-я зона КГр Т, Ы, П, К, М, У, Д, В, Я, Ь, З, Б, Г, Й, Ч, Х, Ш с КГр 20,73 %;
- III я зона КГр Ж, Ю, Щ, Ц, Ф, Э, Ъ, Ё с КГр 2,36 %.
Распределение кумулятивного числа графем в романах «День опричника» и «Голубое сало» от их последовательности, начиная с наибольшей величины (рис. 9), по трем неравномерным зонам было следующим:
- I-я зона КГр А, О, Е, И, Н, Р, Т, c КГр 67,01 %;
- II-я зона КГр С, Л, В, П, К, М, У, Д, Ы, Я, Ь, З, Б, Г, Й, Ч, Х, Ш, Ю, Ж с КГр 32,00 %;
- III я зона КГр Щ, Ц, Ф, Э, Ъ, Ё с КГр 0,99 %.
Для исследованных романов и их корпуса I-е зоны КГр были почти одинаковы и в среднем составляли 65.57%.
Для исследованных романов и их корпуса II-й зоны КГр были близки у романов «День опричника» и корпуса «День опричника» и «Голубое сало», но отличалось от романа «Голубое сало».
Для исследованных романов и их корпуса III-й зоны КГр у романов «День опричника» и корпуса «День опричника» и «Голубое сало» имелись колебания от 0,99 % («День опричника» и «Голубое сало») до 2,36 % («Голубое сало»).
Таким образом, наблюдается сходство и отличие отдельных текстов, и их корпуса.

Свойства кумулятивных словоформ и словоупотреблений

Далее были проведены исследования зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту 25 и более указанных романов (рис. 7-12).
Зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту 25 романа «День опричника» (рис.7) представлены следующими алгебраическими уравнениями: для LN КСФ ДО:yLN КСФ ДО = 9,2812e0,0007x, R² = 0,4209, y = 0,0066x + 9,2818, R² = 0,4249, y = -0,0008x2 + 0,0285x + 9,1835,R² = 0,7057, y = 9,1849x0,0085, R² = 0,7642, y = 0,0789ln(x) + 9,1852, R² = 0,7683, y = 1E-04x3 - 0,0047x2 + 0,0693x + 9,0864, R² = 0,8594 и не описывается с достаточной точности ни одним алгебраическим уравнением, а для LN КСУ ДО: уLN КСУ ДО = 9,5117e0,0026x, R² = 0,6632, y = 0,0255x + 9,5134, R² = 0,6762, y = -0,0022x2 + 0,0831x + 9,2545, R² = 0,8864, y = 9,2304x0,0277, R² = 0,9429, y = 0,267ln(x) + 9,2259, R² = 0,9498, y = 0,0002x3 - 0,0102x2 + 0,1674x + 9,0542, R² = 0,9569 и описывается полиномом второй степени, степенным и логарифмическим уравнениями, полиномом третьей степени.



Рис. 7. Зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту 25 романа «День опричника»

Зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту > 25 романа «День опричника» (рис.8), представлены следующими алгебраическими уравнениями для LN КСФ ДО : yLN КСФ ДО = 9,2843e0,0007x, R² = 0,4194, y = 0,0063x + 9,2848, R² = 0,4234, y = -0,0008x2 + 0,0266x + 9,1902, R² = 0,6928, y = 9,1872x0,0083, R² = 0,7625, y = 0,0774ln(x) + 9,1875, R² = 0,7666, y = 9E-05x3 - 0,0044x2 + 0,0663x + 9,0924 R² = 0,8556 и не описываются с достаточной точностью ни одним алгебраическим уравнением, а для LN КСУ ДО: yLN КСУ ДО = 9,4958e0,0028x, R² = 0,7000, y = 0,0275x + 9,4956, R² = 0,7102, y = -0,0015x2 + 0,0670x + 9,3112, R² = 0,8002, y = 0,2832ln(x) + 9,2000, R² = 0,9020, y = 9,2075x0,0292, R² = 0,9036, y = 0,0003x3 - 0,0126x2 + 0,1897x + 9,0095, R² = 0,9365 и описывается логарифмическим и степенным уравнениями, полиномом третьей степени.
Зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту 25 романа «Голубое сало» представлено следующими алгебраическими уравнениями для LN КСФ ГС: yLN КСФ ГС = 9,8515e0,0008x, R² = 0,4520, y = 0,0081x + 9,8522, R² = 0,4565, y = -0,001x2 + 0,0337x + 9,7370, R² = 0,7349, y = 9,7378x0,0096, R² = 0,7941, y = 0,0946ln(x) + 9,7381, R² = 0,7984, y = 0,0001x3 - 0,0054x2 + 0,0807x + 9,6255, R² = 0,8814 и не описывается с достаточной точностью ни одним алгебраическим уравнением, а для LN КСУ: yLN КСУ ГС = 10,1050e0,003x, R² = 0,6888, y = 0,0308x + 10,1060, R² = 0,7030, y = -0,0025x2 + 0,0963x + 9,8120, R² = 0,8971, y = 9,7760x0,0309, R² = 0,9554, y = 0,3180ln(x) + 9,7692, R² = 0,9621, y = 0,0002x3 - 0,0117x2 + 0,1936x + 9,5807, R² = 0,9644 и описывается полиномом второй степени, степенным и логарифмическим уравнениями, полиномом третьей степени.



Рис. 8. Зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту > 25 романа «День опричника»


Рис. 9. Зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту 25 романа «Голубое сало».
Рассмотрим зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту > 25 романа «Голубое сало», для LN КСФ ГС (рис. 10): yLN КСФ ГС = 9,8550e0,0008x, R² = 0,4529, y = 0,0077x + 9,8557, R² = 0,4576, y = -0,0009x2 + 0,0314x + 9,7452, R² = 0,7216, y = 9,7401x0,0095, R² = 0,7940, y = 0,0932ln(x) + 9,7404, R² = 0,7983, y = 0,0001x3 - 0,0051x2 + 0,0775x + 9,6318, R² = 0,8788 и не описывают с достаточной точностью ни одним алгебраическим уравнением, а для LN КСУ ГС: yLN КСУ = 10,0810e0,0032x, R² = 0,7187, y = 0,0338x + 10,0800, R² = 0,7275, y = -0,0015x2 + 0,0752x + 9,8863, R² = 0,7947, y = 0,3413ln(x) + 9,7319, R² = 0,8898, y = 9,7435x0,0330, R² = 0,8957, y = 0,0003x3 - 0,0152x2 + 0,2253x + 9,5172, R² = 0,9333 и описывается полиномом третьей степени.



Рис. 10. Зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту > 25 романа «Голубое сало»

Зависимости натурального логарифма частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины, по частоту 25 корпуса романов «День опричника» и «Голубое сало» (рис. 11) для LN КСФ ДО и ГС: yLN КСФ ДО и ГС = 10,1420e0,0008x, R² = 0,4571, y = 0,0086x + 10,1430, R² = 0,4618, y = -0,0010x2 + 0,0357x + 10,0210, R² = 0,7388, y = 10,0220x0,0099, R² = 0,7982, y = 0,1004ln(x) + 10,0220, R² = 0,8026, y = 0,0001x3 - 0,0057x2 + 0,0847x + 9,9049, R² = 0,8817 и не описывается ни одним алгебраическим уравнением с достаточной точностью, а для LN КСУ ДО и ГС: y LN КСУ ДО и ГС = 10,4050e0,0030x, R² = 0,6924, y = 0,0325x + 10,4060, R² = 0,7068, y = -0,0026x2 + 0,1012x + 10,0970, R² = 0,9010, y = 10,0600x0,0316, R² = 0,9572, y = 0,3345ln(x) + 10,0520, R² = 0,9639, y = 0,0002x3 - 0,0120x2 + 0,2004x + 9,8612, R² = 0,9642 и описывается полиномом второй степени, степенным и логарифмическим уравнениями, полиномом третьей степени.
Рассмотрим зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту > 25 корпуса романов «День опричника» и «Голубое сало» (рис. 12) для LN КСФ ДО и ГС: yLN КСФ ДО и ГС = 10,1460e0,0008x, R² = 0,4574, y = 0,0082x + 10,1470, R² = 0,4622, y = -0,0009x2 + 0,0333x + 10,0300, R² = 0,7260, y = 10,0250x0,0097, R² = 0,7977, y = 0,0989ln(x) + 10,0250, R² = 0,8022, y = 0,0001x3 - 0,0053x2 + 0,0814x + 9,9116 R² = 0,8791 и не описываются ни одним алгебраическим уравнением с достаточной точностью, а для LN КСУ ДО и ГС: yLN КСУ ДО и ГС = 10,3800e0,0033x, R² = 0,7219, y = 0,0356x + 10,3780, R² = 0,7309, y = -0,0016x2 + 0,0793x + 10,1740, R² = 0,7987, y = 0,3587ln(x) + 10,0130 R² = 0,8920, y = 10,0260x0,0337, R² = 0,8980, y = 0,0003x3 - 0,0157x2 + 0,2340x + 9,7939, R² = 0,9324 и описывается полиномом третьей степени.



Рис. 11. Зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту 25 корпуса романов «День опричника» и «Голубое сало»



Рис. 12. Зависимости натуральных логарифмов частоты кумулятивных словоформ и словоупотреблений от их последовательности, начиная с наибольшей величины по частоту > 25 корпуса романов «День опричника» и «Голубое сало».
Полученные результаты подтверждают ранее проведенные исследования [13-20].



Выводы

1. Основными графемами классического русского литературного языка являются четыре гласных, что подтверждает работы П. Гржибека и Е. Келиха [9]. Следует отметить, что их последовательность может быть другой – А, О, Е, И.
2. В современных русских текстах «День опричника», «Голубое сало» и их корпусе графемы А, О, Е, И составляют 50,15; 50,31 и 50,36 %, что указывает на принадлежность текстов одному автору.
3. Подробно представлены результаты квантитативного исследования по свойствам русских кумулятивных графем в указанных текстах и их корпуса, относительные скорости и относительные экспоненциальные скорости, долей графем, кумулятивных словоформ и словоупотреблений и их моделирование по линейным, экспоненциальным, степенным, логарифмическим уравнениям и полиномам второй и третьей степени.

Литература
1. Сорокин В.Г. День опричника // http://modernlib.ru/
2. Сорокин В..Г. Голубое сало // http://modernlib.ru/
3. Anthony L. AntConc: Design and Development of Freeware Corpus Analysis Toolkit for the Technical Writing Classroom. //
IEEE International Professional Conference Proceedings, 2005. pp .729-737.
4. Пушкин А.С. Стихи 1831-1834. // www.rvb.ru/pushkin/toc.h
5. Гоголь Н.В. Тарас Бульба 1835 // az.lib.ru/g/gogolx_n_w/text_0040.shtm
6. Пушкин А.С. Медный всадник 1817-1820.// www.rvb.ru/pushkin/toc.h
7. Пушкин А.С. Сказка о мёртвой царевне и о семи богатырях».//www.rvb.ru/pushkin/toc.h
8. Глинка Н.Л. Общая химия 2003. //www.alleng.ru/d/chem/chem28.htm
9. Grzybek P., Kelich E. Graphemhäufigkeiten (am Beispiel des Russischen) Teil I. Methodologische Vor-Bemerkungen und Anmerkungen zur Geschichte der Erforschung von Graphemhäufigkeiten im Russischen. //Anzeiger fűr Slavistische Philologie (XXXI) 2003, 131-162.
10. Орлов Ю.К. Невидимая гармония. //http://www/opentext.nn.ru/music/interpretation/?id=2503
11. Тулдава Ю.А. Проблемы и методы квантитативно-системного исследования лексики. Тарту, ТГУ, 1987. – с. 75.
12. Климов Ю.Н. О свойствах кумулятивных русских графем в текстах и их моделирование. ВНЕ РАЗДЕЛОВ оригинал: 07-07-2015 11:09
13. Klimov Yu.N. About properties of cumulative Russian graphemes in texts and their modeling// www.IntellectualArchive.com.: Jul. 09, 2015, 04:45:44 № 1550
14. Климов Ю.Н. Наукометрический анализ алфавита в русских стихах начала ХХ-го века // http: obshelit.net.19-07-2011;17:42. (без соавторов, доля соискателя 0,9 п.л.)
15. Климов Ю.Н. Квалиметрический анализ алфавита в русской поэзии и в произведениях древнерусской литературы. // http: obshelit.net. 2011; 10/10, 14:45. (без соавторов, доля соискателя 0,9 п.л.)
16. Климов Ю.Н. Квантитативное исследование графем в русских поэтических и прозаических текстах... ВНЕ РАЗДЕЛОВ оригинал: Климов Юрий Николаевич 09-12-2014 11:43
17. Климов Ю.Н. Графемы в русских поэтических текстах и их моделирование на основе простых алгебраических уравнений // Материалы IV Межвузовской научно-практической конференции «Актуальные проблемы современной лингвистики» 20-21 апреля 2015 года. СПБ: СПбГЭТУ "ЛЭТИ", 2015. С.138-140.
18. Климов Ю.Н. Сравнительная квантитативная лексикология поэмы H.W. Longfellow's "The Song of Hiawatha" и ее перевода на русский язык И.А. Буниным // Материалы IV Межвузовской научно-практической конференции «Актуальные проблемы современной лингвистики» 20-21 апреля 2015 года. СПБ: СПбГЭТУ "ЛЭТИ", 2015. С.140-142.
19. Климов Ю.Н. Сравнительная квантитативная лексикология поэм А.С. Пушкина «Медный всадник» и «Сказка о мертвой царевне и о семи богатырях»... ВНЕ РАЗДЕЛОВ оригинал. 2015/05/07 10:21
20. Klimov Yu.N. Comparative quantitative lexicology A.S. Pushkin`s poems "The Copper horseman" and "The Fairy tale on dead tsarevna and on seven bogatyrs"//www.IntellectualArchive.com.: May 07, 2015, 02:45:33.

ДЕСКРИПТОРЫ: графемы, русский язык, русская проза, русская поэзия, моделирование графем, кумулятивное число графем, линейное уравнение, экспоненциальное уравнение, степенное уравнение, полином второй степени, полином третьей степени, А.С. Пушкин, Т.Г. Шевченко, Н.Л. Глинка, В.Г. Сорокин, «День опричника», «Голубое сало», корпус романов, длина слова, частота слова, словоформы, словоупотребление, hapax legomena, корпус романов, длина слова, частота слова, словоформы, словоупотребление, hapax dislegomena, Голубое сало, корпус романов, длина слова, частота слова, словоформы, словоупотребление, hapax trislegomena, распределение Бредфорда, распределение Ципфа, относительная экспоненциальная скорость, объем словаря, объем текста, богатство словаря, Попеску-Альтманн





Читатели (740) Добавить отзыв
 

Литературоведение, литературная критика