«И вот есть последние, которые будут первыми, и есть первые, которые будут последними» Евангелие от Луки (Гл. 13. Ст. 30)
Выдвигается гипотеза о применимости в законе Бенфорда последней цифры как первой в данных и описания простыми алгебраическими уравнениями и распределения Бредфорда.
Применена методика определения значения F(n) или вероятности встретить цифру последнюю первой, по работе [1]: • Частотный перечень данных; • Отбор первых цифр по первому столбцу; • Сортировка цифр, начиная с первой цифры до девятой; • Заполнение колонки динамика чисел;; • Определение значения F(n), или вероятность встретить цифру первой по формуле; /. Нами добавлены следующие позиции [2]: • Кумулятивные числа; • Определение значения F(n), или вероятность встретить последнюю цифру первой по формуле первой;. • Моделирование значения F(n), или вероятность встретить последнюю цифру первой простыми алгебраическими уравнениями и распределения Бредфорда. Приведем наши численные данные в области информатики (Information Science) [2]: • Потоки научно-технической информации; • Динамика публикаций в Chemical Abstracts (1907-2003) • Динамика патентов в Chemical Abstracts (1907-2003) ; • Динамика книг в Chemical Abstracts (1907-2003) ; • Динамика рефератов в Chemical Abstracts (1907-2003) ; • Динамика рефератов в РЖ ВИНИТИ РАН ,«Химия» ; • Динамика английских cлогов по Zipf, 1949 [3] ; • Динамика латинских слогов у Плавта по Zipf., 1949. [3]:.
Выдвигается гипотеза о независимости выбора первой цифры для определения значений F(n) или вероятностей встретить первую цифру первой
Значения F(n) или вероятность встретить цифру последнюю первой, вычисленные по этой формуле, приведены в табл. 1-8. При значении цифры 1 равной нулю уравнение не имеет смысла, т.е. сумма значения F(n) или вероятность встретить цифру последнюю первой будет 69,897%. Динамике чисел составила от 9 (Информатика. Потоки НТИ ) до 97 (статьи в Chemical Abstracts). Значения F(n) или вероятность встретить последнюю цифру первой во всех примерах; • Потоки научно-технической информации; • Динамика публикаций в Chemical Abstracts (1907-2003) • Динамика патентов в Chemical Abstracts (1907-2003) ; • Динамика книг в Chemical Abstracts (1907-2003) ; • Динамика рефератов в Chemical Abstracts (1907-2003) ; • Динамика рефератов в РЖ ВИНИТИ РАН ,«Химия» ; • Динамика английских cлогов по Ципфу [6]: ; • Динамика латинских слогов у Плавта по Ципфу, 194 составляют 30,103% , т.е. последние цифры равны первым. Таблица 1. Информатика, Потоки
Информатика, потоки Последняя цифра Динамика чисел Значение F(n) или вероятность встретить последнюю цифру первой Кумулятивные числа Значение F(n) или вероятность встретить цифру последнюю первой 1 2 30,103% 2 30,103% 2 1 17,609% 3 47,712% 3 0 12,494% 3 60,206% 4 0 9,691% 3 69,897% 5 1 7,918% 4 77,815% 6 1 6,695% 5 84,510% 7 1 5,799% 6 90,309% 8 1 5,115% 7 95,424% 9 2 4,576% 9 100,000% 9 100,000% Таблица 2. Динамика статей в CAS (1907-2003) Динамика статей в CAS (1907 2003) Последняя цифра Динамика чисел Значение F(n) или вероятность встретить последнюю цифру первой Кумулятивные числа Значение F(n) или вероятность встретить цифру первой 1 11 30,103% 11 30,103% 2 10 17,609% 21 47,712% 3 13 12,494% 34 60,206% 4 9 9,691% 43 69,897% 5 10 7,918% 53 77,815% 6 6 6,695% 59 84,510% 7 12 5,799% 71 90,309% 8 5 5,115% 76 95,424% 9 11 4,576% 87 100,000% 87 100,000%
Таблица 3. Динамика патентов в CAS (1907- 2003)
Динамика патентов в CAS (1907 2003) Последняя ифра Динамика чисел Значение F(n) или вероятность встретить последнюю цифру первой Кумулятивные числа Значение F(n) или вероятность встретить цифру первой 1 8 30,103% 8 30,103% 2 8 17,609% 16 47,712% 3 10 12,494% 26 60,206% 4 13 9,691% 39 69,897% 5 13 7,918% 52 77,815% 6 13 6,695% 65 84,510% 7 7 7,000% 72 91,510% 8 6 5,115% 78 96,625% 9 8 4,576% 86 100,000% 86 100,000% Таблица 4. Динамика книг в CAS (190-2003)
Динамика книг в CAS (1907- 2003) Последняя цифра Динамика чисел Значение F(n) или вероятность встретить последнюю цифру первой Кумулятивные числа Значение F(n) или вероятность встретить цифру первой 1 8 30,103% 8 30,103% 2 8 17,609% 16 47,712% 3 7 12,494% 23 60,206% 4 13 9,691% 36 69,897% 5 10 7,918% 46 77,815% 6 15 6,695% 61 84,510% 7 10 5,799% 71 90,309% 8 8 5,115% 79 95,424% 9 9 4,576% 88 100,000% 88 100,000% Таблица 5. Динамика рефератов в CAS (190-2003)
Динамика рефератов в CAS (1907 2003) Последняя цифра Динамика чисел Значение F(n) или вероятность встретить последнюю цифру первой Кумулятивные числа Значение F(n) или вероятность встретить цифру первой 1 12 30,103% 12 30,10% 2 5 17,609% 17 47,712% 3 10 12,494% 27 60,206% 4 7 9,691% 34 69,897% 5 17 7,918% 51 77,815% 6 8 6,695% 59 84,510% 7 9 5,799% 68 90,309% 8 12 5,115% 80 95,424% 9 10 4,576% 90 100,000% 90 100,000% Таблица 6 Динамика рефератов в рефератов в РЖ«Химия»
Динамика рефератов вРЖ«Химия» Последняя цифра Динамика чисел Значение F(n) или вероятность встретить последнюю цифру первой Кумулятивные числа Значение F(n) или вероятность встретить цифру первой 1 4 30,103% 4 30,10% 2 4 17,609% 8 47,71% 3 2 12,494% 10 60,21% 4 5 9,691% 15 69,90% 5 6 7,918% 21 77,82% 6 12 6,695% 33 84,51% 7 1 5,799% 34 90,31% 8 4 5,115% 38 95,42% 9 3 4,576% 41 100,00% 41 100,00% Таблица 7. Динамика английских слогов, Zipf. 1949
Динамика английских слогов Zipf.. 1949 Последняя цифра Динамика чисел Значение F(n) или вероятность встретить последнюю цифру первой Кумулятивные числа Значение F(n) или вероятность встретить цифру первой 1 2 30,103% 2 30,10% 2 0 17,609% 2 47,712% 3 1 12,494% 3 60,206% 4 1 9,691% 4 69,897% 5 3 7,918% 7 77,815% 6 2 6,695% 9 84,510% 7 0 5,799% 9 90,309% 8 2 5,115% 11 95,424% 9 1 4,576% 12 100,000% 12 100,000%
Таблица 8. Динамика латинских слов у Плавта, Zipf.. 1949
Динамика латинских слов у Плавта, Zipf.. 1949 Последняя цифра Динамика чисел Значение F(n) или вероятность встретить последнюю цифру первой Кумулятивные числа Значение F(n) или вероятность встретить цифру первой 1 8 30,103% 8 30,10% 2 2 17,609% 10 47,712% 3 3 12,494% 13 60,206% 4 2 9,691% 15 69,897% 5 2 7,918% 17 77,815% 6 2 6,695% 19 84,510% 7 1 5,799% 20 90,309% 8 1 5,115% 21 95,424% 9 3 4,576% 24 100,000% 24 100,000%
Моделирование значения F(n) или вероятность встретить последнюю цифру первой простыми алгебраическими уравнениями,
Проведенное моделирование значения F(n) или вероятность встретить последнюю цифру первой в потоках НТИ и в статьях САS простыми алгебраическими уравнениями показало для динамики и кумудятивного их числа следующие одинаковые:; для динамикиy Д потоки НТИ= -0,026x + 0,2411, R² = 0,7462; y = 0,2745e-0,219x, R² = 0,932 ; y = 0,0059x2 - 0,0852x + 0,3496, R² = 0,9446 ; y = -0,112ln(x) + 0,2698, R² = 0,9475; y = -0,0013x3 + 0,0256x2 - 0,1681x + 0,4362, R² = 0,9898; y = 0,3135x-0,864, R² = 0,9985 описывается с достаточной точностью экспоненциальным уравнением, полиномом второй степени, логарифмическим уравнением, полиномом третьей степени и степенным уравнением. а значения F(n) или вероятность встретить последнюю цифру первой по кумуляте : y К потоки НТИ= 0,3564e0,1314x, R² = 0,8533; y = 0,0829x + 0,3142, R² = 0,9507; y = 0,3192x0,5391, R² = 0,9913; y = 0,3228ln(x) + 0,2698, R² = 0,9934; y = -0,008x2 + 0,1631x + 0,1673, R² = 0,9962; y = 0,001x3 - 0,0234x2 + 0,2278x + 0,0997, R² = 0,9997 описывается с достаточной точностью линейным , степенным и логарифмическим уравнениями, полиномами второй и третьей степени.
Рис.1. Значение F(n) или вероятность встретить последнюю цифру первой в потоках НТИ
Рис.2. Значение F(n) или вероятность встретить последнюю цифру первой статей в CAS
Моделирование значения F(n) или вероятность встретить последнюю цифру распределением Бредфорда
Распределение по трем неравномерным зонам значений F(n) или вероятностей встретить первую цифру первой в потоках по информатике для динамики: I-я зона составляет от 30,103% до 17,609%; II-я зона - от 12,494% до 5,799%, III-я зона - от 5,799% до 4,576%, а для кумуляты; I-я зона составляет от 30,103% до 47,712%; II-я зона - от 47,712% до 90,309% III-я зона - от 90,309% до 100,000%.
Рис.3. Моделирование значения F(n) или вероятность встретить первую цифру в потоке НТИ
Распределение по трем неравномерным зонам значений F(n) или вероятностей встретить последнюю цифру первой статей в потоке НТИ; для динамики I-я зона составляет от 30,103% до 17,609%,; II-я зона - от 12,494% до 5,799%, III-я зона- от 5,799% до 4,576%, а для кумуляты; I-я зона составляет от 30,103% до 47,712%; II-я зона - от 47,712% до 90,309% III-я зона - от 90,309% до 100,000%.
Рис4. Моделирование значения F(n) или вероятность встретить последнюю цифру в потоке НТИ
Распределение по трем неравномерным зонам значений F(n) или вероятностей встретить первую цифру первов в статьях САS для динамики: I-я зона составляет от 30,103% до 17,609%; II-я зона - от 12,494% до 5,799%, III-я зона - от 5,799% до 4,576%, а для кумуляты; I-я зона составляет от 30,103% до 47,712%; II-я зона - от 47,712% до 90,309% III-я зона - от 90,309% до 100,000%.
Рис. 5. Моделирование значения F(n) или вероятность встретить первую цифру в статьях САS
Рим.6. Моделирование значения F(n) или вероятность встретить последнюю цифру в статьях САS
Распределение по трем неравномерным зонам значений F(n) или вероятностей встретить последнюю цифру первой в статьях САS для динамики: I-я зона составляет от 30,103% до 17,609%; II-я зона - от 12,494% до 5,799%, III-я зона - от 5,799% до 4,576%, а для кумуляты; I-я зона составляет от 30,103% до 47,712%; II-я зона - от 47,712% до 90,309% III-я зона - от 90,309% до 100,000%.
Распределение по трем неравномерным зонам значений F(n) или вероятностей встретить первую цифру первой в потоках по информатике, в статьях САS, встретить последнюю цифру первой в потоках по информатике, в статьях САS в динамике имеют одинаковое процентное распределение, соответственно, для динамики и для кумуляты, что подтверждает значения F(n) или вероятность встретить первую цифру и последнюю цифру первой, т.е. независимость выбора первой цифры. [2, 4-7]. Впервые также показано по простым алгебраическим уравнениям различие динамики и кумуляты для относительной и относительной экспоненциальной скоростей изменения F(n) или вероятности встретить цифру первой.или последнюю первой.
ВЫВОДЫ
1. Подтверждена гипотеза о применимости в законе Бенфорда последней цифры как первой в данных и описания простыми алгебраическими уравнениями и распределения Бредфорда. 2. При значении цифры 1 равной нулю уравнение не имеет смысла, т.е. сумма значения F(n). 3. Распределение по трем неравномерным зонам значений F(n) или вероятностей встретить первую цифру первой в потоках по информатике, в статьях САS, встретить последнюю цифру первой в потоках по информатике, в статьях САS в динамике имеют одинаковое процентное распределение, соответственно, для динамики и для кумуляты, что подтверждает значения F(n) или вероятность встретить первую цифру и последнюю цифру первой, т.е. независимость выбора первой цифры. 4. Впервые также показано по простым алгебраическим уравнениям различие динамики и кумуляты для относительной и относительной экспоненциальной скоростей изменения F(n) или вероятности встретить цифру первой.или последнюю цифру первой.
Литература
1. Baguzin. Закон Бенфорда или закон первой цифры http://baguzin.ru/wp/zakon-benforda-ili-zakon-pervoj-tsifry/ 2. リテラ - カート | ロシア書籍専門店 ナウカ・ジャパン naukajapan.jp/detail.php?id=153315&PHPID.. Квантитативная лексикология, корпусная лингвистика и количественная информатика: монография. Климов Ю.Н. Москва, ОчУ ВО "ММА" 340 c. hard. 2016. 年 ISBN 9785904360542 R153315 3. Zipf G. K. Human behavior and the principle of least effort. «Addison-Wesley Publishing» Cambridge, 194 4. 377.クリモフ計量語彙論(書記素からテキストまで)-カートロシア書籍専門.. .naukajapan.jp/detail.php?id=149035&PHPID...Квантитативная лексикология [от графемы до текста]. Монография. Климов Ю.Н. Москва, МИЛ 306 c. Hard 2015 年 ISBN 9785904360504 R149035 5. Klimov Yu.N., Klimov О.N. BENFORD`S LAW IN information science» // www.IntellectualArchive.com.: 2018-10-12 10:23:44 1982 11-02-2018 13:07 Klimov Yu.N., 9785904360504 R149035 6. Klimov Yu.N., Klimov О.N BENFORD`S LAW IN LEXICOLOGY» // www.IntellectualArchive.com.: 2018-10-12 05:15:10 1981 7. Klimov Yu.N., Klimov О.N. BENFORD`S LAW IN // IntellectualArchive.V7. №5. Septrnber –October 2018.
ДЕСКРИПТОРЫ: закон Бенфорда, информатика, математическое моделирование
|