ВАРИАЦИОННАЯ СТАТИСТИКА

ВАРИАЦИОННАЯ СТАТИСТИКА, термин, объединяющий группу приемов статистического анализа, применяющихся преимущественно в естественных науках. Во второй половине XIX в. Кетле (Quetelet, «Anthro-pometrie ou mesure des differentes facultes de 1 ‘hornme», 1871), а затем Гальтон (Galton, «Natural inheritance», 1889) воспользовались статистическими приемами исследования для решения естественно-научных проблем; к концу XIX в. применение статистического метода в естествознании получило уже широкое распространение. Это вызвало необходимость уточнения старых и создания новых приемов статистического анализа в связи с особенностями исследовательского материала в естествознании. Появился термин «математическая статистика» для обозначения той ветви статистики, в к-рой широко используются методы и приемы математич. анализа, преимущественно теории вероятностей. Рядом с этим, на пороге XX века получил распространение и термин В. статистика, подчеркивая своим названием преобладание вопросов изменчивости в тех областях, где применяются статистические приемы, объединяемые этим термином. Слово «вариационная» обычно производят от—вариация, вариант и вариирование (т. е. изменение, изменяющийся объект, факт изменяемости). Провести строго разграничение между математической статистикой и В. с. нельзя: и в той и в другой трактуются одни и те же методы исследования и рассматриваются одни и те же приемы. Термин В. с. распространился по преимуществу в Центральной Европе и оттуда, проник к нам. Однако, основателем ее, по справедливости, считается англ. ученый К. Пирсон (Pearson), опубликовавший, начиная с 1894 г. («Contribution to the mathematical theory of evolution»), много работ, касающихся теоретического обоснования методов статистического исследования применительно к вопросам естествознания (см. также Биометрия). За последнее 25-летие В. с. быстро развивается, и методы ее применяются в самых разнообразных областях знания; в медицине применение В. с. получило распространение преимущественно в антропометрии, физио-метрии и психометрии, в учении о конституциях. В наст. время В. с. преподается на мед. факультетах по кафедре соц. гигиены; на биол. отделениях физ.-мат. факультетов введен специальный курс биометрики и В. с, а на математических отделениях существует специальный уклон математической статистики. В. с. применяется во многих научно-исследовательских учреждениях (Ин-т соц. гигиены, антропологические институтыи др.), широко используется в педологии; многие вопросы в специальных мед. работах, имеющие дело с массовым изменчивым материалом, решаются при помощи В. с, так что для медика В. с. становится одним из рабочих инструментов. Объяснения развитию В. с. за последние годы и широкому проникновению ее в различные науки надо искать 1) в необходимости систематизации обильного исследоват. материала, накопленного за последние годы, 2) в уточнении методов (техники) научной работы и 3) в общей тенденции научной мысли заменить качественные формулировки количественными выражениями. Изучение массового явления ведется в форме исследования статистической совокупности, которая и является основным предметом статистики. В В. с. разбираются по преимуществу вопросы изучения статистической совокупности в части количественно вариирующих признаков, и даются некоторые общие указания об оценке результатов исследования. Признаки, подвергающиеся статистическому анализу, могут быть качественными (пол, цвет, болезнь и пр.) или количественными (вес, размеры, % гемоглобина и пр.), при чем изучение статистической совокупности может вестись либо по каждому признаку в отдельности, либо одновременно по двум, трем и более признакам; в последнем случае возникает вопрос о взаимосоответствии, взаимообусловленности признаков, ставится вопрос о корреляции (см.). Исследование совокупности по одному признаку, в случае качественного характера его, часто ограничивается простым указанием доли той или иной категории признака в обследованной совокупности (% мужчин, % лимфоцитов в крови); в случае количественного признака даются сводные характеристики всей совокупности, т. е. определяются некоторые числа, • суммарно характеризующие эту совокупность по изучаемому признаку (% объектов с определенной категорией качествен, признака также может считаться сводной характеристикой совокупности). Подлежащая изучению статистическая совокупность может быть задана в двух видах: 1. Непосредственно указываются значения признака у всех объектов совокупности: где различные х—вариирующие значе
ния признака, а N—общее число объектов в совокупности, называемое объемом совокупности. Объем—основная характеристика исследуемой совокупности. Пример: х= % лимфоцитов у московских школьниц в возрасте от 9 лет до 9 лет 11 мес. (по материалам Кабинета школьной педологии Академии коммунистического воспитания, работа д-ра Четунова); а: : 23 25 26 27 27 28 28 30 30 30 31 32 32 ) 33 35 37 38 40; > (1а). объем N= 18. I Так, заданной может быть совокупность небольшого объема (N—не больше 40—50). 2. Совокупность большего объема задается в виде двойного ряда: а) значений признака и б) соответствующих каждому значению чисел наблюдений, называемых частотами Xi, х,, х:,-»,хъ I П,, П,, П„’-,ПЦ Г (II), где зс{—значения признака, а щ—соответствующие частоты. Очевидно, что n,+n2+n,+-hnt=N; короче это может быть записано так: 2тц-Л (1).* Значения признака во втором случае обычно даются в виде интервалов, иначе называемых классовыми промежутками. Пример: ж=вес новорожденных, по исключении недоношенных и мацерированных, в кг. х: 1,5 — 2 — 2,5 — 3—3,5 — 4 — 4,5 — 5 — 5,5 п: 5 53 254 558 487 127 19 2 JV-Snj= 1.505 (Иа). Ряды, подобные рядам (I) и (II), называются вариационными рядами. Вопрос о величине интервала для вариационного ряда (II) решается в зависимости от особенностей исследуемого материала. Можно только рекомендовать первичные наблюдения (измерения) вести по возможно мелким интервалам, затем, при табуляции (изображении полученных наблюдений в виде таблицы, в виде вариационного ряда), их редуцировать (из мелких интервалов образовывать более крупные). Удачное редуцирование облегчает изучение совокупности, при чем следует иметь в виду, что слишком мелкие интервалы затрудняют исследование статистической совокупности (вычисления и установление закономерности изменения частот при изменении значений признака), а слишком крупные огрубляют исследовательский материал. Для большей наглядности и более детального изучения вариационные ряды, подобные ряду (II), изображаются графически а) либо в виде ряда прямоугольников с высотами, пропорциональными частотам (гистограмма по Пирсону, см. рисунок 1), б) либо в виде многоугольника (полигон распределения частот),

1500-2000 2500-3000-3500 4000—4500—5000—5500

Рисунок 1. Гистограмма. получаемого после соединения прямыми верхних концов перпендикуляров, пропорциональных частотам и восстановленных из середин соответствующих интервалов (см. рисунок 2**). В тех случаях, когда ломаная * 2—знак суммирования. ** Оба рисунка выполнены применительно к данным вариационного ряда (На). линия вариационного многоугольника заменяется плавной кривой, последняя носит название вариационной кривой или кривой распределения. Первым шагом в изучении статистической совокупности является установление сводной характеристики типичной, вообще средней, величины признака в совокупности. Средняя величина конструируется различно, в зависимости от тех свойств, какие ей приписывать.

1500 — 2000 — 2500 — 3000 — 3500 — 4000 — 4500 — 5000 —5500 Рисунок 2. Политой.

1. Если считать типичным, характерным то, что чаще всего встречается, то в качестве средней надо принять «моду» (der dichteste Wert, обозначение: Mo)—величину признака, имеющую наибольшую частоту [таким грубо приближен, значением моды для примера (Па) будет середина интервала от 3.000 до 3.500, т. е. Жо=3.250 г]. При этой элементарной конструкции средней не учитываются значения признака у объектов, не принадлежащих к модальной группе. Для вариационного ряда с небольшим N [пример (1а)] моду установить трудно; иногда удается выявить моду путем повторного редуцирования, меняя границы интервалов. Точное вычисление моды связано с определением уравнения теоретической кривой распределения, соответствующей данному вариационному ряду. Геометрическое определение: мода—абсцисса наибольшей ординаты вариационной кривой. Вычисление моды может быть несколько уточнено, если принять во внимание частоты двух интервалов, смежных с модальным. Чубер (Е. Czuber) предлагает такую приближенную формулу для моды: п.- п. Но’ = Ж|_ j + Д – 2nf где acj_j обозначает нижнюю (в сторону меньших аначений) границу модального интервала, Д —величину интервала; «(_, , п{ и nf, —соответственно частоты интервалов: соседнего перед модальным, модального и соседнего после него. Для примера (На) Мо’ = 3.000 + 500-7-г-;,4!^71Т¥т4-7тт^ =3.414 г. 1.116—(254 + 487) 2. Если считать характерным и типичным для данной совокупности то, что дальше всего отстоит от крайних (нетипичных) значений, то в качестве характеристики «средней» надо принять значение признака у серединного, центрального объекта в ранжированной (объекты расположены в порядке возрастания или убывания значений признака) совокупности, называемой «медиана» (der Zentralwert, обозначение: Же). Me рассекает совокупность на две равные половины: •14 нижнюю, со значениями меньшими Же, и верхнюю, со значениями большими Me. В качестве сводной характеристики Me чаще всего применяется при обработке результатов тестирования. Определение Me для совокупности с небольшими N сводится к непосредственному указанию значения ДЧ-1 , признака у —j— – го объекта в ранжированной совокупности при N нечетном, при четном N берется среднее между значения – N (N \ ми признака у – о—го объекта и I— + 11-го (в примере (1а) Же=30]. В случаях совокупностей с большим N для элементарного вычисления Me из ряда частот составляют ряд начетных сумм (к частоте первого интервала прибавляется частота второго, к полученной сумме—частота третьего и т. д.; обозначив начетные суммы через S, имеем: S1=n1; Sa=Sl+n1; S3 = S2+ni=nt+ni+n^, и «т. д.) и, сравнивая начетные суммы с – у. определяем, в каком из интервалов находится Me; к его нижней границе прибавляется часть интервала, равная отношению разности между N и начетной суммой предыдущего интервала к частоте медиа-нального интервала: ■■ *i-i+4 N—s где xi_,—-нижняя граница интервала, в котором лежит медиана, Д—величина интервала, S —начетная сумма предыдущего интервала, %—частота медианаль-ного интервала. Для примера (Па) х: 1,5—2—2,5 — 3 — 3,5 — 4—4,5 — 5 — 5,5 кг п: 5 53 254 558 487 127 19 2 S: 5 58 312 870 1357 1484 1503 1505 ~- 752.5; Д = 500; 2 ‘ Ме = 3.000 + 500-^Ь^3—== 3.396г. При таком вычислении Me допускается, что внутри медиана1ьного интервала значения признака распределены равномерно. Более точные вычисления Же, как и Мо, связаны с определением теоретической вариационной кривой. Геометрическое определение: Же—абсцисса той ординаты вариационной кривой, к-рая делит площадь кривой пополам. Me, учитывая значения признака у объектов в порядке их последовательности, не учитывает величин значений признака: можно как угодно вариировать значения признака в нижней половине, лишь бы они не превосходили Me, и как угодно—в верхней, лишь бы все были больше Же; к таким вариациям Же будет нечувствительна, останется неизменной. 3. Наиболее простой и общепризнанной сводной характеристикой «средней» величины, учитывающей и самые значения признака, является средне-арифметическое М (das arithmetische Mittel), определяемое формулой: Xt+Xt+X,+ -+XN м- О), М~ (2). что короче записывается: Если каждому значению признака соответствует определенная частота (п), то «Znx дг= (3), т. е. сумме произведений каждого х на соответствующее п, деленной на N. Ж указывает ту величину признака, какая была бы у всех объектов, если значения признака распределить поровну между всеми объектами (средняя заработная плата, средний ро

Изучайте:

  • ДЕТСКИЙ САД
    ДЕТСКИЙ САД, общественное воспитательное учреждение для приходящих маленьких детей в возрасте (в СССР) от 3 до 7 лет. С...
  • БРОУН-СЕНАРА СИНДРОМ
    БРОУН-СЕНАРА СИНДРОМ, описанный им в 1849 г., наблюдается при одностороннем поражении спинного мозга и характеризуется ...
  • ПАРАМЕТРИЙ
    ПАРАМЕТРИЙ (parametrium). Термин «па-раметрий» понимается различно: одни авторы называют параметрием клетча...
  • МОРГАНЬЕВЫ ГИДАТИДЫ
    МОРГАНЬЕВЫ ГИДАТИДЫ, hydatides Morgagni (от греч. hydatis - пузырек с водянистым содержимьш;. небольшие пузырьковидные ...
  • КЕРАТОПЛАСТИНА
    КЕРАТОПЛАСТИНА, операция восстановления роговицы, разрушенной болезненным процессом. Различают К. тектоническую и К. оп...