An explanation of the statistics used in the Meta-analysis - By Dr Frans Gieles |
По сути, имеем анализ анализов. Группа Ринда не обогатила науку новым исследованием новой выборки вдобавок к уже существующим. Метаанализ - это метод обозрения данных и результатов имеющихся в настоящий момент времени опубликованных исследований. Метод позволяет сравнивать данные и результаты работ, так сказать, "суммировать" их. Используя исследованные другими учёными разрозненные выборки, этот метод словно бы даёт "новую" бо́льшую выборку. В этом огромное преимущество метанализа. Правило статистики: чем объёмней выборка, тем надёжнее результат её исследования. Корреляция и степень связи признаковКорреляция есть ключевое понятие всего исследования. Корреляция - это взаимосвязь между двумя и более факторами. А фактор или агент есть причина, которая может иметь влияние, как, например, интеллект влияет на успеваемость. Фактор должен быть каким-то образом измерен, и результат этого измерения есть переменная величина вроде коэффициента интеллекта IQ. Так, если учёный мерит IQ по группе (выборке), состоящей из детей, эта величина будет варьироваться для разных испытуемых. Результаты измерения, таким образом, выявляют рассеяние (дисперсию) переменной в выборке. Пользуясь известными методами, можно оценить рассеяние в генеральной совокупности (у всех детей данного возраста в отдельно взятом государстве). Дисперсионный анализ (по-английски AnOVa), как и анализ корреляции, выявляет, насколько два и более факторов между собой связаны. Иными словами, корреляция и AnOVa показывают, насколько вариации одной переменной связаны с вариациями другой. Количественной мерой корреляции является коэффициент корреляции r, принимающий значения между +1,00 (например, чем сильнее дождь, тем больше воды в лужах) и −1,00 (например, чем сильнее дождь, тем меньше детей на улице). Значимость этой меры зависит от объёма выборки - количества испытуемых или респондентов. Чем больше наблюдений проделано для вычисления r, тем правдоподобнее результат. Поэтому обычно после r приводится объём выборки n или N. Замечу, что степень r связи между двумя переменными не тождественна статистической значимости, выявляющей, действительно ли одна переменная имеет хоть какое-то отношение к другой. В метаанализе величина r показывает степень связи признаков, выраженных переменными. В метаанализе многие коэффициенты корреляции приводятся в подправленном виде, причём в преобразованиях учтён объём выборки. Так получается несмещённое r̃. Эта величина отражает наилучшую оценку корреляции в пределах генеральной совокупности. Полезное свойство r - возможность возведения в квадрат. Так получается коэффициент детерминации. Когда рассеяние одной переменной X на 50% совпадает с рассеянием другой переменной Y, коэффициент детерминации составляет 0,50, что соответствует r≈+0,70. Заметим, что, например, 0,90×0,90=0,81, а 0,40×0,40=0,16: квадрат r̃² меньше r̃. При интерпретации результатов обзора, вычислении степени связи признаков группа Ринда принимала r=+0,50 как показатель сильной связи, r=+0,30 - средней и r=+0,10 - слабой. Для коэффициента детерминации соответственно 25%, 9% и 1%. Главный фактор в метаанализе - это опыт растления в детстве (РВД). Его сопоставляют с другими факторами вроде состояние психики и прочих психологических факторов. Если вдруг обнаруживается высокий процент совпадения рассеяний РВД и, допустим, состояния психики, можно подозревать, что РВД и состояние психики связаны (сильно, средне, слабо). Если степень согласия на растление или пол растлённого проявляет влияние на состояние психики, согласие и пол выступают агентами. Подвергнутые обзору публикации предоставили по одной степени связи для каждой исследованной выборки, поэтому количество степеней связи совпадает с количеством выборок k. Доверительный интервалБыло сказано: чем больше выборка, тем правдоподобнее корреляция. Для оценки надёжности вычисленного коэффициента корреляции используют ещё две величины: одна меньше, а другая больше его. Если значение коэффициента действительно лежит между этими двумя величинами, в вычисленном значении корреляции можно быть уверенным на 95,0%. Это то же самое, что на 2,5% быть уверенным, что корреляция ниже меньшей величины, и на 2,5% - в том, что корреляция превышает бо́льшую из величин. Если наименьшая величина отрицательна, а наибольшая положительна, это означает, что у корреляции равные шансы быть как положительной, так и отрицательной. Если величины положительны, мы с доверительной вероятностью 95,0% считаем, что наблюдаем положительную корреляцию, лежащую в указанных пределах. Если один из концов получившегося интервала достигает нуля или переваливает за него, у нас нет оснований считать корреляцию положительной или отрицательной. Как сказано в метаанализе, "если интервал не включает в себя нуль, оценку влияния считаем значимой". Одно- и двусторонние критерииЕсли исследователь верит, что корреляция будет обязательно положительна, как в вышеприведенном примере с дождём и лужами, он проверяет только положительные значения коэффициентов корреляции. Такой критерий называется односторонним. Но если исследователь не уверен, есть ли связь между переменными, или хочет знать величину корреляции, а не только, имеется она или нет, он должен исследовать и положительные, и отрицательные значения коэффициентов - применить двусторонний критерий. Корреляция эквисимптомнаяРечь идёт о корреляции между некоторым симптомом (например, депрессией) и фактором РВД, имеющейся во всех выборках, где этот симптом оценивали. Фактор РВД обычно представлен двумя уровнями: наличие опыта растления в детстве и отсутствие такого опыта. В иных работах используется больше уровней: растление через прикосновение, растление без прикосновения, отсутствие опыта РВД. Выборка не имеющих опыта РВД людей составляет контрольную группу. Когда говорят, что 50% испытуемых РВД-группы проявляли депрессивные симптомы, а 50% испытуемых контрольной группы проявляли депрессивные симптомы, степень связи РВД с состоянием психики будет признана нулевой. А вот если бы 100% лиц РВД-группы имели такие симптомы и 0% лиц контрольной группы не имели, тогда бы степень связи составляла +1,00. Корреляция эквивыборочнаяЭта корреляция отражает общую взаимосвязь между РВД и измеренными по различным выборкам типами оценок состояния психики. Если в публикации приводится оценка четырёх симптомов по одной выборке, эти эквисимптомные степени связи в метаанализе усреднены в одну-единственную эквивыборочную степень связи. ОднородностьМетаанализ обобщает данные из различных научных публикаций по одной отрасли знания. Однородность же представляет собою меру разницы и совпадения между различными исследованиями. Если несколько учёных независимо друг от друга приходят приблизительно к одним и тем же результатам, имеется возможность объединить их с достаточно большим уровнем доверия. Нужна повышенная осторожность, если вдруг будем иметь дело с сильными разногласиями касательно результатов. Величина однородности опубликованных результатов вычисляется по так называемым таблицам χ²-распределения. В этой таблице чем больше результатов, тем выше величина χ². Статистически выражаясь, число степеней свободы ν=k−1 увеличивается с числом результатов k. Чтобы выяснить значимость конкретной величины χ² англоязычные статистики пользуются таблицами, в коих значимые величины χ² помечены звёздочкой, которую надо читать так: "α<0,05 для такой-то величины χ²". Это означает, что не более чем на 5% мы уверены, будто у настолько однородных результатов есть шанс очень сильно друг от друга отличаться. Для достижения однородности авторы, если возможно, убирали из рассмотрения наиболее экстремальные степени связи, независимо от того, были это максимумы или минимумы. Без этого научные публикации не могли быть сопоставлены. ВыбросыДопустим, перед нами пять публикаций, приводящих степени связи r=+0,14, r=+0,17, r=+0,23, r=+0,25 и r=+0,27. Без учёта объёма средней будет считаться степень связи +0,21. Теперь если прибавим к нашим пяти ещё одну публикацию, в которой приводится r=+0,70, то тогда средняя связь станет уже +0,29. Вышло, что одна-единственная шестая степень связи признаков заметно изменила наши представления о том, какое влияние считать средним. Поэтому лучше её в метаанализ не включать: уж больно она смахивает на отклонение от истины. О подобных намеренных отклонениях говорят как о "выбросах". По сути, лишь три работы оказались выбросами: две предлагали слишком высокую положительную степень связи РВД с состоянием психики (по исследованиям множества случаев инцеста в выборках), а одна - слишком высокую отрицательную. "Положительность" означает: "Чем больше степень РВД, тем больше психологических проблем". Взвешенные средниеЕсли перед нами ряд степеней связи признаков, можно по ним узнать среднее влияние. Лучше всего воспользоваться при расчётах объёмом выборки - бо́льшая выборка оказывает больше влияния на среднее значение, нежели выборка меньшая. Полученная степень связи будет называться взвешенной средней величиной. Преобразования ФишераКоэффициент корреляции r или r̃ не является интервальной переменной: разница между r=+0,1 и r=+0,2 - это не то же самое, что разница между r=+0,8 и r=+0,9. А вот преобразование Фишера даёт коэффициент корреляции z, который намного лучше позволяет оценить место каждой степени связи среди набора значений этих степеней. Становится так возможным вычисление взвешенных средних, а уже это среднее значение можно преобразовать назад в коэффициент Пирсона. Между прочим, r̃² или процент рассеяния является интервальной мерой. Стандартное отклонение σСтандартным отклонением именуют меру, чаще всего принимающую значения между −2 и 2, что отражает "положение" значения величины среди всех возможных её значений. Если у величины σ=0,0, то имеем среднее значение. Около половины всех значений лежит между σ=−0,1 и σ=0,1. Значения σ=±0,9 нечасты. Множественная регрессия и (полу)частная корреляцияРечь идёт о методе сравнения нескольких ("множества") факторов и получения степени влияния каждого из них на другой фактор. Такой подход значительно лучше вычисления "простых" корреляций между одними только двумя переменными попарно. Например, учебный процесс в школах. Можем предполагать несколько влияний на него: уровень интеллекта школьников, методика преподавания, размеры классных комнат, личностные особенности педагога. Располагая достаточным количеством данных, можно получить другие данные, характеризующие всех учеников того же самого педагога, с одним и тем же уровнем интеллекта и занимавшихся в классных комнатах определённого размера, однако обучавшимся по различным методикам. Затем вы словно бы подвергаете "регрессу" все факторы, кроме одного. Так открывается возможность исследовать, насколько эффективна методика преподавания через корреляцию того одного фактора при подвергнутых "регрессу" остальных. Такая корреляция называется частной. Если "регрессу" подвергаем меньше факторов, говорим, что имеем дело с получастной корреляцией. Выполняя эти манипуляции с переменными, осуществляем так множественный регрессионный анализ степени связи всех факторов между собой. Ни в коем случае нельзя забывать, что в данном метаанализе оба фактора: семейная среда и наличие РВД вместе влияют на состояние психики, однако семейная среда оказывает в 10 раз более сильное влияние, нежели растление само по себе. |