An explanation of the statistics used in the Meta-analysis - By Dr Frans Gieles |
МетаанализПо Ñути, имеем анализ анализов. Группа Ринда не обогатила науку новым иÑÑледованием новой выборки вдобавок к уже ÑущеÑтвующим. Метаанализ - Ñто метод Ð¾Ð±Ð¾Ð·Ñ€ÐµÐ½Ð¸Ñ Ð´Ð°Ð½Ð½Ñ‹Ñ… и результатов имеющихÑÑ Ð² наÑтоÑщий момент времени опубликованных иÑÑледований. Метод позволÑет Ñравнивать данные и результаты работ, так Ñказать, "Ñуммировать" их. ИÑÐ¿Ð¾Ð»ÑŒÐ·ÑƒÑ Ð¸ÑÑледованные другими учёными разрозненные выборки, Ñтот метод Ñловно бы даёт "новую" бо́льшую выборку. Ð’ Ñтом огромное преимущеÑтво метанализа. Правило ÑтатиÑтики: чем объёмней выборка, тем надёжнее результат её иÑÑледованиÑ. КоррелÑÑ†Ð¸Ñ Ð¸ Ñтепень ÑвÑзи признаковКоррелÑÑ†Ð¸Ñ ÐµÑÑ‚ÑŒ ключевое понÑтие вÑего иÑÑледованиÑ. КоррелÑÑ†Ð¸Ñ - Ñто взаимоÑвÑзь между Ð´Ð²ÑƒÐ¼Ñ Ð¸ более факторами. Рфактор или агент еÑÑ‚ÑŒ причина, ÐºÐ¾Ñ‚Ð¾Ñ€Ð°Ñ Ð¼Ð¾Ð¶ÐµÑ‚ иметь влиÑние, как, например, интеллект влиÑет на уÑпеваемоÑÑ‚ÑŒ. Фактор должен быть каким-то образом измерен, и результат Ñтого Ð¸Ð·Ð¼ÐµÑ€ÐµÐ½Ð¸Ñ ÐµÑÑ‚ÑŒ Ð¿ÐµÑ€ÐµÐ¼ÐµÐ½Ð½Ð°Ñ Ð²ÐµÐ»Ð¸Ñ‡Ð¸Ð½Ð° вроде коÑффициента интеллекта IQ. Так, еÑли учёный мерит IQ по группе (выборке), ÑоÑтоÑщей из детей, Ñта величина будет варьироватьÑÑ Ð´Ð»Ñ Ñ€Ð°Ð·Ð½Ñ‹Ñ… иÑпытуемых. Результаты измерениÑ, таким образом, выÑвлÑÑŽÑ‚ раÑÑеÑние (диÑперÑию) переменной в выборке. ПользуÑÑÑŒ извеÑтными методами, можно оценить раÑÑеÑние в генеральной ÑовокупноÑти (у вÑех детей данного возраÑта в отдельно взÑтом гоÑударÑтве). ДиÑперÑионный анализ (по-английÑки AnOVa), как и анализ коррелÑции, выÑвлÑет, наÑколько два и более факторов между Ñобой ÑвÑзаны. Иными Ñловами, коррелÑÑ†Ð¸Ñ Ð¸ AnOVa показывают, наÑколько вариации одной переменной ÑвÑзаны Ñ Ð²Ð°Ñ€Ð¸Ð°Ñ†Ð¸Ñми другой. КоличеÑтвенной мерой коррелÑции ÑвлÑетÑÑ ÐºÐ¾Ñффициент коррелÑции r, принимающий Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸Ñ Ð¼ÐµÐ¶Ð´Ñƒ +1,00 (например, чем Ñильнее дождь, тем больше воды в лужах) и −1,00 (например, чем Ñильнее дождь, тем меньше детей на улице). ЗначимоÑÑ‚ÑŒ Ñтой меры завиÑит от объёма выборки - количеÑтва иÑпытуемых или реÑпондентов. Чем больше наблюдений проделано Ð´Ð»Ñ Ð²Ñ‹Ñ‡Ð¸ÑÐ»ÐµÐ½Ð¸Ñ r, тем правдоподобнее результат. ПоÑтому обычно поÑле r приводитÑÑ Ð¾Ð±ÑŠÑ‘Ð¼ выборки n или N. Замечу, что Ñтепень r ÑвÑзи между Ð´Ð²ÑƒÐ¼Ñ Ð¿ÐµÑ€ÐµÐ¼ÐµÐ½Ð½Ñ‹Ð¼Ð¸ не тождеÑтвенна ÑтатиÑтичеÑкой значимоÑти, выÑвлÑющей, дейÑтвительно ли одна Ð¿ÐµÑ€ÐµÐ¼ÐµÐ½Ð½Ð°Ñ Ð¸Ð¼ÐµÐµÑ‚ хоть какое-то отношение к другой. Ð’ метаанализе величина r показывает Ñтепень ÑвÑзи признаков, выраженных переменными. Ð’ метаанализе многие коÑффициенты коррелÑции приводÑÑ‚ÑÑ Ð² подправленном виде, причём в преобразованиÑÑ… учтён объём выборки. Так получаетÑÑ Ð½ÐµÑмещённое r̃. Ðта величина отражает наилучшую оценку коррелÑции в пределах генеральной ÑовокупноÑти. Полезное ÑвойÑтво r - возможноÑÑ‚ÑŒ Ð²Ð¾Ð·Ð²ÐµÐ´ÐµÐ½Ð¸Ñ Ð² квадрат. Так получаетÑÑ ÐºÐ¾Ñффициент детерминации. Когда раÑÑеÑние одной переменной X на 50% Ñовпадает Ñ Ñ€Ð°ÑÑеÑнием другой переменной Y, коÑффициент детерминации ÑоÑтавлÑет 0,50, что ÑоответÑтвует r≈+0,70. Заметим, что, например, 0,90×0,90=0,81, а 0,40×0,40=0,16: квадрат r̃² меньше r̃. При интерпретации результатов обзора, вычиÑлении Ñтепени ÑвÑзи признаков группа Ринда принимала r=+0,50 как показатель Ñильной ÑвÑзи, r=+0,30 - Ñредней и r=+0,10 - Ñлабой. Ð”Ð»Ñ ÐºÐ¾Ñффициента детерминации ÑоответÑтвенно 25%, 9% и 1%. Главный фактор в метаанализе - Ñто опыт раÑÑ‚Ð»ÐµÐ½Ð¸Ñ Ð² детÑтве (РВД). Его ÑопоÑтавлÑÑŽÑ‚ Ñ Ð´Ñ€ÑƒÐ³Ð¸Ð¼Ð¸ факторами вроде ÑоÑтоÑние пÑихики и прочих пÑихологичеÑких факторов. ЕÑли вдруг обнаруживаетÑÑ Ð²Ñ‹Ñокий процент ÑÐ¾Ð²Ð¿Ð°Ð´ÐµÐ½Ð¸Ñ Ñ€Ð°ÑÑеÑний РВД и, допуÑтим, ÑоÑтоÑÐ½Ð¸Ñ Ð¿Ñихики, можно подозревать, что РВД и ÑоÑтоÑние пÑихики ÑвÑзаны (Ñильно, Ñредне, Ñлабо). ЕÑли Ñтепень ÑоглаÑÐ¸Ñ Ð½Ð° раÑтление или пол раÑтлённого проÑвлÑет влиÑние на ÑоÑтоÑние пÑихики, ÑоглаÑие и пол выÑтупают агентами. Подвергнутые обзору публикации предоÑтавили по одной Ñтепени ÑвÑзи Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ иÑÑледованной выборки, поÑтому количеÑтво Ñтепеней ÑвÑзи Ñовпадает Ñ ÐºÐ¾Ð»Ð¸Ñ‡ÐµÑтвом выборок k. Доверительный интервалБыло Ñказано: чем больше выборка, тем правдоподобнее коррелÑциÑ. Ð”Ð»Ñ Ð¾Ñ†ÐµÐ½ÐºÐ¸ надёжноÑти вычиÑленного коÑффициента коррелÑции иÑпользуют ещё две величины: одна меньше, а Ð´Ñ€ÑƒÐ³Ð°Ñ Ð±Ð¾Ð»ÑŒÑˆÐµ его. ЕÑли значение коÑффициента дейÑтвительно лежит между Ñтими Ð´Ð²ÑƒÐ¼Ñ Ð²ÐµÐ»Ð¸Ñ‡Ð¸Ð½Ð°Ð¼Ð¸, в вычиÑленном значении коррелÑции можно быть уверенным на 95,0%. Ðто то же Ñамое, что на 2,5% быть уверенным, что коррелÑÑ†Ð¸Ñ Ð½Ð¸Ð¶Ðµ меньшей величины, и на 2,5% - в том, что коррелÑÑ†Ð¸Ñ Ð¿Ñ€ÐµÐ²Ñ‹ÑˆÐ°ÐµÑ‚ бо́льшую из величин. ЕÑли Ð½Ð°Ð¸Ð¼ÐµÐ½ÑŒÑˆÐ°Ñ Ð²ÐµÐ»Ð¸Ñ‡Ð¸Ð½Ð° отрицательна, а Ð½Ð°Ð¸Ð±Ð¾Ð»ÑŒÑˆÐ°Ñ Ð¿Ð¾Ð»Ð¾Ð¶Ð¸Ñ‚ÐµÐ»ÑŒÐ½Ð°, Ñто означает, что у коррелÑции равные шанÑÑ‹ быть как положительной, так и отрицательной. ЕÑли величины положительны, мы Ñ Ð´Ð¾Ð²ÐµÑ€Ð¸Ñ‚ÐµÐ»ÑŒÐ½Ð¾Ð¹ вероÑтноÑтью 95,0% Ñчитаем, что наблюдаем положительную коррелÑцию, лежащую в указанных пределах. ЕÑли один из концов получившегоÑÑ Ð¸Ð½Ñ‚ÐµÑ€Ð²Ð°Ð»Ð° доÑтигает Ð½ÑƒÐ»Ñ Ð¸Ð»Ð¸ переваливает за него, у Ð½Ð°Ñ Ð½ÐµÑ‚ оÑнований Ñчитать коррелÑцию положительной или отрицательной. Как Ñказано в метаанализе, "еÑли интервал не включает в ÑÐµÐ±Ñ Ð½ÑƒÐ»ÑŒ, оценку влиÑÐ½Ð¸Ñ Ñчитаем значимой". Одно- и двуÑторонние критерииЕÑли иÑÑледователь верит, что коррелÑÑ†Ð¸Ñ Ð±ÑƒÐ´ÐµÑ‚ обÑзательно положительна, как в вышеприведенном примере Ñ Ð´Ð¾Ð¶Ð´Ñ‘Ð¼ и лужами, он проверÑет только положительные Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸Ñ ÐºÐ¾Ñффициентов коррелÑции. Такой критерий называетÑÑ Ð¾Ð´Ð½Ð¾Ñторонним. Ðо еÑли иÑÑледователь не уверен, еÑÑ‚ÑŒ ли ÑвÑзь между переменными, или хочет знать величину коррелÑции, а не только, имеетÑÑ Ð¾Ð½Ð° или нет, он должен иÑÑледовать и положительные, и отрицательные Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸Ñ ÐºÐ¾Ñффициентов - применить двуÑторонний критерий. КоррелÑÑ†Ð¸Ñ ÑквиÑимптомнаÑРечь идёт о коррелÑции между некоторым Ñимптомом (например, депреÑÑией) и фактором РВД, имеющейÑÑ Ð²Ð¾ вÑех выборках, где Ñтот Ñимптом оценивали. Фактор РВД обычно предÑтавлен Ð´Ð²ÑƒÐ¼Ñ ÑƒÑ€Ð¾Ð²Ð½Ñми: наличие опыта раÑÑ‚Ð»ÐµÐ½Ð¸Ñ Ð² детÑтве и отÑутÑтвие такого опыта. Ð’ иных работах иÑпользуетÑÑ Ð±Ð¾Ð»ÑŒÑˆÐµ уровней: раÑтление через прикоÑновение, раÑтление без прикоÑновениÑ, отÑутÑтвие опыта РВД. Выборка не имеющих опыта РВД людей ÑоÑтавлÑет контрольную группу. Когда говорÑÑ‚, что 50% иÑпытуемых РВД-группы проÑвлÑли депреÑÑивные Ñимптомы, а 50% иÑпытуемых контрольной группы проÑвлÑли депреÑÑивные Ñимптомы, Ñтепень ÑвÑзи РВД Ñ ÑоÑтоÑнием пÑихики будет признана нулевой. Рвот еÑли бы 100% лиц РВД-группы имели такие Ñимптомы и 0% лиц контрольной группы не имели, тогда бы Ñтепень ÑвÑзи ÑоÑтавлÑла +1,00. КоррелÑÑ†Ð¸Ñ ÑквивыборочнаÑÐта коррелÑÑ†Ð¸Ñ Ð¾Ñ‚Ñ€Ð°Ð¶Ð°ÐµÑ‚ общую взаимоÑвÑзь между РВД и измеренными по различным выборкам типами оценок ÑоÑтоÑÐ½Ð¸Ñ Ð¿Ñихики. ЕÑли в публикации приводитÑÑ Ð¾Ñ†ÐµÐ½ÐºÐ° четырёх Ñимптомов по одной выборке, Ñти ÑквиÑимптомные Ñтепени ÑвÑзи в метаанализе уÑреднены в одну-единÑтвенную Ñквивыборочную Ñтепень ÑвÑзи. ОднородноÑтьМетаанализ обобщает данные из различных научных публикаций по одной отраÑли знаниÑ. ОднородноÑÑ‚ÑŒ же предÑтавлÑет Ñобою меру разницы и ÑÐ¾Ð²Ð¿Ð°Ð´ÐµÐ½Ð¸Ñ Ð¼ÐµÐ¶Ð´Ñƒ различными иÑÑледованиÑми. ЕÑли неÑколько учёных незавиÑимо друг от друга приходÑÑ‚ приблизительно к одним и тем же результатам, имеетÑÑ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ÑÑ‚ÑŒ объединить их Ñ Ð´Ð¾Ñтаточно большим уровнем довериÑ. Ðужна Ð¿Ð¾Ð²Ñ‹ÑˆÐµÐ½Ð½Ð°Ñ Ð¾ÑторожноÑÑ‚ÑŒ, еÑли вдруг будем иметь дело Ñ Ñильными разноглаÑиÑми каÑательно результатов. Величина однородноÑти опубликованных результатов вычиÑлÑетÑÑ Ð¿Ð¾ так называемым таблицам χ²-раÑпределениÑ. Ð’ Ñтой таблице чем больше результатов, тем выше величина χ². СтатиÑтичеÑки выражаÑÑÑŒ, чиÑло Ñтепеней Ñвободы ν=k−1 увеличиваетÑÑ Ñ Ñ‡Ð¸Ñлом результатов k. Чтобы выÑÑнить значимоÑÑ‚ÑŒ конкретной величины χ² англоÑзычные ÑтатиÑтики пользуютÑÑ Ñ‚Ð°Ð±Ð»Ð¸Ñ†Ð°Ð¼Ð¸, в коих значимые величины χ² помечены звёздочкой, которую надо читать так: "α<0,05 Ð´Ð»Ñ Ñ‚Ð°ÐºÐ¾Ð¹-то величины χ²". Ðто означает, что не более чем на 5% мы уверены, будто у наÑтолько однородных результатов еÑÑ‚ÑŒ ÑˆÐ°Ð½Ñ Ð¾Ñ‡ÐµÐ½ÑŒ Ñильно друг от друга отличатьÑÑ. Ð”Ð»Ñ Ð´Ð¾ÑÑ‚Ð¸Ð¶ÐµÐ½Ð¸Ñ Ð¾Ð´Ð½Ð¾Ñ€Ð¾Ð´Ð½Ð¾Ñти авторы, еÑли возможно, убирали из раÑÑÐ¼Ð¾Ñ‚Ñ€ÐµÐ½Ð¸Ñ Ð½Ð°Ð¸Ð±Ð¾Ð»ÐµÐµ ÑкÑтремальные Ñтепени ÑвÑзи, незавиÑимо от того, были Ñто макÑимумы или минимумы. Без Ñтого научные публикации не могли быть ÑопоÑтавлены. ВыброÑыДопуÑтим, перед нами пÑÑ‚ÑŒ публикаций, приводÑщих Ñтепени ÑвÑзи r=+0,14, r=+0,17, r=+0,23, r=+0,25 и r=+0,27. Без учёта объёма Ñредней будет ÑчитатьÑÑ Ñтепень ÑвÑзи +0,21. Теперь еÑли прибавим к нашим пÑти ещё одну публикацию, в которой приводитÑÑ r=+0,70, то тогда ÑреднÑÑ ÑвÑзь Ñтанет уже +0,29. Вышло, что одна-единÑÑ‚Ð²ÐµÐ½Ð½Ð°Ñ ÑˆÐµÑÑ‚Ð°Ñ Ñтепень ÑвÑзи признаков заметно изменила наши предÑÑ‚Ð°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¾ том, какое влиÑние Ñчитать Ñредним. ПоÑтому лучше её в метаанализ не включать: уж больно она Ñмахивает на отклонение от иÑтины. О подобных намеренных отклонениÑÑ… говорÑÑ‚ как о "выброÑах". По Ñути, лишь три работы оказалиÑÑŒ выброÑами: две предлагали Ñлишком выÑокую положительную Ñтепень ÑвÑзи РВД Ñ ÑоÑтоÑнием пÑихики (по иÑÑледованиÑм множеÑтва Ñлучаев инцеÑта в выборках), а одна - Ñлишком выÑокую отрицательную. "ПоложительноÑÑ‚ÑŒ" означает: "Чем больше Ñтепень РВД, тем больше пÑихологичеÑких проблем". Взвешенные ÑредниеЕÑли перед нами Ñ€Ñд Ñтепеней ÑвÑзи признаков, можно по ним узнать Ñреднее влиÑние. Лучше вÑего воÑпользоватьÑÑ Ð¿Ñ€Ð¸ раÑчётах объёмом выборки - бо́Ð»ÑŒÑˆÐ°Ñ Ð²Ñ‹Ð±Ð¾Ñ€ÐºÐ° оказывает больше влиÑÐ½Ð¸Ñ Ð½Ð° Ñреднее значение, нежели выборка меньшаÑ. ÐŸÐ¾Ð»ÑƒÑ‡ÐµÐ½Ð½Ð°Ñ Ñтепень ÑвÑзи будет называтьÑÑ Ð²Ð·Ð²ÐµÑˆÐµÐ½Ð½Ð¾Ð¹ Ñредней величиной. ÐŸÑ€ÐµÐ¾Ð±Ñ€Ð°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ Ð¤Ð¸ÑˆÐµÑ€Ð°ÐšÐ¾Ñффициент коррелÑции r или r̃ не ÑвлÑетÑÑ Ð¸Ð½Ñ‚ÐµÑ€Ð²Ð°Ð»ÑŒÐ½Ð¾Ð¹ переменной: разница между r=+0,1 и r=+0,2 - Ñто не то же Ñамое, что разница между r=+0,8 и r=+0,9. Рвот преобразование Фишера даёт коÑффициент коррелÑции z, который намного лучше позволÑет оценить меÑто каждой Ñтепени ÑвÑзи Ñреди набора значений Ñтих Ñтепеней. СтановитÑÑ Ñ‚Ð°Ðº возможным вычиÑление взвешенных Ñредних, а уже Ñто Ñреднее значение можно преобразовать назад в коÑффициент ПирÑона. Между прочим, r̃² или процент раÑÑеÑÐ½Ð¸Ñ ÑвлÑетÑÑ Ð¸Ð½Ñ‚ÐµÑ€Ð²Ð°Ð»ÑŒÐ½Ð¾Ð¹ мерой. Стандартное отклонение σСтандартным отклонением именуют меру, чаще вÑего принимающую Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸Ñ Ð¼ÐµÐ¶Ð´Ñƒ −2 и 2, что отражает "положение" Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸Ñ Ð²ÐµÐ»Ð¸Ñ‡Ð¸Ð½Ñ‹ Ñреди вÑех возможных её значений. ЕÑли у величины σ=0,0, то имеем Ñреднее значение. Около половины вÑех значений лежит между σ=−0,1 и σ=0,1. Ð—Ð½Ð°Ñ‡ÐµÐ½Ð¸Ñ σ=±0,9 нечаÑÑ‚Ñ‹. МножеÑÑ‚Ð²ÐµÐ½Ð½Ð°Ñ Ñ€ÐµÐ³Ñ€ÐµÑÑÐ¸Ñ Ð¸ (полу)чаÑÑ‚Ð½Ð°Ñ ÐºÐ¾Ñ€Ñ€ÐµÐ»ÑциÑРечь идёт о методе ÑÑ€Ð°Ð²Ð½ÐµÐ½Ð¸Ñ Ð½ÐµÑкольких ("множеÑтва") факторов и Ð¿Ð¾Ð»ÑƒÑ‡ÐµÐ½Ð¸Ñ Ñтепени влиÑÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ из них на другой фактор. Такой подход значительно лучше вычиÑÐ»ÐµÐ½Ð¸Ñ "проÑÑ‚Ñ‹Ñ…" коррелÑций между одними только Ð´Ð²ÑƒÐ¼Ñ Ð¿ÐµÑ€ÐµÐ¼ÐµÐ½Ð½Ñ‹Ð¼Ð¸ попарно. Ðапример, учебный процеÑÑ Ð² школах. Можем предполагать неÑколько влиÑний на него: уровень интеллекта школьников, методика преподаваниÑ, размеры клаÑÑных комнат, личноÑтные оÑобенноÑти педагога. РаÑÐ¿Ð¾Ð»Ð°Ð³Ð°Ñ Ð´Ð¾Ñтаточным количеÑтвом данных, можно получить другие данные, характеризующие вÑех учеников того же Ñамого педагога, Ñ Ð¾Ð´Ð½Ð¸Ð¼ и тем же уровнем интеллекта и занимавшихÑÑ Ð² клаÑÑных комнатах определённого размера, однако обучавшимÑÑ Ð¿Ð¾ различным методикам. Затем вы Ñловно бы подвергаете "регреÑÑу" вÑе факторы, кроме одного. Так открываетÑÑ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ÑÑ‚ÑŒ иÑÑледовать, наÑколько Ñффективна методика Ð¿Ñ€ÐµÐ¿Ð¾Ð´Ð°Ð²Ð°Ð½Ð¸Ñ Ñ‡ÐµÑ€ÐµÐ· коррелÑцию того одного фактора при подвергнутых "регреÑÑу" оÑтальных. Ð¢Ð°ÐºÐ°Ñ ÐºÐ¾Ñ€Ñ€ÐµÐ»ÑÑ†Ð¸Ñ Ð½Ð°Ð·Ñ‹Ð²Ð°ÐµÑ‚ÑÑ Ñ‡Ð°Ñтной. ЕÑли "регреÑÑу" подвергаем меньше факторов, говорим, что имеем дело Ñ Ð¿Ð¾Ð»ÑƒÑ‡Ð°Ñтной коррелÑцией. ВыполнÑÑ Ñти манипулÑции Ñ Ð¿ÐµÑ€ÐµÐ¼ÐµÐ½Ð½Ñ‹Ð¼Ð¸, оÑущеÑтвлÑем так множеÑтвенный регреÑÑионный анализ Ñтепени ÑвÑзи вÑех факторов между Ñобой. Ðи в коем Ñлучае Ð½ÐµÐ»ÑŒÐ·Ñ Ð·Ð°Ð±Ñ‹Ð²Ð°Ñ‚ÑŒ, что в данном метаанализе оба фактора: ÑÐµÐ¼ÐµÐ¹Ð½Ð°Ñ Ñреда и наличие РВД вмеÑте влиÑÑŽÑ‚ на ÑоÑтоÑние пÑихики, однако ÑÐµÐ¼ÐµÐ¹Ð½Ð°Ñ Ñреда оказывает в 10 раз более Ñильное влиÑние, нежели раÑтление Ñамо по Ñебе. |