Как читать научное исследование и почему это совсем не просто?

shironosov

iStock

Зачем учиться читать научные исследования?

Маркетинг диктует, чтобы индустрия здоровья и красоты опиралась на научную доказательную базу. Производители добавок продают такие вещества, как экстракт зеленого кофе (о действии которого на людей не было исследований) и преподносят его в той же манере, что и креатин (который испытывали на людях сотни раз). Если расследовать, откуда берутся заявления маркетологов, иногда можно все же раскопать действительно опубликованное научное исследование. Но важно отметить, что научные исследования бывают очень разными по качеству. Чтобы не тратить деньги впустую на неэффективные продукты, требуется рассмотреть исследуемый продукт с разных сторон, а именно с точки зрения его надежности, применимости, клинической значимости отмеченного эффекта.

Плохо проведенные исследования могут показать выдающиеся результаты. Лучше всего подождать и посмотреть, удастся ли их повторить перед тем как делать выводы.

Чтобы понять исследование, а также как оно соотносится с предыдущими исследованиями по теме, недостаточно прочитать только аннотацию. При обсуждении нового исследования самое главное — это контекст, именно поэтому аннотации часто могут ввести вас в заблуждение.

Виды исследований

Существует много разновидностей исследований. Данное руководство поможет вам лучше разобраться в них; особое внимание мы уделили экспериментальным исследованиям.

Виды исследований		Структура	Сильные стороны	Слабые стороны
Обобщение фактических данных	Метаанализ	Обобщает всю доступную литературу по теме с целью собрать и проанализировать данные	Обеспечивает серьезную статистическую базу в конкретном исследовательском вопросе	Занимает много времени и требует глубоких знаний статистики
	Систематический обзор	Представляет экспертную оценку всех имеющихся данных	Способствует составлению рекомендаций в области, где исследования ограничены	Различные структуры исследования могут затруднить сопоставление
Экспериментальные исследования	Рандомизированное контролируемое исследование	Участников случайным образом распределяют по экспериментальным или контрольным группам	Рандомизация позволяет избежать систематических ошибок по выборке среди населения	Могут быть очень дорогостоящими и затребовать много ресурсов
	Нерандомизированное контролируемое исследование	Участников распределяют по экспериментальным и контрольным группам	Дает возможность участникам непредвзято относиться к лечению	Не рандомизированы
Обсервационное исследование	Когортное исследование	Исследует группу на предмет определенных привычек и факторов риска на протяжении определенного промежутка времени	Легче проводить, чем рандомизированное контролируемое исследование	Его продолжительность может занимать долгие годы
	Исследование методом случай-контроль	Сравнивает истории болезней групп при наличии и при отсутствии конкретного заболевания или исходом для здоровья	Позволяет выявлять факторы риска	Предвзятость может влиять на оценку результатов
	Описание клинических случаев	Приводится подробный отчет об отдельных случаях	Позволяет отслеживать новые тенденции	Не поддается обобщению

Рандомизированное двойное слепое плацебо-контролируемое исследование чаще всего считается золотым стандартом биомедицинских исследований. В таких испытаниях участников случайным образом распределяют либо в экспериментальную группу (что подразумевает медицинское вмешательство) либо в контрольную группу (что подразумевает использование плацебо); ни исследователи, ни участники проводимого исследования не знают, к какой группе относится тот или иной участник.

Что можно узнать из аннотации исследования

Исследование разделено на несколько разделов. В зависимости от исследования разделы могут отличаться, но, как правило, всегда есть аннотация, вступление, методы исследования (что включает демографическую справку, описание структуры исследования и иногда ряд конечных точек) и заключение (которое зачастую разделено на «Результаты» и «Обсуждение»).

Аннотация — это краткое резюме основных положений исследования. Поскольку требуется включить значительный объем информации в несколько абзацев, то аннотация может непредумышленно вводить в заблуждение. Поскольку в аннотации нет контекста, она часто не включает ясные данные по ограничениям эксперимента и о применимости его результатов в реальной жизни. Перед тем как использовать цитаты из исследования в обсуждении, убедитесь, что изучили исследование целиком, потому что может оказаться, что у него слабая доказательная база.

Введение задает контекст. В нем ясно определяется изучаемый в исследовании вопрос. Обычно именно в этой главе резюмируют предыдущие исследования, связанные по тематике с данным исследованием, и объясняют, почему было принято решение продолжить изучение.

Например, некалорийный подсластитель стевия показал многообещающие результаты по улучшению контроля кровяного давления, особенно у диабетиков. Поэтому исследователи решили провести более крупное и строгое исследование, чтобы убедиться, станет ли стевия эффективным средством лечения диабета. Введение часто служит прекрасной возможностью найти дополнительный материал для чтения, поскольку там часто бывают отсылки к предыдущим, актуальным и опубликованным исследованиям.

Одно исследование — это лишь один кусочек головоломки

Прочтение нескольких исследований по определенной теме даст вам больше информации, больше данных, даже если вы не знаете, как проводить метаанализ. Например, если вы прочитали только одно исследование, которое изучало влияние креатина на тестостерон, и оно показало увеличение, то 100% ваших данных покажут, что креатин увеличивает тестостерон; но если вы прочитали десять исследований, которые изучали влияние креатина на тестостерон, и только одно обнаружило увеличение, то 90% ваших данных покажут, что креатин не увеличивает тестостерон.

(Это упрощенный пример, в котором мы использовали метод «подсчета голосов»): мы сравнили количество исследований, которое обнаружило эффект, с количеством исследований, в котором такого эффекта не обнаружили. Однако метаанализ гораздо сложнее: он должен учитывать различные критерии, такие как структуру исследования, количество участников и предубеждения, которые влияют на результаты. При этом не стоит сводить каждое из исследований к положительному или отрицательному результату.

Неудивительно, что компании, производящие пищевые добавки, часто выбирают избирательные исследования. Если компания хочет продать вам креатин в качестве усилителя тестостерона, они упомянут лишь одно исследование, в котором было обнаружено увеличение тестостерона, а не девять, в котором его не обнаружили.

Обычно именно так воюющие лагеря с легкостью предъявляют друг другу исследования, чтобы доказать свою точку зрения. Если вы ищете исследование, которое показывает, что диета с низким содержанием жиров позволяет сбросить вес лучше, чем диета с низким содержанием углеводов, то вы его найдете. Если вы ищете исследование, которое доказывает обратное, то его вы тоже найдете. Поэтому важно, если вы ищете истину (а не «боеприпасы» для «войны» в Твиттере), изучить всю совокупность доказательств и честно проанализировать исследования, которые не согласуются с вашим первоначальным мнением (если оно у вас есть, а оно есть у большинства из нас).

Здесь важно отметить, что не только компании используют выборочные исследования. Иногда так поступают и сами исследователи. Если вы знаете, что в какой-либо области есть спорные вопросы, но в статье упоминаются только исследования, подтверждающие выводы авторов, вы можете самостоятельно поискать другие материалы по этой теме (во всяком случае, это никогда не бывает лишним).

Методы: самая важная часть исследования

В разделе «Методы» (или «Материалы и методы») содержится информация по структуре исследования и участниках. В идеале данные должны быть ясными и подробными, чтобы другие исследователи могли повторить исследование, не обращаясь к его авторам. Этот раздел нужно изучить, чтобы определить слабые и сильные стороны исследования и ограничения, что позволит понять, как интерпретировать результаты исследования.

Демография

Раздел «Методы» обычно начинается с данных об участниках, а именно об их возрасте, поле, образе жизни, состоянии здоровья и методе набора. Эта информация поможет вам решить, насколько исследование актуально для вас, ваших близких и ваших клиентов.

Данные о демографии могут быть довольно обширными, и вам, наверное, захочется пропустить их, хотя они влияют и на надежность, и на применимость исследования.

Надежность. Чем больше выборка исследования (т.е. чем больше в нем участников), тем более надежны его результаты. Отметим, что зачастую в начале исследования участников больше, чем в его конце; в частности, существенное количество отсевов происходит в исследованиях диет.

Применимость. В сфере здоровья и фитнеса применимость означает, что какое-то вещество или вмешательство (например, упражнение, диета или добавка) может быть полезным для одного человека и оказаться тратой денег (или даже быть опасным) для другого. Например, в то время как креатин повсеместно считается безопасным и эффективным, есть те, на ком он не работает, и для кого эта добавка оказывается бесполезной.

Ваш опыт может варьироваться, как и показывает пример с креатином, а данные о демографии могут помочь вам оценить применимость исследования. Если исследование содержит данные только о мужчинах, например, то женщинам следует помнить, что для женщин эффект может быть менее выраженным. Точно так же исследование, проведенное на студентах колледжа, может сильно отличаться от результатов людей пенсионного возраста.

Кроме того, разные методы набора привлекают разные демографические группы, и это может повлиять на применимость испытания. В большинстве сценариев исследователи используют случайную выборку. Например, исследования, проводимые университетами, часто проводятся на студентах. Тем не менее, некоторые исследователи производят рандомную выборку, чтобы сделать испытание более применимым к общей популяции. Такие исследования обычно называют расширенными рандомизированными контролируемыми исследованиями.

Затрудняющие факторы

Наконец, в данных о демографии обычно указывается, какие группы не были включены в исследование и по какой причине. Чаще всего затрудняющий фактор — это переменная, которая может запутать (т.е. повлиять) результаты.

Например, если вы изучаете влияние силовых тренировок на мышечную массу, то вы не захотите, чтобы кто-то из участников принимал добавки для наращивания мышечной массы, в то время как другие этого делать не будут. Либо вы захотите, чтобы все они принимали одни и те же добавки, либо, что более вероятно, вы захотите, чтобы никто из них их не принимал.

Более того, если вы изучаете влияние на мышечную массу специальных добавок, вы не захотите, чтобы некоторые участники занимались спортом, в то время как другие этого не делают. Вы либо захотите, чтобы все они следовали одной и той же программе тренировок, либо, что менее вероятно, вы захотите, чтобы ни один из них не тренировался.

Конечно же это возможно для исследований, в которых больше двух групп. Например, можно провести исследование на эффективность силовых тренировок в следующих группах:

— силовые тренировки + отсутствие добавок;

— силовые тренировки + креатин;

— отсутствие силовых тренировок + отсутствие добавок;

— отсутствие силовых тренировок + креатин.

Однако если в исследовании будут изучать четыре группы вместо двух, то, чтобы сохранить размер выборки, вам понадобится вдвое больше участников, из-за чего провести исследование будет еще труднее и дороже.

Если подходить к этому вопросу «в лоб», то любые различия между участниками — это всего лишь переменные, которые могут потенциально играть роль затрудняющих факторов. Именно поэтому испытания на мышах включают виды, очень близкие друг другу. Вот почему исследование на людях довольно редко стремятся изучить разнообразные выборки. Например, исследование, которое включало пожилых женщин, фактически убирало факторы возраста и пола как затрудняющие.

Как уже было отмечено ранее, при достаточно большой выборке можно изучать больше групп в рамках одного исследования. Можно даже разбить выборку на большее количество групп даже после завершения исследования (по завершению анализа подгрупп. Например, если вы проведете наблюдательное исследование о влиянии красного мяса на тысячи людей, то позже сможете выделить группы мужчин и группы женщин и отдельно проанализировать каждое подмножество данных. Однако анализ подгрупп такого рода считается скорее экспериментальным, чем подтверждающим, и потенциально может привести к ложноположительным результатам. (Когда, например, анализ крови ошибочно обнаруживает заболевание, он называется ложноположительным).

Структура и конечные точки

Раздел «Методы» также описывает, как проводилось исследование. Варианты структуры включают одиночные слепые исследования, в которых только участники не знают, получают ли они плацебо; наблюдательные исследования, в которых исследователи только наблюдают за демографией и проводят измерения; и многое другое. (См. гр. 2 выше для дополнительных примеров).

Именно из этого раздела вы узнаете о продолжительности исследования, используемых дозировках, режимах тренировки, методах исследования и так далее. В идеале, как мы уже говорили, эта информация должна быть настолько ясной и подробной, чтобы другие исследователи могли повторить исследование, не связываясь с авторами.

Наконец, раздел «Методы» прояснит конечные точки, на которые будут обращать внимание исследователи. Например, исследование влияния силовых тренировок может взять за основной критерий мышечную массу (основной критерий оценки результатов исследования), а в качестве вторичных конечных точек — жировую массу, силовые показатели и уровень тестостерона.

Одна из уловок исследований, в которых исследователи стремятся доказать конкретный эффект (иногда для того, чтобы они могли служить маркетинговым материалом для продукта, но часто просто потому, что исследования, которые показывают эффект, с большей вероятностью будут опубликованы), состоит в том, чтобы собрать много конечных точек, а затем сделать статью о тех, что показали эффект, либо преуменьшая другие конечные точки, либо не упоминая о них вообще. Чтобы предотвратить такие «выемки/вылов данных» (метод, кажущаяся эффективность которого была продемонстрирована с помощью известного забавного обмана с шоколадом), многие ученые настаивают на предварительной регистрации исследований.

Умение распознать уловки, используемые менее щепетильными авторами, — это, увы, часть навыков, которые вам нужно будет развить, чтобы оценивать опубликованные исследования.

Интерпретация статистики

Раздел «Методы» обычно завершается подробным обсуждением статистики. Определение того, применялся ли соответствующий статистический анализ для данного исследования, — это отдельная область исследований, поэтому мы предлагаем вам не утруждать себя деталями; постарайтесь сосредоточиться на общей картине.

Во-первых, давайте проясним два распространенных заблуждения. Возможно, вы читали, что эффект был значительным, но позже обнаружили, что он был небольшим. Точно так же вы, возможно, читали, что никакого эффекта не было обнаружено, но когда вы прочитали статью, то обнаружили, что испытуемые экспериментальной группы потеряли больше веса, чем группа плацебо. Что это означает?

Ответ лежит на поверхности: эти чудные ученые не говорят на языке нормальных людей.

Для них «значительный» означает не «важный», а «статистически значимый». Эффект считается значительным, если вероятность получить данные, собранные во время исследования, была бы маловероятной в случае их неэффективности.

Это означает, что эффект может быть значительным, пусть даже и небольшим (например, 0,2 кг или 0,5 фунта потери веса за год). Более того, эффект может быть значительным, но клинически незначимым (это означает, что он не оказывает заметного воздействия на здоровье).

Это означает, что отсутствие эффекта для ученых обычно означает отсутствие статистически значимого эффекта. Именно поэтому вы можете пересмотреть измерения, собранные в ходе исследования и обнаружить повышение или понижение показателей и после обнаружить в заключении, что никаких изменений или эффектов обнаружено не было. А изменения были, но лишь незначительные. Другими словами изменения были, но такими маленькими, что их могли вызвать случайными флуктуациями. Тем не менее, они могут также быть вызваны реальными эффектами, однако утверждать наверняка мы не можем.

Ранее, в разделе «Демография», мы отметили, что чем больше выборка исследования, тем надежнее его результаты. Небольшое изменение менее вероятно из-за случайных флуктуаций, когда оно обнаруживается в исследовании с тысячью человек, чем, скажем, чем в исследовании на десяти людях.

Это объясняет, почему метаанализ может обнаружить значительные изменения путем объединения данных нескольких исследований, которые независимо друг от друга не показали существенных изменений.

Уровень р-величины 101

Чаще всего эффект считается значительным, если статистический анализ (проведенный исследователями после исследования) имеет значение P, которое не превышает определенного порога (установленного исследователями до исследования). Назовем его «порогом значимости».

Даже специалистам может быть трудно интерпретировать показатели величины р; предлагаем научиться делать это интуитивно.

Возьмем, к примеру, бросание монетки. Подбросьте ее 100 раз и получите соотношение орла и решки примерно на 50/50. В этом нет ничего удивительного. Но что, если вы подбросите монету, и в ста случаях из ста выпадет орел? Вот это было бы странно! Уточним, что подобная вероятность составляет всего 0,00000000000000000000000000008%. Вот и подумайте о величине р с точки зрения получить орла при подбрасывали монеты.

— Величина р, равная 5% (р = 0,05), также невероятна, как и возможность выбросить все решки при четырех бросках монеты.

— Величина р, равная 0,5% (р = 0,005), также невероятна, как и возможность выбросить все решки при восьми бросках монеты.

— Величина р, равная 0,05% (р = 0,0005), также невероятна, как и возможность выбросить все решки при одиннадцати бросках монеты.

Вопреки распространенному мнению, «р» в «величине р» не означает «вероятность» (от англ. probability). Вероятность получить 4 решки подряд составляет 6,25%, а не 5%. Если вы хотите пересчитать значение р в броски монет (технически называемые S-значениями) и процент вероятности, воспользуйтесь нашим конвертером.

Как мы уже убедились, эффект значителен, если данные, собранные в ходе исследования, не появились бы, не будь они эффективными. Теперь мы можем добавить, что, чем ниже величина р (ниже порога значимости), тем больше мы можем быть уверены, что эффект значим.

Обычно в каждом эксперименте присутствуют два противоположных положения – основная и альтернативная гипотезы. Давайте представим выдуманное исследование, в котором бы изучалась потеря веса при помощи добавки «Лучший вес» по сравнению с плацебо. Эти противоположные заявления выглядели бы так:

— Основная гипотеза: по сравнению с плацебо «Лучший вес» не приводит ни к снижению, ни к повышению веса (гипотеза состоит в том, что добавка никак не влияет на вес).

— Альтернативная гипотеза: по сравнению с плацебо «Лучший вес» влияет на повышение или снижение веса (гипотеза подразумевает, что у добавки есть эффект, положительный или негативный, на изменение веса).

Цель — установить, является ли эффект (в данном случае — на вес) вмешательства (т.е. добавка «Лучший вес») таким же хорошим, менее выраженным или таким же, как и в контрольной группе (т.е. плацебо, но иногда результаты контрольной группы имеют другой, хорошо изученный результат вмешательства, так как новый препарат может быть изучен по сравнению с эталонным препаратом).

Для этой цели исследователи обычно устанавливают порог значимости (α) перед испытанием. Если в конце исследования значение р (p) имело результат меньше или равно этому порогу (p ≤ α), то это означало существование существенной разницы между эффектами двух исследуемых методов лечения. (Помните, что в данном контексте значимое означает статистически значимое).

p ≤ α альтернативная гипотеза

Наиболее часто используемый порог значимости составляет 5% (α = 0,05). Это означает, что если основная гипотеза (то есть предположение об отсутствии различий между методами лечения) верна, то, повторив эксперимент бесконечное число раз, исследователи получат ложноположительный результат (то есть обнаружат значительный эффект там, где его нет) не более чем в 5% случаев (р ≤ 0,05).

Как правило, значение р служит мерой согласованности между результатами исследования и предположением о том, что оба метода лечения имеют одинаковый эффект. Давайте посмотрим, как это будет выглядеть в нашем испытании по снижению веса, где в качестве методов лечения будут использоваться добавки и плацебо.

Сценарий 1. При р-величине 0,80 (р=0,80). Результаты более согласуются с основной гипотезой (то есть с идеей, что между двумя методами лечения нет никакой разницы). Мы пришли к выводу, что «Лучший вес» не оказал существенного влияния на потерю веса по сравнению с плацебо.

Сценарий 2. При р-величине 0,01 (р=0,01). Результаты более согласуются с альтернативной гипотезой (то есть с идеей, что между двумя методами лечения есть разница). Мы пришли к выводу, что «Лучший вес» оказал существенное влияние на потерю веса по сравнению с плацебо.

Значимым результатом является р = 0,01, равно как и р = 0,000001. Так какую же информацию содержат меньшие значения величины р? Они дают нам большую уверенность в результатах. В нашем примере значение р, равное 0,000001, дало бы нам большую уверенность в том, что «Лучший вес» оказывает существенное влияние на изменение веса.

Помните, что значительный эффект может не быть клинически значимым. Предположим, что мы обнаружили значимый результат р = 0,01, показывающий, что «Лучший вес» способствует потере веса. Вывод: «Лучший вес» способствовал большей потере веса только на 0,2 кг (0,5 фунта) по сравнению с плацебо за год применения — разница слишком мала, чтобы иметь какое-либо значительное влияние на здоровье. В этом случае, хотя результат значим, реальный эффект статистически слишком мал, чтобы оправдать прием этой добавки. (Этот тип сценария более вероятен, когда исследование делается довольно большим, поскольку, как мы уже обсудили, чем больше выборка исследования, тем больше оно позволяет определить, будут ли небольшие эффекты значимыми).

Наконец, следует отметить, что, хотя наиболее часто используемый порог значимости составляет 5% (р ≤ 0,05), некоторые исследования требуют большей точности. Например, чтобы генетические эпидемиологи сочли, что генетическая ассоциация статистически значима (скажем, могли определить, что ген связан с увеличением веса), порог значимости обычно устанавливается на уровне 0,0000005% (р ≤ 0,000000005), что соответствует получению всех орлов при 28 бросках монеты. Вероятность этого составляет 0,00000003%.

Величина р: не делайте из нее абсолютную истину!

И, наконец, помните (и это очень важно), что величина р не определяет, были ли результаты исследования точными!

Не раз бывало, что исследователи, которые слишком стремились выискать в своем исследовании эффект, прибегали к так называемому «слепому прочесыванию данных».

Они также могли снизить величину р различными способами: например, проводить различные анализы на одних и тех же данных и сообщать только о значимых показателях р, или же набирать все больше и больше участников до тех пор, пока не получат статистически значимый результат. Такие недобросовестные научные методы известны как «р-хакинг», или «выборочная отчетность». (Ознакомиться с реальными примерами можно здесь).

В то время как статистический анализ исследования обычно учитывает переменные, которые исследователи пытались контролировать по мере проведения исследования, значения р также могут зависеть (намеренно или нет) от структуры исследования, скрытых путающих факторов, типов используемых статистических тестов и многого, многого другого. Оценивая достоинства структуры исследования, представьте себя на месте того, кто его проводил, и подумайте, как бы вы работали над ним, чтобы выставить результаты так, как вам выгодно, и тем самым продвинуть свою карьеру.

Как читать результаты исследований

В заключении исследователи обсуждают первичные результаты или то, что интересовало их в исследовании больше всего. Обычно они это делают в разделе «Результаты» или «Результаты и обсуждение». Вам может захотеться сразу перейти к этому разделу после аннотации, но это часто приводит к неправильному толкованию и распространению дезинформации. Никогда не читайте результаты, не прочитав сначала раздел «Методы»; знание того, как исследователи пришли к выводу, так же важно, как и сам вывод.

Первое, что следует искать в разделе «Результаты», — это сравнение характеристик между тестируемыми группами. Большие различия в исходных характеристиках после рандомизации могут означать, что эти две группы не сопоставимы. Эти различия могут быть результатом случайности или неправильного применения метода рандомизации.

Исследователи также должны сообщать об отсеве участников и показателях соответствия. Жизнь часто встает на пути науки, поэтому почти в каждом испытании есть доля участников, которые не прошли исследование до конца или не выполняли инструкции. Это особенно верно в отношении длительных испытаний или испытаний с ограничениями (например, диетических). Тем не менее, слишком большая доля отсева или несоответствующих участников должна удивлять, особенно если одна из групп имеет гораздо более высокий процент отсева, чем другая.

Ученые используют опросники, анализы крови и другие методы сбора данных, которые могут быть представлены в виде диаграмм и графиков. Обязательно проверьте по вертикальной оси (оси y) масштаб, на котором представлены результаты; то, что на первый взгляд может показаться существенным изменением, на самом деле может быть очень незначительным.

В нашем исследовании по снижению веса добавка «Лучший вес» привела к потере веса всего на 0,2 кг (0,5 фунта) больше по сравнению с плацебо после года употребления. Однако, изменив ось y, мы можем сделать этот непримечательный результат намного более впечатляющим:

Раздел «Результаты» может включать вторичный анализ, например, анализ подгрупп или анализ чувствительности.

Анализ подгрупп. Как мы описывали в конце раздела «Затрудняющие факторы», он состоит в повторном анализе, но только на подмножестве участников. Например, если в вашем исследовании участвовали как мужчины, так и женщины всех возрастов, вы могли бы провести анализ только по данным женщин или только по данным группы старше 65 лет, чтобы увидеть, получите ли вы другой результат.

Анализ чувствительности. Вы можете проверить, остаются ли результаты неизменными, когда вы выполняете другой анализ или когда, как в анализе подгрупп, вы исключаете некоторые данные (например, в метаанализе вы можете убрать одно исследование и снова провести метаанализ).

Как уже обсуждалось в разделе «Демография», достоверность исследования зависит от размера выборки. Если вы исключите ряд участников из анализа, размер выборки уменьшится, и риск ложноположительных результатов может увеличиться. Это также означает, что если вы достаточно точно поиграете с данными, то сможете в конечном итоге получить положительный результат.

Давайте представим крайний случай: скажем, исследователю платят за то, чтобы он доказал, что «Лучший вес» действительно эффективен. Он проверил эффект «Лучшего веса» на 20 участниках обоего пола, возраст которых варьировался от 21 до 87 лет. Увы, из этих 19 участников похудел только один. Это удалось женщине в возрасте 65 лет. Исследователь может провести анализ подгрупп, исключив мужчин, а также людей в возрасте до 65 лет. Тогда он мог бы сделать вывод, что «Лучший вес» эффективен для женщин в возрасте 65 лет.

Уточнение выводов

Иногда заключение разделено на два раздела — «Результаты» и «Обсуждение».

В разделе «Обсуждение» авторы описывают значение своей работы. Они также могут уточнить интерпретацию результатов или выдвинуть гипотезу о механизме действия (т. е. о биохимии, лежащей в основе эффекта). Часто они сравнивают свое исследование с предыдущими и предлагают новые эксперименты, которые можно было бы провести на основе результатов их исследования. Крайне важно помнить, что одно исследование — это всего лишь часть общей головоломки. Как же оно вписывается в совокупность доказательств по выбранной теме?

Авторы должны изложить сильные и слабые стороны своего исследования. Изучите их критически. Удалось ли авторам хорошо осветить и то, и другое? Не упустили ли они какое-либо критическое ограничение? Не принимайте на веру их отчеты — проанализируйте их.

Как и введение, заключение содержит ценный контекст и ряд достижений. Если вам кажется, что исследователи экстраполируют данные на демографические группы, выходящие за рамки их исследования, или преувеличивают результаты, не бойтесь прочитать исследование еще раз (особенно раздел «Методы»).

Конфликт интересов

Конфликт интересов, если существует, обычно указывается после заключения. Конфликты интересов могут возникать, когда люди, которые разрабатывают, проводят или анализируют исследования, имеют мотив найти определенные результаты. Наиболее очевидным источником конфликта интересов считается финансовый — когда исследование спонсируется компанией или когда один из авторов работает на компанию, которая получит от исследования определенную выгоду.

К сожалению, одно исследование
показало, что неразглашение конфликта интересов является довольно распространенным явлением. Кроме того, то, что один журнал сочтет конфликтом интересов, может не считаться таковым в другом журнале, да и сами журналы могут иметь конфликт интересов, причем они их раскрывать не обязаны. Например, журнал из страны, которая экспортирует большие объемы определенного растения, может иметь скрытые стимулы для публикации исследований, подтверждающих его преимущества, — так что вы можете предположить, что конфликта интересов нет, потому что исследование посвящено растению, а не какому-то конкретному продукту.

Конфликт интересов нужно внимательно изучать. Не предполагайте, что его нет как само собой разумеющееся; его нет только потому, что о нем не сообщается, но при этом не предполагается, что они обязательно повлияют на результаты, если эти результаты есть.

В поисках правды

Как мы описывали в разделе «Демография», результаты исследования редко применимы ко всем. Например, первые исследования глутамина проводились на пострадавших от ожогов, у которых из-за травмы наблюдается дефицит этой аминокислоты. Последующие исследования показали, что люди, не страдающие дефицитом глутамина, не получат тех же положительных результатов, что и жертвы ожогов.

Преднамеренный выбор определенной демографической группы имеет смысл для исследователей, которые ищут способ помочь конкретной категории пациентов, но это также может быть стратегией продвижения определенных результатов, поэтому нередко новые «жиросжигатели» продвигаются исследованиями, в которых участвуют только женщины с избыточным весом в постменопаузе. Сначала это уточнение не включается в аннотацию, затем журналисты пропускают раздел «Методы» (или даже все исследование), и читатели в итоге оказываются в заблуждении.

Не верьте, что СМИ читают исследование целиком. Исследование, в котором оценивалось качество доказательств диетических рекомендаций, приведенных в национальных газетах Великобритании, показало, что от 69% до 72% заявлений о пользе для здоровья были основаны на недостаточных или неполных данных. Чтобы уложиться в сроки, перегруженные работой журналисты часто полагаются на пресс-релизы исследований, которые нередко не дают точного обобщения результатов исследований.

В заключение следует отметить, что заменить самостоятельное прочтение исследований невозможно, поэтому, если вы сомневаетесь, перечитайте раздел «Методы», чтобы лучше оценить его сильные стороны и потенциальные ограничения.

Зачем вам целая команда?

Изучение и оценка даже одного исследования может занять много времени, порой на это может уйти несколько часов. Знание основ оценки исследований очень важно, но надо понимать и то, что у людей есть своя жизнь. Ни у кого нет столько времени, чтобы хватило прочитать все новые публикуемые исследования; кроме того, некоторые исследования могли бы принести пользу, если бы их прочли профессионалы из различных областей знаний.

Обладая учеными степенями в области общественного здравоохранения, физической культуры, кинезиологии, питания, фармакологии, токсикологии, микробиологии, молекулярной биофизики, биомедицины, нейробиологии, химии и многого другого, члены нашей команды являются аккредитованными экспертами с очень разным опытом, так что, когда мы вместе изучаем результаты исследований, то получаем полную картину. У каждого из нас есть собственная сеть знакомств, к которой мы обращаемся всякий раз, когда нам нужно связаться с лучшими специалистами в той или иной области.

Профессионалы, чья жизнедеятельность зависит от получения ими достоверной информации, доверяют Examine.com. Благодаря нашему сайту они остаются в курсе последних исследований в области питания; они доверяют нам изучать каждое исследование, доверяют нашей предельной тщательности и способности четко, кратко и точно представлять сведения о научных трудах. Но даже если вы не являетесь медицинским работником, то сможете извлечь выгоду из Examine.com. Посетите наш сайт (и прочитайте сотни бесплатных статей) или прочтите одно из наших практических руководств (о фитнесе, кето-диете, молочной сыворотке и многом другом).

Базовый
чек-лист

В данном
руководстве мы рассмотрели многое, поэтому предлагаем вам простой список
вопросов, который будет под рукой всякий раз, когда вы решите изучить научную
работу, посвященную питанию.

В чем
суть главной гипотезы? (На какой вопрос пытается ответить данное исследование?)

Указана
ли в исследовании четко и ясно его структура?

— К какому типу
относится данное исследование?

— Как долго длилось
исследование?

— Какими были
первичные и вторичные референсные точки?

Если
это клиническое исследование, то сможете ли вы сделать о нем все необходимые
выводы по сопроводительной информации к статье?

— Было ли оно
рандомизированным? Как именно?

— Было ли оно
слепым? Было ли оно одинарным, двойным или тройным?

— Какое лечение
было проведено? (Имеются ли достаточные сведения о том,
какое лечение получали и не получали экспериментальная и контрольная группы?)

Какие
демографические группы изучались?

— Какой размер
выборки? (Сколько участников были включены?)

— Были ли четко
определены условия включения в исследование или исключения участников?

— Как именно
производился набор участников исследования?

Что
показал анализ?

— Как много людей
были исключены в каждой группе?

— Были ли
результаты статистически значимы?

Применимы
ли результаты к реальной жизни?

— Были ли
результаты клинически релевантны?

— К кому может быть
применимо данное исследование на основании изученной демографической выборки?

— Были ли дозировки
реалистичными?

Были ли какие-либо побочные эффекты или
нежелательные явления?

— Если да, то
насколько они были выражены?

— Если да, то как
часто они встречались?

Какими
были основные источники возможной необъективности?

— Выбывали ли
участники из групп равномерно? Почему?

— Следовала ли
экспериментальная группа указаниям?

— Было ли
исследование предварительно зарегистрировано, чтобы избежать исключения данных?

— Были ли конфликты
интересов? Какие?

Оригинал:
http://v6.examinecdn.com/learn/2015-ERDStudyGuide.pdf

Межтекстовые Отзывы

Посмотреть все комментарии

Нет ничего, что заменит обучение один-на-один, когда вы пытаетесь чему-то научиться.

поэтому данные функции могут и должны брать на себя профессионалы фитнеса, к которым люди обращаются именно с целью укрепления здоровья…