Глава 1. Методология оценки эффективности лечебных мероприятий.

Традиционный стиль написания руководств и монографий предусматривает последовательное изложение этиологии, патогенеза, клинической картины и средств диагностики. Только после этого, вооружив читателя теоретическими, клиническими и инструментальными данными, авторы обычно переходят к принципам лечения. Казалось бы, что может быть логичнее? Но логичные методы лечения часто оказываются неэффективными или даже опасными для больных, поэтому мы начнем эту книгу, посвященную вопросам лечения ЧМТ, нетрадиционно – с методологии оценки эффективности лечебных мероприятий. Иными словами, мы начнем с конца – с вопроса: «Как правильно оценить эффективность лечения?» После этого вернемся к этиологии и патогенезу, необходимым средствам диагностики, рассмотрим все теоретически возможные способы лечения. Затем на основе научно обоснованного анализа отберем только те методы терапии, эффективность которых доказана. Опираясь на них, мы закончим нашу работу практическими алгоритмами интенсивной терапии ЧМТ.

Слово «методология» только на первый взгляд кажется заумным и высоконаучным. На самом деле, в приложении к процессу врачевания, это очень простое и важное понятие. Методология описывает процесс получения и критического анализа информации об эффективности лечения. Этот процесс может опираться на ощущения, теоретические представления, изменения в клиническом состоянии пациента и данные, полученные в ходе специально подготовленных и проведенных исследований. Именно последний подход, называемый доказательной медициной, заслуживает пристального внимания.

В чем смысл доказательной медицины – «evidence based medicine»? Самое главное – в осознании необходимости данных доказательных исследований. Нужно понять, что доказательная медицина – это не мода. Прошло то время, когда принципы лечения различных патологических состояний зависели только от мнения авторитетных исследователей и врачей. Врачебное сообщество внимательно прислушивалось к этому мнению и, в зависимости от убедительности авторитетов, использовало в практической деятельности. Чем же современных врачей перестал устраивать этот веками отработанный подход? В основном своей субъективностью. Конечно, нельзя лечить без теоретических предпосылок и клинического опыта. Однако чтобы полученные результаты оказались не субъективным мнением увлеченного человека, а объективной реальностью, их эффективность должна быть подтверждена в рамках сравнительных исследований, удовлетворяющих определенным требованиям.

Каким же требованиям должны соответствовать исследования, результаты которых можно рассматривать в качестве руководства к действию? Наиболее важным требованием является правильная организация (дизайн) (Ф. Флетчер и соавт., 1998). С точки зрения дизайна различают следующие типы клинических исследований: экспериментальные (или контролируемые, с преднамеренным вмешательством) и обсервационные (рис. 1.1). В экспериментальных исследованиях (в смысле организации исследований, а не использования лабораторных животных) исследователь может контролировать или манипулировать тем фактором, влияние которого на исход болезни подлежит изучению и анализу. При отсутствии такой возможности исследования относятся к обсервационным. Несмотря на очевидное преимущество экспериментальных исследований к обсервационным не следует относиться свысока. Хорошо организованное обсервационное исследование является более информативным, чем плохо выполненное экспериментальное.

Все экспериментальные исследования являются проспективными. Обсервационные исследования могут быть проспективными и ретроспективными. Проспективные исследования предпочтительнее ретроспективных из-за большей точности сбора информации. По дизайну обсервационные исследования делятся на одномоментные (которые также называют поперечными) и продольные, или лонгитудинальные (т.е. проводимые на протяжении определенного временного интервала). К поперечным обсервационным исследованиям относятся описание случая, исследование серии случаев, к продольным – исследование типа «случай-контроль», а также когортное исследование. Исследование «случай-контроль» представляет собой ретроспективную оценку различий группы пациентов с той или иной болезнью (случай) и без этой болезни (контроль). Когортное исследование позволяет производить проспективное наблюдение за выделенной группой населения (когортой).

Экспериментальные исследования обязательно используют как минимум две группы пациентов: основную, которая подвергается изучаемому способу лечения, и контрольную, в которой лечение проводят по общепринятым стандартам. В качестве контроля может служить и сам больной до лечения. Основная (экспериментальная) и контрольная группа могут меняться местами по ходу исследования. Такой перекрестный дизайн позволяет уменьшить различия между группами больных, однако увеличивает вероятность ошибок из-за изменений патологического процесса во времени (рис. 1.2). В контролируемых исследованиях должны соблюдаться следующие условия:

•Четкое обозначение и соблюдение критериев включения и исключения больных из исследования
•Математически обоснованный способ рандомизации.
•Правильный выбор критериев исхода болезни.
•Корректное использование статистических методов обработки данных.

Критерии включения и исключения из исследования необходимо четко формулировать. Они должны иметь однозначное толкование. Это обеспечивает возможность проверки результатов работы и понимание, имеют ли результаты исследования отношение к тем больным, которых читающий статью специалист лечит в повседневной практике. Обязательным условием хорошо спланированного экспериментального исследования является проведение рандомизации. Дословный перевод английского слова "random" означает "сделанный или выбранный наугад, случайный". Под рандомизацией понимают процедуру, обеспечивающую случайное распределение больных между экспериментальной и контрольной группами. Рандомизация является вторым этапом исследования, проводимым после того, как больной включен в испытание. Случайное или рандомизированное разделение не является синонимом беспорядочного, при котором процесс разделения не поддается математическому описанию. Рандомизация считается плохо организованной при разделении больных на группы по номеру истории болезни, страхового полиса или дате рождения. Лучше всего пользоваться таблицей случайных чисел, методом конвертов или путем централизованного компьютерного распределения вариантов лечения.

Исследования могут быть одноцентровыми или многоцентровыми. В одном лечебном учреждении за короткий срок очень трудно сформировать выборку, однородную по всем признакам, поэтому в испытания часто включаются несколько клиник (многоцентровые исследования). Рандомизированные исследования также могут быть открытыми и «слепыми» (маскированными) (табл. 1).

Дизайн открытых и слепых контролированных исследованийТабл. 1. Дизайн открытых и слепых контролированных исследований

Открытым испытание считается в том случае, если и пациент, и врач сразу после проведения рандомизации узнают о том, какой вид лечения будет применен. При слепом исследовании больному не сообщается о виде применяемого лечения. Этот момент обговаривается с пациентом заранее при получении информированного согласия на исследование. В случае недееспособности пациента информированное согласие необходимо получить у его представителей (обычно близких родственников). Информированное согласие предполагает полное разъяснение больному всех возможных преимуществ и недостатков участия в исследовании, прав и обязанностей врача и пациента. Эта процедура предполагает, что больной получит все необходимые средства лечения независимо от согласия или несогласия участвовать в исследовании. Объем медицинской помощи не изменится и в том случае, если пациент решит прекратить участвовать в исследовании после первоначального согласия. Врач узнает, какой вариант лечения получит больной, после процедуры рандомизации. При выполнении двойного слепого исследования ни врач, ни пациент не знают, какой из видов лечения используется в конкретном случае. В тройном слепом исследовании о типе вмешательства не знают ни больной, ни врач, ни исследователь (статистик), обрабатывающий собранные данные.

Результаты нескольких рандомизированных исследований по какой-либо проблеме можно объединять. Количественный анализ объединенных результатов нескольких клинических испытаний одного и того же вмешательства называют метаанализом. За счет увеличения размера выборки при метаанализе обеспечивается большая статистическая мощность, чем в каждом отдельном испытании. Однако некорректно проведенный метаанализ может вводить в заблуждение из-за недостаточной сопоставимости групп больных и условий проведения лечения в различных исследованиях (В.В. Власов, 2001).

Необходимо остановиться на статистике, при применении которой чаще всего встречаются серьезные ошибки (С. Гланц, 1999). Часто исследователи нечетко представляют, какие статистические критерии должны быть использованы при разном дизайне исследований. Характерным примером является использование критерия Стьюдента при сравнении нескольких групп друг с другом без поправки на так называемый «эффект множественных сравнений». В результате получаются «странные» результаты, которые, впрочем, не смущают исследователей. Нередко приходится сталкиваться со следующими выводами: исследуемый показатель недостоверно отличается между первой и второй группами больных, недостоверно – между второй и третьей, а вот между первой и третьей различия достоверны (рис. 1.3). Согласно здравой логике такого результата быть не должно, однако при неправильном использовании статистических методов - возможно. Корректным в этой ситуации является использование не критерия Стьюдента, а дисперсионного анализа (ANOVA).

Распространенной ошибкой является статистический анализ различий между группами, выделенными из всей популяции обследованных пациентов уже после получения результатов.

Типичный пример
При введении лекарственного средства X результаты лечения в основной группе не отличаются от контрольной. Однако если оценивать результаты лечения только пациентов мужского пола в возрасте от 30 до 40 лет, то при введении этого средства они выздоравливают быстрее. Казалось бы, можно сделать вывод, что данное лекарство следует применять у молодых мужчин.

Такой подход отражает тенденциозность исследователей, их стремление получить определенные результаты. Его использование приводит к ошибочным заключениям, так как желание исследователей подтвердить эффективность того или иного метода лечения заставляет их интуитивно подбирать сравниваемые группы больных. С точки зрения статистики, положительные результаты лечения в группе больных, выделенной постфактум, могли выявиться случайно. Это не значит, что так вовсе нельзя поступать. Просто после подобного анализа необходимо новое отдельное исследование для проверки полученных различий, в котором группы больных будут выделены до проведения лечения.

В нашем случае нужно провести исследование эффекта введения лекарственного средства X при условии, что и в контрольной, и в основной группе будут только мужчины в возрасте от 30 до 40 лет.

Современные возможности дисперсионного анализа и его программное обеспечение позволяют корректно планировать исследование, в котором сравнивают лечение разными методами нескольких групп больных, со значительной экономией времени и средств.

Обычным является незнание о существовании ошибок первого и второго рода. Чаще всего авторы рассчитывают ошибку первого рода (α-ошибку). В медицинских исследованиях при величине этой ошибки меньше 5% (обычное обозначение р < 0,05) можно быть уверенным в наличии достоверных различий между экспериментальной и контрольной группами. Многие исследователи уверены, что при величине α–ошибки, равной или большей 5%, группы больных ничем не отличаются и методы лечения не имеют преимущества друг перед другом. Это не так. Для суждения об отсутствии достоверных различий между группами необходим расчет ошибки второго рода (β-ошибки). Величина этой ошибки в медицинских исследованиях должна быть меньше 20%. Этого достичь часто удается только при значительном числе обследованных больных, поэтому не найденные в большинстве работ различия объясняются недостаточным количеством наблюдений.

Типичный пример
В контрольной группе пострадавших с тяжелой ЧМТ летальность составляет 40%. Исследователь считает, что если в результате лечения летальность в экспериментальной группе снизится на 10%, то эффект лечения можно считать существенным. Если изучаемый метод очень эффективен, то может понадобиться обследование всего 40-50 больных, летальность которых снизится на искомые 10%, и разница между основной и контрольной группами будет признана достоверной (α-ошибка менее 5%, р <0,05). Но если в такой выборке пациентов искомого эффекта не наблюдается, то это не всегда значит, что метод не влияет на летальность. Величина α-ошибки более 5% (р> 0,05) свидетельствует только о недостаточном количестве обследованных больных. Для достоверного вывода об отсутствии эффективности лечения и, следовательно, отсутствии достоверных различий между основной и контрольными группами нужно, чтобы величина β-ошибки была менее 20%. Согласно законам статистики, для этого понадобится обследование около 350 пациентов.

Если исследователь считает существенным для клинической практики еще меньший эффект лечения, например, снижение летальности не 10%, а на 5%, то для того, чтобы достичь в этом случае величины β-ошибки менее 20%, понадобится обследовать в три раза больше пациентов.

В настоящее время в мировой практике золотым стандартом считаются рандомизированные контролируемые (проспективные) испытания с двойным или тройным слепым контролем, результаты которых корректно обработаны статистическими методами (табл. 2). Эти исследования относятся к I классу. Материалы таких испытаний и данные метаанализа, корректно проведенного на основе исследований I класса, должны использоваться в медицинской практике в качестве источников наиболее достоверной информации. Методы лечения, эффективность которых доказана в исследованиях I класса, обязательны для использования в клинической практике. Верно и обратное. Методы, неэффективность которых доказана в этих исследованиях, должны быть исключены из практической деятельности.

Классы исследований в зависимости от их качества и достоверности результатовТабл.2. Классы исследований в зависимости от их качества и достоверности результатов

Хорошо спланированные открытые экспериментальные исследования, а также обсервационные проспективные и ретроспективные работы относятся ко II классу. При известной доле критичности результаты этих испытаний могут применяться на практике. Исследования, в организации которых допущены значительные ошибки, а также работы, описывающие случаи из практики и серии случаев, относятся к III классу. Результаты этих исследований нужно использовать только в качестве информации к размышлению.

Сложнее выработать позицию в отношении методов, эффективность которых не доказана. Для ряда способов лечения этого просто не нужно делать. Например, это касается использования антибиотиков при лечении септических осложнений. Но есть огромное количество фармакологических препаратов, методов лечения, инструментальных средств, рациональность которых нуждается в доказательстве. Нельзя их безоглядно использовать только потому, что интуитивно они кажутся безупречными. В истории медицины в целом и реаниматологии, в частности, есть масса примеров, когда подобный подход вместо пользы наносил только вред больному.

Показательным примером являются результаты исследований по эффективности антиаритмического средства флекаинида в качестве средства вторичной профилактики внезапной смерти после перенесенного инфаркта миокарда. Предпосылки для испытаний были вполне логичными: аритмии являются причиной внезапной смерти после инфаркта миокарда, флекаинид эффективно их купировал. Однако многоцентровое исследование с использованием препарата пришлось прервать из-за того, что летальность в экспериментальной группе была больше, чем в контрольной. При детальном рассмотрении свойств флекаинида оказалось, что он, кроме антиаритмического эффекта, сам по себе вызывал аритмии (A.E. Epstein et al., 1989).

Проблемы, возникшие при анализе результатов цитированного исследования, объясняются выбором критериев эффективности (исходов лечения). Эти критерии делят на косвенные (суррогатные) и прямые (табл. 3). К косвенным критериям относят положительные изменения какого-либо исследуемого показателя (например, нормализацию артериального давления, сердечного выброса, уровня биологических субстанций в крови, восстановление активности ферментов и т.п.). К прямым критериям эффективности относят выздоровление, снижение летальности и числа осложнений, сокращение срока госпитализации, улучшение качества жизни.

Примеры прямых и косвенных исходовТабл.3. Примеры прямых и косвенных исходов

К сожалению, большинство исследований посвящено оценке суррогатных исходов. В качестве еще одного примера можно привести изучение уровня внутричерепного давления при ЧМТ. Высоко оценивая значение этого показателя для исхода повреждения мозга, нужно подчеркнуть, что врача больше интересует не уровень внутричерепной гипертензии, а исход ЧМТ. Исследование эффективности профилактической гипервентиляции для лечения внутричерепной гипертензии показало, что метод снижал внутричерепное давление, но имел негативное влияние на исход повреждений мозга (J.P. Muizelaar et al., 1991).

Приведенные факты не означают, что на суррогатные критерии не надо опираться совсем. Громоздкость и высокая стоимость исследований первого класса не позволяет проверить таким образом все методы лечения. В связи с этим во многих случаях врач должен ориентироваться и на суррогатные критерии, и на исследования второго класса, а также на теоретические предпосылки, коллективный опыт и собственную практику. В таких ситуациях основу действий врача составляют постоянная оценка состояния больного и получаемых инструментальных данных (мониторинг в широком смысле слова). Критический анализ лечебных действий, готовность к их коррекции при неэффективности лечения является традицией отечественной медицины, следуя которой можно избежать ошибок. При получении доказательных данных, даже противоречащих традиционным представлениям, нужно быть готовым изменить свою позицию.

В нашей работе основное внимание уделено лечебным концепциям, которые опираются на данные, полученные в рамках доказательной медицины. При отсутствии таких данных мы обратимся к традиционному для российской медицины подходу – оценке лечебных мероприятий с точки зрения их клинической эффективности. Необходимые для осуществления этой постоянной оценки средства диагностики и мониторинга мы подробно рассмотрим.