Училище за науки за живота и здравето, Университет Астън, Бирмингам, Великобритания

използва

Кореспонденция: Ричард А. Армстронг

Училище за науки за живота и здравето, Университет Астън, Бирмингам, Великобритания

Кореспонденция: Ричард А. Армстронг

Резюме

Предназначение

Корекцията на Bonferroni регулира вероятността (стр) стойности поради повишения риск от грешка тип I при извършване на множество статистически тестове. Рутинното използване на този тест е критикувано като вредно за стабилна статистическа преценка, тестване на грешната хипотеза и намаляване на вероятността от грешка от тип I, но за сметка на грешка от тип II; въпреки това остава популярен в офталмологичните изследвания. Целта на тази статия е да изследва използването на корекцията на Bonferroni в изследователски статии, публикувани в три оптични списания, т.е. Очна и физиологична оптика, Оптометрия и наука за зрението, и Клинична и експериментална оптометрия, и да предоставя съвети на авторите, които обмислят множество тестове.

Последни открития

Някои автори пренебрегват проблема с многократното тестване, докато други използват метода безкритично, без обосновка или дискусия. Разнообразни методи за коригиране стр са използвани стойности, като методът Bonferroni е най-популярният. Bonferroni се използва при различни обстоятелства, най-често за коригиране на експерименталната честота на грешки при използване на множество „т’Тестове или като a след хок процедура за коригиране на семейната степен на грешка след дисперсионен анализ (anova). Някои цитирани изследвания са коригирани стр стойности неправилно или са дали грешна обосновка.

Обобщение

Дали да се използва корекцията на Bonferroni зависи от обстоятелствата на изследването. Той не трябва да се използва рутинно и трябва да се има предвид, ако: (1) един тест на „универсалната нулева хипотеза“ (Ho), който всичко не са необходими тестове, (2) е императив за да се избегне грешка от тип I и (3) се провеждат голям брой тестове без предварително планирани хипотези.

Въведение

Корекцията на Bonferroni, кръстена на италианския статистик Карло Bonferroni (1892–1960), се основава на метод, предложен първоначално от Neyman и Pearson 1, за да подпомогне решенията в проучвания, включващи повтарящи се извадки. В съвременните изследвания обаче процедурата често се използва за коригиране на вероятността (стр) стойности при извършване на множество статистически тестове във всеки контекст и тази употреба се дължи главно на Дън. 2 Той се превърна в популярен метод и се използва широко в различни експериментални контексти, включително: (1) сравняване на различни групи на изходно ниво, (2) изучаване на връзката между променливите и (3) изследване на повече от една крайна точка в клинични изпитвания. 3, 4 В допълнение, корекцията на Bonferroni може да се използва за коригиране на честотата на грешки при „експериментиране“ и „по семейство“ при множество сравнения. Експериментално коригиране на грешки е мястото, където се извършват голям брой независими тестове, като се използват основни статистически процедури като „Студенти“ („т’) Или коефициента на корелация на Пиърсън (‘r’) И всички тестове са включени. 5 За разлика от това, коригирането на грешки в рамките на семейството се случва, когато по-малък брой свързани груповите средства се сравняват често след a след хок процедура след анализ на дисперсията (anova) 6-11 (известен също като Bonferroni след хок тест).

където ‘α’ е критичното стр ниво ит’Е броят на извършените тестове. На практика коригирано ниво на значимост на α /т се използва като приближение към (1). Следователно корекцията на Bonferroni се прилага към стр стойности, свързани с всеки индивидуален тест за поддържане на нивото на α над всичко тестове при 0,05.

Целта на тази статия е да направи преглед на използването на корекцията Bonferroni при офталмологични изследвания през последните 10 години и да предостави някои статистически съвети за авторите, извършващи клинични проучвания, които могат да включват тестване на множество хипотези. Първо, настоящата практика при използването на Bonferroni и други видове корекции се преразглежда с позоваване на статии, публикувани в три оптични списания, а именно. Офталмологична и физиологична оптика (OPO), оптометрия и зрителни науки (OVS) и клинична и експериментална оптика (CXO). Второ, дава се статистически съвет за използването на корекцията на Bonferroni в два статистически контекста: (1) коригиране на експерименталната честота на грешки при извършване на множество тестове, включващи проста процедура като „т' или 'r’И (2) коригиране на степента на семейни грешки след anova .

Методи

Списания

Всички статии, в които е използвано множество статистически тестове на данни и които са публикувани в OPO, OVS, и CXO в периода 2003–2013 г. бяха прегледани. Бяха направени две претърсвания за разследване: (1) честотата на корекция на стр стойности по всеки наличен метод (термини за търсене: „многократно тестване“, „след хок“Тестове) и (2) специфичното използване на настройката на Bonferroni (термини за търсене:„ корекция на Bonferroni “,„ настройка на Bonferroni “,„ Bonferroni след хок тест'). Разгледани са два въпроса във връзка с разгледаните статии: (1) дали статията е коригирана стр стойности за намаляване на шанса за грешка от тип I, използвайки някой от наличните методи и предоставяне на обосновка за използвания метод (Търсене 1), и (2) правилно ли е изследването прилага Bonferroni и предостави ли подходяща обосновка и/или дискусия на неговото използване (Търсене 2)?

Анализ на данни

Разликите в разпределението на честотите между категориите бяха сравнени между трите списания (общо за години), използвайки тестове за таблица за извънредни ситуации хи-квадрат (χ 2).

Резултати

Анализът на проучванията, които включват множество статистически тестове по всеки наличен метод, е показан в Таблица 1. От 142 прегледани статии 47 (33%) не са коригирали стр стойности за множество сравнения. От 95 (67%) статии, които са правилни стр стойности, девет (9%) предоставиха ясна обосновка за използването му, т.е. за да се избегне грешка от тип I, докато 86 (91%) не предоставиха ясна обосновка или дискусия. Нямаше разлики в тези пропорции в трите списания (= 1,58, стр = 0.81). Корекцията на Bonferroni е приложена специално в 51 (36%) статии, други видове корекции като метод Bonferroni-Holm, стандартна формула на Abbott, процент на фалшиво откриване, метод на Hochberg или алтернативен консервативен след хок процедура, като тест на Scheffé, който се използва в останалата част. Нямаше значителни разлики в тези пропорции в трите изследвани списания (= 2,44, стр = 0,30).

Вестник категории OPO CXO OVS Общо
Корекция/Обосновка
Без корекция 17 9 21. 47
Поправка, обосновка 2 3 4 9
Корекция, без обосновка 30 15 41 86
Метод
Бонферони 14. 9 28 51
Други 35 18. 38 91
  • Сравнение на списания (Корекция/обосновка: = 1,58 (стр = 0,81).
  • Сравнение на списания (Метод: = 2,44 (стр = 0,30).

Делът на проучванията, при които е дадена или ясна обосновка, и/или последиците от корекцията на Bonferroni в сравнение с тези, при които не е очевидна такава дискусия, е показан в Таблица 2. От 187 прегледани статии 133 (71%) предоставиха малко или никакво обсъждане, докато 54 (29%) предоставиха някаква рационалност и/или дискусия за метода. От статиите, които предоставиха някаква дискусия, 36 (19%) обсъдиха нейното значение за намаляване на грешка от тип I, две (1%) обсъдиха възможността за грешка от тип II, шест (3%) обсъдиха уместността на корекцията на Bonferroni и реши да не се приспособява стр стойности и осем (4%) дадоха неправилна обосновка за използването му. От 187 прегледани статии 72 (39%) изрично посочват стр стойност, използвана за преценка на статистическата значимост. От тях 34 (47%) цитират коригираните стр стойност правилно, докато 38 (53%) продължават да цитират това стр = 0,05 се използва като критерий за изпитване дори след корекция. Нямаше значителни разлики в тези пропорции между трите списания (Discussion/Rational = 11.67, стр = 0,31; Котировка на стр стойност = 4.80, стр = 0,09).

Вестник категории OPO CXO OVS Общо
Дискусия/Обосновка
Няма дискусия 50 32 51 133
Дискусия, грешка от тип I 12 9 15 36
Дискусия, грешка тип II 2 0 0 2
Дискусия, без корекция 4 0 2 6
Дискусия със и без корекция 1 0 1 2
Погрешна обосновка 6 0 2 8
Коригирано стр
Правилно цитиран 7 6 21. 34
стр = 0,05 цитирано 1 9 28 38
  • Сравнение на списания: (Дискусия/Обосновка: = 11,67 (стр = 0,31).
  • Оферта за коригирана стр (= 4,80 (стр = 0,09).

Дискусия

Бяха прегледани голямо разнообразие от клинични проучвания в оптометрията и редица съвременни практики за корекция стр стойности при извършване на множество тестове е идентифициран. Разнообразни методи за коригиране стр бяха използвани стойности, включително Hochberg, 16 Greenhouse-Geisser, 17 процент на фалшиви открития, 18 формулата на Abbott, 19 или „ръководство за изразяване на несигурност в измерването“, 20 но методът Bonferroni беше най-популярният. В допълнение, най-голямото еднократно използване на тези методи беше като след хок процедура, следваща anova 6-8 и нейните варианти, включително анализ на ковариацията (ancova), 21 и многовариантната anova (manova). 22.

В разгледаните проучвания бяха идентифицирани два основни проблема. Първо, твърде много проучвания не успяха да отговорят на проблема с множество тестове, а именно. възможността за допускане на грешка от тип I и много малко проучвания са разгледали неговото последствие, т.е. нарастващият риск от грешка от тип II, ако е приложена корекция. Освен това няколко проучвания разгледаха проблема, но след това взеха решение да не се коригират стр стойности. 23-26 Някои автори сравняват резултатите както от коригирането, така и от коригирането стр стойности 22, като по този начин потенциално усложнява интерпретацията на данните. Второ, когато проблемът с многократното тестване беше решен чрез прилагането на Bonferroni или еквивалентен метод, имаше твърде много проучвания, в които не беше предоставена обосновка за неговото използване или обсъждане на неговите ефекти.

Самата корекция на Bonferroni беше приложена към голямо разнообразие от статистически процедури, най-често като след хок тест след anova 6-8 или когато е многократно ‘т’Тестове 27-30 и на Пиърсън‘r’31-34 бяха наети. Също така се използва за коригиране на непараметрични тестове като тест на Ман-Уитни, 35 тест на Уилкоксън, 36, 37 тест на Крускал-Уолис, 38, 39 хи-квадрат (χ 2) тест за непредвидени обстоятелства, 40, 41 и 2 × 2 точен тест на Fisher. 42, 43 По-рядко се използва в проучвания, включващи регресия и множествена регресия, 29, 44, 45 или в проучвания, включващи коефициент на вътрешнокласова корелация (ICC), 46 и рядко се използва за тестване на доброто съответствие на данните със статистическите модели като модел на Rasch или нормалното разпределение. 47, 48 Прилагането на корекция на Bonferroni към поредица от тестове за добро съответствие не би било препоръчително, тъй като намаляването на шанса за грешка от тип I би увеличило грешка от тип II, т.е. увеличаване на шанса някои набори от данни да фалшиво отговарят на модела.

Заключителни бележки и съвети

Като се имат предвид описаните проблеми и опасенията, повдигнати от Pernerger 12, какъв е подходящият статистически съвет за авторите, които планират множество статистически тестове? Както е посочено от Streiner и Norman 3, коригирането или не коригирането зависи от обстоятелствата на изследването.

  1. Не се препоръчва корекция при следните обстоятелства:
    • ако изследването е ограничено до малък брой планирани сравнения. 3, 61
    • ако изследването е изследователско, включващо след хок тестване на непланирани сравнения, които се разглеждат като хипотези за по-нататъшно разследване.
    • ако многократно използване на прост тест като „т' или 'rСе предвижда, ако това са резултатите от индивидуален тестове, които са важни. Вместо това, точното стр стойностите за всеки отделен тест трябва да бъдат цитирани и обсъдени по подходящ начин.
    • ако е наложително да се избягва грешка от тип II.
  2. Трябва да се обмисли корекция на Bonferroni, ако:
    • единичен тест на „универсалната нулева хипотеза“ (Ho), че всичко не са необходими тестове.
    • наложително е да се избягва грешка от тип I.
    • провеждат се голям брой тестове без предварително планирани хипотези в опит да се установят някакви резултати, които могат да бъдат значими. 3
  3. Ако се изисква корекция, но оригиналната процедура на Bonferroni се счита за твърде консервативна, тогава възможна алтернатива е използването на методите Bonferroni-Holm 62 или Hochberg 63. И двете са коректни за честотата на семейните грешки, използват последователно тестване и са по-малко консервативни от оригиналния метод на Bonferroni. И при двата метода, стр стойностите за различните тестове се класират от ниска към висока, т.е., представляващи най-голямата до най-малко значимата разлика. За метода на Bonferroni-Holm със сравнения от 1 до т и стр = 0,05 като ниво „α“, ако е най-значимото стр164 За разлика от тях методът на Хохберг тества най-големите стр стойност (стрт) първо. Ако стрт64
  4. Във всички проучвания, включващи множество тестове, изследователите трябва ясно да опишат дизайна на своето изследване, включително дали се предвижда конкретно тестване на хипотези или генериране на хипотези, да предоставят обосновка за избора си на корекция или не стр стойности, обосновете избрания метод, ако стр Стойностите се коригират и офертите се коригират стр стойности правилно.

Разкриване

Авторът не съобщава за конфликт на интереси и няма собственически интерес към нито един от материалите, споменати в тази статия.

Биография

Ричард А. Армстронг е получил образование в King's College London и St. Catherine's College Oxford. Бил е лектор по ботаника, микробиология, екология, неврология и оптика през 36-те си години в Астън. Неговите научни интереси включват невропатологията на невродегенеративните заболявания със специално позоваване на зрението и зрителната система. Той също така има особен интерес от прилагането на статистически методи в научните изследвания.