Роли Куриране на данни, формален анализ, методология, писане - оригинален проект

риск

Принадлежности Дала Лана Училище за обществено здраве, Университет в Торонто, Торонто, Онтарио, Канада, Институт за клинични оценъчни науки, Торонто, Онтарио, Канада

Роли Формален анализ, методология, софтуер

Принадлежност Дала Лана Училище за обществено здраве, Университет в Торонто, Торонто, Онтарио, Канада

Роли Формален анализ, Методология

Принадлежности Dalla Lana School of Public Health, University of Toronto, Toronto, Ontario, Canada, Public Health Ontario, Toronto, Ontario, Canada

Концептуализация на роли, официален анализ, разследване, методология, надзор, писане - преглед и редактиране

Принадлежности Dalla Lana School of Public Health, University of Toronto, Toronto, Ontario, Canada, Institute for Clinical Evaluative Sciences, Toronto, Ontario, Canada, Public Health Ontario, Toronto, Ontario, Canada

  • Майкъл Лебенбаум,
  • Освалдо Еспин-Гарсия,
  • Yi Li,
  • Лора С. Росела

Фигури

Резюме

Заден план

Като се има предвид драматичното нарастване на разпространението на затлъстяването, е необходимо по-голямо внимание върху превенцията. Ние се стремихме да разработим и утвърдим инструмент за популационен риск за затлъстяване за информиране на усилията за превенция.

Методи

Разработихме инструмента за риск от затлъстяване на населението (OPoRT), използвайки надлъжното национално проучване на здравето на населението и обобщените уравнения за оценка на пола, за да предскажем 10-годишния риск от затлъстяване сред възрастни на 18 и повече години. Моделът е валидиран, използвайки начален подход, отчитащ дизайна на проучването. Ефективността на модела се измерва чрез статистиката на Brier, дискриминацията се измерва чрез C-статистиката и калибрирането се оценява с помощта на Hosmer-Lemeshow Goodness of Fit Chi Square (HL χ 2).

Резултати

Прогнозиращите фактори включват изходен индекс на телесна маса, възраст, време и техните взаимодействия, статус на тютюнопушенето, начин на живот, образование, консумация на алкохол, физическа активност и етническа принадлежност. OPoRT показа добро представяне за мъже и жени (Brier 0,118 и 0,095, съответно), отлична дискриминация (C статистика ≥ 0,89) и постигнато калибриране (HL х 2 70 kg/m 2), тези, които са бременни или липсват ИТМ на изходно ниво, и тези с липсващи изходни данни за моделни ковариати.

Анализ

Ние проектираме модела, така че да може да се приложи към рутинно събрани проучвания на населението и по този начин бяха включени само променливи, които бяха на разположение на изходно ниво и последователно се събираха в проучванията на населението. Оценихме включването на времето, изходния ИТМ, възрастта, семейното положение, условията на живот, статуса на тютюнопушене, физическата активност в свободното време, образованието, еквивалентните квинтили (доход, коригиран според размера на домакинството), етническата принадлежност, имиграционния статус, статуса на селските райони, консумацията на алкохол и собствеността на домакинствата. И базовият ИТМ, и възрастта бяха тествани в непрекъснати и категорични спецификации, а взаимодействията бяха оценени между времето, базовия ИТМ и възрастта. Като се има предвид пристрастието в самоотчетения ИТМ, ние приложихме утвърдено уравнение за корекция на ИТМ към всички анализи [17]. Добавихме променливи последователно, контролирайки променливите, които вече са в модела, въз основа на важността, определена от предходни проучвания, и маргинална прогноза (Brier Score, C статистика и Hosmer Lemeshow Goodness of Fit Chi Square (HL χ 2)) и статистическа значимост.

Като се има предвид седем последващи цикъла, разработването на модела беше проведено с помощта на логистична регресия с обобщени изчислителни уравнения (GEE) с процедурата GENMOD в SAS (Версия 9.3). Тези модели по подходящ начин моделират надлъжни двоични данни, като използват матрица за корелация, за да отчетат групирането на наблюдения в рамките на индивиди във времето [18]. Освен това, като се има предвид, че наборите данни OPoRT ще се прилагат само за изходни данни, маргинален модел (т.е. GEE) е за предпочитане пред смесен подход на модела. Оценихме целесъобразността на редица корелационни матрици, включително независимост, неструктурирана, авторегресивна (AR) (1) и заменяема. Като се има предвид концептуалната целесъобразност и разумно калибриране, бяха избрани корелационни матрици AR (1). Тъй като GEE са маргинални модели, прогнозите съответстват на средния прогнозен риск за даден индивид със специфични характеристики.

Проверка

Ние валидирахме нашите данни вътрешно, използвайки данни от 10-годишно проследяване (2005–6, NPHS цикъл 7), използвайки стандартни критерии за валидиране за разработване на модели за прогнозиране на риска. Оценихме цялостната ефективност на модела с оценката на Brier, мярка, равна на сумата от квадратното отклонение на прогнозата от наблюдаваната стойност, разделена на общия размер на извадката [19]. Тя варира от 0–1, като 0 представлява перфектни прогнози и стойност от 0,33 или по-голяма, показваща произволна способност за предсказване [19]. Умножихме отклоненията в квадрат по теглото на изследването и го разделихме на общото тегло на извадката, за да изчислим претеглена оценка на Brier. Като се има предвид, че стойността на оценката на Brier зависи от разпространението на резултата, ние мащабираме оценката на Brier с нейната максимална стойност, така че стойностите варират от 0–1 [19]. Оценихме калибрирането с помощта на Hosmer Lemeshow Goodness of Fit Chi Square (HL χ 2 тест) [19,20]. Тестът HL χ 2 е мярка за цялостното прилягане на статистически модел, който сравнява съгласието между наблюдавания и прогнозирания риск между децилите на прогнозирания риск [19]. В съответствие с други модели за прогнозиране на риска, включително оценката за риска на Framingham, използвахме HL χ 2 стойност Таблица 1. Описателни характеристики на кохортата на изходно ниво.

Функциите на OPoRT за пола за мъже и жени са представени в Таблица 2. Най-силните предиктори за затлъстяване са измерванията на изходния ИТМ, изходната възраст, затлъстяването и времето. И двете уравнения включват всички тези променливи и взаимодействия между тях. Установено е, че непрекъснатият ИТМ и възрастта водят до най-голямото представяне на модела, оценено по бриерска оценка и c-статистика. Установено е, че статутът на пушене и начинът на живот са важни предиктори за двата пола. Променливите, специфични за пола, включват всяко образование след средното образование и статус на непиене за мъжете и физическо бездействие и етническа принадлежност за жените.

Характеристиките за валидиране за всеки модел са представени в Таблица 3. Цялостната ефективност на двата модела, измерена чрез оценката на Brier, е добра и калибрирането на моделите, измерено чрез Chi Square на Hosmer-Lemeshow (HL χ 2), е приемливо. Междувременно дискриминацията, измерена чрез c-статистиката на двата модела, е отлична. Моделите и за двата пола се представят по подобен начин при валидирането на bootstrap, като оптимизмът коригира статистическите данни, равняващи се на 0,118 за мъжете и 0,095 за жените. Като се имат предвид ограниченията за освобождаване на малки размери на клетките, забранени освобождаването на участъци от децили с прогнозен спрямо наблюдаван риск, бяха използвани калибриращи графики, за да се демонстрира изгладената връзка между прогнозирания и наблюдавания риск. Както е показано на фигури 1 и 2, графиките за калибриране също демонстрират отлично калибриране с тясно съгласие между прогнозираните и наблюдаваните рискове както за мъже, така и за жени.

За мъжете ограничаването на валидирането на модела до индивиди, които не са със затлъстяване на изходно ниво, води до намаляване на резултатите от Brier (мащабиран бриер) до 0.108 (0.251) и c-статистиката намалява до стойност до 0.837, а калибрирането остава приемливо (HL χ 2 = 5,98, р = 0,649). При жените ограничаването на валидирането до индивиди, които не са със затлъстяване на изходно ниво, води до намаляване на ефективността на Brier (мащабиран бриер) до 0,083 (0,291) и c-статистиката намалява на стойност до 0,85, а калибрирането остава приемливо (HL χ 2 = 13,23, p = 0,104). Примерно изчисление, показващо как се оценява 10-годишен (т.е. 5 цикъла) риск, е включено в S1 Text.

Дискусия

Това проучване предоставя първия пример за инструмент за предсказване на популационен риск, който може да се приложи за оценка на бъдещия риск от затлъстяване въз основа на множество рискови фактори, редовно достъпни в проучванията на здравето на населението. Установено е, че инструментът за риск от затлъстяване (OPoRT) е дискриминационен и демонстрира добро цялостно представяне и калибриране, с високо съгласие между наблюдаваните и прогнозираните стойности. Този инструмент представлява нов подход за оценка на риска от затлъстяване, който може да се използва за информиране на политиката на общественото здраве за превенция на затлъстяването.

Въпреки използването на променливи, ограничени до проучвания на популацията, оценката на Brier на модела демонстрира разумни резултати във вътрешното валидиране. Резултатите от вътрешните валидирания в данните за развитието често се наричат ​​очевидна валидност на модела, което може да бъде оптимистично, тъй като те са валидирани в същия източник на данни, използван за изграждане на модела [24]. Като се има предвид това, проведохме валидиране на bootstrap, което демонстрира подобен оптимизиран коригиран резултат на Brier. Моделът имаше висока дискриминация, вероятно поради силната връзка между изходния ИТМ и бъдещото затлъстяване. Моделите за прогнозиране на риска за други състояния, включително хипертония и диабет, също демонстрират подобна висока дискриминация, тъй като те обикновено включват подобни изходни мерки, свързани със състоянието, като кръвно налягане за хипертония или плазмена глюкоза на гладно за диабет [25,26].

Моделите за прогнозиране на риска обикновено моделират честотата на заболяванията и индивидите със състоянието на изходно ниво са изключени от кохортата на развитието. Въпреки това включихме индивиди със затлъстяване на изходно ниво, като се има предвид, че е възможно индивидите със затлъстяване да се върнат към не-затлъстяване и предвиденото приложение на модела за прогнозиране на разпространението. Въпреки че общата производителност и дискриминация са по-ниски, моделът поддържа отлична дискриминация и приемливо калибриране както при мъже, така и при жени сред възрастни, които не са със затлъстяване на изходно ниво.

Други подходи за прогнозиране на бъдещата тежест на затлъстяването включват включване на линейни или нелинейни тенденции във времето за повтаряне на данните от напречното сечение [5,7,8], използване на симулационни методи [6] и прогнозиране на разпространението на затлъстяването с помощта на кохорта [32]. Ограничението на тези минали подходи беше изключително фокусирано на популационното ниво и тези проучвания обикновено не оценяват въздействието на отделни рискови фактори върху бъдещото разпространение на затлъстяването и не оценяват конкретни популации с висок риск, които могат да информират за целенасочени интервенции, свързани със затлъстяването и по този начин ограничават приложението им за информиране на стратегиите за превенция.

Силна страна на това проучване беше използването на 14-годишни данни за няколко периода на събиране, позволяващи подходящо моделиране на дългосрочните тенденции дори при наличие на колебания в телесното тегло във времето. В допълнение, това проучване използва национална и провинциална представителна кохорта, която поддържа високи нива на отговор през целия период на изследване, със степен на отговор от 9-ти цикъл от 69,7% [33]. Също така използвахме енергични показатели за валидиране, за да гарантираме, че моделът е точен за целите на здравното планиране на населението, както и че има широка приложимост, като можем да провеждаме здравни проучвания на населението с променливи, които са широко събрани в световен мащаб.

Заключение

Инструментът за риск от затлъстяване (OPoRT) представлява нов, валиден и точен модел за прогнозиране на риска при затлъстяване. OPoRT демонстрира както добро калибриране, така и отлична дискриминация за прогнозиране на затлъстяването сред населението. Като се има предвид, че затлъстяването е ключов световен фактор за тежестта на хроничните заболявания, борбата с епидемията от затлъстяване се превърна във висок държавен приоритет и спешно е необходима превенция. Чрез характеризиране на риска и разпределението на риска сред населението, инструментите за риск на населението, включително OPoRT, могат да се използват за информиране на здравното планиране, включително определяне на приоритетите на групите за превенция.

Етика: Това проучване получи етично одобрение от Съвета по етика на изследователския университет на Торонто (протокол № 28094)