1 Департамент по статистика, Университетът в Бурдуан, Бурдуан, Западна Бенгалия, Индия

* Автор-кореспондент: Рабиндра Нат Дас
Департамент по статистика
Университетът в Бурдуан, Golapbag
Rajbati, Burdwan, Западна Бенгалия, Индия
Тел: +91-9232638970
Електронна поща: [имейл защитен]

Получено 14 ноември 2017 г. - Прието 24 декември 2017 г.

Резюме

Има малко проучване за обяснителните фактори на серумната алкална фосфатаза (ALP), като се има предвид реалният факт, че тя е ненормална, хетеросцедастична и положителна. Установено е, че реакцията ALP е хетерогенна и не е нормално разпределена. Следователно ALP трябва да се анализира чрез съвместни генерализирани линейни модели (JGLM), а именно гама или Log-нормално [18, 19, 20, 21]. За да се потвърди анализът, настоящият разгледан набор от данни е анализиран, използвайки както гама, така и Log-нормални съвместни генерализирани линейни модели. Установено е, че съвместните Log-нормални модели дават по-добри резултати. И двата резултата от анализа са дадени в статията.

Статията се опитва да знае отговора на следните кариери или хипотези. Какви са обяснителните фактори или детерминанти на серумната алкална фосфатаза (ALP)? По какъв начин обяснителните фактори са свързани с ALP? Какви са функционалните дейности на обяснителните фактори за ALP? Тези кариери или хипотези се оценяват в статията, като се използва реален набор от данни от 583 субекта с 9 непрекъснати променливи и 2 атрибутни знака.

МАТЕРИАЛИ И СТАТИСТИЧЕСКА МЕТОДОЛОГИЯ

Материали

Настоящият доклад разглежда реален набор от данни от 583 субекта с 9 непрекъснати променливи и 2 атрибутни знака. Данните са събрани от североизточната част на Андра Прадеш, Индия. Наборът от данни може да бъде получен от https://archive.ics.uci.edu/ml/machine-learningdatabases/ 00225 /. Изявлението на обяснителните променливи и нивата на атрибутните знаци са дадени в маса 1. Описателните статистически данни като пропорция, средна стойност, нормален диапазон на биохимичните параметри и стандартно отклонение са показани в маса 1. Мъжете са 75,82%, а жените - 24,18%. Чернодробните пациенти (71,5%) са повече от пациентите, които не са чернодробни (28,5%) в дадения набор от данни. Изложението на субекта на субекта и метода за събиране на информация са показани в [22, 23]. Това не е описано отново в доклада.

чернодробни

Статистически методи

Обичайните регресионни модели считат, че дисперсията на отговора (Y) е постоянна в целия диапазон на променливата. Това предположение обаче не винаги е вярно [24]. Като цяло биохимичните данни са разнородни. Например, стойностите на ALP за пациентите с чернодробно заболяване са разнородни. За да се премахне непостоянната дисперсия на набор от данни, обикновено се използва регистрационната трансформация, но на практика хетероскадастичността на набора от данни не винаги може да бъде премахната [24, Таблица 2].

Положителните данни от непрекъснатите променливи с постоянна дисперсия или постоянен коефициент на вариация могат да бъдат анализирани или от Log-нормалното, или от гама моделите [21]. Като цяло физиологичните данни са разнородни, така че тези два модела може да не дават подобни резултати [19, 20, 25, 26, 28]. На практика клас обобщени линейни модели се използва за анализ на ненормални, хетероскедастични и положителни набори от данни. Обикновено средната стойност и дисперсията на променливата на реакцията могат да бъдат свързани в обобщените линейни модели, в резултат на това дисперсията на реакцията може да е неконстантна. За анализ на непостоянни дисперсионни положителни данни yi ’s, Nelder и Lee [28] предлагат да се използват съвместните обобщени линейни модели (JGLM). Подробно обсъждане на JGLM е дадено в [18, 19, 27, 28]. За готов справка тук се възпроизвежда кратко описание на JGLM.

Трансформацията на дневника Zi = log (Yi) се използва за стабилизиране на дисперсията Var. Ако някой се нуждае от по-добри модели, се използва подобрен статистически инструмент. Обикновено дисперсията не може да бъде стабилизирана винаги чрез проста трансформация [24]. Тогава Нелдер и Лий [28] предлагат да се използват JGLM.

За положителната зависима променлива Yi се прилага регистрационната трансформация Zi = logYi. Съвместното моделиране за средната стойност и дисперсията при Log-нормално разпределение се дава от

където xit и git означават съответно, редовите вектори за регресионните коефициенти β (среден модел) и γ (модел на дисперсия).

За положителната зависима променлива yi, ако

където са дисперсионните параметри и е дисперсионната функция. В обобщените линейни модели вариацията има две части. Едната порция зависи от средните стойности. Другата част е σi 2, която не съдържа средни стойности. Функцията на дисперсията идентифицира фамилията на разпространение в GLM. Например разпределението е гама if, Poisson if и Normal if и т.н.

Средните и дисперсионните модели на JGLM са

където g (⋅) и h (⋅) са съответно функциите на GLM връзка за средно и дисперсия, и означават съответно редови вектори за регресионните коефициенти β (среден модел) и γ (модел на дисперсията). За оценка на β (среден модел) се използва метод на максимална вероятност (ML), а за оценка на γ (модел на дисперсия) се използва метод с ограничен ML (REML) [18, 19].

Добре известно е, че серумната алкална фосфатаза (ALP) е биомаркер на черния дроб. По-високи от нормалните нива на ALP (маса 1) в кръвта може да означава проблем с черния дроб или жлъчния мехур. Това може да включва хепатит (инфекция), цироза (белези), рак на черния дроб, камъни в жлъчката или запушване на нашите жлъчни пътища. Статията разглежда ALP като зависима променлива за изследване на хипотезите, както е посочено във Въведение. Отговорът на алкалната фосфатаза в серума е положителен с нестабилна дисперсия и принадлежи към експоненциално семейно разпределение. Следователно, такива данни обикновено се анализират от Log-нормални или гама модели, както е посочено по-горе. За да се потвърдят получените резултати, и двата горни модела се използват за извършване на анализа. Сега ние се интересуваме да проучим следното, като използваме и двата модела. Какви са приблизителните истински модели на ALP за пациенти с чернодробно заболяване? Какви са обяснителните фактори (или детерминанти) на ALP? Какви са ефектите от обяснителните фактори върху ALP? Тези кариери са разгледани в следващите раздели.

Анализ на стойността на алкалния фосфат (ALP), резултати и интерпретации

Анализ: Стойността на алкалния фосфат (ALP) е произволна променлива с непрекъснат положителен отговор, представляваща интерес за статията. Има останали 8 непрекъснати и 2 атрибутни обяснителни променливи. В случай на атрибутни фактори, ние разгледахме ограничението, че ефектите от първите нива са нулеви. Следователно за всеки фактор на атрибута първото ниво се счита за референтно ниво, като се изчислява като нула. Основният ефект на A се обозначава с ai за i = 1, 2, 3. Помислихме, така че. Следователно оценката на ефекта А2 е разликата между второто и първото ниво в основния ефект A.

Фигура 1 (а) представя графика на абсолютните остатъци на монтираните Log-нормални модели (Таблица 2) по отношение на монтираните стойности. Това е права плоска диаграма, което означава, че дисперсията е постоянна при работещите средства. Графиката на нормалната вероятност за монтирания среден модел на Log-нормално прилягане (Таблица 2) е даден в Фигура 1 (б). Няма липса на годност или системно напускане на Фигура 1 (б). Следователно, монтираните Log-нормални модели (Таблица 2) са приблизителни истински модели на ALP.

Фигура 1. За монтираните в нормални за ALP модели на ALP (таблица 2), а). графика на абсолютните остатъци по отношение на монтираните стойности и (b). графика на нормалната вероятност на средния модел