Резюме

ОБЕКТИВЕН Затлъстяването е все по-често срещано заболяване, което предразполага към няколко медицински състояния, включително диабет тип 2. Изследвахме дали големите и редки вариации на броя на копията (CNV) разграничават умереното до екстремното затлъстяване от субектите, които никога не са с наднормено тегло.

вариации

ПРОЕКТИРАНЕ И МЕТОДИ НА ИЗСЛЕДВАНИЯТА Използвайки масиви от единичен нуклеотиден полиморфизъм (SNP), направихме проучване на CNV за целия геном на 430 пациенти със затлъстяване (ИТМ> 35 kg/m 2) и 379 субекти с наднормено тегло (BMI 2). Всички субекти са от европейски произход и са генотипизирани върху масивите Illumina HumanHap550 с ∼550 000 SNP маркери. Обажданията за CNV са генерирани от софтуера PennCNV.

РЕЗУЛТАТИ Установено е, че CNVs> 1 Mb са свръхпредставени в случая спрямо контролните субекти (съотношение на шансовете [ИЛИ = 1,5 [95% CI 0,5–5]), а CNVs> 2 Mb са налице при 1,3% от пациентите, но не са отсъствали при контролни субекти (ИЛИ = безкрайност [95% CI 1,2 – безкрайност]). Когато се фокусира върху редки делеции, които нарушават гените, се наблюдават още по-изразени размери на ефекта (OR = 2,7 [95% CI 0,5–27,1] за CNVs> 1 Mb). Интересното е, че пациентите със затлъстяване, които носят тези големи CNV, имат умерено висок ИТМ и не изглежда да са екстремни случаи. Няколко CNV разрушават известни гени-кандидати за затлъстяване, като делеция от 3.3 Mb, нарушаваща NAP1L5 и делеция от 2.1 Mb, нарушаваща UCP1 и IL15.

ЗАКЛЮЧЕНИЯ Нашите резултати показват, че големите CNV, особено редки делеции, създават риск от затлъстяване при пациенти с умерено затлъстяване и че гените, засегнати от големи CNV, представляват интригуващи кандидати за затлъстяване, които налагат допълнително проучване.

Затлъстяването се превърна в най-често срещаното здравословно разстройство в света. Затлъстяването предразполага към множество заболявания, особено диабет, и се изчислява, че продължителността на живота може да намалее в следващото поколение като резултат (1). Многобройни проучвания показват, че телесното тегло и затлъстяването са силно повлияни от генетични фактори, като оценките за наследственост са в диапазона 65–80% (2). Въпреки това, единичните генни мутации са доста редки и общите вариации (например в FTO [3] и MC4R [4]) представляват малък процент от фамилния риск. Последните широкомащабни метаанализи на проучвания за асоцииране в целия геном (GWAS) идентифицират шест допълнителни гена, които се свързват с ИТМ, но всичките осем гена колективно обясняват само 0,84% от вариацията на ИТМ в човешки популации (5). Следователно е малко вероятно разширяването на размера на извадката в GWAS да идентифицира често срещани варианти с големи размери на ефекта.

Изследването на вариациите на броя на копията (CNV) предлага нова представа за генетичната архитектура на често срещаните и сложни човешки заболявания. CNV се определят като хромозомен сегмент, чийто брой на копията варира в зависимост от индивидите в популацията (6). Съобщава се, че повтарящи се CNV, като 16p11.2 заличавания, представляват 0,7% от случаите на болестно затлъстяване (7). В допълнение, няколко доклада демонстрират, че големи и редки CNV се свързват колективно с шизофрения (8–10), екстремно затлъстяване в началото (11) и вариация в ИТМ (12).

В настоящото проучване ние изследвахме потенциалната роля на редки варианти при затлъстяване, като направихме сравнителен анализ на CNV на пациенти със затлъстяване и контролни субекти, които бяха генотипирани от масиви с единичен нуклеотиден полиморфизъм Illumina (SNP). Пациентите с казус са имали умерено до екстремно затлъстяване и контролните субекти никога не са имали наднормено тегло. Въпреки че размерът на извадката ни изключва окончателното идентифициране на специфични CNV/гени, които се асоциират със затлъстяването, ние демонстрираме, че големи, но редки CNV, като група, са колективно свързани със затлъстяването. Освен това идентифицирахме предварително замесени гени-кандидати за затлъстяване в някои от тези големи и редки CNV, което ги прави особено привлекателни за допълнителни последващи изследвания и функционални анализи.

ПРОЕКТИРАНЕ И МЕТОДИ НА ИЗСЛЕДВАНИЯТА

Затлъстели случаи и контролни субекти.

Субектите в случая са били със затлъстяване (ИТМ ≥35 kg/m 2) с ИТМ през целия живот> 40 kg/m 2. Избрани са независими контролни субекти, които имат BMI на ток и за цял живот ≤25 kg/m 2. Всички случаи и контролни субекти, които са участвали в настоящото проучване, са били част от предишно генно проучване кандидат (13). Характеристиките на пробите са обобщени в Таблица 1 за 430 случая и 379 контролни субекта, преминали контрол на качеството. Средната възраст при настъпване на затлъстяването е била 12 години, а 90% са имали начало преди 26-годишна възраст. Всички субекти дадоха информирано съгласие и протоколът беше одобрен от комисията по проучвания с участието на хора в университета в Пенсилвания.

Примерни характеристики на изследваните субекти в проучването CNV

SNP генотипиране.

ДНК се извлича от пълнокръвни или лимфобластоидни клетъчни линии, използвайки метод с високо съдържание на сол, и се генотипизира върху масивите на Illumina HumanHap550 SNP (Illumina, Сан Диего, Калифорния). За обработка на сигналите за генотипиране са използвани стандартни процедури за нормализиране на данни на Illumina и канонични файлове за клъстериране на генотип. Всички субекти и контролни субекти са преминали мерки за повикване (> 95%) и са били генетично установени, че са от европейски произход, въз основа на многоизмерен анализ на мащабиране (допълнителна фигура 1 в онлайн приложението, достъпно на http: //diabetes.diabetesjournals. org/cgi/content/full/db10-0192/DC1).

CNV повикване.

Използвайки съотношението log R и честотата на алела B за всички маркери, повикванията на CNV са генерирани от софтуера PennCNV (Версия 2009Aug27) (14). Процедурата за контрол на качеството е описана подробно в допълнителна фиг. 2. Отстранихме проби с ниско качество на стойностите на интензитета на сигнала, така че останалите проби да имат съотношение log R 50 kb), обаждания в имуноглобулиновите региони и обаждания в центромерни региони и теломерни области (100 kb в началото или края на хромозомите). Припокриващите се гени или екзони за повиквания на CNV бяха анотирани с помощта на програмата scan_region.pl, базирана на анотация на ген RefSeq (15). Съставихме набор от общи CNV региони (cCNVR), които се срещат с честота> 1%, и след това класифицирахме повикването CNV като често срещано или рядко от програмата scan_region.pl: ако> 50% от повикването на CNV се припокрива с cCNVR, тя се нарича обща CNV. Сравнението на броя на повикванията на CNV в случая спрямо контролните субекти беше извършено чрез t тест, докато сравнението на проби от фракции с големи CNV беше извършено чрез точния тест на Fisher.

РЕЗУЛТАТИ

CNV повикване и контрол на качеството.

За да се изследва дали CNV представляват генетични рискови фактори за затлъстяването, ние анализирахме повиквания за CNV при 430 случая със затлъстяване и 379 контролни субекта, които бяха генотипирани от масиви SNP на Illumina и преминаха мерки за контрол на качеството за анализ на CNV. Характеристиките на извадката бяха описани в таблица 1. Първо сравнихме общите характеристики на повикванията на CNV между субекти и контролни субекти. Броят на CNV на субект не се различава между пациентите и контролните субекти (5,8 ± 3,3 срещу 6,0 ± 3,1, P = 0,35). Броят на геноразрушаващите CNV на субект е сходен в случая спрямо контролните субекти (3,8 ± 3,1 срещу 4,2 ± 2,7, P = 0,07). По същия начин броят на екзоничните CNV на субект е сходен в случая спрямо контролните субекти (3,2 ± 2,9 срещу 3,6 ± 2,6, P = 0,06). Съставихме списък с често срещани региони на CNV и установихме, че 38,2% от повикванията на CNV могат да бъдат класифицирани като редки CNV. Броят на редки CNV на субект не се различава между пациентите със затлъстяване и контролните субекти (2,3 ± 2,4 срещу 2,2 ± 1,8, P = 0,41).

Големите CNV са свръхпредставени при пациенти със затлъстяване.

След това извършихме сравнителен анализ на повикванията на CNV, стратифицирани по техните размери, често срещано/рядко състояние и състояние на заличаване/дублиране. Интересното е, че с нарастващите прагове на размера, наблюдаваме по-силна тенденция на асоцииране (съотношение на шансовете [OR]) между CNV и затлъстяване (Таблица 2). Подобно на предишните доклади в случаи на шизофрения (8), открихме, че 5/427 (1,2%) от пациентите, които са в случая, но никой от контролните субекти не носи CNV> 2 Mb (ИЛИ = безкрайност [95% CI 1,16 до безкрайност]), Р = 0,04). Честотата на пациентите със затлъстяване, носещи CNV> 2 Mb, в нашето проучване е подобна на Kirov et al. проучване (16) (6 от 471, 1,3%) и Need et al. проучване (8) (14 от 1013, 1,4%) за случаи на шизофрения. Сред пет CNVs> 2 Mb, наблюдавани в нашето проучване, три са заличавания и две са дублирания. Изброихме всички 16 CNVs> 1 Mb за случаите и контролните субекти в Таблица 2, а моделите на интензитета на сигнала са предоставени в допълнителна фиг. 3 като визуално средство за валидиране. Също така оценихме дали големите и редки генно-разрушаващи делеции CNVs са склонни да се обогатяват в случаите спрямо контролните субекти. Не е изненадващо, че НОР за присвояване на риск от затлъстяване са дори по-високи за тази група CNV (2.7 [0.47–27.1] за> 1 Mb CNV, безкрайност за> 2 Mb CNV) (Таблица 2), въпреки че това не достига статистическа значимост поради редкия характер на събитията.

Честота на случаите и контролните субекти, носещи CNV, надвишаващи определени прагове за размер

Множество големи и редки CNV нарушават гените-кандидати за затлъстяване.

Кандидат-гени, засегнати от големи CNV, уникални за затлъстели пациенти. О: CNV на хромозома 4 е делеция от 3,3 Mb, която нарушава отпечатания ген NAP1L5, за който е доказано, че влияе върху раждането и телесното тегло на възрастни. B: CNV на хромозома 4 е делеция от 2,1 Mb на регион, съдържащ два кандидат-гена, UCP1 и IL15. За всяка CNV бяха показани съответните съотношение log R и честота B алел за всички маркери (като сини точки). Делециите се проверяват чрез намалено съотношение log R и липсата на хетерозиготни SNP в стойностите на честотата на B алела.

Описание на CNVs> 1 Mb в случаите и контролните субекти

Изследване на съобщени преди това затлъстяване CNV.

Наскоро беше съобщено за връзка между ИТМ и хромозома 10q11 CNV в китайска кохорта (12). Наблюдавахме трима пациенти с казус, носещи този CNV (BMI 36, 41 и 43 kg/m 2, съответно), но той не присъства при контролните субекти. Два гена в този регион са GPRIN2 и PPYR1, които са достойни за последващи проучвания в по-големи проби. Освен това наскоро се съобщава, че силно проникваща делеция на 16p11.2 е свързана със затлъстяване (7,11). В нашите данни един затлъстял субект (BMI 44,9 kg/m 2) носи това заличаване, а един контролен субект (BMI 19,1 kg/m 2) носи реципрочното дублиране. Следователно нашите данни са в съответствие с възможността изтриването на 16p11.2 да е свързано със затлъстяване.

ДИСКУСИЯ

В настоящото проучване ние изследвахме пробна колекция от пациенти със затлъстяване и пациенти с наднормено тегло и намерихме силна подкрепа, че големите и редки CNV допринасят за затлъстяването. Като цяло, OR за големи CNV, наблюдавани в нашето проучване, е по-висок от често срещаните SNPs, идентифицирани в GWAS (например OR за FTO е 1,3 [3] и за MC4R при тежко детско затлъстяване е 1,3 [4]), което предполага, че редки CNV може да представлява повече проникващи рискови фактори за затлъстяване.

Едно интересно значение на нашето изследване е свързано с хипотезата на генетичната архитектура на затлъстяването. Въпреки че е добре известно, че затлъстяването е резултат от множество генетични рискови фактори, както и от фактори на околната среда, не е ясно какви и колко генетични рискови фактори са включени. Наскоро GWAS идентифицираха няколко гена за затлъстяване, но те колективно обясняват само малка част от междуиндивидуалните различия в затлъстяването (5). Следователно, въпреки че по-често срещаните варианти на чувствителност могат да бъдат идентифицирани чрез увеличаване на размера на извадката, е много малко вероятно те да представляват значителна част от генетичния риск. От друга страна, нашето проучване предполага, че редки варианти с много по-високи OR също могат да допринесат за риск от затлъстяване. Като се има предвид рядкото естество на CNV, не можахме да разберем коя от тези големи CNV е наистина причинна за затлъстяването, така че някои по-малко проникващи или безпричинни големи CNV ще разреждат размерите на ефекта. Следователно, наблюдаваните размери на ефекта за големи CNV могат да представляват подценяване на истинския размер на ефекта на причинните CNV за затлъстяване.

Друго интересно значение е как количествената генетика е свързана с фенотипите на заболяванията. Колко различни алели, включително алели със скромен ефект и алели с основен ефект, могат да взаимодействат, за да оформят представянето на заболяването, не е добре проучено. Що се отнася до затлъстяването, въпреки че FTO представлява най-силният ген в много проучвания за асоциации, той никога не е бил замесен от изследвания на моногенни форми на затлъстяване. По същия начин, въпреки че MC4R е замесен в моногенни форми на затлъстяване, анализът на често срещаните варианти е бил много непоследователен, докато не се проведат широкомащабни GWAS (4). Следователно е вероятно редки алели да работят заедно с общи алели, за да оформят началото на затлъстяването в човешките популации и че някои гени с редки причинно-следствени алели може никога да не се появят от проучвания върху често срещани варианти.

В заключение установихме големи, но редки CNV, представляващи основни рискови фактори за затлъстяването. Някои от тези големи CNV обхващат известни гени за затлъстяване или потенциални кандидат-гени за последващи изследвания. По-нататък нашите резултати предполагат, че изследванията на моногенни форми на сложни нарушения, изследвания на често срещани варианти при GWAS и изследвания на CNV представляват три допълващи се подхода за изследване на генетичната основа на сложни заболявания.

ПРИЗНАВАНИЯ

Тази работа беше подкрепена отчасти от Националните здравни институти R01DK44073, R01DK56210 и R01DK076023 (на R.A.P.) и грант за развитие на учени (0630188N) от Американската асоциация по сърдечни заболявания (на W.D.L.). Генотипирането в целия геном е финансирано отчасти с награда за институционално развитие на Центъра за приложна геномика (на H.H.) от Детската болница във Филаделфия.

Не са докладвани потенциални конфликти на интереси, свързани с тази статия.

К.В. проучи данни и написа ръкописа. W.-D.L. изследва данни и редактира ръкописа. J.T.G., S.F.A.G. и H.H. генерират данни за генотипа и допринасят за дискусията. R.A.P. проектира проучването, събра проби и редактира ръкописа.

Благодарим на всички случаи и контролни субекти, дарили кръвни проби за целите на генетичните изследвания.