Юнмей Лу

1 Колеж по компютърни науки и технологии, Университет Дзилин, Чанчун, Дзилин, 130012, Китай

здравните

Янхонг Гао

2 Катедра по клинична биохимия, китайска PLA General Hospital, Пекин, 100853, Китай

Zhongbo Cao

1 Колеж по компютърни науки и технологии, Университет Дзилин, Чанчун, Дзилин, 130012, Китай

Хуан Куи

3 Лаборатория по компютърна системна биология, Катедра по биохимия и молекулярна биология, Университет на Джорджия, Атина, GA, 30602, САЩ

4 Институт по биоинформатика, Университет на Джорджия, Атина, Джорджия, 30602, САЩ

Женнан Донг

2 Катедра по клинична биохимия, китайска PLA General Hospital, Пекин, 100853, Китай

Yaping Tian

2 Катедра по клинична биохимия, китайска PLA General Hospital, Пекин, 100853, Китай

Ин Сю

1 Колеж по компютърни науки и технологии, Университет Дзилин, Чанчун, Дзилин, 130012, Китай

3 Лаборатория по компютърна системна биология, Катедра по биохимия и молекулярна биология, Университет на Джорджия, Атина, GA, 30602, САЩ

4 Институт по биоинформатика, Университет на Джорджия, Атина, Джорджия, 30602, САЩ

Резюме

Заден план

Океанските пътувания на дълги разстояния могат да окажат значително въздействие върху здравето на моряците, евентуално да причинят недохранване и други заболявания. Възможно е да се вземат мерки за предотвратяване на подобни проблеми чрез изготвяне на специална диета и вземане на специални предпазни мерки преди или по време на плаването, ако може да се получи подробно разбиране за това какви специфични ефекти върху здравето могат да имат такива пътувания върху моряците.

Методи

Представяме изчислително проучване върху 200 моряци, използвайки 41 химични показателя, измерени върху техните кръвни проби, събрани преди и след плаването. Нашето изчислително проучване се извършва с помощта на подход за класификация на данните с машинен базиран класификатор на поддръжка във връзка с избор на характеристики, използвайки рекурсивна процедура за премахване на характеристиките.

Резултати

Резултатите от нашия анализ показват, че сред 41-те мерки за химия на кръвта най-вероятно ще бъдат засегнати девет по време на плаването, които дават важни улики за специфичните ефекти на океанското пътуване върху здравето на моряците.

Заключения

Идентифицирането на деветте мерки за химия на кръвта дава важни улики за ефектите от пътуването на дълги разстояния върху здравето на моряците. Тези открития ще се окажат полезни за насочване при подобряване на жизнената и работната среда, както и при приготвянето на храна на корабите.

Заден план

Често са използвани статистически методи за анализиране на здравните ефекти от океанските пътувания на дълги разстояния върху моряци [12,13]; често обаче се установява, че прости статистически методи са недостатъчни за справяне със сложни взаимовръзки между физиологични и психологически функции в изследваните тела на моряци. В тази статия представяме изчислително изследване на този тип проблеми, използвайки подход, различен от традиционните статистически методи. Ние разглеждаме проблема с идентифицирането на ефектите върху здравето на океанските пътувания върху моряци като проблем на класификацията, т.е. да класифицираме мерки за химия на кръвта, които постоянно са засегнати или не от океанското пътуване, и прилагаме контролиран метод на машинно обучение, по-специално поддържащи векторни машини (SVM ), за решаване на проблема с класификацията. Поддържащите векторни машини са широко използвани за проблеми с класификацията и са установени като особено ефективни за откриване на информативни модели на характеристики за малки набори от данни [14].

Идентифицирането на дискриминантни характеристики (напр. Химични мерки на кръвта) сред предварително определени класове обекти е от основен и практически интерес. Чрез идентифициране на връзки, свързващи специфични характеристики (напр. Определени мерки за химия на кръвта) и стойности на характеристиките с определени класове обекти като болести, може евентуално да се добие нова информация за болестта и нейното развитие.

За нашия проблем използвахме метод за избор на характеристика, съвместно с SVM-базиран класификатор, наречен рекурсивно премахване на характеристиките (RFE), за да намерим мерки за кръвна химия, които показват последователни и съществени промени, причинени от океанското пътуване, което отчита взаимните информация между характеристиките в процеса на избор на характеристика. Тази процедура се оказа по-добра от други базирани на корелация методи [14] за решаване на подобни проблеми. Очакваме, че нашите открития, по отношение на идентифицираните мерки за химия на кръвта с най-съществените и последователни промени в морските тела поради океанското пътуване, ще предоставят полезна насочваща информация за приготвяне на храна и прием за моряци по време на океански пътувания и за по-добро проектиране на по-здравословно жизнена и работна среда на кораба.

Методи

Дадена е колекция от данни за химическа химия на M моряци х1, х2. хк, . хm, като всеки xk представлява вектор от 41 мерки за кръвна химия за всеки моряк, преди или след океанското пътуване. Нашата цел е да идентифицираме подмножество от 41 мерки, които показват съществени и последователни промени, причинени от океанското пътуване. Ние формулираме този проблем, както следва. За всеки xk (моряк) в x1, х2. хк, . хm>, присвояваме етикет yk = +1 или -1, за да посочим дали тези данни се измерват преди или след океанско пътуване. Нашата цел за класификация е да намерим дискриминантна функция F (x) върху множеството от 41-размерни вектори, за да отделим най-добре пробите, маркирани с +1, от тези, маркирани с -1. Страничен продукт при решаването на този проблем с класификацията е идентифицирането на подмножество от 41 кръвни мерки, които могат най-добре да разграничат подмножествата от проби с различни етикети, крайната цел на това проучване. По-конкретно, възнамеряваме да намерим линейна дискриминантна функция, както следва:

които могат най-добре да разделят двете подгрупи с различни y етикети на дадените кръвни проби от моряци, където ω е вектор на тежестта и b е стойност на отклонението, която се определя чрез намиране на оптималната дискриминантна функция. За този проблем избрахме да използваме SVM подход, съчетан с RFE процедура, за да намерим оптималната дискриминантна функция F (x), както и подмножество от кръвни мерки, които показват съществени и последователни промени между двете подмножества.

Поддръжка на векторна машина

SVM са клас техники за машинно обучение [15], широко използвани за решаване на класификационни проблеми като нашия проблем. Алгоритъм за класификация, базиран на SVM, конструира разделяща хиперплоскост между два класа извадки от данни като гореспоменатите с различни етикети във входното пространство. Разделителната хиперплан се определя от

а) картографиране на входното пространство в пространство с по-големи измерения чрез функция на ядрото, и

б) конструиране в това пространствено пространство на две хиперплоскости с максимално поле [16] за разделяне на картографираните проби от данни в пространството с по-високи размери.

Целта при обучението на SVM е да се намери разделителна хиперплоскост заедно с две паралелни поддържащи хиперплоскости, по една от всяка страна на разделителната хиперплоскост, които дават възможно най-големи полета на пробите от данни на разделителната хиперплоскост (вж. Фигура Фигура 1) . 1). Както е показано на фигура Фигура 1, 1, маржът е равен на 2/|| ω ||; следователно намирането на хиперплоскостите, които разделят извадките от данни с различни етикети, които имат максимален марж, е еквивалентно на решаването на следния ограничен проблем за оптимизация: