Съобщение за публикуване на данни и покана за участие

i2b2

Втора i2b2 споделена задача и семинар
Предизвикателства при обработката на естествен език за клинични данни
Предизвикателство за затлъстяването (споделена задача за затлъстяването): Кой е затлъстял и какви съпътстващи заболявания имат (определено/вероятно)?

Публикуване на данни: 15 март 2008 г.
Оценка: 23-25 ​​юни 2008 г.
Подаване на хартия: 1 септември 2008 г.
Семинар: 7 ноември 2008 г. във Вашингтон, окръг Колумбия

Организатор: Информатика за интегриране на биологията и нощното шкафче, i2b2, Национален център за биомедицински изчисления

Предизвикателството при затлъстяването е многокласна, многоразмерна класификационна задача, фокусирана върху затлъстяването и неговите съпътстващи заболявания. Данните за предизвикателството се състоят от резюмета на освобождаване от Partners Healthcare. Всички записи са напълно премахнати. Информацията за затлъстяването и съпътстващите заболявания са отбелязани на ниво документ като налични, отсъстващи, съмнителни или неспоменати в документите. За всеки пациент се предоставят както текстови преценки, т.е. това, което в текста изрично се посочва за затлъстяването и съпътстващите заболявания, така и интуитивни преценки, т.е. Целта на предизвикателството е да се оценят системите за способността им да разпознават дали пациентът е със затлъстяване и какви съпътстващи заболявания проявява.

Предизвикателството е отворено за предварителна регистрация на 1 февруари 2008 г. Данните за обучение за предизвикателството ще бъдат публикувани на вноски; първата вноска ще бъде пусната на 15 март 2008 г. Останалите вноски ще последват скоро след това. Данните от теста трябва да бъдат публикувани само за три дни и ще бъдат използвани само за целите на оценката. Резултатите от предизвикателството ще бъдат представени на семинара, организиран от i2b2.

Данните за предизвикателството за затлъстяване ще бъдат публикувани съгласно Споразумението за използване на данни и ще бъдат използвани само за предизвикателството. Получаването на данните изисква попълване на предварителна регистрация и подписване на Споразумението за използване на данни.

Дати за оценка, файлови формати и метрики за оценка.

Оценката на предизвикателството при затлъстяване ще бъде върху данните от теста. Участващите екипи са помолени да спрат разработката веднага щом изтеглят данните от теста. Всеки отбор има право да качва (чрез този уебсайт) до три системни старта. Изходът на системата се очаква под формата на анотации в състояние на противопоставяне, следвайки точния формат на анотациите на основната истина, предоставени от i2b2. Прецизността, изземването и f-мярката ще бъдат използвани като показатели за оценка.

Участниците се приканват да представят кратък доклад, описващ тяхната система и анализиращ тяхното представяне. Документите трябва да са в стил AMIA и да не надвишават пет страници. Автори на най-ефективните системи и на особено нови подходи ще бъдат поканени да представят или демонстрират своите системи на семинара.