Допринесе еднакво за тази работа с: Павел Матула, Мартин Машка

точността

Настоящ адрес: Botanická 68a, 602 00 Бърно, Чехия

Партньорски център за биомедицински анализ на изображения, Факултет по информатика, Университет Masaryk, Бърно, Чехия, Департамент по молекулярна цитология и цитометрия, Институт по биофизика, Академия на науките на Чешката република, Бърно, Чехия

Допринесе еднакво за тази работа с: Павел Матула, Мартин Машка

Партньорски център за биомедицински анализ на изображения, Факултет по информатика, Университет Масарик, Бърно, Чехия

Партньорски център за биомедицински анализ на изображения, Факултет по информатика, Университет Масарик, Бърно, Чехия

Партньорски център за биомедицински анализ на изображения, Факултет по информатика, Университет Масарик, Бърно, Чехия

Лаборатория за образна диагностика на рак, Център за приложни медицински изследвания, Университет на Навара, Памплона, Испания

Партньорски център за биомедицински анализ на изображения, Факултет по информатика, Университет Масарик, Бърно, Чехия

  • Павел Матула,
  • Мартин Машка,
  • Дмитрий В. Сорокин,
  • Петър Матула,
  • Карлос Ортис-де-Солорцано,
  • Михал Козубек

Фигури

Резюме

Цитат: Matula P, Maška M, Sorokin DV, Matula P, Ortiz-de-Solórzano C, Kozubek M (2015) Измерване на точността на клетъчното проследяване въз основа на сравнение на ациклично ориентирани графики. PLoS ONE 10 (12): e0144959. https://doi.org/10.1371/journal.pone.0144959

Редактор: Томас Ейбрахам, Пенсилвания, държавен колеж по медицина Hershey, САЩ

Получено: 25 май 2015 г .; Прието: 26 ноември 2015 г .; Публикувано: 18 декември 2015 г.

Наличност на данни: Всички релевантни данни се намират в хартията и нейните поддържащи информационни файлове. Повече информация можете да намерите тук: www.codesolorzano.com/celltrackingchallenge/.

Финансиране: Тази работа беше подкрепена от Чешката научна фондация (GA14-22461S за Петр Матула и 13-07822S за Павел Матула), Европейския социален фонд и чешкото министерство на образованието (CZ.1.07/2.3.00/30.0009 за ММ, Чехия. 1.07/2.3.00/30.0030 за DVS) и испанското министерство на икономиката и конкурентоспособността (DPI2012-38090-C03-02 за COS). Финансистите не са играли роля в дизайна на проучването, събирането и анализа на данни, решението за публикуване или подготовката на ръкописа.

Конкуриращи се интереси: Авторите са декларирали, че не съществуват конкуриращи се интереси.

Въведение

Крайъгълният камък на много съвременни експерименти с образи на живи клетки е способността автоматично да се проследява и анализира подвижността на клетките в микроскопични изображения с интервал от време [1, 2]. Клетъчното проследяване е съществена стъпка в разбирането на голямо разнообразие от сложни биологични процеси като имунния отговор, ембрионалното развитие или туморогенезата [3].

Автоматизираното проследяване на клетките може да бъде формулирано като проблем за идентифициране и сегментиране на всички желани клетъчни събития и описване на техните временни връзки в интервала от време. Тъй като клетките могат да мигрират, да претърпят деление или клетъчна смърт, да се сблъскат или да влязат и да напуснат зрителното поле, алгоритъмът за проследяване на клетки, подходящ за ежедневна практика, трябва надеждно да адресира всички тези събития и да предостави структура от данни, която напълно да характеризира поведението на проследяваните обекти, които могат да бъдат или цели клетки, или клетъчни ядра в зависимост от приложението.

Съвременните подходи за проследяване на клетки могат да бъдат класифицирани най-общо в две категории [4]: ​​проследяване чрез откриване [5–9] и проследяване чрез развитие на модела [4, 10–13]. Предишната парадигма обикновено включва две стъпки. Първо, алгоритъмът за сегментиране на клетка или клетъчно ядро ​​идентифицира всички целеви обекти в цялата серия от времеви интервали поотделно за всеки кадър. Второ, откритите обекти са свързани между последователни кадри, обикновено чрез оптимизиране на вероятностна целева функция. За разлика от това, последната парадигма решава и двете стъпки едновременно, обикновено използвайки или параметрични, или неявни активни контурни модели.

Независимо от конкретния използван алгоритъм, резултатите от проследяването му могат да бъдат математически представени с помощта на ациклично ориентирана графика. Върховете на такава графика съответстват на откритите обекти, докато нейните ръбове съвпадат с временните отношения между тях. Неразделящите се обекти имат най-много един наследник, докато тези, които се подлагат на разделяне, имат два или дори повече наследници в случай на необичайно разделяне. Резултатите от проследяване на клетъчните линии, представени от ациклично ориентирана графика, образуват гора от дървета в терминологията на теорията на графовете.

С нарастващия брой алгоритми за проследяване на клетки има естествено търсене на обективни сравнения на тяхната ефективност. Като цяло има два аспекта на алгоритмите за проследяване на клетки, които си струва да бъдат оценени: точност на сегментиране и точност на проследяване. Първият характеризира способността на алгоритъма да идентифицира прецизно пикселите (или вокселите), заети от обектите в изображенията. Това обикновено води до сравнение на референтни и изчислени региони въз основа на тяхното припокриване или разстояния между техните контури [14, 15]. Точността на проследяването оценява способността на алгоритъма да открива правилно отделни обекти от интерес и да ги следва във времето.

Има два популярни подхода за измерване на точността на проследяване. Единият подход се основава на съотношението на напълно реконструираните писти към общия брой наземни писти [4, 16]. Вторият изчислява съотношението на правилните времеви отношения в реконструираните писти към общия брой временни отношения в рамките на следите на земята-истината [16, 17]. И двата подхода количествено определят в различен мащаб колко добре алгоритмите за проследяване на клетките са в състояние да реконструират конкретна референтна земна истина. Те обаче нито санкционират откриването на фалшиви песни, нито отчитат събития от разделянето, които често се оценяват отделно [4, 16].

В областта на компютърното зрение беше създадена цялостна рамка за оценка на ефективността на алгоритмите за откриване и проследяване [18]. Независимо от това, той е насочен само към топологично стабилни обекти, като човешки лица, текстови полета и превозни средства. Следователно, той не може да бъде приложен към приложения за проследяване на клетки, тъй като проследяваните обекти могат да се разделят с течение на времето или да изчезнат след претърпяна клетъчна смърт. По същия начин друга рамка за оценка [19], създадена за сравняване на ефективността на методите за проследяване на частици, не отчита събитията на разделяне, изключвайки способността му да оцени правилната реконструкция на клетъчната линия.

В тази статия ние предлагаме мярка за точност на проследяване, която наказва всички възможни грешки в резултатите от проследяването и ги обединява в една стойност. Мярката оценява трудността на трансформирането на изчислена ациклично ориентирана графика в дадена референтна основа на истината. Такава трудност се измерва като претеглена сума от най-малкия брой графични операции, необходими, за да се направят графиките идентични.

Предложената мярка може да служи не само на разработчиците на алгоритми, но и на анализатори, за да изберат най-подходящия алгоритъм и да настроят неговите параметри по отношение на всички проследяващи събития чрез оптимизиране на един критерий. Типичен сценарий е да се създаде истината на земята и да се оценят потенциалните алгоритми върху част от данните за изображението и да се остави най-подходящият алгоритъм да работи върху останалата част от тях. Наскоро в [20, 21] е предложен алтернативен начин за сравняване на ефективността на алгоритмите, без да е необходима основна истина. Този подход обаче създава класирането въз основа на двойно сравнение на алгоритмите и следователно абсолютната ефективност на алгоритмите остава неизвестна.

Материали и методи

Предложената неточностно измерване на точността на проследяване на клетките

Основната цел на предложената мярка е да се оцени способността на алгоритмите за проследяване на клетки да откриват всички желани обекти и да ги следват навреме. Въпреки че не оценява пряко точността на сегментираните региони, надеждното откриване на обект е много важен фактор и в тази мярка.

Всъщност мярката отчита броя на всички откривания, както и свързващи грешки, извършени от алгоритъма. Той отчита броя на пропуснатите обекти (FN - фалшиви отрицания), броя на допълнително откритите обекти (FP - фалшиви положителни резултати) и броя на пропуснатите разделяния (необходими за правилно сегментиране на клъстери, NS). Имайки тези три броя грешки, можем да ги обобщим в едно число като претеглената сума wNS NS + wFN FN + wFP FP с неотрицателни тегла wNS, wFN и wFP. Способността на алгоритъма да идентифицира правилно времевите връзки между обектите се оценява чрез преброяване на броя на грешките при свързването на обекти. А именно, той отчита броя на липсващите връзки (EA), броя на излишните връзки (ED) и броя на връзките с грешна семантика (EC). Тези числа отново се обобщават в едно число като претеглената сума wEA EA + wED ED + wEC EC с неотрицателни тегла wEA, wED и wEC. Теглото е наказание за отделни видове грешки и може, например, да отразява ръчните усилия, необходими за коригиране на грешките в даден конкретен софтуер.

Броят на извършените грешки може да се изчисли чрез преброяване на разликите между референтната земна истина и изчисления резултат, където всеки може да бъде математически представен чрез ациклично ориентирана графика. От изчислителна гледна точка критична част от предложената мярка е съществуването на уникален начин за сдвояване на референтни и изчислени обекти (т.е. графични върхове). За тази цел сдвояваме референтен обект с изчислен, ако и само ако последният покрива по-голямата част от първия, което гарантира уникалността на установеното сдвояване и по този начин просто изчисление без никаква оптимизация. Интересното е, че такъв прост тест не съществува за проблема с проследяването на частиците, където частиците се считат за обеми, което прави подобна процедура за оценка изчислително неизпълнима.

В останалата част на този раздел е въведена основната терминология и обозначения, необходими за установяване на връзка между резултатите от проследяване на клетъчната линия и ациклично ориентирани графики, а предложената мярка е официално определена.

Основна терминология и нотация

Всяка четворка може директно да се трансформира в ациклично ориентирана графика G = (V, E), където набор от върхове V е съставен от всички маркери, присъстващи в пътеки θi ∈ Θ и набор от ориентирани ръбове E ⊂ V × V представлява времеви връзки между маркерите. По-точно, двойка е ръб на графика G тогава и само ако i = j ∧ t2 = t1 + 1 или. В първия случай ръбът свързва два последователни маркера в рамките на една писта, докато крайният маркер на θi е свързан с първоначалния на θj във втория случай. По-нататък ние наричаме първия ръб като връзка към пистата, а втория като родителска връзка. Върху множеството ребра E дефинираме функция, описваща семантиката на ръб e ∈ E, както за връзки към писта, така и за връзки родител. Обърнете внимание, че ориентацията на ръбовете следва възходящото времево подреждане на маркерите вътре, както и между песните, което осигурява ацикличност на графиката G. Пример за графика G е изобразен на фиг. 1.