Cnn - Разбиране на графики за обучение и загуба на тестове

bg.waykun.com - Диета и загуба на тегло, днес

Приложих фигура, която съдържа 6 подпартии по-долу. Всеки от тях показва обучение и загуба на тестове през няколко епохи. Само като разгледам всяка графика, как мога да видя коя е най-добрата? Кои са прекалено или недостатъчно. Кои се влошават с всяка епоха?

2 отговора 2

Ако приемем, че влаковите и валидиращите набори в сравняваните криви са еднакви, най-добрата крива е може би тази с най-ниска стойност на загуба при валидиране.

Номерирането на вашите фигури отляво надясно и отгоре надолу, бих казал, че най-добрата е # 5 (втори ред, втора колона).

Сега нека разделим какво се случва във всеки сюжет:

Много високи стойности, на пръв поглед случайни, без никакво намаление нито при загуби от влака, нито при валидиране: моделът не се учи; вероятно има нещо нередно или с модела, или с процеса на оптимизация, или може би някаква стойност на хиперпараметъра е ужасно грешна.

Низходящи стойности както за загуби от обучение, така и за валидиране, като загубата от валидиране има разлика между тренировъчната и двете се стабилизират (т.е. нито една от тях вероятно няма да се понижи - ако се съмнявате в това, оставете им повече време за обучение-): изглежда обучението Добре, но има място за подобрение, ако регламентирате модела си, така че да получите горната си крива на обучение, а валидирането една по-ниска.

Първоначално и двете криви се спускат, след което валидирането започва да се изкачва около стъпка 800: преоборудване. Трябва да опитате да узаконите модела и ако това не е ефективно, използвайте ранно спиране, за да използвате модела, който се представя най-добре на данните за валидиране. Можете също така да опитате с някаква настройка на хиперпараметри или да имате график на скоростта на обучение, който го прави по-малък с времето.

И двете криви се спускат и изглежда, че ще продължат да правят това известно време: обучението не е завършено, оставете го да тренира повече време.

И двете криви се спускат, въпреки първоначалното плато, и достигат ниска точка, без пропуск между кривите на обучение и валидиране: вероятно можете да подобрите инициализацията на теглото на модела. Както и да е, този график изглежда най-добрият, тъй като кривата на валидиране достига най-ниската стойност и няма прекалено подходящо.

И двете криви се покачват: има нещо нередно, вероятно в начина, по който определяте процеса на оптимизиране на функцията си за загуби.

Не виждам ясен случай на недооборудване сред вашите заговори. В сценарий за недостатъчно оборудване ще видим, че моделът научава нещо, но както загубите от обучението, така и валидирането се стабилизират при твърде високи стойности. Това би предполагало липса на капацитет на модела, което му пречи да улови правилно разпределението на данните по отношение на етикетите.

Популярен

Те четат сега

Разбиране на тренировъчни и тестови загуби

2 отговора 2