Приложих фигура, която съдържа 6 подпартии по-долу. Всеки от тях показва обучение и загуба на тестове през няколко епохи. Само като разгледам всяка графика, как мога да видя коя е най-добрата? Кои са прекалено или недостатъчно. Кои се влошават с всяка епоха?

разбиране

2 отговора 2

Ако приемем, че влаковите и валидиращите набори в сравняваните криви са еднакви, най-добрата крива е може би тази с най-ниска стойност на загуба при валидиране.

Номерирането на вашите фигури отляво надясно и отгоре надолу, бих казал, че най-добрата е # 5 (втори ред, втора колона).

Сега нека разделим какво се случва във всеки сюжет:

Много високи стойности, на пръв поглед случайни, без никакво намаление нито при загуби от влака, нито при валидиране: моделът не се учи; вероятно има нещо нередно или с модела, или с процеса на оптимизация, или може би някаква стойност на хиперпараметъра е ужасно грешна.

Низходящи стойности както за загуби от обучение, така и за валидиране, като загубата от валидиране има разлика между тренировъчната и двете се стабилизират (т.е. нито една от тях вероятно няма да се понижи - ако се съмнявате в това, оставете им повече време за обучение-): изглежда обучението Добре, но има място за подобрение, ако регламентирате модела си, така че да получите горната си крива на обучение, а валидирането една по-ниска.

Първоначално и двете криви се спускат, след което валидирането започва да се изкачва около стъпка 800: преоборудване. Трябва да опитате да узаконите модела и ако това не е ефективно, използвайте ранно спиране, за да използвате модела, който се представя най-добре на данните за валидиране. Можете също така да опитате с някаква настройка на хиперпараметри или да имате график на скоростта на обучение, който го прави по-малък с времето.

И двете криви се спускат и изглежда, че ще продължат да правят това известно време: обучението не е завършено, оставете го да тренира повече време.

И двете криви се спускат, въпреки първоначалното плато, и достигат ниска точка, без пропуск между кривите на обучение и валидиране: вероятно можете да подобрите инициализацията на теглото на модела. Както и да е, този график изглежда най-добрият, тъй като кривата на валидиране достига най-ниската стойност и няма прекалено подходящо.

И двете криви се покачват: има нещо нередно, вероятно в начина, по който определяте процеса на оптимизиране на функцията си за загуби.

Не виждам ясен случай на недооборудване сред вашите заговори. В сценарий за недостатъчно оборудване ще видим, че моделът научава нещо, но както загубите от обучението, така и валидирането се стабилизират при твърде високи стойности. Това би предполагало липса на капацитет на модела, което му пречи да улови правилно разпределението на данните по отношение на етикетите.