Тензорна мрежа

bg.waykun.com - Диета и загуба на тегло, днес

Съдържание

Подпространствените методи на Крилов [1] [2] [3] [4] [5] [6] (напр. Методът на Lanczos [7] [8]) са добре познати итеративни техники от областта на числената линейна алгебра. В приложението им към зависими от времето проблеми, човек сближава действието на $ \ hat U ^ \ mathrm (\ delta) $ директно върху квантовото състояние $ \ ket $, което води до състояние $ \ ket $, развито във времето. Той не осигурява достъп до експоненциалната $ e ^ \ delta \ hat H> $ в стандартната физическа основа. Най-директният подход е да се игнорира специалната структура на MPS/MPO представяне и директно да се приложи итеративната процедура, както е описано по-долу. Това наричаме \ textit. За разлика от него, вариант, използващ структурата на MPS ansatz, се нарича локален метод на Крилов и идентичен с метода за насочване по стъпка във времето на DMRG на системната среда.

Тук първо въвеждаме метода на Крилов, независим от конкретното представяне (плътни вектори като при точна диагонализация, MPS, мрежи на тензорни дървета и т.н.), използвани. Този алгоритъм се използва и като локален интегратор за локалния метод на Крилов и TDVP. Впоследствие ще обсъдим конкретни предупреждения, когато прилагаме метода в световен мащаб към състояния на матрица-продукт.

Подпространството на Крилов $ \ mathcal_N $ на хамилтонов $ \ hat H $ и начално състояние $ \ ket $ се определя като обхват на векторите $ \< \ket, \hat H \ket, \ldots, \hat H^ \ket \>$. Това пространство е обхванато от криловските вектори $ \ ket $, $ \ ket $, $ \ ldots $, $ \ ket> $, така че първият вектор на Крилов $ | v_0 \ rangle $ е зададен на $ \ ket $, нормализиран да има норма $ 1 $, а следващите криловски вектори $ \ ket $ се конструират чрез прилагане на $ \ hat H $ към $ \ ket> $ и ортонормиране спрямо всички предишни криловски вектори еквивалентно на алгоритъма на Lanczos. В точна аритметика с ермитов $ \ hat H $, този начин за конструиране на подпространство на Крилов се свежда до ортогонализиране спрямо предишните два вектора $ \ ket> $ и $ \ ket> $, което е еквивалентно на алгоритъма на Lanczos [8].

Въпреки това, поради закръглени грешки, присъщи на числово изпълнение, ортогоналността на векторите Крилов обикновено се губи. Ако точността, която се изисква от всяко решение, е ниска, човек може да се въздържа от избягване на този проблем и просто да работи в много малко подпространство. Поради натрупването на грешки по време на еволюцията на времето и изчисляването на спектрални или зависими от времето свойства е необходимо да се излекува този проблем. Следователно, обикновено трябва да се ортогонализира всеки нов вектор на Крилов спрямо всички предишни вектори на Крилов. (Алтернативно, може да се ортогонализира само спрямо предходните два вектора и да се постигне пълна ортогоналност чрез последващо преобразуване на база, както е подробно описано в Реф. 5.) След това методът продължава чрез търсене на елемента $ \ mathcal_N $, който приближава резултата от точния еволюция най-тясно:

За целта дефинираме проектора на $ \ mathcal_N $

\ begin \ hat P_N & = \ sum_ ^ \ ket> \ langle v_i | \\ & = \ begin \ Big | \ begin \ vdots \\ v_0 \\ \ vdots \ end \ Big \ rangle & \ Big | \ begin \ vdots \\ v_ \\ \ vdots \ end \ Big \ rangle & \ cdots & \ Big | \ begin \ vdots \\ v_ \\ \ vdots \ end \ Big \ rangle \ end \ cdot \ begin \ bra \ hbox <>> \ cdots> \\ \ bra \ hbox <>> \ cdots> \ \ \ vdots \\ \ bra \ cdots> \ end \ equiv V_N ^ \ dagger V_N \ end

където въведохме матрици $ V_N $ и $ V_N ^ \ dagger $, за да представим картите от пространството на Хилберт върху пространството на Крилов и обратно. Решението на горния проблем за минимизиране се дава от

\ begin \ ket = \ hat P_N ^ \ dagger \ hat U ^ \ mathrm (\ delta) \ hat P_N \ ket \;. \край

Имайте предвид, че за $ N = \ mathcal \ equiv N _> $ това е точно. Разширявайки проекторите и записвайки официалната поредица на Тейлър за $ \ hat U ^ \ mathrm (\ delta) $, откриваме:

където $ N \ ll N _ >> $ и $ T_N $ е криловско-пространствено представяне на $ \ hat H $ с коефициенти

Приближението на Крилов е въведено в $ \ eqref $. Имайте предвид, че за $ n> N-1 $ \ begin V _ >> \ hat H ^ n V _ >> ^ \ dagger V _ >> \ ket \ neq \ left (T_N \ right) ^ n V_N \ ket \;. \край

Това предполага, че грешката в разширението на Тейлър на оператора за еволюция на времето е от порядък $ \ frac $, което показва, че вече са достатъчни няколко итерации, за да се получи много малка грешка в интегратора. Ако $ V_N ^ \ dagger V_N $ бяха правилна идентичност, бихме могли да го вмъкнем между всяка степен на $ \ hat H $ и да получим точно $ V_N \ hat H ^ n V_N ^ \ dagger = T_N ^ n $. Нашето подпространство на Крилов обаче е много по-малко от истинското Хилбертово пространство и проекцията, индуцирана от $ V_N ^ \ dagger V_N $, е следователно много голяма, $ V_N ^ \ dagger V_N \ neq \ mathbf $. Но поради специалната структура на това пространство на Крилов, $ V_N ^ \ dagger T_N ^ n V_N \ ket $ се сближава много по-бързо до $ \ hat H ^ n \ ket $, отколкото се очакваше, ако например избрахме случайни вектори изцяло Хилбертово пространство за конструиране на нашето подпространство.

В точна аритметика и с ермитовски $ \ hat H $, $ T_N $ би бил тридиагонален, т.е. $ \ left (T_N \ right) _ = 0 $, ако $ | i-i ^ \ prime | > 1 $. Въпреки че на практика това не е непременно вярно, установихме, че подобрява числената стабилност и точността на резултатите, за да приемем, че $ T_N $ е тридиагонален и само оценява тези елементи, като принудително настройва всички останали елементи на нула. Връщайки се към нашето уравнение $ \ eqref $, $ V_N \ ket $ е векторът на пространството на Крилов

тъй като всички останали вектори на Крилов са ортогонални на $ \ ket $ и $ \ ket $ е нормализираната версия на $ \ ket $. $ T_N $ може да бъде експоненцирано ефективно, като се използват стандартни рутинни диагонални процедури от LAPACK, тъй като той е само с размер $ N \ пъти N $. С $ T_N = Q_N ^ \ dagger D_N Q_N $ това дава

Следователно за даден брой вектори на Крилов и размер на стъпка $ \ delta $ получаваме

с коефициентния вектор $ c_N = Q ^ \ dagger_N e ^ \ delta D_N> Q_N e ^ 1_N $ и $ e ^ 1_N $ $ N $ -мерният векторен размер $ (1, 0, 0, \ ldots) ^ T $ . За типичните проблеми, представени в примера, броят на използваните от нас вектори на Крилов е между $ 3 $ и $ 10 $.

Алгоритъм

Основният вход на метода Krylvo са хамилтоновият $ \ hat H $, началното състояние $ \ ket $ и (евентуално сложната) времева стъпка. Освен това е необходима процедура APPLY-ORTHONORMALIZE, която от своя страна изисква продукт на оператор-държава и ортогонализиране на състояния. За подробности относно вариационен подход към това, вижте Ref. 9, раздел. 2.8.2. Функцията COMPUTE-EFFECTIVE-H трябва само да актуализира новите елементи на $ T_ $ в сравнение с $ T_j $.

Следователно има два подхода за измерване на конвергенцията на пространството на Крилов: (i) Най-долният десен запис на ефективната матрица $ T_n $ измерва теглото, разпръснато от пространството на Крилов чрез прилагане на Хамилтониан и обикновено се разпада експоненциално; (ii) пълното разстояние от 2-нормово пространство на Хилберт между две последователни итерации е евтино достъпно чрез коефициентите на векторите на Крилов, получени в двете итерации. Според нашия опит тази втора мярка дава отличен критерий за конвергенция.

В допълнение към присъщата грешка на Крилов, която често може да бъде изключително малка ($ O (10 ^) $ или по-малка), методът на Крилов, разбира се, страда и от стандартната грешка при отрязване на MPS - тази грешка също може да бъде измерена прецизно ( чрез изхвърленото тегло) и да бъде много малък. Като такива и двете грешки на глобалния метод на Крилов могат да бъдат изключително малки при краен размер на стъпка от време, макар и при относително големи числени разходи. Следователно методът по-специално превъзхожда, ако се използва за прецизна оценка на състоянията, например за измерване на грешките на други методи на кратки времеви скали.

\ подраздел До този момент не беше необходимо да се стеснява описанието до конкретно представяне, което служи като доказателство за многостранността на метода на Крилов. В нашите практически изчисления обаче ние искаме да използваме MPS, за да представим еволюиралите във времето квантови състояния и междинни вектори на Крилов и MPO, за да представим хамилтоновия $ \ hat H $, което изисква няколко малки адаптации за ефективност и точност. Имайте предвид, че в ярък контраст с метода TEBD и MPO \ wiii, се изисква само MPO представяне на $ \ hat H $ и не се изисква аналитично или друго разлагане.

Първо и най-важно, най-очевидното подобрение е при изчисляването на последното въвеждане на ефективната матрица на Крилов $ T_N $. В точна или плътна аритметика, оценката на $ \ bra> \ hat H \ ket> $ изисква изчисляване на матрично-векторния продукт $ \ hat H \ ket> $. Това не е така при подхода MPS: Всъщност оценката на очакваната стойност $ \ bra> \ hat H \ ket> $ е много по-евтина от изчисляването на MPS, представляваща $ \ hat H \ ket> $. Като такъв, за да се генерира $ N \ пъти N $ -измерна ефективна матрица на Крилов $ T_N $, трябва само да се оцени $ N-1 $ MPO-MPS продукти и да се избегне MPO-MPS продукта за най-скъпото приложение в последния Крилов вектор. Според нашия опит размерът на връзката на всеки допълнителен вектор на Крилов нараства суперлинейно, което прави тази оптимизация много полезна.

За да се изгради еволюиралото във времето състояние $ \ ket $, е необходимо да се сумират $ N $ векторите Крилов заедно. Съществуват различни методи за това, при нашето внедряване последователно добавяме два вектора (в резултат на което се получава нов MPS с размер на връзката $ 2m $), които след това се отрязват обратно до целевото измерение на връзката $ m $. В стъпки от $ N-1 $ всички $ N $ криловски вектори се сумират по цена $ O (N (2m) ^ 3) $. Може да се проследи тази процедура с някои мачове на вариационна оптимизация или алтернативно директно вариационна оптимизация, но това не изглежда необходимо за нашето приложение.

Загуба на ортогоналност

Типичен проблем на методите на Крилов-подпространство е възможната загуба на ортогоналност на базисните вектори поради аритметиката с крайна точност на операциите с плаваща запетая. Този въпрос става значително по-належащ в алгебрата на матрицата-произведение, тъй като съкращаването е от решаващо значение за поддържане на възможните изчисления. Ако са желани много вектори на Крилов, грешките при отрязването, засягащи ортогоналността на базисните вектори, не просто добавят към общата грешка (виж по-горе), но могат бързо да влошат цялостното качество на пространството на Крилов, което води до лош резултат. В този случай е необходимо да се провери за ортогоналност в основата и евентуално да се ортогонализират последователно векторите на основата. Ако обаче се използва проста процедура на Gram-Schmidt за ортогонализиране на вектори чрез последователни добавяния на MPS, по време на тази процедура се въвеждат нови грешки при отрязване, което често води до същия проблем.

Според нашия опит се оказа плодотворно да се ортогонализират новите състояния на Крилов вариационно спрямо всички други състояния на Крилов. Това е по същество вариационно компресиране на състояние при допълнителните ограничения на нулевото припокриване с всички предишни състояния на Крилов. Допълнителните ограничения могат да бъдат включени с метода на множителите на Лагранж: За всяко ограничение (ортогонален вектор $ \ ket $) въведете съответния множител на Лагранж $ \ beta_i $. За да минимизираме $ \ | \ hat \ ket- \ ket> \ | ^ 2 $ под ограниченията $ \ | v_> = 0 \> _ $, ние всъщност свеждаме до минимум

по отношение на $ \ ket $ и $ \ beta_ $. Както при вариационното компресиране, това също може да бъде решено чрез итеративно решаване на локалните проблеми с един или два сайта (без изрична оценка на $ \ braket $). Трябва да се внимава да се осигури локална ортогоналност, като се използва псевдообратната на грам матрицата, както е обяснено в Реф. 6. Използването на подход на две площадки води до допълнителна стъпка за отрязване след всяка стъпка на локална оптимизация и предполага отново загуба на ортогоналност. Подходът на две площадки обаче се сближава много по-добре от подхода на един обект към глобалния оптимум. На практика следователно първо правим няколко размита, като използваме оптимизацията на два сайта (или по подобен начин, оптимизация на един сайт с разширяване на подпространството [11]) и след това с няколко почиствания на напълно оптимизация на един сайт без разширяване и следователно също без съкращаване. Тогава полученото състояние е точно ортогонално на всички предишни състояния. Имайте предвид, че при първоначалното стартиране на оптимизацията $ \ eqref $ наличното векторно пространство на първите няколко сайта вероятно ще бъде много малко (например $ \ sigma ^ 2 \ cdot (m_2 = \ sigma ^ 2) $) и ортогонализацията следователно прекомерно. За да се избегне този проблем, трябва да се добавят ограниченията едно по едно по време на последващи почиствания.

Тази вариационна ортогонализация може да се използва или като отделна стъпка за ортогонализация след приложението MPO-MPS (използвайки някой от известните алгоритми), или може да се комбинира с приложението на вариационния оператор. Дали е по-добре първо да направите приложението MPO-MPS, като използвате zip-up метода и след това вариационно да ортогонализирате резултата или да направите и двете стъпки наведнъж, зависи от разглежданата система: по-специално при взаимодействията на дълги разстояния, вариационният подход може изискват повече почиствания, за да се сближат, докато взаимодействията с къси разстояния се разглеждат много ефективно там.

Динамично оразмеряване на стъпки

Динамичното оразмеряване на стъпки е една от най-интересните и мощни характеристики на този метод и може да се използва по няколко начина. Идеята е, че подпространството на Крилов, което е изчислено за известно време стъпка $ \ delta $, може да бъде рециклирано за някаква друга дължина на стъпката. Възможно е да се разграничат два случая: интерполация и екстраполация.

Интерполация

В някои приложения еволюцията на времето трябва да се извърши на много фина мрежа във времето. Методите за стъпка във времето ще включват една стъпка за всяка точка от мрежата, която може бързо да стане тромава или дори невъзможна. От друга страна, ако имаме подпространство на Крилов, което използвахме за извършване на голяма стъпка във времето, то може да бъде използвано повторно за изчисляване на всяко междинно по-малко време със същата или по-висока точност. Това веднага следва от построяването на пространството на Крилов и критериите/предположенията за конвергенция, направени по-горе. Тъй като диагонализацията на ефективния хамилтониан вече е известна, всичко, което трябва да направим, е да експоненцираме диагонала по новата стъпка от време, да се картографираме обратно в основата на Крилов, за да получим вектора на коефициента, и да изчислим новия MPS като суперпозиция на векторите на Крилов. Ако някой се интересува само от очакваните стойности на наблюдаем $ \ hat $, изгодно е да се изчисли неговата проекция в пространството на Крилов чрез $ \ left (O_ \ right) _ = \ braket | \ phi _> $ със сложност $ \ sim \ mathcal (n ^ 2) $. С вектора на коефициента $ c_N $, желаната стойност на очакване може да бъде изчислена като $ c_N ^ \ кинджал O_N c_N $, като изцяло се пропуска по-скъпата суперпозиция на състоянията на Крилов.

Екстраполация

Макар и по-сложно за изпълнение, екстраполацията може значително да подобри производителността, когато се използва като вид автоматична схема за адаптивно оразмеряване на стъпки. Идеята е следната: Като се има предвид пространство на Крилов, често е възможно да се рециклира и за по-големи размери на стъпки, като се добавят само малък брой допълнителни вектори на Крилов (или изобщо няма). От това следва, че оптималното измерение на подпространството на Крилов минимизира съотношението на времето, необходимо за изчисляване на неговата основа и броя стъпки, за които може да се използва. Като сурови приближения на тези количества, приемаме, че цената на всеки нов вектор на Крилов расте експоненциално, т.е.съотношението на разходите на последователни вектори е фиксирано. Освен това приемаме също така, че всеки нов вектор на Крилов ни позволява толкова допълнителни времеви стъпки, колкото предишния вектор на Крилов. След това непрекъснато наблюдаваме времето, необходимо за конструиране на нов вектор на Крилов и броя стъпки, които сме в състояние да предприемем с него. След като трябва да се вземе решение дали да се разшири пространството на Крилов или да се възстанови от нулата, ние използваме тези стойности като оценки за нашето решение. На практика тази евристика се оказа доста надеждна.

Съдържанието на тази страница се базира на методи за еволюция на времето за състояния на матрични продукти от S. Paeckel, T. Köhler, A. Swoboda, S. R. Manmana, U. Schollwöck и C. Hubig и е лицензиран под лиценза CC-BY 4.0.

Популярен

Те четат сега

Крилова еволюция на времето (Глобален Крилов)

Алгоритъм

Загуба на ортогоналност

Динамично оразмеряване на стъпки

Интерполация

Екстраполация