Редактирано * от Джак У. Шостак, Медицински институт "Хауърд Хюз" и Обща болница в Масачузетс, Бостън, Масачузетс, и одобрено на 6 юни 2012 г. (получено за преглед на 27 март 2012 г.)

независима

Резюме

Естествената четирибуквена генетична азбука, състояща се само от две базови двойки (dA-dT и dG-dC), се запазва през целия живот и нейното разширяване чрез развитието на трета, неестествена двойка основи се очертава като централна цел на химическа и синтетична биология. Наскоро разработихме клас кандидат-неестествени базови двойки, илюстрирани от двойката, образувана между d5SICS и dNaM. Тук изследваме PCR амплификацията на ДНК, съдържаща една или повече двойки d5SICS-dNaM в голямо разнообразие от контексти на последователности. При стандартни условия ние показваме, че тази ДНК може да бъде усилена с висока ефективност и по-голяма от 99,9% точност. За да проучим по-стриктно потенциалните ефекти на последователността, използвахме дълбоко секвениране, за да характеризираме библиотека от шаблони, съдържащи неестествената двойка основи като функция на усилване. Установихме, че неестествената базова двойка се възпроизвежда ефективно с висока точност в практически всички контексти на последователността. Резултатите показват, че за PCR и PCR-базирани приложения d5SICS-dNaM е функционално еквивалентен на естествена базова двойка и когато се комбинира с dA-dT и dG-dC, той осигурява напълно функционална шестбуквена генетична азбука.

Разширяването на генетичната азбука с включване на неестествена двойка основи се очертава като централна цел на химическата и синтетичната биология. Успехът би представлявал забележителна интеграция на ортогонални синтетични компоненти във фундаментална биологична система и би изградил основата за полусинтетичен организъм с повишен потенциал за съхранение и извличане на информация (1). Нещо повече, съставните неестествени нуклеотиди могат да се използват за специфично маркиране на ДНК или РНК с различни функционалности от интерес (2 ⇓ –4) и потенциално да революционизират вече повсеместните in vitro приложения на нуклеинови киселини, като селекции на аптамер и ДНК/РНКазим ( 5, 6), PCR-базирана диагностика (7, 8) и базирани на ДНК наноматериали и устройства (9).

Въпреки че са докладвани много кандидат-неестествени базови двойки (10 ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ ⇓ –21), само няколко са действително реплицируеми с ДНК полимерази (10, 11, 13, 16). Освен това е ясно, че повечето приложения ще изискват неестествената базова двойка не само да се репликира с висока ефективност и точност, но също така, че репликацията да бъде поне приблизително независима от контекста на последователността. Зависимостите на последователността биха причинили предубедено усилване и ефективно биха изключили много приложения на неестествената двойка основи. Доказано е, че нито една кандидат-неестествена базова двойка не се репликира без пристрастие към последователност и по този начин никой все още не може да претендира за функционална еквивалентност на естествена базова двойка.

Усилията ни да развием предимно хидрофобни неестествени базови двойки завършиха с идентифицирането на двойките, образувани между d5SICS и гMMO2 (28) или dNaM (11, 29) (Фиг. 1 показва сравнение на d5SICSNaM с естествен dG-dC). Всъщност ние използвахме тези нуклеотиди, за да маркираме специфично за място ДНК и РНК с множество различни функционални групи (2). Въпреки че и дMMO2 и гNaM са добри партньори за d5SICS, кинетика и предварителни PCR експерименти разкриват, че d5SICSNaM се репликира (11, 29, 30) и транскрибира (12) по-добре от d5SICSMMO2. Освен това, скорошни структурни проучвания разкриха, че ефективното възпроизвеждане на d5SICSNaM е резултат от способността на полимеразите да я подтикват да възприеме структурата на двойка Уотсън-Крик, въпреки липсата на Н-връзки (31, 32).

Неестествено (d5SICSNaM) и естествените двойки бази на Уотсън – Крик (dC-dG).

Тук изследваме използването на d5SICSNaM чрез строго характеризиране на зависимостта на последователността на неговата репликация. Открихме, че OneTaq, търговска смес от Taq и Deep Vent полимерази, едновременно оптимизира както ефективността, така и точността на d5SICSNaM репликация. След това показваме, че ДНК, съдържаща неестествената основна двойка, може да бъде ефективно усилена в различни контексти на различни последователности, включително богати на GC и AT последователности, рандомизирани последователности и последователности с множество d5SICSNaM двойки, с повече от 99,9% вярност на удвояване. И накрая, чрез използването на PCR селекция и анализ на дълбоко секвениране установяваме, че репликацията на неестествената базова двойка протича практически без пристрастия на последователността. Като цяло резултатите показват, че поне за ин витро приложения, d5SICSNaM е функционално еквивалентен на естествена основна двойка и заедно с естествените двойки основи, d5SICSNaM представлява напълно функционална разширена генетична азбука.

Резултати и дискусия

Изследване на обхвата на PCR с ДНК, съдържаща d5SICS-dNaM.

Първо характеризирахме амплификацията на ДНК шаблон, съдържащ d5SICSNaM фланкирани от всяка страна от три нуклеотида на рандомизирана последователност с екзонуклеазно-отрицателните полимерази Taq, Vent (екзо-) или Deep Vent (екзо-) или екзонуклеазно-положителните полимерази KOD, Phusion, Vent или Deep Vent (SI Приложение, Таблица S1 и фиг. S1). PCR амплификацията с екзонуклеазно-дефицитни полимерази обикновено протича с висока ефективност, позволявайки използването на стандартна концентрация на всеки dNTP (200 μM), но със само умерена точност, което предполага, че точно както при естествените базови двойки, значително количество вярност е допринесе чрез корекция. Съответно, амплификацията с екзонуклеазни полимерази протича с по-голяма точност, но също така изисква използването на високи концентрации на естествените трифосфати (700 μM; вероятно поради неефективно удължаване на праймера след неестествената двойка основи), което е свързано със склонността към грешки усилване на естествената ДНК (33).

За да изследваме условия, които могат едновременно да оптимизират както ефективността, така и верността, ние тествахме различни комбинации от Taq и владееща екзонуклеаза полимераза (SI Приложение, Таблица S2 и Фиг. S2). По принцип амплификацията протича с ефективност, която е сравнима с ефективността само на Taq, но с точност, характерна за полимеразите, владеещи екзонуклеазата. Това откритие предполага, че съотношението на дейностите за изрязване и удължаване на естествените полимерази, владеещи екзонуклеазата, е оптимизирано по време на еволюцията за естествените базови двойки и че ефикасната и с висока точност репликация на ДНК, съдържаща d5SICSNaM изисква леко намалена екзонуклеазна активност. Независимо от това е ясно, че бинарните полимеразни смеси са по-подходящи за репликация на ДНК, съдържаща d5SICSNaM. Предвид надеждността му като търговски продукт, ние избрахме да проучим допълнително използването на OneTaq (смес от Taq и Deep Vent, предлагана от New England Biolabs).

За да се изследва последователната зависимост на амплификацията, неестествените нуклеотиди бяха включени в различни ДНК шаблони, където фланкиращите последователности варираха от високо GC до високо съдържание на AT или бяха рандомизирани. С OneTaq, стандартни PCR условия (напр. 200 μM dNTPs и 1-минутно време за удължаване) и 100 μM всеки неестествен трифосфат, всички шаблони бяха ефективно усилени с точност, варираща от 99,7% до 99,99% (Таблица 1 и SI Приложение, Фиг. S3) (съответстващ на честотата на грешки от 10-3 до 10 -4 на нуклеотид). Тези вярности доведоха до 87% до> 99% задържане на неестествената двойка основи в продукта след 10 12-кратно усилване. Ясно е, че OneTaq е в състояние да амплифицира ДНК, съдържаща един d5SICSNaM в различни контексти на последователност, както с висока ефективност, така и с точност.

Зависимост на последователността на PCR амплификация

PCR селекция и биоинформатичен анализ.

За да изследваме стриктно ефекта от контекста на последователността, извършихме PCR селекция (Фиг. 2А). За да се отчетат крайните ефекти, въведени от праймерите, бяха проектирани три подбиблиотеки, които включват d5SICSNaM на три различни позиции в рамките на 40 рандомизирани нуклеотида (фиг. 2В). Двунуклеотидните баркодове, специфични за суббиблиотеката, бяха включени, за да идентифицират позицията на неестествената базова двойка по време на анализа на данните за секвениране. Комбинираните подбиблиотеки, общо ∼2 × 10 10 членове, се усилват с OneTaq и аликвотни части се вземат за анализ след 10 3 -, 10 6 -, 10 12 -, 10 18 - и 10 24-кратно усилване (SI Приложение, Фиг. S4). За да променяме селективното налягане за преференциално репликирани последователности, изпълнихме два комплекта усилвания паралелно, които варираха само във времето за удължаване (1 или 4 минути).

(А) Схема за избор на PCR. х = NaM (или когато е биотинилиран, негов аналог MMO2; вижте фиг. S5) и Y. = 5SICS. (Б) Дизайн на библиотека. Областите, близки до неестествената базова двойка, които бяха анализирани за отклонения, са показани в червено, а дисталните области, използвани като контрола, са показани в зелено. Суббиблиотечните специфични двунуклеотидни баркодове, които показват позицията на неестествената двойка основи, обграждат рандомизираните региони и са показани в курсив. Областите за свързване на грунда са обозначени като PBR (последователности в приложение SI, таблица S1).

ДНК от аликвотите, взети по време на всяко усилване, се разделя на две популации въз основа на това дали е запазила или загубила неестествената основна двойка чрез извършване на допълнителни шест цикъла на PCR; по време на PCR, dNaMTP беше заменен с биотинилиран dMMO2TP (2) (SI приложение, фиг. S5), последвано от преминаване през твърда подложка на стрептавидин (фиг. 2А). За да се подготви ДНК за секвениране, бяха извършени още 10 цикъла на PCR амплификация, използвайки праймери Illumina със специфични за популацията баркодове (SI Приложение, Таблица S3) и само естествени dNTPs (за заместване на неестествените нуклеотиди с естествени нуклеотиди). Химично синтезирани (неамплифицирани) подбиблиотеки се подлагат на същата процедура, със и без биотинилиране, за да се контролира всякакво отклонение, въведено по време на анализа. Общо 23 популации бяха анализирани чрез дълбоко секвениране на система за секвениране Illumina HiSeq2000 (SI Приложение, Таблица S3). От този анализ са генерирани общо 58 милиона сурови четения и са филтрирани по качествен рейтинг и дължина, което води до средно 1,6 × 10 6 четения на население (общо 37 милиона обработени четения).

Първоначалният анализ разкри, че няма значителни разлики между подбиблиотеките, което предполага, че всякакви пристрастия, въведени от неестествената двойка основи, не зависят от нейната позиция в шаблона. По този начин данните от подбиблиотеките бяха комбинирани и ние се съсредоточихме върху 20 nt, фланкираща неестествената двойка основи (фиг. 2B, червено). Като първа мярка за пристрастие на последователността, ние определихме количествено разнообразието на всяка популация, като изчислихме частта от откритите последователности с едно копие. Освен това изчислихме нормализираната ентропия на Шанън (35, 36) (уравнение. 1),

Фракция от единични копия на последователности (горна) и нормализирана ентропия на Шанън (долна) за усилване с 1- (ляво) или 4-минутно (дясно) време за удължаване. Червените линии съответстват на регионите, близки до неестествената базова двойка, а зелените линии съответстват на дисталните контролни области (фиг. 2Б). Популациите, които са запазили или загубили неестествената основна двойка, са представени съответно с плътни или пунктирани линии. Лентите за грешки бяха определени от независимия анализ на всяка от трите подбиблиотеки.

За да се оцени потенциалното въздействие на наблюдаваните пристрастия, е поучително да се вземат предвид техните последици. Най-големите наблюдавани единични и динуклеотидни отклонения са frel C (-1) - 1 за frel GC (-1, -2) - 1 в популацията, която запазва неестествената основна двойка, която след пълното 10 21-кратно усилване, само достигна стойности съответно от 0,32 и 0,51. Тези стойности съответстват на увеличаване на честотата на 5′-CNaM от 18,71% до 24,65%, като субпопулацията има 5′-GCNaM последователност се увеличава от 2,30% на 3,48%. Тези отклонения не са по-големи от отклоненията, наблюдавани сред естествените последователности (39), и е малко вероятно да пречат на всяко ин витро приложение на ДНК, съдържаща неестествената двойка основи, дори включително тези приложения, изискващи масивна амплификация.

Заключение

Материали и методи

PCR на OneTaq.

PCR селекция и дизайн на библиотека.

Три подбиблиотеки бяха подготвени като d5SICS нишки, използващи стандартен автоматизиран ДНК синтез (последователностите са показани в допълнение SI, таблица S1 и dNaM нишките са показани на фиг. 2Б). Смес от фосфорамидити за синтеза на рандомизиран регион се приготвя, както е описано по-горе (41). Трите пречистени подбиблиотеки се определят количествено чрез UV и се смесват в съотношение 1: 1: 1 и 5 ng се подлагат на амплификация на OneTaq PCR, както е описано по-горе. След 13 цикъла реакциите се разреждат с фактор 10 3 и се прехвърлят в PCR епруветки с пресни реактиви, последвани от 10 цикъла при разреждане 10 3, 2 × 20 цикъла при разреждане 10 6 и накрая, 21 цикъла (общо 84 PCR цикъла ) (Приложение SI, фиг. S4A показва количествени PCR данни). Пробите с различни нива на усилване бяха пречистени, количествено определени и анализирани на 10% неденатурираща PAGE (SI Приложение, Фиг. S4B).

Дуплексно биотинилиране.

Амплифицираните продукти (5 ng) се подлагат на шест допълнителни кръга PCR и се изпълняват при условия, идентични на условията, описани по-горе, с изключение на това, че биотинилиран вариант на dMMO2TP се използва вместо dNaMTP (2) (SI Приложение, Фиг. S5) и 80-nt-дълъг грунд (Primer1-poly-dT) е използван вместо 21-nt-дълъг Primer1, за да позволи отделяне на амплифициращия продукт върху 4% агарозен гел (Приложение SI, таблица S1 показва пълни последователности). Фрагментът, съответстващ на ~ 180 bp, беше изрязан и извлечен от гела, пречистен и количествено определен. Нивото на биотинилиране на всеки дуплекс е количествено определено чрез анализ на мобилността на стрептавидин гел (SI приложение, SI материали и методи).

Дълбоко секвениране и биоинформатичен анализ.

Благодарности

Благодарим на Стивън Хед, Лана Шафър и Денис Шпаков за съдействието при дълбоко секвениране и анализ. Финансирането на тази работа е осигурено от Националния здравен институт \ xНационален център за изследователски ресурси Клинична и транслационна научна награда Grant UL1 RR025774 (за A.T.) и Национален институт по здравеопазване Grant GM060005 (за F.E.R.).

Бележки под линия

  • ↵ 1 До кого трябва да се адресира кореспонденция. Имейл: floydscripps.edu .