Тази статия е част от изследователската тема

Временна структура на нервните процеси, свързваща сензорни, двигателни и когнитивни функции на мозъка Вижте всички 17 статии

Редактиран от
Dezhong Yao

Университет по електронна наука и технологии в Китай, Китай

Прегледан от
Търговецът Хюго

Национален автономен университет в Мексико, Мексико

Дая С. Гупта

Колеж в окръг Камдън, САЩ

Принадлежностите на редактора и рецензенти са най-новите, предоставени в техните профили за проучване на Loop и може да не отразяват тяхното положение по време на прегледа.

frontiers

  • Изтеглете статия
    • Изтеглете PDF
    • ReadCube
    • EPUB
    • XML (NLM)
    • Допълнителни
      Материал
  • Цитат за износ
    • EndNote
    • Референтен мениджър
    • Прост ТЕКСТ файл
    • BibTex
СПОДЕЛИ НА

ЧЛЕН

  • 1 Езиков и познавателен отдел, Институт по психолингвистика Макс Планк, Неймеген, Холандия
  • 2 Лаборатория за изкуствен интелект, Vrije Universiteit Brussel, Брюксел, Белгия
  • 3 Изследователски отдел, Sealcentre Pieterburen, Pieterburen, Холандия
  • 4 Катедра по клинична медицина, Център за музика в мозъка, Орхуски университет, Орхус, Дания

Целочислени съотношения и музикален ритъм

Какво са малки съотношения на цели числа, и какво прави ритмите с цяло число съотношение специални? A съотношение между два интервала между началните интервали (IOI) е разделението между две, обикновено съседни продължителности. Цяло число съотношенията могат да се запишат като дроб: 1,5 е равно на 15/10 или 3/2, но 2 например не може да се запише като дроб. Целочислено съотношение е малък ако резултатът от делението може да бъде записан като малко цяло число, разделено на друго малко цяло число, например 2/3, но не и 23/51 (Pikovsky et al., 2003; Strogatz, 2003).

A ритъм, по дефиниция, както се използва тук, е модел на продължителността (Лондон, 2004, стр. 4), характеризиращ се с последователност от настъпвания на събития във времето, с други думи поредица от IOI. Слуховите ритми с малки цели числа между IOI са често срещани в световната музика (Essens and Povel, 1985; Toussaint, 2013; Savage et al., 2015). Психологическите и невронни изследвания предполагат, че малките ритми с цяло съотношение позволяват по-точно вътрешно представяне (Essens, 1986; Sakai et al., 1999), подобрено откриване на отклонения (Jones and Yee, 1997; Large and Jones, 1999), подобрена памет ( Deutsch, 1986; Palmer and Krumhansl, 1990) и възпроизвеждане (Povel and Essens, 1985; Essens, 1986) и по-добра синхронизация (Patel et al., 2005). Изкривяването на съотношенията с почти цяло число към целочислените (или техните хармоници), докладвано в поведенчески (Fraisse, 1982) и неврофизиологични изследвания (Motz et al., 2013), допълнително подкрепя идеята за малки съотношения, действащи като „атрактори“ (Gupta и Chen, 2016). Тази идея наскоро получи подкрепа от проучвания за повторно учене и възпроизвеждане. Когато хората възпроизвеждат първоначално произволно определена ритмична последователност и този процес се повтаря каскадно в рамките на един или няколко индивида, последователността се подсъзнателно прекроява, за да се състои от IOI, свързани с малки цели числа (Фигура 1А; cf Polak et al ., 2016; Ravignani et al., 2016, 2018; Jacoby and McDermott, 2017).

Защо ритмите (т.е. моделите на продължителността) са склонни да показват малки цели числа? Защо хората са привлечени от ритми с толкова особени математически свойства, както във възприятието, така и в производството? Това свойство отразява ли някаква особеност на възприятието на музиката и/или двигателното секвенциониране, или би могло да се обясни с общите аспекти на познанието? Можем ли да изследваме тези алтернативи чрез математически формализъм? Тук ние изследваме математически възможността човешкото пристрастие към малките цели съотношения да се обясни с комбинация от скаларна продължителност и категорично възприятие.

Започваме с очертаването на съответните класически рамки за човешкото време и продължаваме да обобщаваме доказателствата в подкрепа на пристрастието на съотношението на малките цели числа във възприемането на ритъма. След това представяме нашето предложение, свързващо рамките с пристрастията чрез математически формализми. По-конкретно, ние използваме скаларното свойство на оценката на интервала от време, за да формулираме прост модел на категорично възприятие, който може да доведе до пристрастие на цяло число (Фигура 1), и да го свържем с невронни трептения. В заключение обсъждаме накратко достойнствата и ограниченията на нашия модел и очертаваме бъдещите цели.

Психофизични и осцилаторни подходи

Предложени са два основни теоретични подхода, сред няколкото, за да се отчетат механизмите, които стоят зад времето на човека (Wing and Kristofferson, 1973a, b; Getty, 1975; Meck, 1996; Church, 1999; Grondin, 2001, 2010; Mauk and Buonomano, 2004; Karmarkar and Buonomano, 2007; Ivry and Schlerf, 2008; Allman et al., 2014; Merker, 2014). Най-влиятелният и емпирично тестван психоакустичен модел е „скаларната теория на продължителността“ (Wearden, 1991; Allman and Meck, 2011). Психофизичните изследвания показват, че времето на човека често следва закона на Вебер (Bizo et al., 2006): грешката за времетраене на интервала е пропорционална на продължителността на този интервал. Една формулировка въз основа на възприятие гласи, че съотношението между точно забележимата разлика (JND) и продължителността на референтния стимул е постоянно по дължината на стимула (Grondin, 2001). В друга формулировка коефициентът на вариация (стандартно отклонение, разделено на средно) при изчисляване на продължителността е постоянен през продължителностите (Фигура 1D; Gibbon, 1977).

Друг подходящ подход към механизмите за синхронизация идва от неврологията и физиката. Той предполага, че невронните трептения увличат (или дори „резонират“) с периодичността на външните дразнители в множество времеви скали (Buzsaki, 2006; Large, 2008; Arnal and Giraud, 2012; Gupta, 2014; Aubanel et al., 2016; Celma-Miralles et al., 2016). По-конкретно, в него се посочва, че фазата и честотата на невронните трептения се улавят с фазата и честотата на външните събития на множество метрични нива. Например, обработката на метроном ритъм ще предизвика нискочестотни трептения и/или колебания на мощността във високочестотни трептения след периодичността на ритъма, плюс неговите кратни или делители. Критично е, че стабилността на връзката между две или повече активни невронни трептения, т.е. "съпротивлението" на външни смущения, зависи от съотношението на техните периоди (например 1: 1, 2: 1, 2: 3). Малките съотношения на цели числа обикновено придават по-голяма стабилност. Това може да обясни перцептивното предимство за стимули с цяло съотношение над по-сложни метрични модели (Large и Kolen, 1995). Други рамки твърдят, че специфични неврони или невронни канали са настроени на определени продължителни интервали или темпове (Merchant et al., 2013; Bartolo et al., 2014).

Повторени експерименти с барабани: малки цели числа като когнитивни атрактори

Неотдавнашните поведенчески изследвания изследваха човешките приоритети за продължителността на ритмичните модели (Ravignani et al., 2016, 2018; Jacoby and McDermott, 2017). На участниците бяха дадени барабанни последователности, за да се възпроизведат, доколкото е възможно. Произведените модели бяха представени на същия или нов участник в итеративна процедура. Поразително е, че на участниците от „първо поколение“ са дадени напълно случайни модели, а участниците от „последно поколение“ произвеждат ритми, показващи малки съотношения на цяло число, в съответствие с предишната работа по напр. Бимануално потупване (Peper et al., 1991, 1995a, b; Пепер и Бийк, 1998).

По-конкретно, на участниците бяха представени последователности от IOI, взети от равномерно разпределение U (напр. Фигура 1Б). Тъй като моделите се предават чрез „вериги на репродукции“ (Ravignani et al., 2016, 2018; Jacoby and McDermott, 2017), разпространение U се сближи към разпределение д: задно разпределение на IOI на човешки наблюдател (напр. Фигура 1А). Това разпределение е мултимодално и режимите са свързани с малки цели числа, универсално свойство на човешките музикални култури (Ravignani et al., 2016; Jacoby and McDermott, 2017).

Тук целим да обясним разпределението д чрез установени психофизични принципи, никой от които не включва изрично съотношения с малки цели числа. С други думи, пристрастието на цяло число е перцептивен примитив сам по себе си или може да възникне от взаимодействието на по-фундаментални примитиви? Jacoby and McDermott (2017) свързват теоретично хипотетичен предшественик с вградени целочислени съотношения с емпирично оценен предшественик, показвайки, че те са подравнени. Тук изследваме дали е възможно да се изведе приоритет със сходни свойства, като не се вгражда целочисленото съотношение, а чрез комбиниране на емпирично основани принципи на времето с минимални предположения (и място за усъвършенстване чрез бъдещи тестове).

Вероятностно заключение за категории на интервалното съотношение

Нашият конкретен въпрос е: при какви условия ще се извършва разпределение G показват съотношения с малки цели числа, без да са вграждали тези съотношения в нашия модел?

Без никакви предположения, разпределение G би било равно на равномерното разпределение на IOI U в очакване. С други думи, резултатите от основните механизми за възприемане и производство на ритъма ни позволяват да се обърнем U в G? По-долу правим четири предположения въз основа на психофизични доказателства и намаляваме драстично броя на свободните параметри в модела с малка загуба на общ характер. Започваме с разработването на предишни формализации, за да направим съответните предположения изрични и сравними.

Предположение 1: Категорично време

Предположение 2: Байесов извод за гауссови категории

Общо предположение в изследването на ритъма е, че времето за възприемане може да бъде описано като процес, съчетаващ предишни вярвания със сензорни входове. Един от начините да се улови това математически е да се моделира възприемането на времето като байесов извод (Jazayeri and Shadlen, 2010; Cicchini et al., 2012; Merchant et al., 2013; Pérez and Merchant, 2018). Докато нашият анализ разчита на природата на предшественика, а не на това как той е разгърнат по време на перцептивна интерпретация, възприемането на байесова гледна точка е полезно. Позволява ни да изразим предварително разпределение като индуктивно пристрастие (Thompson et al., 2016) и е успешно приложено в предишни модели за оценка на интервала от време (напр. Jazayeri and Shadlen, 2010; Cicchini et al., 2012). Използвайки байесов извод, можем да характеризираме поведението на участниците като приписване на категорично представяне на съотношението на интервала ri според разпределението стр(zi = к|ri) ∝ стр(ri|zi = к)стр(zi = к). Нашият фокус е предишното разпределение по категории, стр(zi = к), еквивалентно G. Като алтернатива би било възможно да се моделират предположенията на учащите за разпределение на вероятността като източник на пристрастия (напр. Jazayeri and Shadlen, 2010; Cicchini et al., 2012).

Jacoby and McDermott (2017) наскоро моделирани н-интервални ритми като единични точки в n-1 размерния симплекс и формулира многовариантна смес преди това пространство, приемайки, че Гаусовите модели са в основата на всяка от смесите. А именно, те формулираха многомерност стр(z) директно. Нашият подход към предшественика е тясно свързан. Подобно на Jacoby и McDermott (2017), ние изразяваме приоритета като смес от гауссови компоненти. Нашата формулировка обаче третира н-интервален ритъм като набор от n-1 независими проби от a едномерно мултимодално разпределение, а не една многомерна извадка. Двата подхода по същество представляват незначителни варианти на модела за ковариация на категориите съотношения на интервалите. Предположението, че разпределението стр(z) има гауссова форма, трябва да бъде тествана в бъдеща работа, но е в съответствие със съществуващата работа и справедливо първо приближение.

Пишем приора като a К-размерна гауссова смес от категории на съотношението на интервалите и вероятността за данните като i.i.d. Gaussian, лежащ в основата на тези категории, така че пределното разпределение на съотношенията на интервалите има формата:

Тук предишният присвоява на всеки Гаус к = 1, ..., К тегло в сместа, φк, което определя относителната му значимост като категория; категория означава μк, което определя очакваното съотношение на интервала, залегнало в основата на тази категория; и дисперсия на категорията σк. Предположението, което правим, е, че теглата са постоянни: φ k = K - 1 (съответстващи на равен брой наблюдения в Гаусаните на фигури 1C – E). Въпреки че се надяваме да разгледаме това предположение емпирично в бъдеще, ние продължаваме с най-неутралното предположение: никоя категория на съотношението не е привилегирована.

Предположение 3: Малък брой под-втори категории

Ако приемем, че нашето индексиране на категории под предходното е строго подредено от средствата на категорията, така че μ j μ k ⇔ j k, можем веднага да изразим второто си емпирично ограничение върху разпределението G: съществуват само няколко категории (Desain and Honing, 2003; Motz et al., 2013; Ravignani et al., 2016, 2018). К е естествено ограничен от нашия подход само за компоненти на модела за малък целочислени съотношения и те са ограничени по брой. Освен това, ограничихме диапазона на категорията означава μк от 200 ms (Лондон, 2004, стр. 35) до 1000 ms (Shaffer, 1983; Desain and Honing, 2003; Buhusi and Meck, 2005). Това ограничение ограничава К до най-голям брой категории, така че никое средно за категория не надвишава 1000 ms:

Предположение 4: Скаларно време

Засега нашите предположения не ограничават нито една категория, а μк нито стандартни отклонения σк. Последното ни, може би най-централно предположение е, че времето показва скаларни свойства в под-втория времеви диапазон, разгледан тук (Gibbon, 1977; Matell and Meck, 2000). Скаларното синхронизиране драстично намалява броя на свободните параметри, описващи разпределението G, чрез изразяване на вариации на категорията като функция на категорийните средства. Стандартното отклонение за всяка категория σк е равно на средната стойност μк умножен по постоянен, безразмерен коефициент с (Фигура 1Е):

Предварителни емпирични доклади са оценени с да приблизително 0,025 (Friberg and Sundberg, 1995; Madison and Merker, 2004).

Свързване на категоричното възприятие и скаларното време: колко близо можем да стигнем до интервалите на цяло числово съотношение?

И четирите предположения са емпирично основани и независими едно от друго. Сега, G може допълнително да се характеризира със степента на припокриване между гаусите, съставящи сместа. За да формализираме това, приемаме всяка категория к да се пресича със съседните му съседи к-1 и к+1 на разстояние, пропорционално на c k l и c k u далеч от средната стойност μк (Фигура 1F), което е постоянен дял от стандартното отклонение σк. c k l и c k u параметризират припокриването между категориите: те изразяват колко стандартни отклонения са далеч от средната стойност μк клъстерът к пресича клъстера к+1, и колко стандартни отклонения далеч от средната стойност μк+1 клъстера к+1 пресича клъстера к (Фигура 1F показва пример за к = 1,2).

Комбинирайки тази идея за параметризирано припокриване със скаларни свойства, всеки клъстер к се простира от μ k - s c k l μ k до μ k + s c k u μ k. При тези предположения разстоянието между средствата на две съседни разпределения (Фигура 1F) може да бъде записано като