Informacje dotyczące projektu "Rhythmic structure of utterances in Polish: A corpus study" (Struktura rytmiczna wypowiedzi w języku polskim: analiza korpusowa; projekt finansowany przez NCN na podst. decyzji 2013/11/D/HS2/04486 w okresie 01.08.2014-31.07.2017).
- Cele, znaczenie, metodologia, workplan (full description in English).
- Wyniki projektu - zob. Wagner, Agnieszka (2017). Rytm w mowie i języku w ujęciu wielowymiarowym. ISBN 978-83-8017-168-8, Wyd. Elipsa, Warszawa 2017. (English version of project results summary; see also Publications)
- Polish Rhythmic Database (LREC paper).
Cel naukowy
Proponowany projekt dotyczy rytmu mowy i koncentruje się na języku polskim, którego rytm w porównaniu z innymi językami (np. niemieckim, angielskim lub chińskim) jest stosunkowo mało zbadany. W projekcie poruszone zostaną różne zagadnienia związane ze strukturą rytmiczną wypowiedzi w języku polskim, które dotychczas nie były badane wcale lub tylko w ograniczonym zakresie, i konieczne jest poddane ich głębszej i bardziej wszechstronnej analizie w oparciu o korpus mowy i najnowszą metodologię.
Celem proponowanego projektu jest stworzenie wielowymiarowego opisu rytmu mowy w języku polskim. Będzie to opis na poziomie frazy i będzie się on opierał na wiedzy o związkach między iloczasem a strukturą fonotaktyczną i prozodyczną wypowiedzi języka polskiego, relacji między rytmem a tempem mowy, udziału parametrów w wymiarze iloczasu, intonacji, intensywności i tempa w realizacji zjawiska metrum i grupowania (o decydującym znaczeniu dla percepcji rytmu), a także międzyjęzykowej (ang. cross-linguistic) produkcji i percepcji prominencji (ang. prominence) i frazowania związanych kolejno z metrum i grupowaniem. Jednym z zastosowań tego opisu w proponowanym projekcie będzie ilościowa i jakościowa analiza rytmu wypowiedzi języka polskiego, zrealizowanych przez mówców nienatywnych reprezentujących języki o percepcyjnie różnych rytmach. Stworzenie takiego wielowymiarowego opisu będzie wymagało przeprowadzenia szeregu analiz dotyczących zagadnień takich jak m.in. wpływ struktury fonotaktycznej (związanej ze strukturą sylab) i prozodycznej (związanej z rozkładem i siłą prominencji i granic frazowych) na organizację rytmiczną wypowiedzi, czy też związek między tempem mowy a rytmem, włączając w to kwestię relacji między tempem zamierzonym a faktycznie zrealizowanym, średniego tempa w wypowiedziach w języku polskim i fonetyczną realizację zmian tempa, od bardzo wolnego do bardzo szybkiego. Na podstawie obecnego stanu wiedzy można się spodziewać, że język polski będzie wykazywał w tym zakresie specyficzne własności, ale też podobieństwa z innymi językami (Dellwo & Wagner 2003, Dellwo 2008, Malisz 2013).
Kolejnym celem proponowanego projektu jest rytmiczna klasyfikacja języka polskiego, którego status pozostaje nieustalony, a dotychczasowe badania wskazują różne i często sprzeczne klasyfikacje (Dauer 1987, Ramus et al. 1999, Grabe & Low 2002). Planowane w projekcie analizy odpowiedzą na nierozstrzygnięte dotąd pytanie, czy język polski należy do języków o rytmie sylabicznym (jak np. hiszpański), czy też do języków o rytmie akcentowym (jak np. angielski), czy może stanowi odrębną klasę. Wyniki analiz będą ważnym głosem w debacie toczącej się między zwolennikami różnych koncepcji: kategorii rytmicznych, rytmicznego kontinuum, czy też rytmów współistniejących. Prace dotyczące rytmicznej klasyfikacji języków i wielu innych zagadnień związanych z rytmem opierają się najczęściej na miarach zwanych metrami rytmicznymi (rhythm metrics), które pozwalają na zmierzenie zmienności czasu trwania interwałów samogłoskowych i spółgłoskowych. Nie ma jednak zgody co do tego, na ile stabilny jest ilościowy opis rytmu, którego dostarczają metra (Arvaniti 2012, Wiget et al. 2010, Prieto et al. 2012). Celem proponowanego projektu będzie zbadanie wpływu potencjalnych czynników zmienności (m.in. struktura fonotaktyczna, tempo, styl wypowiedzi) na metra rytmiczne w oparciu i wypowiedzi w języku polskim, i wyłonienie najbardziej stabilnych miar do wykorzystania w kolejnych etapach projektu. Zwerfykowana zostanie również hipoteza, że wybrane metra rytmiczne efektywnie opisują zjawiska iloczasowe na poziomie frazy.
Obecnie uważa się, że badania rytmu powinny wyjść poza wymiar iloczasu, dlatego też w proponowanym projekcie zostanie dokładnie zbadane zagadnienie akustycznej realizacji i percepcji prominencji (metrum) i frazowania (grupowania). Badania będą miały charakter międzyjęzykowy – z uwagi na udział mówców nienatywnych języka polskiego – i wskażą, w jakim stopniu percepcja tych zjawisk zależy od struktur językowych, a w jakich od cech akustycznych sygnału mowy. Zweryfikowana zostanie hipoteza o różnicach między mówcami natywnymi i nienatywnymi języka polskiego w zakresie fonetycznej realizacji zmienności w wymiarze iloczasu, intonacji i intensywności, która związana jest z różnymi poziomami prominencji i frazowania. Zbadana zostanie także hipoteza o wpływie czynników fonetycznych (akustycznych) i językowych na percepcję prominencji i frazowania.
Znaczenie projektu
Rytm jest jednym z podstawowych pojęć w dziedzinie muzyki, poezji i mowy, i w każdej z nich może być inaczej rozumiany. W odniesieniu do mowy, rytm można zdefiniować jako systematyczną czasową organizację mniej i bardziej uwydatnionych (ang. prominent) jednostek mowy. Badania w dziedzinie rytmu mają ogromne znaczenie nie tylko w językoznawstwie i fonetyce, ale także w innych dziedzinach nauki, m.in. psychologii, patologii i terapii mowy, technologii mowy i języka, nabywaniu języka, ponieważ struktura rytmiczna ułatwia analizę składniową, interpretację i zapamiętywanie treści wypowiedzi. Znaczna część dotychczasowych badań nad rytmem pozostaje pod wpływem hipotezy o rytmicznej klasyfikacji języków, która ma swe źródło w obserwacji, że różne języki posiadają percepcyjnie różne rytmy. Zgodnie z tą hipotezą języki można przyporządkować do jednej z trzech kategorii: rytmu sylabicznego (np. jęz. hiszpański, włoski), rytmu akcentowego (niemiecki, angielski) lub rytmu opartego na morach (japoński). Tradycyjne badania rytmu (np. Pike 1946) szukały potwierdzenia tej hipotezy w izochronizmie, który zakładał, że w językach o rytmie sylabicznym/akcentowym/opartym na morze sylaby/stopy/mory powinny być tej samej długości (tj. mieć ten sam iloczas). Ponieważ nie udało się potwierdzić empirycznie istnienia izochronizmu, źródeł percepcyjnych różnic między rytmami języków zaczęto szukać w ich fonetyce i fonologii. Zaobserwowano, że w językach o rytmie sylabicznym na ogół nie występują samogłoski zredukowane, a prawie połowa sylab ma bardzo prostą strukturę (Dauer 1987, Dellwo 2008). W językach o rytmie akcentowym sylaby mogą zawierać wieloelementowe zbitki spółgłoskowe w pozycji nagłosowej i wygłosowej, zaś samogłoski podlegają redukcji o różnym nasileniu. Te i wiele innych zjawisk na poziomie głosek i sylab wpływa na organizację czasową wypowiedzi, a więc również na ich rytm (którego iloczas jest głównym akustycznym korelatem). Obserwacje te dały początek ilościowemu opisowi rytmu za pomocą miar nazywanych metrami rytmicznymi. Do najczęściej stosowanych metrów należą %V i ΔC (Ramus et al. 1999), nPVI i rPVI (Grabe & Low 2002), oraz VarcoV i VarcoC (Dellwo 2006), a głównym obszarem ich zastosowań jest rytmiczna klasyfikacja języków (Ramus et al. 1999, Grabe & Low 2002, Benus & Simko 2012, Prieto et al. 2012, Wagner 2013).
Status rytmiczny języka polskiego pozostaje jak dotąd nieustalony. Ogólnie rzecz biorąc, język polski wykazuje cechy fonologiczne charakterystyczne dla języków o obu typach rytmu – sylabicznym, m.in. stała pozycja akcentu leksykalnego (fixed stress), brak redukcji samogłosek nieakcentowanych, i akcentowym, m.in. obecność sylab o złożonej strukturze fonotaktycznej, znaczący udział iloczasu w realizacji prominencji i frazowania (zob. Jassem 1962, Richter 1987, Demenko 1999, Klessa 2006, Wagner 2008, Malisz 2013). Wyniki badań z użyciem metrów rytmicznych (Ramus et al. 1999, Grabe & Low 2002) również nie pozwoliły na jednoznaczną klasyfikację rytmu języka polskiego lub dały sprzeczne wyniki: według nPVI i rPVI ma on rytm zbliżony do sylabicznego, zaś według %V i ΔC jest to rytm akcentowy. Wyniki rytmicznej klasyfikacji języka polskiego dokonanej w proponowanym projekcie i analiza porównawcza z innymi językami (na podstawie wyników prezentowanych w literaturze) w oparciu o wielowymiarowy opis rytmu będą miały znaczenie dla ogólnego rozumienia rytmu mowy, dla którego punktem wyjścia jest nadal koncepcja kategorii rytmicznych. Jest ona poddawana krytyce z uwagi na sprowadzenie rytmu do pojedynczego wymiaru iloczasu. Krytykowana jest także koncepcja rytmu sylabicznego, którego wiarygodność psychologiczną poddaje się w wątpliwość (Arvaniti 2009). Wyniki analiz będą ważnym głosem w debacie toczącej się między zwolennikami różnych koncepcji: kategorii rytmicznych, rytmicznego kontinuum (Dauer 1987) oraz rytmów współistniejących (Nolan & Asu 2009). Jeśli rytm języka polskiego okaże się nieklasyfikowalny (ani sylabiczny, ani akcentowy, ani nie będzie stanowić odrębnej klasy), konieczne będzie rozważenie innych niż kategorialna koncepcji rytmu. Z zagadnieniem rytmicznej klasyfikacji języków związane jest zagadnienie związku między rytmem a tempem mowy. Istnieje pogląd, że u podstaw percepcyjnie różnych rytmów nie leżą kategorie rytmiczne, a typowe dla języków tempo mowy i sposoby realizacji jego zmian (Dellwo & Wagner 2003, Dellwo 2008). Zagadnienie to nie było dotąd w języku polskim obszernie analizowane (np. Malisz, 2013). Proponowany projekt będzie miał duży wkład na poszerzenie wiedzy w tym zakresie, w oparciu o analizy na zróżnicowanym materiale językowym (mowa ciągła – tekst, fonotaktycznie zróżnicowane zdania, mini-dialogi o różnej strukturze prozodycznej i rytmicznej, wiersze, mowa półspontaniczna) w pięciu różnych tempach (od bardzo wolnego do bardzo szybkiego).
Metra rytmiczne, które stanowią podstawę metodologii wielu najnowszych badań nad rytmem (m.in. Beňuš & Šimko, Prieto et al. 2012) są obecnie poddawane krytyce z uwagi na wrażliwość na szereg różnych czynników, m.in. tempo mowy i typ wypowiedzi (Wiget et al. 2010, Arvaniti 2012). Kwestionowany jest także ich status jako „akustycznych korelatów rytmu” (Barry et al. 2009). Opis rytmu za pomocą metrów jest niestabilny, gdyż niekiedy wskazywane przez niego różnice wewnątrz danego języka są większe niż między różnymi językami. Nie przesądza to jednak o tym, że nie mogą one być stosowane do opisu wzorców czasowych wypowiedzi. Hipoteza taka zostanie zweryfikowana w proponowanym projekcie. Po raz pierwszy do badań stabilności metrów rytmicznych zostaną wykorzystane wypowiedzi w języku polskim. Zidentyfikowane zostaną czynniki o decydującym wpływie na ich wartości i wyłonione najbardziej stabilne miary do wykorzystania w projekcie oraz przez innych badaczy rytmu na etapie planowania badań i interpretacji ich wyników. Wyniki analiz będą miały duże znaczenie dla metodologii przyszłych badań nad rytmem.
Obecnie panuje pogląd, że nie powinno się stawiać znaku równości między rytmem a wzorcami czasowymi (Arvaniti 2009), ponieważ w produkcji i percepcji rytmu znaczenie mają także czynniki inne niż iloczas, jak wysokość tonu (intonacja), intensywność czy też tempo mowy, za pomocą których realizowane są zjawiska metrum i grupowania (związane z prominencją i frazowaniem). Wkład poszczególnych cech akustycznych jest specyficzny dla danego języka. Dotychczasowe badania dla języka polskiego nie są w tej kwestii zgodne: Dłuska (1950) za główny korelat prominencji związanej z akcentem leksykalnym (ang. stress) uznaje intensywność, natomiat Jassem (1962) – zmiany wysokości tonu. Zróżnicowanie iloczasu jest mniejsze w przypadku prominencji niższego poziomu niż wyższego poziomu (Demenko 1999, Wagner 2008, Malisz & Wagner 2012). Iloczas jest głównym korelatem granic fraz prozodycznych, choć zmiany wysokości tonu także odgrywają rolę (Demenko 1999, Wagner 2008). Nowatorski charakter projektu polega na włączeniu do badania struktury rytmicznej wypowiedzi także zjawiska prominencji i frazowania (na poziomie produkcji i percepcji), przy czym uwzględnionych zostanie więcej poziomów prominencji, niż we wcześniejszych pracach (por. Malisz & Wagner 2012). Nowością będzie również włączenie do badań wypowiedzi mówców nienatywnych i przeprowadzenie analiz porównawczych między różnymi akcentami. Z uwagi na znaczenie rytmu w percepcji obcego akcentu oraz ogólnie w komunikacji słownej, wiedza na ten temat jest istotna w procesie uczenia się i nauczania języka polskiego jako obcego.
Jak dotąd jedynie nieliczne prace dotyczące rytmu (i ogólnie prozodii) wypowiedzi w języku polskim opierały się na korpusach mowy i najnowszej metodologii (m.in. Demenko 1999, Klessa 2006, Gibbon et al. 2007, Wagner 2013, Malisz 2013). Wiele aspektów rytmicznej struktury języka polskiego nie było badanych wcale, np. fonotaktyczne cechy rytmu wypowiedzi na poziomie frazy lub realizacja i percepcja rytmu przez mówców nienatywnych języka polskiego, lub analizowano je tylko w ograniczonym zakresie, np. związki między rytmem a tempem mowy (Malisz 2013), czy też produkcja i percepcja prominencji (Malisz & Wagner 2012). Zagadnienia te zostaną dogłębnie zbadane w proponowanym projecie, gdyż są one istotnym elementem wiedzy o rytmie języka polskiego. Jak dotąd analizy opierały się na ograniczonym materiale (mała liczba mówców, małe urozmaicenie fonotaktyczne/prozodyczne/rytmiczne lub wypowiedzi „niekontrolowane”, niespełniające warunków badań szczegółowych). Nowatorski charakter projektu będzie polegał na wykorzystaniu do badań rytmu specjalnie stworzonego zróżnicowanego korpusu wypowiedzi w języku polskim zrealizowanych przez mówców natywnych (20 osób) oraz nienatywnych (15 osób). Ponadto w przeciwieństwie do dotychczasowych prac, które nie wychodziły poza poziom segmentalny, poziom sylaby, stopy lub tzw. interstress intervals, i tylko rzadko poza wymiar iloczasu, w proponowanym projekcie analizy będą przeprowadzane na poziomie frazy i będą również uwzględniały wymiary inne niż iloczas, tj. wysokość tonu (intonację), intensywność i tempo mowy. Zastosowane zostaną najnowsze metodologie oraz opracowane nowe sposoby analizy i opisu rytmu. Projekt przybliży badania w dziedzinie rytmu języka polskiego do światowych standardów.
Koncepcja i plan badań
Prace w projekcie będą przebiegały etapami. W pierwszym etapie powstaną specyfikacje dotyczące korpusu mowy, jego anotacji (opisu) oraz pomiarów parametrów akustycznych i ekstrakcji cech językowych na potrzeby analiz. Wszystkie specyfikacje powstaną w oparciu o aktualną wiedzę i najnowszą metodologię, z uwzględnieniem charakterystyki języka polskiego (szacowany czas trwania: 1-4 mies. projektu). Drugi etap będzie związany z tworzeniem korpusu i bazy mowy, anotacją nagrań oraz pomiarami i ekstrakcją parametrów do wykorzystania w konkretnych analizach (5-12 mies.). W trzecim etapie prowadzone będą analizy, najpierw bardziej szczegółowe, a następnie bardziej całościowe i bezpośrednio związane z celami projektu (13-24 mies.). Wyniki badań będą na bieżąco opracowywane na potrzeby kolejnych analiz oraz rozpowszechniania wyników projektu (zob. zad. 14). Poniższa lista przedstawia szczegółowe cele badawcze. Niektóre zadania, z uwagi na powiązania ich tematyki, będą przebiegały równolegle i będą realizowane przez kilku wykonawców (zad. 2 i 3, 7 i 8, 10 i 11). Badania opisane w punktach 7-11 będą opierały się na wybranym materiale językowym (np. tekst czytany we wszystkich tempach mowy lub tylko w tempie normalnym).
Metodyka
Na potrzeby badań powstanie specjalny korpus zawierający bogaty materiał językowy zróżnicowany pod względem tempa mowy oraz struktury fonotaktycznej, prozodycznej i rytmicznej (tekst ciągły, izolowane zdania, mini-dialogi, wiersze, mowa spontaniczna), zrealizowany przez 20 mówców natywnych i 15 nienatywnych języka polskiego. Mówcy natywni będą wybrani spośród studentów Instytutu Językoznawstwa UAM i powinni reprezentować jeden typ wymowy: z uwagi na miejsce prowadzenia projektu będzie to wymowa krakowsko-poznańska. Mówcy nienatywni będą wybrani spośród uczestników kursu Polish phonetics oraz Experimental phonetics (Instytut Językoznawstwa UAM), a w razie potrzeby także spośród uczestników Studium Języka i Kultury Polskiej dla Cudzoziemców UAM. Głównym kryterium doboru będzie język ojczysty mówców: preferowane będą rytmicznie różne języki (np. niemiecki, hiszpański i koreański). Mówcy powinni posługiwać się standardowym akcentem w swoich językach ojczystych i reprezentować podobny poziom zaawansowania w języku polskim. Nagrania zostaną przeprowadzone w profesjonalnym studiu nagraniowym Zakładu Psycholingwistyki (IJ, UAM) na laptopie wyposażonym w oprogramowanie Sound Forge Audio Studio 10.0.
Na podstawie nagrań materiału językowego powstanie korpus mowy. Osoby pracujące z nagraniami będą miały do nich dostęp przez specjalnie zaprojektowaną bazę, która będzie też powiązana z narzędziami Annotation Pro i Praat do segmentacji, anotacji i pomiarów. Baza i korpus mowy będą przechowywane na zakupionym w projekcie serwerze. Korpus zostanie poddany transkrypcji fonetycznej oraz segmentacji i opisowi (anotacji) na poziomie głosek, sylab, wyrazów i fraz. Transkrypcja i segmentacja zostaną przeprowadzone automatycznie za pomocą istniejących narzędzi (CreatSeg, Annotation Pro), a ich wyniki zostaną zweryfikowane przez dwóch fonetyków. Następnie określone zostaną (częściowo automatycznie) granice interwałów samogłoskowych i spółgłoskowych do pomiarów metrów rytmicznych. Anotacja prozodyczna będzie uwzględniała zaznaczenie pozycji sylab o różnym stopniu prominencji (unstressed, stressed unaccented, pitch accent, nuclear accent) i sile granicy frazy (intermediate & intonational phrase). W anotację zostanie zaangażowanych 5 studentów Instytutu oraz studenci obcojęzyczni, którzy wezmą udział w nagranich. Na potrzeby anotacji stworzone zostaną dwa nowe stanowiska wyposażone w komputer stacjonarny i dobrej jakości słuchawki, z dostępem do serwera. W oparciu o segmentacje i anotacje utworzona zostanie baza pomiarów akustycznych (m.in. parametry związane z iloczasem, intensywnością i intonacją, metra rytmiczne) i cech językowych (m.in. struktura sylaby i jej pozycja we frazie). Pomiary będą wykonywane automatycznie w Annotation Pro i Praacie z użyciem specjalnie stworzonych wtyczek i skryptów działających pod tymi programami. Wyniki będą zapisywane w formacie umożliwiającym eksport do arkusza kalkulacyjnego. Baza ta będzie wykorzystana w zadaniach 7-13. W celu zbadania statystycznej istotności obserwowanych tendencji, wpływów i relacji, zastosowane zostaną m.in. ANOVA, Uogólnione Mieszane Modele Liniowe, regresja, testy post-hoc, i obliczone będą współczynniki korelacji i odległości euklidesowe. Analizy statystyczne zostaną przeprowadzone w Statistice 10. Do opracowania wyników projektu wykorzystane będą narzędzia pakietu MS Office oraz wymienione powyżej programy specjalistyczne.
References
Arvaniti, A. (2009). Rhythm, timing and the timing of rhythm. Phonetica, 66(1-2), 46-63.
Arvaniti, A. (2012). The usefulness of metrics in the quantification of speech rhythm. Journal of Phonetics, 40(3), 351-373.
Barry, W., Andreeva, B., & Koreman, J. (2009). Do rhythm measures reflect perceived rhythm?. Phonetica, 66(1-2), 78-94.
Beňuš, Š., & Šimko, J. (2012). Rhythm and tempo in Slovak. In Proc. Speech Prosody, Shanghai, China.
Dauer, R. (1987). Phonetic and phonological components of language rhythm. In Proceedings of the XIth International Congress of the Phonetic Sciences, volume 5, pages 447–450. Tallinn: Academy of Sciences.
Dłuska, M. (1950) Fonetyka polska. PWN: Warszawa
Dellwo, V. and Wagner, P. (2003). Relationships between speech rate and rhythm. In Proceedings of the 15th International Conference of the Phonetic Sciences, 471–474, Barcelona, Spain.
Dellwo, V. (2008). The influence of speech rate on speech rhythm. Unpublished PhD thesis, Universität Bonn.
Dellwo, V. (2006). Rhythm and speech rate: A variation coefficient for ∆C. Language and language-processing, 231-241.
Demenko, G. (1999). Analysis of Polish suprasegmentals for needs of Speech Technology. UAM, Poznań.
Gibbon, D., Bachan, J., & Demenko, G. (2007). Syllable timing patterns in Polish: results from annotation mining. In Interspeech 2007, 994-997, Antwerp, Belgium.
Grabe, E., & Low, E. L. (2002). Durational variability in speech and the rhythm class hypothesis. Papers in laboratory phonology, 7(515-546).
Jassem, W. (1962) Akcent języka polskiego. Wrocław: Ossolineum.
Klessa, K. (2006) Analiza iloczasu głoskowego na potrzeby syntezy mowy polskiej. Niepublikowana rozprawa doktorska, Uniwersytet im. Adama Mickiewicza w Poznaniu.
Malisz, Z., & Wagner, P. (2012). Acoustic-phonetic realisation of Polish syllable prominence: a corpus study. Speech and Language Technology vol. 14/15, 105-114.
Malisz, Z. (2013). Speech rhythm variability in Polish and English: A study of interaction between rhythmic levels. Niepublikowana rozprawa doktorska, Uniwersytet im. Adama Mickiewicza w Poznaniu.
Nolan, F., & Asu, E. L. (2009). The pairwise variability index and coexisting rhythms in language. Phonetica, 66(1-2), 64-77
Pike, K. L. (1945). The Intonation of American English. Ann Arbor: University of Michigan.
Prieto, P., Vanrell, M. D. M., Astruc, L., Payne, E., & Post, B. (2012). Phonotactic and phrasal properties of speech rhythm. Evidence from Catalan, English, and Spanish. Speech Communication, 54(6), 681-702.
Ramus, F., Nespor, M. & Mehler, J. (1999) Correlates of linguistic rhythm in the speech signal. Cognition 73(3). 1-28.
Richter, L. (1987). Modelling of the rhythmic structure of utterances in Polish. Studia Phonetica Posnaniensia 1, 91–125.
Wagner, A. (2008) Comprehensive model of intonation for application in speech synthesis. Niepublikowana rozprawa doktorska, Uniwersytet im. Adama Mickiewicza w Poznaniu.
Wagner, A. (2013) Struktura rytmiczna wypowiedzi w polskiej mowie natywnej i nienatywnej. Scripta manent - res novae, Stanisław Puppel, Teresa Tomaszkiewicz (red.), 499-510, Wyd. UAM.
Wiget, L., White, L., Schuppler, B., Grenon, I., Rauch, O. & Mattys, S. L. (2010) How stable are acoustic metrics of contrastive speech rhythm? J. Acoust. Soc. Am 127(3). 1559-1569.
Proponowany projekt dotyczy rytmu mowy i koncentruje się na języku polskim, którego rytm w porównaniu z innymi językami (np. niemieckim, angielskim lub chińskim) jest stosunkowo mało zbadany. W projekcie poruszone zostaną różne zagadnienia związane ze strukturą rytmiczną wypowiedzi w języku polskim, które dotychczas nie były badane wcale lub tylko w ograniczonym zakresie, i konieczne jest poddane ich głębszej i bardziej wszechstronnej analizie w oparciu o korpus mowy i najnowszą metodologię.
Celem proponowanego projektu jest stworzenie wielowymiarowego opisu rytmu mowy w języku polskim. Będzie to opis na poziomie frazy i będzie się on opierał na wiedzy o związkach między iloczasem a strukturą fonotaktyczną i prozodyczną wypowiedzi języka polskiego, relacji między rytmem a tempem mowy, udziału parametrów w wymiarze iloczasu, intonacji, intensywności i tempa w realizacji zjawiska metrum i grupowania (o decydującym znaczeniu dla percepcji rytmu), a także międzyjęzykowej (ang. cross-linguistic) produkcji i percepcji prominencji (ang. prominence) i frazowania związanych kolejno z metrum i grupowaniem. Jednym z zastosowań tego opisu w proponowanym projekcie będzie ilościowa i jakościowa analiza rytmu wypowiedzi języka polskiego, zrealizowanych przez mówców nienatywnych reprezentujących języki o percepcyjnie różnych rytmach. Stworzenie takiego wielowymiarowego opisu będzie wymagało przeprowadzenia szeregu analiz dotyczących zagadnień takich jak m.in. wpływ struktury fonotaktycznej (związanej ze strukturą sylab) i prozodycznej (związanej z rozkładem i siłą prominencji i granic frazowych) na organizację rytmiczną wypowiedzi, czy też związek między tempem mowy a rytmem, włączając w to kwestię relacji między tempem zamierzonym a faktycznie zrealizowanym, średniego tempa w wypowiedziach w języku polskim i fonetyczną realizację zmian tempa, od bardzo wolnego do bardzo szybkiego. Na podstawie obecnego stanu wiedzy można się spodziewać, że język polski będzie wykazywał w tym zakresie specyficzne własności, ale też podobieństwa z innymi językami (Dellwo & Wagner 2003, Dellwo 2008, Malisz 2013).
Kolejnym celem proponowanego projektu jest rytmiczna klasyfikacja języka polskiego, którego status pozostaje nieustalony, a dotychczasowe badania wskazują różne i często sprzeczne klasyfikacje (Dauer 1987, Ramus et al. 1999, Grabe & Low 2002). Planowane w projekcie analizy odpowiedzą na nierozstrzygnięte dotąd pytanie, czy język polski należy do języków o rytmie sylabicznym (jak np. hiszpański), czy też do języków o rytmie akcentowym (jak np. angielski), czy może stanowi odrębną klasę. Wyniki analiz będą ważnym głosem w debacie toczącej się między zwolennikami różnych koncepcji: kategorii rytmicznych, rytmicznego kontinuum, czy też rytmów współistniejących. Prace dotyczące rytmicznej klasyfikacji języków i wielu innych zagadnień związanych z rytmem opierają się najczęściej na miarach zwanych metrami rytmicznymi (rhythm metrics), które pozwalają na zmierzenie zmienności czasu trwania interwałów samogłoskowych i spółgłoskowych. Nie ma jednak zgody co do tego, na ile stabilny jest ilościowy opis rytmu, którego dostarczają metra (Arvaniti 2012, Wiget et al. 2010, Prieto et al. 2012). Celem proponowanego projektu będzie zbadanie wpływu potencjalnych czynników zmienności (m.in. struktura fonotaktyczna, tempo, styl wypowiedzi) na metra rytmiczne w oparciu i wypowiedzi w języku polskim, i wyłonienie najbardziej stabilnych miar do wykorzystania w kolejnych etapach projektu. Zwerfykowana zostanie również hipoteza, że wybrane metra rytmiczne efektywnie opisują zjawiska iloczasowe na poziomie frazy.
Obecnie uważa się, że badania rytmu powinny wyjść poza wymiar iloczasu, dlatego też w proponowanym projekcie zostanie dokładnie zbadane zagadnienie akustycznej realizacji i percepcji prominencji (metrum) i frazowania (grupowania). Badania będą miały charakter międzyjęzykowy – z uwagi na udział mówców nienatywnych języka polskiego – i wskażą, w jakim stopniu percepcja tych zjawisk zależy od struktur językowych, a w jakich od cech akustycznych sygnału mowy. Zweryfikowana zostanie hipoteza o różnicach między mówcami natywnymi i nienatywnymi języka polskiego w zakresie fonetycznej realizacji zmienności w wymiarze iloczasu, intonacji i intensywności, która związana jest z różnymi poziomami prominencji i frazowania. Zbadana zostanie także hipoteza o wpływie czynników fonetycznych (akustycznych) i językowych na percepcję prominencji i frazowania.
Znaczenie projektu
Rytm jest jednym z podstawowych pojęć w dziedzinie muzyki, poezji i mowy, i w każdej z nich może być inaczej rozumiany. W odniesieniu do mowy, rytm można zdefiniować jako systematyczną czasową organizację mniej i bardziej uwydatnionych (ang. prominent) jednostek mowy. Badania w dziedzinie rytmu mają ogromne znaczenie nie tylko w językoznawstwie i fonetyce, ale także w innych dziedzinach nauki, m.in. psychologii, patologii i terapii mowy, technologii mowy i języka, nabywaniu języka, ponieważ struktura rytmiczna ułatwia analizę składniową, interpretację i zapamiętywanie treści wypowiedzi. Znaczna część dotychczasowych badań nad rytmem pozostaje pod wpływem hipotezy o rytmicznej klasyfikacji języków, która ma swe źródło w obserwacji, że różne języki posiadają percepcyjnie różne rytmy. Zgodnie z tą hipotezą języki można przyporządkować do jednej z trzech kategorii: rytmu sylabicznego (np. jęz. hiszpański, włoski), rytmu akcentowego (niemiecki, angielski) lub rytmu opartego na morach (japoński). Tradycyjne badania rytmu (np. Pike 1946) szukały potwierdzenia tej hipotezy w izochronizmie, który zakładał, że w językach o rytmie sylabicznym/akcentowym/opartym na morze sylaby/stopy/mory powinny być tej samej długości (tj. mieć ten sam iloczas). Ponieważ nie udało się potwierdzić empirycznie istnienia izochronizmu, źródeł percepcyjnych różnic między rytmami języków zaczęto szukać w ich fonetyce i fonologii. Zaobserwowano, że w językach o rytmie sylabicznym na ogół nie występują samogłoski zredukowane, a prawie połowa sylab ma bardzo prostą strukturę (Dauer 1987, Dellwo 2008). W językach o rytmie akcentowym sylaby mogą zawierać wieloelementowe zbitki spółgłoskowe w pozycji nagłosowej i wygłosowej, zaś samogłoski podlegają redukcji o różnym nasileniu. Te i wiele innych zjawisk na poziomie głosek i sylab wpływa na organizację czasową wypowiedzi, a więc również na ich rytm (którego iloczas jest głównym akustycznym korelatem). Obserwacje te dały początek ilościowemu opisowi rytmu za pomocą miar nazywanych metrami rytmicznymi. Do najczęściej stosowanych metrów należą %V i ΔC (Ramus et al. 1999), nPVI i rPVI (Grabe & Low 2002), oraz VarcoV i VarcoC (Dellwo 2006), a głównym obszarem ich zastosowań jest rytmiczna klasyfikacja języków (Ramus et al. 1999, Grabe & Low 2002, Benus & Simko 2012, Prieto et al. 2012, Wagner 2013).
Status rytmiczny języka polskiego pozostaje jak dotąd nieustalony. Ogólnie rzecz biorąc, język polski wykazuje cechy fonologiczne charakterystyczne dla języków o obu typach rytmu – sylabicznym, m.in. stała pozycja akcentu leksykalnego (fixed stress), brak redukcji samogłosek nieakcentowanych, i akcentowym, m.in. obecność sylab o złożonej strukturze fonotaktycznej, znaczący udział iloczasu w realizacji prominencji i frazowania (zob. Jassem 1962, Richter 1987, Demenko 1999, Klessa 2006, Wagner 2008, Malisz 2013). Wyniki badań z użyciem metrów rytmicznych (Ramus et al. 1999, Grabe & Low 2002) również nie pozwoliły na jednoznaczną klasyfikację rytmu języka polskiego lub dały sprzeczne wyniki: według nPVI i rPVI ma on rytm zbliżony do sylabicznego, zaś według %V i ΔC jest to rytm akcentowy. Wyniki rytmicznej klasyfikacji języka polskiego dokonanej w proponowanym projekcie i analiza porównawcza z innymi językami (na podstawie wyników prezentowanych w literaturze) w oparciu o wielowymiarowy opis rytmu będą miały znaczenie dla ogólnego rozumienia rytmu mowy, dla którego punktem wyjścia jest nadal koncepcja kategorii rytmicznych. Jest ona poddawana krytyce z uwagi na sprowadzenie rytmu do pojedynczego wymiaru iloczasu. Krytykowana jest także koncepcja rytmu sylabicznego, którego wiarygodność psychologiczną poddaje się w wątpliwość (Arvaniti 2009). Wyniki analiz będą ważnym głosem w debacie toczącej się między zwolennikami różnych koncepcji: kategorii rytmicznych, rytmicznego kontinuum (Dauer 1987) oraz rytmów współistniejących (Nolan & Asu 2009). Jeśli rytm języka polskiego okaże się nieklasyfikowalny (ani sylabiczny, ani akcentowy, ani nie będzie stanowić odrębnej klasy), konieczne będzie rozważenie innych niż kategorialna koncepcji rytmu. Z zagadnieniem rytmicznej klasyfikacji języków związane jest zagadnienie związku między rytmem a tempem mowy. Istnieje pogląd, że u podstaw percepcyjnie różnych rytmów nie leżą kategorie rytmiczne, a typowe dla języków tempo mowy i sposoby realizacji jego zmian (Dellwo & Wagner 2003, Dellwo 2008). Zagadnienie to nie było dotąd w języku polskim obszernie analizowane (np. Malisz, 2013). Proponowany projekt będzie miał duży wkład na poszerzenie wiedzy w tym zakresie, w oparciu o analizy na zróżnicowanym materiale językowym (mowa ciągła – tekst, fonotaktycznie zróżnicowane zdania, mini-dialogi o różnej strukturze prozodycznej i rytmicznej, wiersze, mowa półspontaniczna) w pięciu różnych tempach (od bardzo wolnego do bardzo szybkiego).
Metra rytmiczne, które stanowią podstawę metodologii wielu najnowszych badań nad rytmem (m.in. Beňuš & Šimko, Prieto et al. 2012) są obecnie poddawane krytyce z uwagi na wrażliwość na szereg różnych czynników, m.in. tempo mowy i typ wypowiedzi (Wiget et al. 2010, Arvaniti 2012). Kwestionowany jest także ich status jako „akustycznych korelatów rytmu” (Barry et al. 2009). Opis rytmu za pomocą metrów jest niestabilny, gdyż niekiedy wskazywane przez niego różnice wewnątrz danego języka są większe niż między różnymi językami. Nie przesądza to jednak o tym, że nie mogą one być stosowane do opisu wzorców czasowych wypowiedzi. Hipoteza taka zostanie zweryfikowana w proponowanym projekcie. Po raz pierwszy do badań stabilności metrów rytmicznych zostaną wykorzystane wypowiedzi w języku polskim. Zidentyfikowane zostaną czynniki o decydującym wpływie na ich wartości i wyłonione najbardziej stabilne miary do wykorzystania w projekcie oraz przez innych badaczy rytmu na etapie planowania badań i interpretacji ich wyników. Wyniki analiz będą miały duże znaczenie dla metodologii przyszłych badań nad rytmem.
Obecnie panuje pogląd, że nie powinno się stawiać znaku równości między rytmem a wzorcami czasowymi (Arvaniti 2009), ponieważ w produkcji i percepcji rytmu znaczenie mają także czynniki inne niż iloczas, jak wysokość tonu (intonacja), intensywność czy też tempo mowy, za pomocą których realizowane są zjawiska metrum i grupowania (związane z prominencją i frazowaniem). Wkład poszczególnych cech akustycznych jest specyficzny dla danego języka. Dotychczasowe badania dla języka polskiego nie są w tej kwestii zgodne: Dłuska (1950) za główny korelat prominencji związanej z akcentem leksykalnym (ang. stress) uznaje intensywność, natomiat Jassem (1962) – zmiany wysokości tonu. Zróżnicowanie iloczasu jest mniejsze w przypadku prominencji niższego poziomu niż wyższego poziomu (Demenko 1999, Wagner 2008, Malisz & Wagner 2012). Iloczas jest głównym korelatem granic fraz prozodycznych, choć zmiany wysokości tonu także odgrywają rolę (Demenko 1999, Wagner 2008). Nowatorski charakter projektu polega na włączeniu do badania struktury rytmicznej wypowiedzi także zjawiska prominencji i frazowania (na poziomie produkcji i percepcji), przy czym uwzględnionych zostanie więcej poziomów prominencji, niż we wcześniejszych pracach (por. Malisz & Wagner 2012). Nowością będzie również włączenie do badań wypowiedzi mówców nienatywnych i przeprowadzenie analiz porównawczych między różnymi akcentami. Z uwagi na znaczenie rytmu w percepcji obcego akcentu oraz ogólnie w komunikacji słownej, wiedza na ten temat jest istotna w procesie uczenia się i nauczania języka polskiego jako obcego.
Jak dotąd jedynie nieliczne prace dotyczące rytmu (i ogólnie prozodii) wypowiedzi w języku polskim opierały się na korpusach mowy i najnowszej metodologii (m.in. Demenko 1999, Klessa 2006, Gibbon et al. 2007, Wagner 2013, Malisz 2013). Wiele aspektów rytmicznej struktury języka polskiego nie było badanych wcale, np. fonotaktyczne cechy rytmu wypowiedzi na poziomie frazy lub realizacja i percepcja rytmu przez mówców nienatywnych języka polskiego, lub analizowano je tylko w ograniczonym zakresie, np. związki między rytmem a tempem mowy (Malisz 2013), czy też produkcja i percepcja prominencji (Malisz & Wagner 2012). Zagadnienia te zostaną dogłębnie zbadane w proponowanym projecie, gdyż są one istotnym elementem wiedzy o rytmie języka polskiego. Jak dotąd analizy opierały się na ograniczonym materiale (mała liczba mówców, małe urozmaicenie fonotaktyczne/prozodyczne/rytmiczne lub wypowiedzi „niekontrolowane”, niespełniające warunków badań szczegółowych). Nowatorski charakter projektu będzie polegał na wykorzystaniu do badań rytmu specjalnie stworzonego zróżnicowanego korpusu wypowiedzi w języku polskim zrealizowanych przez mówców natywnych (20 osób) oraz nienatywnych (15 osób). Ponadto w przeciwieństwie do dotychczasowych prac, które nie wychodziły poza poziom segmentalny, poziom sylaby, stopy lub tzw. interstress intervals, i tylko rzadko poza wymiar iloczasu, w proponowanym projekcie analizy będą przeprowadzane na poziomie frazy i będą również uwzględniały wymiary inne niż iloczas, tj. wysokość tonu (intonację), intensywność i tempo mowy. Zastosowane zostaną najnowsze metodologie oraz opracowane nowe sposoby analizy i opisu rytmu. Projekt przybliży badania w dziedzinie rytmu języka polskiego do światowych standardów.
Koncepcja i plan badań
Prace w projekcie będą przebiegały etapami. W pierwszym etapie powstaną specyfikacje dotyczące korpusu mowy, jego anotacji (opisu) oraz pomiarów parametrów akustycznych i ekstrakcji cech językowych na potrzeby analiz. Wszystkie specyfikacje powstaną w oparciu o aktualną wiedzę i najnowszą metodologię, z uwzględnieniem charakterystyki języka polskiego (szacowany czas trwania: 1-4 mies. projektu). Drugi etap będzie związany z tworzeniem korpusu i bazy mowy, anotacją nagrań oraz pomiarami i ekstrakcją parametrów do wykorzystania w konkretnych analizach (5-12 mies.). W trzecim etapie prowadzone będą analizy, najpierw bardziej szczegółowe, a następnie bardziej całościowe i bezpośrednio związane z celami projektu (13-24 mies.). Wyniki badań będą na bieżąco opracowywane na potrzeby kolejnych analiz oraz rozpowszechniania wyników projektu (zob. zad. 14). Poniższa lista przedstawia szczegółowe cele badawcze. Niektóre zadania, z uwagi na powiązania ich tematyki, będą przebiegały równolegle i będą realizowane przez kilku wykonawców (zad. 2 i 3, 7 i 8, 10 i 11). Badania opisane w punktach 7-11 będą opierały się na wybranym materiale językowym (np. tekst czytany we wszystkich tempach mowy lub tylko w tempie normalnym).
- Stworzenie specyfikacji korpusu mowy: sprecyzowanie wymagań dotyczących mówców, materiału językowego i procedury nagraniowej.
- Stworzenie specyfikacji anotacji językowej: określenie sposobu segmentacji i anotacji nagrań (m.in. typ transkrypcji, liczba poziomów segmentacji i anotacji, etykiety) pod kątem konkretnych analiz.
- Stworzenie specyfikacji pomiarów akustycznych i esktrakcji cech językowych: określenie zbioru parametrów i cech potrzebnych do realizacji konkretnych analiz; określenie sposobu ich pozyskania, przetwarzania i przechowywania.
- Stworzenie korpusu mowy na potrzeby badań rytmu języka polskiego: w zadaniu tym mieści się nagranie wypowiedzi 20 mówców natywnych i 15 nienatywnych języka polskiego (ok. 5,5 godz. mowy), ewaluacja korpusu oraz stworzenie bazy, w której nagrania będą przechowywane, anotowane, i przez którą dokonywane będą pomiary.
- Stworzenie anotacji językowej dla nagrań w bazie mowy na potrzeby konkretnych analiz.
- Stworzenie bazy pomiarów akustycznych i cech językowych na potrzeby analiz różnych aspeków realizacji i percepcji rytmu (w polszczyźnie mówców natywnych i nienatywnych).
- Analiza związku pomiędzy rytmem a tempem mowy: będzie miała na celu określenie typowego dla mówców polskich tempa mowy, relacji między tempem zamierzonym a faktycznie zrealizowanym przez mówców i fonetycznej realizacji zmian tempa od bardzo wolnego do bardzo szybkiego. Ma to znaczenie dla charakteryzacji rytmu języka polskiego i dla ogólnej debaty dotyczącej klasyfikacji rytmicznej języków (zob. Dellwo & Wagner 2003, Dellwo 2008).
- Analiza cech fonotaktycznych i prozodycznych rytmu na poziomie frazy: oceniany będzie wpływ struktury fonotaktycznej sylab w wypowiedzi na wartości metrów rytmicznych oraz wpływ poziomu prominencji i frazowania na iloczas samogłoskowy i sylabiczny (w mowie natywnej i nienatywnej), a także badane związki między tymi dwoma poziomami analizy (Prieto et al. 2012).
- Zbadanie stabilności metrów rytmicznych: będzie miało na celu wyłonienie najbardziej stabilnych miar i zweryfikowanie hipotezy, że wybrane metra rytmiczne mogą efektywnie opisywać zjawiska iloczasowe na poziomie frazy. Badany będzie m.in. wpływ materiału językowego, akcentu, tempa mowy, struktury fonotaktycznej i prozodycznej wypowiedzi na wartości metrów.
- Zbadanie udziału iloczasu, intonacji, intensywności i tempa mowy w akustycznej realizacji metrum (prominencji) i grupowania (frazowania): analizie zostanie poddana akustyczna realizacja 4 poziomów prominencji (ang. unstressed, stressed unaccented, pitch accent, nuclear accent) i 2 poziomów frazowania (ang. intermediate & intonational phrase, zob. Wagner A. 2008) oraz wpływ tempa mowy na tę realizację.
- Analiza międzyjęzykowej (ang. cross-linguistic) percepcji i produkcji prominencji i frazowania: oceniana będzie realizacja akustyczna różnych poziomów prominencji i frazowania przez mówców natywnych i nienatywnych oraz wpływ cech akustycznych wypowiedzi i czynników językowych na percepcję tych dwóch zajwisk.
- Stworzenie wielowymiarowego opisu rytmu wypowiedzi w języku polskim: meta-analiza wyników badań w projekcie wyłoni czynniki decydujące o strukturze rytmicznej wypowiedzi na poziomie frazy. Na tej podstawie zaproponowany zostanie opis rytmu wypowiedzi mówców natywnych i nienatywnych, którego ramy będą mogły zostać wykorzystane do scharakteryzowania rytmu innych języków i akcentów oraz do ich porównania.
- Zbadanie kwestii rytmicznej klasyfikacji języka polskiego: będzie polegało na porównaniu wyników badań dla języka polskiego z wynikami dla innych języków (Ramus et al. 1999, Grabe & Low 2002, Dellwo & Wagner 2003, Dellwo 2008, Beňuš & Šimko 2012), również w oparciu o wielowymiarowy opis rytmu.
- Opracowanie wyników badań.
Metodyka
Na potrzeby badań powstanie specjalny korpus zawierający bogaty materiał językowy zróżnicowany pod względem tempa mowy oraz struktury fonotaktycznej, prozodycznej i rytmicznej (tekst ciągły, izolowane zdania, mini-dialogi, wiersze, mowa spontaniczna), zrealizowany przez 20 mówców natywnych i 15 nienatywnych języka polskiego. Mówcy natywni będą wybrani spośród studentów Instytutu Językoznawstwa UAM i powinni reprezentować jeden typ wymowy: z uwagi na miejsce prowadzenia projektu będzie to wymowa krakowsko-poznańska. Mówcy nienatywni będą wybrani spośród uczestników kursu Polish phonetics oraz Experimental phonetics (Instytut Językoznawstwa UAM), a w razie potrzeby także spośród uczestników Studium Języka i Kultury Polskiej dla Cudzoziemców UAM. Głównym kryterium doboru będzie język ojczysty mówców: preferowane będą rytmicznie różne języki (np. niemiecki, hiszpański i koreański). Mówcy powinni posługiwać się standardowym akcentem w swoich językach ojczystych i reprezentować podobny poziom zaawansowania w języku polskim. Nagrania zostaną przeprowadzone w profesjonalnym studiu nagraniowym Zakładu Psycholingwistyki (IJ, UAM) na laptopie wyposażonym w oprogramowanie Sound Forge Audio Studio 10.0.
Na podstawie nagrań materiału językowego powstanie korpus mowy. Osoby pracujące z nagraniami będą miały do nich dostęp przez specjalnie zaprojektowaną bazę, która będzie też powiązana z narzędziami Annotation Pro i Praat do segmentacji, anotacji i pomiarów. Baza i korpus mowy będą przechowywane na zakupionym w projekcie serwerze. Korpus zostanie poddany transkrypcji fonetycznej oraz segmentacji i opisowi (anotacji) na poziomie głosek, sylab, wyrazów i fraz. Transkrypcja i segmentacja zostaną przeprowadzone automatycznie za pomocą istniejących narzędzi (CreatSeg, Annotation Pro), a ich wyniki zostaną zweryfikowane przez dwóch fonetyków. Następnie określone zostaną (częściowo automatycznie) granice interwałów samogłoskowych i spółgłoskowych do pomiarów metrów rytmicznych. Anotacja prozodyczna będzie uwzględniała zaznaczenie pozycji sylab o różnym stopniu prominencji (unstressed, stressed unaccented, pitch accent, nuclear accent) i sile granicy frazy (intermediate & intonational phrase). W anotację zostanie zaangażowanych 5 studentów Instytutu oraz studenci obcojęzyczni, którzy wezmą udział w nagranich. Na potrzeby anotacji stworzone zostaną dwa nowe stanowiska wyposażone w komputer stacjonarny i dobrej jakości słuchawki, z dostępem do serwera. W oparciu o segmentacje i anotacje utworzona zostanie baza pomiarów akustycznych (m.in. parametry związane z iloczasem, intensywnością i intonacją, metra rytmiczne) i cech językowych (m.in. struktura sylaby i jej pozycja we frazie). Pomiary będą wykonywane automatycznie w Annotation Pro i Praacie z użyciem specjalnie stworzonych wtyczek i skryptów działających pod tymi programami. Wyniki będą zapisywane w formacie umożliwiającym eksport do arkusza kalkulacyjnego. Baza ta będzie wykorzystana w zadaniach 7-13. W celu zbadania statystycznej istotności obserwowanych tendencji, wpływów i relacji, zastosowane zostaną m.in. ANOVA, Uogólnione Mieszane Modele Liniowe, regresja, testy post-hoc, i obliczone będą współczynniki korelacji i odległości euklidesowe. Analizy statystyczne zostaną przeprowadzone w Statistice 10. Do opracowania wyników projektu wykorzystane będą narzędzia pakietu MS Office oraz wymienione powyżej programy specjalistyczne.
References
Arvaniti, A. (2009). Rhythm, timing and the timing of rhythm. Phonetica, 66(1-2), 46-63.
Arvaniti, A. (2012). The usefulness of metrics in the quantification of speech rhythm. Journal of Phonetics, 40(3), 351-373.
Barry, W., Andreeva, B., & Koreman, J. (2009). Do rhythm measures reflect perceived rhythm?. Phonetica, 66(1-2), 78-94.
Beňuš, Š., & Šimko, J. (2012). Rhythm and tempo in Slovak. In Proc. Speech Prosody, Shanghai, China.
Dauer, R. (1987). Phonetic and phonological components of language rhythm. In Proceedings of the XIth International Congress of the Phonetic Sciences, volume 5, pages 447–450. Tallinn: Academy of Sciences.
Dłuska, M. (1950) Fonetyka polska. PWN: Warszawa
Dellwo, V. and Wagner, P. (2003). Relationships between speech rate and rhythm. In Proceedings of the 15th International Conference of the Phonetic Sciences, 471–474, Barcelona, Spain.
Dellwo, V. (2008). The influence of speech rate on speech rhythm. Unpublished PhD thesis, Universität Bonn.
Dellwo, V. (2006). Rhythm and speech rate: A variation coefficient for ∆C. Language and language-processing, 231-241.
Demenko, G. (1999). Analysis of Polish suprasegmentals for needs of Speech Technology. UAM, Poznań.
Gibbon, D., Bachan, J., & Demenko, G. (2007). Syllable timing patterns in Polish: results from annotation mining. In Interspeech 2007, 994-997, Antwerp, Belgium.
Grabe, E., & Low, E. L. (2002). Durational variability in speech and the rhythm class hypothesis. Papers in laboratory phonology, 7(515-546).
Jassem, W. (1962) Akcent języka polskiego. Wrocław: Ossolineum.
Klessa, K. (2006) Analiza iloczasu głoskowego na potrzeby syntezy mowy polskiej. Niepublikowana rozprawa doktorska, Uniwersytet im. Adama Mickiewicza w Poznaniu.
Malisz, Z., & Wagner, P. (2012). Acoustic-phonetic realisation of Polish syllable prominence: a corpus study. Speech and Language Technology vol. 14/15, 105-114.
Malisz, Z. (2013). Speech rhythm variability in Polish and English: A study of interaction between rhythmic levels. Niepublikowana rozprawa doktorska, Uniwersytet im. Adama Mickiewicza w Poznaniu.
Nolan, F., & Asu, E. L. (2009). The pairwise variability index and coexisting rhythms in language. Phonetica, 66(1-2), 64-77
Pike, K. L. (1945). The Intonation of American English. Ann Arbor: University of Michigan.
Prieto, P., Vanrell, M. D. M., Astruc, L., Payne, E., & Post, B. (2012). Phonotactic and phrasal properties of speech rhythm. Evidence from Catalan, English, and Spanish. Speech Communication, 54(6), 681-702.
Ramus, F., Nespor, M. & Mehler, J. (1999) Correlates of linguistic rhythm in the speech signal. Cognition 73(3). 1-28.
Richter, L. (1987). Modelling of the rhythmic structure of utterances in Polish. Studia Phonetica Posnaniensia 1, 91–125.
Wagner, A. (2008) Comprehensive model of intonation for application in speech synthesis. Niepublikowana rozprawa doktorska, Uniwersytet im. Adama Mickiewicza w Poznaniu.
Wagner, A. (2013) Struktura rytmiczna wypowiedzi w polskiej mowie natywnej i nienatywnej. Scripta manent - res novae, Stanisław Puppel, Teresa Tomaszkiewicz (red.), 499-510, Wyd. UAM.
Wiget, L., White, L., Schuppler, B., Grenon, I., Rauch, O. & Mattys, S. L. (2010) How stable are acoustic metrics of contrastive speech rhythm? J. Acoust. Soc. Am 127(3). 1559-1569.
Osiągnięcia
Drugim badanym czynnikiem była struktura metryczna i tutaj również zaobserwowano istotne zmiany we wzorcach czasowych (zob. Barry i in. 2009): stopy binarne (à jamby i trocheje) charakteryzowały się większą zmiennością iloczasu samogłoskowego i sylabicznego w porównaniu ze stopami ternarnymi (à heksametry i anapesty), natomiast iloczas spółgłoskowy był bardziej wrażliwy na pozycję prominencji w stopie metrycznej, niż na długość stopy. Kolejnym analizowanym czynnikiem był styl/typ wypowiedzi: porównano ogólną zmienność iloczasu w czytanych zdaniach, tekście opowiadania, wierszach, czytanych dialogach oraz spontanicznych, naturalnych monologach. Największe zróżnicowanie iloczasu samogłoskowego i sylabicznego w porównaniu z pozostałymi stylami wypowiedzi stwierdzono w mowie spontanicznej, natomiast stosunkowo najmniejsze zróżnicowanie zaobserwowano w przypadku izolowanych zdań (zob. Arvaniti 2012).
We wszystkich typach wypowiedzi zrealizowanych w pięciu różnych tempach mowy zaobserwowano, że przyspieszenie tempa skutkowało redukcją globalnego zróżnicowania iloczasu na poziomie frazy (co jest łączone z kategorią syllable-timing), natomiast zwolnienie tempa miało efekt odwrotny („więcej” stress-timing).
W badaniu dotyczącym kwestii stabilności metrów rytmicznych spośród ośmiu miar: nPVI-V, rPVI-C, nPVI-syl (Grabe & Low 2002), VarcoV i VarcoC (Dellwo 2006), ΔC, ΔV i %V (Ramus i in. 1999) w rezultacie szczegółowych analiz wyłoniono cztery: nPVI-V, nPVI-syl, VarcoV i VarcoC, które spełniały sformułowane wcześniej warunki, aby można je uznać za potencjalnych kandydatów na akustyczne korelaty rytmu pojmowanego zgodnie z koncepcją Dauer (1983, 1987). Stwierdzono, że z jednej strony te konkretne metra pozwalają uchwycić zmienność wzorców czasowych, która wynika ze struktury rytmicznej (np. typu stopy rytmicznej – jamb kontra trochej), a z drugiej strony w znacznym stopniu charakteryzują się odpornością na wpływ czynników niezwiązanych z fonologicznymi ani fonetycznymi uwarunkowaniami rytmu, czyli w tym przypadku tempa mowy i typu wypowiedzi.
Analiza zakresu zmienności wzorców czasowych wewnątrz poszczególnych języków pokazała, że wzorce czasowe konkretnego języka mogą się zmieniać w sposób istotny: na przykład, bardziej złożona struktura fonotaktyczna przesuwa pozycję języka w dwuwymiarowej przestrzeni rytmicznej w kierunku stress-timing. Z kolei porównanie zakresu zmienności wzorców czasowych wewnątrz poszczególnych języków ze zmiennością obserwowaną między nimi pozwoliło stwierdzić, że zmienność wewnątrz jednego języka może być porównywalna, lub nawet większa niż ta, obserwowana między językami łączonymi z różnymi kategoriami rytmicznymi – w efekcie położenie języka w przestrzeni rytmicznej przesuwa się między obszarami „specyficznymi” dla stress-timing i syllable-timing, co jest bliższe koncepcji rytmicznego kontinuum (Nolan & Asu 2009) niż stabilnych, kontrastywnych kategorii rytmicznych.
Uzyskane wyniki poddają w wątpliwość założenia hipotezy o rytmicznej klasyfikacji języków, gdyż pokazują, że a) nie dla każdego języka (tutaj polskiego) możliwe jest ustalenie jego rytmicznej afiliacji, w związku z czym pozostaje on rytmicznie niesklasyfikowany, b) wzorce czasowe konkretnych języków nie są stabilne i kontrastywne, lecz zmieniają się wykazując własności tradycyjnie łączone zarówno z kategorią rytmu sylabicznego, jak i akcentowego.
Wyniki analiz krótkookresowej zmienności iloczasu pokazały, że za akustyczny wyznacznik końca frazy można uznać znaczne lokalne zwolnienie tempa (μ = 38 ms) i znaczne wzdłużenie iloczasu sylaby (μ = 279 ms) – oba sygnalizujące obecność mechanizmu phrase-final lengthening, a także istotną zmianę wysokości tonu między sylabami (3 półtony). Sylaby w pozycji akcentu wyrazowego są pozbawione prominencji fenomenalnej: relacje między sylabą poprzednią a sylabą z prominencją wyrazową kształtują się prawie tak samo jak te obserwowane na przejściach do sylab nieakcentowanych (lokalne przyspieszenie: -4 ms; iloczas sylaby: 161 ms; zmiana F0: 1,8 półtonu). W związku z tym akcent wyrazowy w języku polskim można interpretować jako abstrakcyjne, fonologiczne oznaczenie pozycji sylaby w wyrazie lub stopie, na której może być zrealizowany akcent melodyczny (Dogil 1999). Jednak mimo to prominencja wyrazowa może mieć charakter metryczny (np. Hayes & Puppel 1985; Rubach & Booij 1985; Peperkamp & Dupoux 2002; Peperkamp i in. 2010) i być słuchowo postrzegana przez natywnych użytkowników języka polskiego w rezultacie antycypacji metrycznej (zob. Malisz & Wagner P. 2012).
Silniejsza prominencja związana z akcentem melodycznym jest realizowana jako prominencja fenomenalna, ale przede wszystkim w dziedzinie wysokości tonu (à zmiana wysokości tonu rzędu 2,5 półtonów). Iloczas sylab nie jest wzdłużony, ale na przejściu do sylaby z akcentem melodycznym następuje statystycznie istotne lokalne zwolnienie tempa (μ = 35 ms). Z kolei najsilniejsza prominencja – frazowa, posiada wyraziste korelaty akustyczne zarówno w dziedzinie iloczasu (średnie lokalne zwolnienie tempa: 71 ms, średni iloczas sylaby: 243 ms), jak i F0 (zmiana rzędu 2,5 półtonów).
Wyniki badań o charakterze teoretycznym i empirycznym, których zwieńczeniem jest monografia pt. Rytm w mowie i języku w ujęciu wielowymiarowym mają ważne implikacje dla przyszłych badań rytmu w mowie i języku o uniwersalnym, niezależnym od konkretnego języka charakterze. Przede wszystkim pokazują konieczność „usamodzielnienia” rytmu i odróżnienia go od wzorców czasowych, z którymi jest często utożsamiany. Rytm jest rozwijającą się w czasie, specyficzną strukturą, którą tworzą trzy komponenty: puls (ang. beat), metrum i grupowanie, i która podlega uwarunkowaniom fonologicznym, fonetycznym, psychologicznym, poznawczym, a także neuronalnym. Natomiast pod pojęciem wzorców czasowych rozumiemy zmienność iloczasu i relacje czasowe, u podstaw których znajdują się liczne czynniki funkcjonalne/komunikacyjne (np. różne typy fokusa), ale przede wszystkim strukturalne, włączając w to rytm. W takim ujęciu terminy stress-timing i syllable-timing są traktowane jako etykiety opisujące niezależne od kategorii rytmicznej, konkretne własności struktury czasowej wypowiedzi (np. istotny/nieznaczny udział iloczasu w sygnalizowaniu prominencji lub duże/małe ogólne zróżnicowanie iloczasu w wypowiedzi) i związane z nimi wektory cech (np. Dauer 1983, 1987) obejmujące różne aspekty struktury prozodycznej, metrycznej (przede wszystkim prominencję), fonologicznej (w tym fonotaktycznej) oraz ich realizacji fonetycznej.
Realizowane cele
Pierwszy z celów sformułowanych we wniosku dotyczył stworzenia wielowymiarowego opisu struktury rytmicznej wypowiedzi w języku polskim. Jak to zostało opisane w części Wyniki cel ten w pełni osiągnięto. Zaproponowany opis ma charakter ilościowy, ale częściowo także jakościowy (relacje czasowe we frazie są wyrażane w kategoriach różnego typu przejść, ang. transitions, zob. Wagner 2015, rozdz. 6.3 monografii); uwzględnia on zarówno strukturę fonologiczną i fonetyczną języka polskiego (m.in. poprzez zastosowanie metrów rytmicznych, wyłonionych w drodze analiz jako najbardziej stabilne), jak i czynniki percepcyjne (np. tzw. poziom rytmizacji, na którym puls rytmiczny jest najbardziej wyrazisty, stabilny i periodyczny, zob. rozdz. 4.2.2, 6.4 w monografii oraz pracę Wagner & Bachan 2017). Opis ten pozwala także na spójną analizę zjawiska metrum oraz grupowania rytmicznego. Może być z powodzeniem stosowany do badania udziału czynników językowych i pozajęzykowych (np. reguł percepcji typu Gestalt) w percepcji i produkcji rytmu, analiz typologicznych języków pod kątem rytmu, ale także do analiz porównawczych między różnymi akcentami w wypowiedziach mówców nienatywnych (Wagner 2015).
Bardzo dokładnie i z różnych perspektyw zbadano także związek między tempem i rytmem/wzorcami czasowymi (Wagner 2016, 2017, Wagner & Klessa 2015, Wagner & Bachan 2017; rozdz. 6.1, 6.4. oraz 6.5 monografii) oraz dokonano opisu wybranych aspektów struktury rytmicznej wypowiedzi mówców nienatywnych w zakresie realizacji prominencji, struktury frazowej oraz grupowania rytmicznego na poziomie stóp (Wagner 2015).
Drugi cel dotyczył rytmicznej klasyfikacji języka polskiego. Badania przeprowadzone w tym zakresie, tak na gruncie teoretycznym, jak i empirycznym pokazały, że język polski albo wykazuje w pewnym stopniu własności, które można byłoby określić jako pośrednie między stress- i syllable-timing, co wspiera koncepcję mixed/intermediate rhythm (Nespor 1990) albo zupełnie „odstaje” od pozostałych języków (à rhythmic outlier, Wagner 2017). To „niepowodzenie” w ustaleniu klasyfikacji rytmicznej języka polskiego ma istotne konsekwencje dla rozumienia rytmu oraz kategorii rytmicznych: po pierwsze wyniki badań pokazują, że terminy stress-timing i syllable-timing nie powinny być łączone z niezmiennymi, stabilnymi kategoriami rytmicznymi, do których można zaliczyć poszczególne języki lub grupy języków (tak, jak to zakłada rytm class hypothesis), lecz powinny być traktowane jako etykiety określające konkretne własności rytmiczne wynikające ze specyfiki komponentów rytmu i ich implementacji (a być może również ich przetwarzania). Ponadto wyniki wskazują na konieczność dokonania rozróżnienia między pojęciami rytmu, (ang.) timingu i wzorców czasowych, które często są ze sobą niesłusznie utożsamiane (m.in. Kohler 2003 i Arvaniti 2009).
Trzeci cel związany był z uzyskaniem wiedzy na temat produkcji i percepcji prominencji i frazowania. Taką wiedzę udało się wypracować w efekcie szeroko zakrojonych analiz: a) z wykorzystaniem metody time-delay (Wagner 2016 i rozdz. 6.3 w monografii), b) analizy jakościowej wpływu tempa na strukturę rytmiczną, metryczną i intonacyjną (rozdz. 6.5 monografii) oraz c) analizy percepcyjnej, w rezultacie której zidentyfikowano tzw. rhythmic prominence intervals/frazy akcentowe (Wagner & Bachan 2017; zob. również rozdz. 6.4 w monografii).
Cele, których nie planowano na etapie wniosku, a które osiągnięto, dotyczą przede wszystkim szerszego niż pierwotnie zakładano ujęcia tematyki rytmu, struktury czasowej wypowiedzi i „rytmicznej klasyfikacji” języków, łączącego wiedzę z dziedzin mniej lub bardziej związanych z językoznawstwem, co z uwagi na uniwersalny charakter rytmu wnosi nową jakość nie tylko na poziomie badań empirycznych, ale także, a może przede wszystkim na poziomie teoretycznym. Za główne osiągnięcie projektu, obok wspomnianych wcześniej celów i wyników, można uznać poparte aktualnym stanem wiedzy z wielu dziedzin nauki oraz wynikami badań własnych, dostarczenie odpowiedzi na pytania o kluczowym znaczeniu dla badań nad rytmem i strukturą czasową mowy, co do których nie ma zgody w literaturze, przede wszystkim czym jest rytm (tzn. jakie są jego komponenty i uwarunkowania) i gdzie należy go „szukać” (tzn. na jakim poziomie analizy: tylko percepcji, czy też produkcji mowy, tylko na poziomie poznawczym, czy też fizycznym oraz w jakim wymiarze akustycznym – tylko iloczasu, czy także np. wysokości tonu), ale również z bardziej zasadniczym pytaniem – mianowicie, czy rytm w ogóle istnieje jako samodzielny komponent struktury języka, a w związku z tym, czy w ogóle powinien stanowić niezależny przedmiot badań (zob. rozdz. 7.1).
Wpływ na dyscyplinę
Uzyskanie w efekcie realizacji zadań projektu obszernej wiedzy teoretycznej na temat: a) uwarunkowań fonologicznych, fonetycznych, psychologicznych, psychoakustycznych, poznawczych i neuronalnych rytmu, b) komponentów rytmu, c) metod analizy i opisu rytmu oraz struktury czasowej wypowiedzi (wzorców czasowych), wywiera znaczący wpływ na rozwój dziedziny prozodii (a szerzej językoznawstwa), z uwagi na uporządkowanie terminologii, zaproponowanie spójnych koncepcji zjawisk, które w literaturze opisywane są z odmiennych perspektyw (np. odnośnie do prominencji i akcentu, zob. rozdz. 4.3 w monografii), zaproponowanie wielowymiarowego ujęcia rytmu i alternatywnej (do rhythm class hypothesis) koncepcji „kategorii rytmicznych” stress- i syllable-timing.
Zakładając, że warunkiem prowadzenia rzetelnych, o dużym wkładzie naukowym badań eksperymentalnych (również tych, ukierunkowanych na rozwój nowych metod i technologii), są przede wszystkim solidne podstawy teoretyczne, zaproponowane w monografii, a będące efektem prac prowadzonych w projekcie koncepcje dostarczają takich solidnych, spójnych między różnymi teoriami (np. prosodic phonology, metrical phonology, domain and locus approach) i dziedzinami (fonetyka, fonologia, ale też m.in. psycholingwistyka, muzykologia, psychologia, neurokognitywistyka, terapia mowy, technologia mowy) podstaw i mogą być z powodzeniem wykorzystane w badaniach we wspomnianych dyscyplinach/dziedzinach. Natomiast uzyskana wiedza na temat rytmu języka polskiego może być wykorzystana jako punkt wyjścia dla przyszłych badań.
Wypracowane w efekcie projektu wielowymiarowe podejście do analizy i opisu komponentów rytmu, wzorców czasowych, a także wpływu tempa strukturę rytmiczną i czasową wypowiedzi, wraz z opracowanymi zasobami i narzędziami (wchodzącymi w skład Polish rhythmic database) może istotnie przyczynić się do wzrostu liczby badań eksperymentalnych dotyczących cech suprasegmentalnych i prozodii języka polskiego (włączając w kwestie związane z nabywaniem języka polskiego jako języka drugiego/obcego).
Wyniki projektu, oprócz znaczenia dla językoznawstwa i innych dziedzin (psycholingwistyka, psychologia, neurokognitywistyka, terapia mowy, technologia mowy) mają również znaczenie społeczne z uwagi na istotną rolę, jaką rytm odgrywa w nabywaniu języka, percepcji mowy oraz przetwarzaniu języka i mowy (zob. rozdz. 7.1 w monografii). Wypracowana wiedza i metodologia mogą stać się podstawą m.in. do rozwijania nowych metod terapii osób cierpiących na zaburzenia języka i mowy (np. w dysleksji, Goswami i in. 2010, 2013, 2016).
- Stworzenie Polish Rhythmic Database (Wagner, Klessa & Bachan 2016), czyli jedynego jak dotąd korpusu zawierającego obszerny materiał nagraniowy (5 godz. 17 minut wypowiedzi realizowanych przez 20 mówców natywnych języka polskiego oraz 13 minut mowy nienatywnej) dedykowanego analizie rytmu oraz wzorców czasowych wypowiedzi, a także szeroko rozumianej prozodii: dane zebrane w korpusie są odpowiednie także do analizy akustyczno-fonetycznej np. wzorców intonacyjnych, iloczasu segmentalnego i suprasegmentalnego, jak i do analiz na poziomie fonologicznym, np. w zakresie akcentu prymarnego i akcentów opcjonalnych à rytmicznych, tj. sekundarnego i ternarnego.
- Opracowanie licznych narzędzi wchodzących razem z korpusem mowy w skład Polish Rhythmic Database; mają one postać wtyczek do programu AnnotationPro, z którym baza jest zintegrowana lub skryptów w języku Python i umożliwiają weryfikację oraz korektę wielowarstwowej anotacji materiału nagraniowego (przeprowadzonej w AnnotationPro i częściowo też w Praacie) oraz automatyczną ekstrakcję licznych informacji z anotacji wypowiedzi, m.in. wartości tzw. rhythm metrics, czy też pomiar tempa w liczbie syl./sek. lub liczbie interwałów samogłoskowych i spółgłoskowych na sek., iloczasy wybranych jednostek (samogłosek, sylab, fraz akcentowych à interwałów RPI, rhythmic prominence intervals) oraz długość interwałów RPI wyrażoną w sylabach (Wagner & Bachan 2017).
- Publikacje w cenionym czasopiśmie krajowym (Prace filologiczne) oraz w źródłach zagranicznych, m.in. monografii wieloautorskiej Nordic Prosody (wyd. Peter Lang) oraz w recenzowanych materiałach liczących się na świecie i mających długą tradycję konferencji (ESSV, LREC, ExLing, zob. Upowszechnianie wyników).
- Publikacja monografii autorstwa kierownik projektu, dr Agnieszki Wagner, pt. Rytm w mowie i języku w ujęciu wielowymiarowym. Książka jest owocem intensywnych studiów aktualnego stanu wiedzy i prowadzenia badań własnych w tematyce rytmu, wzorców czasowych, zjawiska timingu i związanych z nimi aspektów, włączając w to m.in. komponenty rytmu (à puls rytmiczny (ang. beat), metrum i grupowanie rytmiczne), udział czynników fonologicznych, fonetycznych, neuronalno-poznawczych, psychologicznych i psychoakustycznych w produkcji i percepcji rytmu, różnice między rytmem a wzorcami czasowymi i timingiem oraz metodologia badania tych zjawisk, kwestia „rytmicznej klasyfikacji” języków, i wiele innych. Książka nie tylko prezentuje krytyczny przegląd koncepcji rytmu i metod jego badania prezentowanych w dotychczasowej literaturze, ale przede wszystkim proponuje nowe, oryginalne spojrzenie na istotę rytmu, dokładnie definiuje, czym jest rytm, jakie są jego komponenty, a także w jaki sposób je analizować. W książce oczywiście nie mogło zabraknąć części poświęconej wynikom badań (zrealizowanych w ramach projektu i związanych z jego celami) dotyczących aspektów kluczowych dla rytmu i (bardziej ogólnie) czasowej organizacji wypowiedzi języka polskiego (zob. Uzyskane wyniki).
- Zaproponowanie zgodnej z koncepcją rytmu (przedstawioną w monografii, wypracowaną w rezultacie analizy aktualnego stanu wiedzy oraz w efekcie realizacji zadań w projekcie) metody wielowymiarowej analizy rytmu, na którą składają się: zastosowanie oscylacyjnych modeli rytmu (zob. Wagner A. & Bachan 2017 i rozdz. 6.4 monografii) do badania pulsu rytmicznego (ang. beat) i metrum rozumianego jako schemat neuronalno-poznawczy (zgodnie z Dynamic Attending Theory, Jones & Boltz 1989) oraz metody time-delay (Wagner P. 2008) do analizy grupowania rytmicznego na różnych poziomach hierarchii rytmicznej, włączając w to wyznaczniki fonetyczne różnego typu prominencji oraz wyznaczniki struktury prozodycznej (w rozumieniu Nespor & Vogel 1986/2007), a także wzorce czasowe wewnątrz stóp rytmicznych (Wagner A. 2015 & rozdz. 6.3 monografii).
- Prezentacja wyników badań zrealizowanych w ramach projektu na międzynarodowych konferencjach: ESSV (2017), Nordic Prosody (2016), LREC (2016), ExLing (2015) oraz krajowej konferencji Akustyka w językoznawstwie, językoznawstwo w akustyce (UW, rok 2014; zob. Upowszechnianie wyników). W rezultacie nawiązano nowe kontakty naukowe (UW, Norwegian University of Science and Technology w Trondheim/Norwegia, Zentrum für Allgemeine Sprachwissenschaft w Berlinie oraz Phonetics Laboratory/University of Zurich) oraz pogłębiono już wcześniej nawiązane kontakty (prof. Petra Wagner, Universität Bielefeld, Fakultät für Linguistik und Literaturwissenschaft, prof. Bernd Möbius, Dept. of Language Science and Technology, Saarland University), co zaowocowało dwoma stażami (Zentrum für Allgemeine Sprachwissenschaft, październik 2016 r. oraz Saarland University, marzec, 2017 r.), zaproszeniem do przeprowadzenia warsztatów fonetycznych (UW, czerwiec 2015 r.) oraz zaproszeniem na wizytę naukową i wygłoszenie wykładu w Phonetics Laboratory/University of Zurich (w planach). Planowany staż w Bielefeldzie (na zaproszenie prof. Petry Wagner) został przełożony na inny termin w związku z moją intensywną, roczną pracą nad monografią.
- Ogólna zmienność wzorców czasowych i kwestia stabilności tzw. metrów rytmicznych (zadanie 7, 8, 9 i częściowo 10)
Drugim badanym czynnikiem była struktura metryczna i tutaj również zaobserwowano istotne zmiany we wzorcach czasowych (zob. Barry i in. 2009): stopy binarne (à jamby i trocheje) charakteryzowały się większą zmiennością iloczasu samogłoskowego i sylabicznego w porównaniu ze stopami ternarnymi (à heksametry i anapesty), natomiast iloczas spółgłoskowy był bardziej wrażliwy na pozycję prominencji w stopie metrycznej, niż na długość stopy. Kolejnym analizowanym czynnikiem był styl/typ wypowiedzi: porównano ogólną zmienność iloczasu w czytanych zdaniach, tekście opowiadania, wierszach, czytanych dialogach oraz spontanicznych, naturalnych monologach. Największe zróżnicowanie iloczasu samogłoskowego i sylabicznego w porównaniu z pozostałymi stylami wypowiedzi stwierdzono w mowie spontanicznej, natomiast stosunkowo najmniejsze zróżnicowanie zaobserwowano w przypadku izolowanych zdań (zob. Arvaniti 2012).
We wszystkich typach wypowiedzi zrealizowanych w pięciu różnych tempach mowy zaobserwowano, że przyspieszenie tempa skutkowało redukcją globalnego zróżnicowania iloczasu na poziomie frazy (co jest łączone z kategorią syllable-timing), natomiast zwolnienie tempa miało efekt odwrotny („więcej” stress-timing).
W badaniu dotyczącym kwestii stabilności metrów rytmicznych spośród ośmiu miar: nPVI-V, rPVI-C, nPVI-syl (Grabe & Low 2002), VarcoV i VarcoC (Dellwo 2006), ΔC, ΔV i %V (Ramus i in. 1999) w rezultacie szczegółowych analiz wyłoniono cztery: nPVI-V, nPVI-syl, VarcoV i VarcoC, które spełniały sformułowane wcześniej warunki, aby można je uznać za potencjalnych kandydatów na akustyczne korelaty rytmu pojmowanego zgodnie z koncepcją Dauer (1983, 1987). Stwierdzono, że z jednej strony te konkretne metra pozwalają uchwycić zmienność wzorców czasowych, która wynika ze struktury rytmicznej (np. typu stopy rytmicznej – jamb kontra trochej), a z drugiej strony w znacznym stopniu charakteryzują się odpornością na wpływ czynników niezwiązanych z fonologicznymi ani fonetycznymi uwarunkowaniami rytmu, czyli w tym przypadku tempa mowy i typu wypowiedzi.
- Próba „rytmicznej klasyfikacji” języka polskiego (zadanie 13)
Analiza zakresu zmienności wzorców czasowych wewnątrz poszczególnych języków pokazała, że wzorce czasowe konkretnego języka mogą się zmieniać w sposób istotny: na przykład, bardziej złożona struktura fonotaktyczna przesuwa pozycję języka w dwuwymiarowej przestrzeni rytmicznej w kierunku stress-timing. Z kolei porównanie zakresu zmienności wzorców czasowych wewnątrz poszczególnych języków ze zmiennością obserwowaną między nimi pozwoliło stwierdzić, że zmienność wewnątrz jednego języka może być porównywalna, lub nawet większa niż ta, obserwowana między językami łączonymi z różnymi kategoriami rytmicznymi – w efekcie położenie języka w przestrzeni rytmicznej przesuwa się między obszarami „specyficznymi” dla stress-timing i syllable-timing, co jest bliższe koncepcji rytmicznego kontinuum (Nolan & Asu 2009) niż stabilnych, kontrastywnych kategorii rytmicznych.
Uzyskane wyniki poddają w wątpliwość założenia hipotezy o rytmicznej klasyfikacji języków, gdyż pokazują, że a) nie dla każdego języka (tutaj polskiego) możliwe jest ustalenie jego rytmicznej afiliacji, w związku z czym pozostaje on rytmicznie niesklasyfikowany, b) wzorce czasowe konkretnych języków nie są stabilne i kontrastywne, lecz zmieniają się wykazując własności tradycyjnie łączone zarówno z kategorią rytmu sylabicznego, jak i akcentowego.
- Fonetyczna analiza grupowania rytmicznego w oparciu o model time-delay (zadanie 10)
Wyniki analiz krótkookresowej zmienności iloczasu pokazały, że za akustyczny wyznacznik końca frazy można uznać znaczne lokalne zwolnienie tempa (μ = 38 ms) i znaczne wzdłużenie iloczasu sylaby (μ = 279 ms) – oba sygnalizujące obecność mechanizmu phrase-final lengthening, a także istotną zmianę wysokości tonu między sylabami (3 półtony). Sylaby w pozycji akcentu wyrazowego są pozbawione prominencji fenomenalnej: relacje między sylabą poprzednią a sylabą z prominencją wyrazową kształtują się prawie tak samo jak te obserwowane na przejściach do sylab nieakcentowanych (lokalne przyspieszenie: -4 ms; iloczas sylaby: 161 ms; zmiana F0: 1,8 półtonu). W związku z tym akcent wyrazowy w języku polskim można interpretować jako abstrakcyjne, fonologiczne oznaczenie pozycji sylaby w wyrazie lub stopie, na której może być zrealizowany akcent melodyczny (Dogil 1999). Jednak mimo to prominencja wyrazowa może mieć charakter metryczny (np. Hayes & Puppel 1985; Rubach & Booij 1985; Peperkamp & Dupoux 2002; Peperkamp i in. 2010) i być słuchowo postrzegana przez natywnych użytkowników języka polskiego w rezultacie antycypacji metrycznej (zob. Malisz & Wagner P. 2012).
Silniejsza prominencja związana z akcentem melodycznym jest realizowana jako prominencja fenomenalna, ale przede wszystkim w dziedzinie wysokości tonu (à zmiana wysokości tonu rzędu 2,5 półtonów). Iloczas sylab nie jest wzdłużony, ale na przejściu do sylaby z akcentem melodycznym następuje statystycznie istotne lokalne zwolnienie tempa (μ = 35 ms). Z kolei najsilniejsza prominencja – frazowa, posiada wyraziste korelaty akustyczne zarówno w dziedzinie iloczasu (średnie lokalne zwolnienie tempa: 71 ms, średni iloczas sylaby: 243 ms), jak i F0 (zmiana rzędu 2,5 półtonów).
- Wpływ tempa na strukturę rytmiczną wypowiedzi. Interakcja między komponentami struktury rytmicznej (zadanie 7, 10)
- Akustyczne wyznaczniki rytmu w wypowiedziach mówców nienatywnych (zadanie 11)
Wyniki badań o charakterze teoretycznym i empirycznym, których zwieńczeniem jest monografia pt. Rytm w mowie i języku w ujęciu wielowymiarowym mają ważne implikacje dla przyszłych badań rytmu w mowie i języku o uniwersalnym, niezależnym od konkretnego języka charakterze. Przede wszystkim pokazują konieczność „usamodzielnienia” rytmu i odróżnienia go od wzorców czasowych, z którymi jest często utożsamiany. Rytm jest rozwijającą się w czasie, specyficzną strukturą, którą tworzą trzy komponenty: puls (ang. beat), metrum i grupowanie, i która podlega uwarunkowaniom fonologicznym, fonetycznym, psychologicznym, poznawczym, a także neuronalnym. Natomiast pod pojęciem wzorców czasowych rozumiemy zmienność iloczasu i relacje czasowe, u podstaw których znajdują się liczne czynniki funkcjonalne/komunikacyjne (np. różne typy fokusa), ale przede wszystkim strukturalne, włączając w to rytm. W takim ujęciu terminy stress-timing i syllable-timing są traktowane jako etykiety opisujące niezależne od kategorii rytmicznej, konkretne własności struktury czasowej wypowiedzi (np. istotny/nieznaczny udział iloczasu w sygnalizowaniu prominencji lub duże/małe ogólne zróżnicowanie iloczasu w wypowiedzi) i związane z nimi wektory cech (np. Dauer 1983, 1987) obejmujące różne aspekty struktury prozodycznej, metrycznej (przede wszystkim prominencję), fonologicznej (w tym fonotaktycznej) oraz ich realizacji fonetycznej.
Realizowane cele
Pierwszy z celów sformułowanych we wniosku dotyczył stworzenia wielowymiarowego opisu struktury rytmicznej wypowiedzi w języku polskim. Jak to zostało opisane w części Wyniki cel ten w pełni osiągnięto. Zaproponowany opis ma charakter ilościowy, ale częściowo także jakościowy (relacje czasowe we frazie są wyrażane w kategoriach różnego typu przejść, ang. transitions, zob. Wagner 2015, rozdz. 6.3 monografii); uwzględnia on zarówno strukturę fonologiczną i fonetyczną języka polskiego (m.in. poprzez zastosowanie metrów rytmicznych, wyłonionych w drodze analiz jako najbardziej stabilne), jak i czynniki percepcyjne (np. tzw. poziom rytmizacji, na którym puls rytmiczny jest najbardziej wyrazisty, stabilny i periodyczny, zob. rozdz. 4.2.2, 6.4 w monografii oraz pracę Wagner & Bachan 2017). Opis ten pozwala także na spójną analizę zjawiska metrum oraz grupowania rytmicznego. Może być z powodzeniem stosowany do badania udziału czynników językowych i pozajęzykowych (np. reguł percepcji typu Gestalt) w percepcji i produkcji rytmu, analiz typologicznych języków pod kątem rytmu, ale także do analiz porównawczych między różnymi akcentami w wypowiedziach mówców nienatywnych (Wagner 2015).
Bardzo dokładnie i z różnych perspektyw zbadano także związek między tempem i rytmem/wzorcami czasowymi (Wagner 2016, 2017, Wagner & Klessa 2015, Wagner & Bachan 2017; rozdz. 6.1, 6.4. oraz 6.5 monografii) oraz dokonano opisu wybranych aspektów struktury rytmicznej wypowiedzi mówców nienatywnych w zakresie realizacji prominencji, struktury frazowej oraz grupowania rytmicznego na poziomie stóp (Wagner 2015).
Drugi cel dotyczył rytmicznej klasyfikacji języka polskiego. Badania przeprowadzone w tym zakresie, tak na gruncie teoretycznym, jak i empirycznym pokazały, że język polski albo wykazuje w pewnym stopniu własności, które można byłoby określić jako pośrednie między stress- i syllable-timing, co wspiera koncepcję mixed/intermediate rhythm (Nespor 1990) albo zupełnie „odstaje” od pozostałych języków (à rhythmic outlier, Wagner 2017). To „niepowodzenie” w ustaleniu klasyfikacji rytmicznej języka polskiego ma istotne konsekwencje dla rozumienia rytmu oraz kategorii rytmicznych: po pierwsze wyniki badań pokazują, że terminy stress-timing i syllable-timing nie powinny być łączone z niezmiennymi, stabilnymi kategoriami rytmicznymi, do których można zaliczyć poszczególne języki lub grupy języków (tak, jak to zakłada rytm class hypothesis), lecz powinny być traktowane jako etykiety określające konkretne własności rytmiczne wynikające ze specyfiki komponentów rytmu i ich implementacji (a być może również ich przetwarzania). Ponadto wyniki wskazują na konieczność dokonania rozróżnienia między pojęciami rytmu, (ang.) timingu i wzorców czasowych, które często są ze sobą niesłusznie utożsamiane (m.in. Kohler 2003 i Arvaniti 2009).
Trzeci cel związany był z uzyskaniem wiedzy na temat produkcji i percepcji prominencji i frazowania. Taką wiedzę udało się wypracować w efekcie szeroko zakrojonych analiz: a) z wykorzystaniem metody time-delay (Wagner 2016 i rozdz. 6.3 w monografii), b) analizy jakościowej wpływu tempa na strukturę rytmiczną, metryczną i intonacyjną (rozdz. 6.5 monografii) oraz c) analizy percepcyjnej, w rezultacie której zidentyfikowano tzw. rhythmic prominence intervals/frazy akcentowe (Wagner & Bachan 2017; zob. również rozdz. 6.4 w monografii).
Cele, których nie planowano na etapie wniosku, a które osiągnięto, dotyczą przede wszystkim szerszego niż pierwotnie zakładano ujęcia tematyki rytmu, struktury czasowej wypowiedzi i „rytmicznej klasyfikacji” języków, łączącego wiedzę z dziedzin mniej lub bardziej związanych z językoznawstwem, co z uwagi na uniwersalny charakter rytmu wnosi nową jakość nie tylko na poziomie badań empirycznych, ale także, a może przede wszystkim na poziomie teoretycznym. Za główne osiągnięcie projektu, obok wspomnianych wcześniej celów i wyników, można uznać poparte aktualnym stanem wiedzy z wielu dziedzin nauki oraz wynikami badań własnych, dostarczenie odpowiedzi na pytania o kluczowym znaczeniu dla badań nad rytmem i strukturą czasową mowy, co do których nie ma zgody w literaturze, przede wszystkim czym jest rytm (tzn. jakie są jego komponenty i uwarunkowania) i gdzie należy go „szukać” (tzn. na jakim poziomie analizy: tylko percepcji, czy też produkcji mowy, tylko na poziomie poznawczym, czy też fizycznym oraz w jakim wymiarze akustycznym – tylko iloczasu, czy także np. wysokości tonu), ale również z bardziej zasadniczym pytaniem – mianowicie, czy rytm w ogóle istnieje jako samodzielny komponent struktury języka, a w związku z tym, czy w ogóle powinien stanowić niezależny przedmiot badań (zob. rozdz. 7.1).
Wpływ na dyscyplinę
Uzyskanie w efekcie realizacji zadań projektu obszernej wiedzy teoretycznej na temat: a) uwarunkowań fonologicznych, fonetycznych, psychologicznych, psychoakustycznych, poznawczych i neuronalnych rytmu, b) komponentów rytmu, c) metod analizy i opisu rytmu oraz struktury czasowej wypowiedzi (wzorców czasowych), wywiera znaczący wpływ na rozwój dziedziny prozodii (a szerzej językoznawstwa), z uwagi na uporządkowanie terminologii, zaproponowanie spójnych koncepcji zjawisk, które w literaturze opisywane są z odmiennych perspektyw (np. odnośnie do prominencji i akcentu, zob. rozdz. 4.3 w monografii), zaproponowanie wielowymiarowego ujęcia rytmu i alternatywnej (do rhythm class hypothesis) koncepcji „kategorii rytmicznych” stress- i syllable-timing.
Zakładając, że warunkiem prowadzenia rzetelnych, o dużym wkładzie naukowym badań eksperymentalnych (również tych, ukierunkowanych na rozwój nowych metod i technologii), są przede wszystkim solidne podstawy teoretyczne, zaproponowane w monografii, a będące efektem prac prowadzonych w projekcie koncepcje dostarczają takich solidnych, spójnych między różnymi teoriami (np. prosodic phonology, metrical phonology, domain and locus approach) i dziedzinami (fonetyka, fonologia, ale też m.in. psycholingwistyka, muzykologia, psychologia, neurokognitywistyka, terapia mowy, technologia mowy) podstaw i mogą być z powodzeniem wykorzystane w badaniach we wspomnianych dyscyplinach/dziedzinach. Natomiast uzyskana wiedza na temat rytmu języka polskiego może być wykorzystana jako punkt wyjścia dla przyszłych badań.
Wypracowane w efekcie projektu wielowymiarowe podejście do analizy i opisu komponentów rytmu, wzorców czasowych, a także wpływu tempa strukturę rytmiczną i czasową wypowiedzi, wraz z opracowanymi zasobami i narzędziami (wchodzącymi w skład Polish rhythmic database) może istotnie przyczynić się do wzrostu liczby badań eksperymentalnych dotyczących cech suprasegmentalnych i prozodii języka polskiego (włączając w kwestie związane z nabywaniem języka polskiego jako języka drugiego/obcego).
Wyniki projektu, oprócz znaczenia dla językoznawstwa i innych dziedzin (psycholingwistyka, psychologia, neurokognitywistyka, terapia mowy, technologia mowy) mają również znaczenie społeczne z uwagi na istotną rolę, jaką rytm odgrywa w nabywaniu języka, percepcji mowy oraz przetwarzaniu języka i mowy (zob. rozdz. 7.1 w monografii). Wypracowana wiedza i metodologia mogą stać się podstawą m.in. do rozwijania nowych metod terapii osób cierpiących na zaburzenia języka i mowy (np. w dysleksji, Goswami i in. 2010, 2013, 2016).

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.