Część I: Od ogółu do szczegółu
Zadanie 1 (bardzo ogólne): Podstawy pracy w Wavesurferze.
Proszę uruchomić program Wavesurfer. (http://sourceforge.net/projects/wavesurfer/files/latest/download)
Następnie proszę otworzyć plik dźwiękowy 001.wav (znajdujący się w katalogu analizaI) i wyświetlić oscylogram (waveform) nagranej w nim wypowiedzi.
Odtworzyć plik w całości i we fragmentach (od pauzy do pauzy).
Dodać spektrogram wypowiedzi.
Wczytać plik 001.lab zawierający segmentację i transkrypcję fonetyczną wypowiedzi.
Utworzyć dodatkowy panel anotacji i wczytać do niego plik 001.words zawierający podział wypowiedzi na wyrazy.
Zapisać waveform i dwa panele anotacji jako nową konfigurację o nazwie „mojakonfiguracja”.
W tej konfiguracji otworzyć kolejny plik dźwiękowy (002.wav) i utworzyć dla niego segmentację na poziomie wyrazów. Wynik zapisać.
To samo powtórzyć dla pozostałych plików (003.wav i 004.wav).
Zadanie 2 (trochę mniej ogólne): Podstawy pracy w Praacie.
Proszę uruchomić program Praat. (http://www.fon.hum.uva.nl/praat/praat5404_win32.zip)
Następnie proszę wczytać plik dźwiękowy 005.wav i wyświetlić oscylogram (waveform) i spektrogram nagranej w nim wypowiedzi.
Odtworzyć plik w całości i we fragmentach (od pauzy do pauzy).
Wczytać plik 005.Textgrid zawierający segmentację i transkrypcję fonetyczną wypowiedzi.
Utworzyć drugi panel anotacji i umieścić w nim granice sylab. W przypadkach niejednoznacznych przenieść elementy z wygłosu sylaby do nagłosu sylaby następnej.
Zapisać zmiany (obie warstwy anotacji w jednym pliku Textgrid).
Zadanie 3 (trochę bardziej szczegółowe): Analiza źródła dźwięku
Proszę wczytać plik dźwiękowy stół.wav.
Utworzyć plik Textgrid z automatycznym podziałem na ciszę i mowę.
Wyświetlić plik Sound i Textgrid i poprawić wyniki segmentacji automatycznej.
W warstwie anotacji umieścić granice głosek i wstawić oznaczenia typów źródła dźwięku: źródło dźwiękowe (d), szumowe (s) i dźwiękowo-szumowe (ds).
Wynik zapisać w pliku Textgrid.
To samo powtórzyć dla wypowiedzi: ranka, torty, zadać, i kapcie.
Zadanie 4 (bardzo szczegółowe): Segmentacja i transkrypcja fonetyczna.
W programie Praat proszę dokonać segmentacji i transkrypcji fonetycznej dla plików dźwiękowych znajdujących się w katalogu analizaII (wypowiedzi: farmer, sad-siad, szal, harcerz, liczę, deszcz, nosi, duzi, pysk, dana, Zosia). Pliki wynikowe zapisać jako krótki plik tekstowy (Save -> save as short text file; plik będzie miał rozszerzenie Textgrid).
Proszę uruchomić program Wavesurfer. (http://sourceforge.net/projects/wavesurfer/files/latest/download)
Następnie proszę otworzyć plik dźwiękowy 001.wav (znajdujący się w katalogu analizaI) i wyświetlić oscylogram (waveform) nagranej w nim wypowiedzi.
Odtworzyć plik w całości i we fragmentach (od pauzy do pauzy).
Dodać spektrogram wypowiedzi.
Wczytać plik 001.lab zawierający segmentację i transkrypcję fonetyczną wypowiedzi.
Utworzyć dodatkowy panel anotacji i wczytać do niego plik 001.words zawierający podział wypowiedzi na wyrazy.
Zapisać waveform i dwa panele anotacji jako nową konfigurację o nazwie „mojakonfiguracja”.
W tej konfiguracji otworzyć kolejny plik dźwiękowy (002.wav) i utworzyć dla niego segmentację na poziomie wyrazów. Wynik zapisać.
To samo powtórzyć dla pozostałych plików (003.wav i 004.wav).
Zadanie 2 (trochę mniej ogólne): Podstawy pracy w Praacie.
Proszę uruchomić program Praat. (http://www.fon.hum.uva.nl/praat/praat5404_win32.zip)
Następnie proszę wczytać plik dźwiękowy 005.wav i wyświetlić oscylogram (waveform) i spektrogram nagranej w nim wypowiedzi.
Odtworzyć plik w całości i we fragmentach (od pauzy do pauzy).
Wczytać plik 005.Textgrid zawierający segmentację i transkrypcję fonetyczną wypowiedzi.
Utworzyć drugi panel anotacji i umieścić w nim granice sylab. W przypadkach niejednoznacznych przenieść elementy z wygłosu sylaby do nagłosu sylaby następnej.
Zapisać zmiany (obie warstwy anotacji w jednym pliku Textgrid).
Zadanie 3 (trochę bardziej szczegółowe): Analiza źródła dźwięku
Proszę wczytać plik dźwiękowy stół.wav.
Utworzyć plik Textgrid z automatycznym podziałem na ciszę i mowę.
Wyświetlić plik Sound i Textgrid i poprawić wyniki segmentacji automatycznej.
W warstwie anotacji umieścić granice głosek i wstawić oznaczenia typów źródła dźwięku: źródło dźwiękowe (d), szumowe (s) i dźwiękowo-szumowe (ds).
Wynik zapisać w pliku Textgrid.
To samo powtórzyć dla wypowiedzi: ranka, torty, zadać, i kapcie.
Zadanie 4 (bardzo szczegółowe): Segmentacja i transkrypcja fonetyczna.
W programie Praat proszę dokonać segmentacji i transkrypcji fonetycznej dla plików dźwiękowych znajdujących się w katalogu analizaII (wypowiedzi: farmer, sad-siad, szal, harcerz, liczę, deszcz, nosi, duzi, pysk, dana, Zosia). Pliki wynikowe zapisać jako krótki plik tekstowy (Save -> save as short text file; plik będzie miał rozszerzenie Textgrid).
Część II: Cechy segmentalne istotne dla analizy prozodii.
Zadania znajdują się w pliku doc, w którym będziemy umieszczać wyniki pracy.
Część III: Cechy suprasegmentalne. Automatyczna ekstrakcja informacji prozodycznej.
Zadanie 1: Ekstrakcja i wygładzanie konturów intonacyjnych.
Proszę dokonać ekstrakcji konturu intonacyjnego (przebiegu zmian wysokości tonu, F0) w wypowiedzi „Pada deszcz” (plik deszcz.wav). W tym celu należy określić zakres F0 (120-350Hz), wyświetlić kontur i poprawić błędy. Następnie wygładzić kontur, ponownie wyświetlić i poprawić błędy.
Kontury zapisać w plikach tekstowych. Dokonać resyntezy wypowiedzi z poprawionym wygładzonym konturem i zapisać w pliku dźwiękowym.
Oba kontury zilustrować łącznie ze spektrogramem i segmentacją/transkrypcją (plik deszcz.Textgrid) w oknie Praat Picture. Wynik zapisać.
Zadanie 2: Manipulacja intonacją.
Proszę dokonać manipulacji wysokością tonu w wypowiedzi „Pada deszcz” (plik deszcz.wav) w taki sposób, aby:
a) główny akcent przypadał na wyraz pada,
b) wypowiedź miała charakter pytający, a nie oznajmujący
Zadanie 3: Automatyczny pomiar wartości F0 i iloczasu dla całych wypowiedzi.
W Praacie proszę utworzyć plik tekstowy list.txt z nazwami plików zawierających samogłoski (dana, liczę, deszcz, nosi, duzi, pysk).
Proszę uruchomić skrypt get_pitch.psc w Praacie i utworzyć automatycznie pliki o rpzszerzeniu .Pitch dla wypowiedzi w plikach wymienionych wyżej. W niektórych wypowiedziach konieczne będzie poprawienie błędów automatycznego pomiaru F0, dlatego też będzie uruchamiało się okno edycji i dopiero po kliknięciu CONTINUE skrypt będzie przechodził do następnego pliku.
Następnie uruchomić skrypt pitch_analysis.psc, który zgromadzi informacje dotyczące cech wysokości tonu wypowiedzi: f0max i f0min (plus w jakim punkcie czasowym każde z nich występuje), f0mean oraz odchylenie standardowe f0.
Zadanie 4: Automatyczny pomiar wartości F0 i iloczasu dla sylab i głosek.
Dla zdań w pliku 005.wav (katalog analizaI) proszę utworzyć obiekt .Pitch.
Następnie uruchomić skrypt collect_f0_data.psc.
Na podstawie wyników opisać różnice w realizacji samogłosek/sylab akcentowanych i nieakcentowanych (chodzi o akcent leksykalny, ang. stress).
Proszę dokonać ekstrakcji konturu intonacyjnego (przebiegu zmian wysokości tonu, F0) w wypowiedzi „Pada deszcz” (plik deszcz.wav). W tym celu należy określić zakres F0 (120-350Hz), wyświetlić kontur i poprawić błędy. Następnie wygładzić kontur, ponownie wyświetlić i poprawić błędy.
Kontury zapisać w plikach tekstowych. Dokonać resyntezy wypowiedzi z poprawionym wygładzonym konturem i zapisać w pliku dźwiękowym.
Oba kontury zilustrować łącznie ze spektrogramem i segmentacją/transkrypcją (plik deszcz.Textgrid) w oknie Praat Picture. Wynik zapisać.
Zadanie 2: Manipulacja intonacją.
Proszę dokonać manipulacji wysokością tonu w wypowiedzi „Pada deszcz” (plik deszcz.wav) w taki sposób, aby:
a) główny akcent przypadał na wyraz pada,
b) wypowiedź miała charakter pytający, a nie oznajmujący
Zadanie 3: Automatyczny pomiar wartości F0 i iloczasu dla całych wypowiedzi.
W Praacie proszę utworzyć plik tekstowy list.txt z nazwami plików zawierających samogłoski (dana, liczę, deszcz, nosi, duzi, pysk).
Proszę uruchomić skrypt get_pitch.psc w Praacie i utworzyć automatycznie pliki o rpzszerzeniu .Pitch dla wypowiedzi w plikach wymienionych wyżej. W niektórych wypowiedziach konieczne będzie poprawienie błędów automatycznego pomiaru F0, dlatego też będzie uruchamiało się okno edycji i dopiero po kliknięciu CONTINUE skrypt będzie przechodził do następnego pliku.
Następnie uruchomić skrypt pitch_analysis.psc, który zgromadzi informacje dotyczące cech wysokości tonu wypowiedzi: f0max i f0min (plus w jakim punkcie czasowym każde z nich występuje), f0mean oraz odchylenie standardowe f0.
Zadanie 4: Automatyczny pomiar wartości F0 i iloczasu dla sylab i głosek.
Dla zdań w pliku 005.wav (katalog analizaI) proszę utworzyć obiekt .Pitch.
Następnie uruchomić skrypt collect_f0_data.psc.
Na podstawie wyników opisać różnice w realizacji samogłosek/sylab akcentowanych i nieakcentowanych (chodzi o akcent leksykalny, ang. stress).
Część IV: Prozodia a tempo mowy - analiza struktury frazowej w AnnotationPro.
Program można pobrać tutaj.
Proszę w programie AnnotationPro wczytać plik tekst_norm.wav i dokonać na podstawie odsłuchu podziału na frazy intonacyjne. Wyniki eksportować do formatu Textgrid.
To samo powtórzyć dla pliku tekst_bszybko.wav.
Następnie za pomocą skryptu collect_f0_data.psc dokonać pomiarów iloczasu i F0. Porównać wyniki ze względu na tempo mowy.
Proszę w programie AnnotationPro wczytać plik tekst_norm.wav i dokonać na podstawie odsłuchu podziału na frazy intonacyjne. Wyniki eksportować do formatu Textgrid.
To samo powtórzyć dla pliku tekst_bszybko.wav.
Następnie za pomocą skryptu collect_f0_data.psc dokonać pomiarów iloczasu i F0. Porównać wyniki ze względu na tempo mowy.