Reprezentacja danych w komputerze - odpowiedzi (21.03.2018)
# Tekst i inne znaki
## Pytania
1. ASCII to tablica kodów (lub inaczej standard kodowania) umożliwiająca binarną reprezentację znaków alfanumerycznych (liter, cyfr), znaków interpunkcyjnych i znaków kontrolnych. Każdy znak w tym kodzie posiada swój odpowiednik liczbowy z przedziału <0, 255>; 1 bajt, 256 znaków.
2. Windows-1250, przy czym dla stron kodowych Microsoftu można też spotkać określenie (Windows) ANSI; ISO-8859-2 (dla systemów uniksowych).
3. Unicode (podobnie jak ASCII) jest standardem kodowania, ale nie jest ograniczony do 256 znaków - ponieważ na zapis jednego znaku są w nim przeznaczone 2 bajty, możliwe jest zakodowanie w nim w sumie 65536 różnych znaków. "Początek" Unicode jest taki sam jak ASCII, zaś pozostałe kody odpowiadają literom występującym w różnych językach (np. polskich ą, ę, ć, itd.); Unicode "wyczerpuje" alfabety wszystkich języków.
Ze strony StackOverflow:
"Unicode allows for 17 planes, each of 65,536 possible characters (or 'code points'). This gives a total of 1,114,112 possible characters. At present, only about 10% of this space has been allocated."
4. Unicode to tabela kodów znaków, zaś UTF-8 to nazwa jednego z możliwych sposobów ich kodowania.
# Obraz
## Pytania
1. W grafice bitmapowej każdy obraz składa się z punktów nazywanych pikselami. Matryca tych punktów określana jest mianem mapy bitowej (ang. bitmap, raster). Rozdzielczość obrazu jest uzależniona od liczby pikseli - im więcej, tym lepsza jakość obrazu. Dużą wadą tego typu grafiki jest utrata jakości obrazu w miarę powiększania jego rozmiaru.
W grafice wektorowej obraz zapisywany jest w postaci zbioru obiektów geometrycznych (odcinków, okręgów, itp.). Grafika wektorowa dobrze poddaje się wszelkim przekształceniom, ale nie zawsze jest pożądana (np. w odniesieniu do fotografii i grafiki o charakterze artystycznym).
2. RGB: kolor powstaje przez zmieszanie trzech barw: czerwonej, zielonej i niebieskiej (stąd akronim RGB - red, green, blue) i manipulowanie natężeniem każdej z tych trzech składowych. Każda składowa jest opisywana na jednym bajcie. Na przykład, w HTML kolor zapisujemy podając kolejno składowe w zapisie heksadecymalnym (np. #000000, #ee00ee).
HSV: kolor jest definiowany za pomocą trzech parametrów: odcienia, nasycenia i intensywności/jasności.
CMYK: model barw wykorzystywany w drukarkach; kolor docelowy powstaje przez zmieszanie barw składowych - cyan, magenta, yellow, black.
3. Tryb czarno-biały: informacja o barwie jest zapisywana na jednym bicie.
Greyscale (odcienie szarości): najczęściej zapisuje się 256 odcieni, do zapisu potrzebny jest 1 bajt (8 bitów).
Indexed colour (kolor indeksowany): liczba kolorów jest potęgą dwójki i wynosi najczęściej między 16 (4 bity/piksel) a 256 (8 bitów/piksel).
True colour (pełen kolor): ponad 16 mln barw (2 do potęgi 24). Każdy piksel jest opisany przez 3 składowe (RGB), a każda składowa przez liczbę z przedziału <0, 255>.
4. Kompresja to proces pozwalający na zmniejszenie objętości pliku graficznego w sposób umożliwiający odtworzenie oryginalnego obrazu (-> dekompresja). Dane skompresowane bezstratnie, po dokonaniu dekompresji są identyczne z oryginalnymi danymi, zaś dane skompresowane stratnie - nie są identyczne, lecz równoważne (pewne informacje zostają w procesie kompresji bezpowrotnie utracone).
Formaty: GIF, TIFF (k. bezstratna), JPEG (k. stratna).
5. CDR (Corel Draw), WMF (Windows Meta File), EPS (Encapsulated PostScript).
# Dźwięk
## Pytania
1. Digitalizacja oznacza zamianę sygnału analogowego (np. sygnału mowy lub dźwięku z otoczenia słyszanego w sposób ciągły) na jego postać cyfrową (nieciągłą, dyskretną). W tym kontekście próbkowanie oznacza pobranie wartości amplitudy sygnału (tzw. próbki dźwięku) określoną liczbę razy w sekundzie.
Częstotliwość próbkowania określa liczbę próbek jednostce czasu (zwykle sekundzie) pobranych z sygnału ciągłego w celu uzyskania sygnału cyfrowego; powinna być wyższa niż wynosi dwukrotność najwyższej składowej w mierzonym sygnale.
2. Częstotliwości próbkowania oraz dokładności zapisu liczbowego próbki (rozdzielczości). Drugi z czynników należy do etapu tzw. kwantyzacji (zob. też tutaj).
3. WAVE to najpopularniejszy format zapisu plików audio bez utraty jakości (przy zachowaniu wysokiej częstotliwości próbkowania i rozdzielczości). Podstawową plików .wav jest ich wysoka jakość; wadą jest duża objętość zależna od częstotliwości próbkowania i rozdzielczości. Max. parametry formatu: 44,1 kHz, 16 bit.
4. Sygnał, który po przekształceniach (PCM) jest zapisany jako ciąg dyskretnych wartości/próbek, zostaje
poddany kodowaniu, którego efektem jest jego zapis binarny. Kodek jest skrótem hasła koder-dekoder, które oznacza urządzenie lub program zdolny do przekształcenia strumienia danych lub sygnału.
5. Potrzebnych informacji dostarcza nam psychoakustyka, w której to dziedzinie bada się percepcję dźwięków.
MP3 – algorytm kompresji stratnej dźwięku, przetworzonego uprzednio na sygnał cyfrowy. Format ten wykorzystuje model psychoakustyczny w celu osiągnięcia pożądanego stopnia kompresji stratnej: z sygnału usunięte zostają te informacje, które są niezauważalne lub mało istotne dla człowieka.
## Pytania
1. ASCII to tablica kodów (lub inaczej standard kodowania) umożliwiająca binarną reprezentację znaków alfanumerycznych (liter, cyfr), znaków interpunkcyjnych i znaków kontrolnych. Każdy znak w tym kodzie posiada swój odpowiednik liczbowy z przedziału <0, 255>; 1 bajt, 256 znaków.
2. Windows-1250, przy czym dla stron kodowych Microsoftu można też spotkać określenie (Windows) ANSI; ISO-8859-2 (dla systemów uniksowych).
3. Unicode (podobnie jak ASCII) jest standardem kodowania, ale nie jest ograniczony do 256 znaków - ponieważ na zapis jednego znaku są w nim przeznaczone 2 bajty, możliwe jest zakodowanie w nim w sumie 65536 różnych znaków. "Początek" Unicode jest taki sam jak ASCII, zaś pozostałe kody odpowiadają literom występującym w różnych językach (np. polskich ą, ę, ć, itd.); Unicode "wyczerpuje" alfabety wszystkich języków.
Ze strony StackOverflow:
"Unicode allows for 17 planes, each of 65,536 possible characters (or 'code points'). This gives a total of 1,114,112 possible characters. At present, only about 10% of this space has been allocated."
4. Unicode to tabela kodów znaków, zaś UTF-8 to nazwa jednego z możliwych sposobów ich kodowania.
# Obraz
## Pytania
1. W grafice bitmapowej każdy obraz składa się z punktów nazywanych pikselami. Matryca tych punktów określana jest mianem mapy bitowej (ang. bitmap, raster). Rozdzielczość obrazu jest uzależniona od liczby pikseli - im więcej, tym lepsza jakość obrazu. Dużą wadą tego typu grafiki jest utrata jakości obrazu w miarę powiększania jego rozmiaru.
W grafice wektorowej obraz zapisywany jest w postaci zbioru obiektów geometrycznych (odcinków, okręgów, itp.). Grafika wektorowa dobrze poddaje się wszelkim przekształceniom, ale nie zawsze jest pożądana (np. w odniesieniu do fotografii i grafiki o charakterze artystycznym).
2. RGB: kolor powstaje przez zmieszanie trzech barw: czerwonej, zielonej i niebieskiej (stąd akronim RGB - red, green, blue) i manipulowanie natężeniem każdej z tych trzech składowych. Każda składowa jest opisywana na jednym bajcie. Na przykład, w HTML kolor zapisujemy podając kolejno składowe w zapisie heksadecymalnym (np. #000000, #ee00ee).
HSV: kolor jest definiowany za pomocą trzech parametrów: odcienia, nasycenia i intensywności/jasności.
CMYK: model barw wykorzystywany w drukarkach; kolor docelowy powstaje przez zmieszanie barw składowych - cyan, magenta, yellow, black.
3. Tryb czarno-biały: informacja o barwie jest zapisywana na jednym bicie.
Greyscale (odcienie szarości): najczęściej zapisuje się 256 odcieni, do zapisu potrzebny jest 1 bajt (8 bitów).
Indexed colour (kolor indeksowany): liczba kolorów jest potęgą dwójki i wynosi najczęściej między 16 (4 bity/piksel) a 256 (8 bitów/piksel).
True colour (pełen kolor): ponad 16 mln barw (2 do potęgi 24). Każdy piksel jest opisany przez 3 składowe (RGB), a każda składowa przez liczbę z przedziału <0, 255>.
4. Kompresja to proces pozwalający na zmniejszenie objętości pliku graficznego w sposób umożliwiający odtworzenie oryginalnego obrazu (-> dekompresja). Dane skompresowane bezstratnie, po dokonaniu dekompresji są identyczne z oryginalnymi danymi, zaś dane skompresowane stratnie - nie są identyczne, lecz równoważne (pewne informacje zostają w procesie kompresji bezpowrotnie utracone).
Formaty: GIF, TIFF (k. bezstratna), JPEG (k. stratna).
5. CDR (Corel Draw), WMF (Windows Meta File), EPS (Encapsulated PostScript).
# Dźwięk
## Pytania
1. Digitalizacja oznacza zamianę sygnału analogowego (np. sygnału mowy lub dźwięku z otoczenia słyszanego w sposób ciągły) na jego postać cyfrową (nieciągłą, dyskretną). W tym kontekście próbkowanie oznacza pobranie wartości amplitudy sygnału (tzw. próbki dźwięku) określoną liczbę razy w sekundzie.
Częstotliwość próbkowania określa liczbę próbek jednostce czasu (zwykle sekundzie) pobranych z sygnału ciągłego w celu uzyskania sygnału cyfrowego; powinna być wyższa niż wynosi dwukrotność najwyższej składowej w mierzonym sygnale.
2. Częstotliwości próbkowania oraz dokładności zapisu liczbowego próbki (rozdzielczości). Drugi z czynników należy do etapu tzw. kwantyzacji (zob. też tutaj).
3. WAVE to najpopularniejszy format zapisu plików audio bez utraty jakości (przy zachowaniu wysokiej częstotliwości próbkowania i rozdzielczości). Podstawową plików .wav jest ich wysoka jakość; wadą jest duża objętość zależna od częstotliwości próbkowania i rozdzielczości. Max. parametry formatu: 44,1 kHz, 16 bit.
4. Sygnał, który po przekształceniach (PCM) jest zapisany jako ciąg dyskretnych wartości/próbek, zostaje
poddany kodowaniu, którego efektem jest jego zapis binarny. Kodek jest skrótem hasła koder-dekoder, które oznacza urządzenie lub program zdolny do przekształcenia strumienia danych lub sygnału.
5. Potrzebnych informacji dostarcza nam psychoakustyka, w której to dziedzinie bada się percepcję dźwięków.
MP3 – algorytm kompresji stratnej dźwięku, przetworzonego uprzednio na sygnał cyfrowy. Format ten wykorzystuje model psychoakustyczny w celu osiągnięcia pożądanego stopnia kompresji stratnej: z sygnału usunięte zostają te informacje, które są niezauważalne lub mało istotne dla człowieka.