pátek 17. června 2016

Jak bych definoval informaci

Chceme-li číst text, musíme v první řadě rozumět jazyku, v němž je psán. Jsem si docela jistý, že drtivá většina nás v české zemi vyrůstajících je schopna rozumět všemu, co tu teď píšu. K tomu, abyste mi rozuměli, je zapotřebí, abych dodržoval určitá pravidla - těmi je jazyk. Ne vždy se zcela správně vyjadřuji, dělám jazykové chyby, ale i tak jsou téměř všichni dostatečně kompetentní k tomu, aby text pochopili. Za tento jev - schopnost rozpoznat a opravit chybu může nejspíš to, jakým způsobem zpracovává mozek text. Za prvé jde-li o překlep, chybu v i/y nebo něco podobně malého (na úrovni znaků), dokážeme chybu odfiltrovat zcela nevědomně, jelikož díváme-li se na sadu písmen oddělených mezerou, chápeme je jako celek. Ten celek jsme už dříve mnohokrát viděli a malá estetická vada nás ani nemusí trknout => text vidíme jako správný. Kdybychom trochu rozházeli slovosled, s trochou vypětí mozkových závitů se rovněž smyslu věty dopídíme tím, jak se snažíme dát podobu realitě kterou informace popisuje. Když už ale dochází k nesmyslně rozházeným souvětím, či náhodně seřazeným větám, naše schopnost dešifrovat informaci klesá. Nedej bože, že bych rozházel věty v textu, podvěty v souvětích, slova ve větách i písmena ve slovech. Pak už informace neexistuje - pouze chaos. Kdybych takové rozhazování činil podle nějakého klíče, který bych poslal se správou a podal instrukce  k překladu, pak by se defacto jednalo o šifrovanou zprávu, které má rozumět pouze ten, kdo zná algoritmy a klíče - základní prvky šifry. My prostě čteme text jedním směrem, v daném pořadí a máme-li nějak přeskakovat, přehazovat nebo nahrazovat, musíme být o tom informováni.

To, jak data chápe počítač, binární informace, má už poněkud striktnější podobu, ale podobně jako v lidské mysli, i zde existují desítky pomůcek jak chybu rozpoznat, kontrolní součty, opakované odesílaní, zjišťování, co by ta data nejpravděpodobněji měla reprezentovat - např.: v mém minimalnim binarnim kódu sestrojeném pomocí Huffmanovi konstrukce, je slovo "ahoj" reprezentováno touto sekvencí: 1110111100000111101 a kdybych třeba náhodně pozměnil jeden bit abych simuloval chybu, třeba takto: 1110111101000111101, měl bych slovo "ajoj", což  tedy není tak významný rozdil, jak jsem čekal. I kdyby ale byl a my bychom vybavili počítač databází českých slov v tomto binárním jazyce, uměl by rozpoznat čemu se nejvíce kód blíží lépe než my, jelikož z jeho binárního hlediska se změnila daleko menší část slova, než z našeho abecedního. Došlo k menší míře neurčitosti. Prostě za předpokladu, že je naprogramován algoritmus do nějaké úrovně chápání dat, pak je tak počítač dokáže chápat. Stále ale infromace zpracovává jen jednim směrem, jinými slovy je dostává v určitém pořadí. O šifrování už netřeba mluvit. A stejně jak platí pro text, i zde, je-li informace dokonale neuspořádána, jedná se o chaos - nazýváno v informatice šum. Čím méně je informací, tím větší je neurčitost.

Vite, co má informace společného s rychlostí světla, tedy limitní rychlostí? Je jí stejně omezena jako světlo. Nemůže se pohybovat rychleji. Ono to totiž ve skutečnosti není tak, že by se hmota nemohla pohybovat rychleji, to platí pouze v relativním měřítku. Objekty nesmírně vzdálené se od sebe v praxi (tedy podle měření a informací nám dostupných) pohybují rychlostí nadsvětelnou, jelikož se rozpíná prostor, ba dokonce se i rozpíná zrychleně. A je-li některý objekt natolik vzdálený, aby se pohyboval vzhledem k nám nadsvětelnou rychlostí, pak o něm nezískáme informaci. To ale není dnešní téma. Mě zajímá informace, a protože v matematice se dokazuje např. i rozporem, zkusme se podívat co informace není. Nemusí být totiž úplně triviální informaci a neinformaci rozeznat. Představte si kocoura, kterému páníček svítí před očima na zem laserovým ukazovátkem. Kocour dostává informaci o tečce na podlaze, a tak ji se zájmem sleduje. Pak ale páníček pohne rukou a kocour si pohyb interpretuje tak, že se tečka hnula. Začne se pohybovat za ní a jak tečka utíká, honí ji jako myš. Tou tečkou bychom mohli svítit na jinou planetu - pak by stačil malý pohyb ruky a tečka se přesune nadsvětelnou rychlostí z jednoho místa na druhé. K nadsvětelnému pohybu tečky sice dochází, ale k přenosu informace s ní ne. informace se přenáší pouze z laseru k tečce a z tečky se odráží do okolí, maximálně rychlostí světla. Dalš analogie: moře a vlny, jež se pohybují směrem k pobřeží. Vlna se sice žene, ale vodu, kterou zvedá, za sebou zas nechá a nepřesouvá jí k pobřeží stejnou rychlostí, jako se sama pohybuje. Tahle analogie je vlastně zjednodušený popis fázové rychlosti. Za určitých okolností se totiž fáze může pohybovat rychleji než světlo, ale nedokáže nést informaci. Úplně základní grafický nástroj pro pochopení: řada několika desítek kuliček, které se střídavě pohybují nahoru a dolu, tak, že dělají vlny. Ten jeden jejich poziční stav je fáze, a ta se posouvá po částicích. Nejlépe to vysvětlí asi třeba tenhle obrázek. Dává dojem přemístění, ikdyž částice jsou stále na stejné dráze.
Když jsem mluvil o rozpnajícím se prostoru (dovolím si teď trochu rozporuplnější úroveň abstrakce) je vidět že ani prostor bez částic nenese informaci, protože za prvně se chová podobně jako vlna - pohání částice svou rozpínavou (temnou) energií, které se ale nikdy nebudou pohybovat rychleji než ona, a za druhé je každý jeho bod nerozlišitelný od druhého - představuje ticho proti šumu.


Dalo by se tedy říci, že je informace podmnožinou dat, jejichž známe správnou pozici. Data, a tedy i informaci, může podle mě nést pouze neinertní částice, taková, která s něčím reaguje, ať už fyzikálně, chemicky nebo čertvíjakještě. Taky se definuje, že informace snižuje míru neurčitosti stavu nějakého systému a kde není informace, tam je šum. Šum je podobně jako informace nesen neinertními částicemi, ale narozdíl od informace neznáme jejich pozici. Vesměs to odpovídá teorii, dle níž je znalost stavu systému založena na znalosti dvou proměnných, přičemž čím přesněji určíme jednu z nich, tím hůře určíme druhou. Jako příklad se uvádí letící částice. Čím lépe známe její rychlost, tím hůře se určuje její poloha. Nebo také alternativa - čím rychleji letí, tím hůře se dá říci kde zrovna je. Tak jako je graf funkce dvourozměrný, protože její hodnotový stav v bodě definitivně určují dvě proměnné, tak i informace je zřejmě dvourozměrná (ikdyž pravděpodobně diskrétní, jelikož se předpokládá, že vesmír obsahuje konečné množství částic, a tedy konečné množství dat, což také znamená, že by lépe odpovídalo přirovnání k posloupnostem), jenže nikdy nelze přesně změřit obě hodnoty s naprostou jistotou, jen s nějakou pravděpodobností, a proto tedy pojem míry neurčitosti. Na to člověk hledá odpovědi v matematice. Hledáme funkce, které jedné hodnotě z pozorovaného šumu přiřadí druhou hodnotu a sledujeme potom, zda druhá hodnota odpovída jinému pozorování.

Moje poslední otázka: Zatím se zdá, že každá informace je nesena částicí. Zajímalo by mě, zda každá částice nese informaci. Moje abstraktní představivost tomu rozhodně napovídá, což ale nemohu nikdy nikde považovat za důkaz. Otázka vlastně zní, zda vždy existuje funkce správně přiřazující druhou proměnnou zadáním první ze šumu, což znamená, že je možné přeložit všechen šum na informaci. Bylo-li by tomu tak, pak by byla částice ekvivalentem  informace. No a naposledy, je-li hmota ekvivalentem informace, pak jsme my pouze informace. A co je informace? Má vůbec nějakou hodnotu? Lze o informaci říct, že existuje? Nejsme my nakonec jen kočka honící se za červenou tečkou?