Binokuláris látás – Wikipédia

Emberi sztereo látás

Megjegyzés: a fixációs pontnak nem feltétlenül kell valamely tárgy felületi pontjára illeszkedni; lehetséges, hogy a két nézõvonal metszéspontja a "levegõben" van. Mind a binokuláris parallaxis, mind a horizontális diszparitás az irodalomban használt értelemben a képrészletek vízszintes irányú eltolódásának jelölésére szolgál. Azonban célszerûnek tartom megkülönböztetni a téri viszonyok geometriájából adódó parallaxist attól, ami a két retinán keletkezik, ugyanis a szemek vergens mozgásának következtében nem feltétlenül a végtelen távoli pontoknak lesz nulla a diszparitása.

A megkülönböztetés érdekében vezessük be a következõ két definíciót. Ezt másképp úgy is fogalmazhatjuk, hogy ez az a konvergenciaszög, amit a két szem nézõvonala egymással bezárna, ha erre a pontra fixálnánk mindkét szemmel.

A végtelen távoli pontok binokuláris parallaxisa 0. Megállapodás szerint mindig a emberi sztereo látás koordinátából vonjuk ki a jobboldalit. A horizontális retinális diszparitás elõjeles mennyiség. Ha adott fixációs pont esetén egy másik pont az un. Vieth-Müller körön belül van, akkor az ahhoz tartozó diszparitásérték pozitív, ha ezen kívül, akkor negatív 4.

Egyszerû elemi geometriai meggondolással a 2.

Navigációs menü

A késõbbiekben a horizontális retinális diszparitás helyett a rövidebb horizontális diszparitás, vagy a még rövidebb diszparitás kifejezést fogjuk használni.

A binokuláris parallaxis definíciója tehát független az aktuális fixációs ponttól, ezzel szemben a diszparitás függ a fixációs pont helyzetétõl. A binokuláris parallaxis fogalma arra vonatkozik, amit látunk azaz magára az objektumraa diszparitásé pedig a retinaképekre azaz, ahogyan az objektum a retinákra vetül. Az említett Vieth-Müller kör egy adott fixációs pont esetén az összes nulla diszparitású pontok halmazát jelenti a két szem és a fixációs pont emberi sztereo látás meghatározott síkban ld.

Kardos, Ezen pontok mértani helye az elemi geometriából jól ismert tétel szerint egy kör, mely átmegy a két szem optikai centrumán és a fixációs ponton. Az Vieth-Müller kör tapasztalati megfelelõje a kísérletileg megállapítható "horopter", mely a szubjektív megítélés alapján ugyanabba a mélységbe esõ pontoknak halmazát jelenti.

Némileg eltér az elméleti alakzattól, azaz a Vieth-Müller körtõl aminek oka, hogy a szemek forgási középpontja nem esik egybe a leképezõ rendszer szemlencse, csarnokvíz optikai centrumával.

Tartalomjegyzék

A horizontális diszparitás a fixációs ponttól való mélységbeli eltérés függvénye. A szempár elhelyezkedése következtében nemcsak horizontális, hanem vertikális retinális diszparitás is fellép, ami közeli tárgyaknál válik jelentõsebb mértékûvé. Ennek oka, hogy a tárgyak bal oldala közelebb van a bal szemhez, jobb oldala a jobb szemhez, így az optikai nagyítás mértéke eltérõ. Ezt szemlélteti a 5.

Figyeljük meg a képeken az ellenkezõ értelmû trapéztorzítást. Vegyük észre a 5. Az is könnyen belátható, hogy egy tetszõleges adott P pont esetén mindkét szemet ugyanakkora függõleges szöggel kell elforgatni, ha a két nézõvonalat erre a P emberi sztereo látás szeretnénk irányítani. Más szavakkal: ha L -lel jelöljük a bal, R -rel a jobb szem forgási középpontját, akkor az LAR sík vízszintessel bezárt szöge jelenti a bal és a jobb szem vertikális szöghelyzetét, tehát ez a két szög azonos.

Vertikális parallaxis pedig csak akkor állhatna fenn, ha ez a két függõleges irányt mérõ szög eltérõ lenne. A szemmozgások leírása A szem mozgását többféle geometriai rendszer szerint írhatjuk le.

A két legismertebb a Helmholtz-féle, valamint a Fick-féle leírás. Collevijn and Erkelens, Ezek között a horizontális és vertikális szögelmozdulások közötti sorrendben van eltérés. A Helmholtz rendszer szerint elõször mindkét szemet függõleges irányban mozdítjuk el [lambda] szöggel eleváció, felfelé pozitív a két szemet összekötõ bázistengely körül, és vele együtt a szem eredeti függõleges tengelyét is elmozdítjuk!

Ezután u szöggel fordítjuk el a szemet, az új pozícióban lévõ, eredetileg függõleges tengely körül azimut, jobbra pozitív.

emberi sztereo látás

Végül az elforgatást torzió, szagittális mozgás a nézõvonal körül végezzük. Az említett Fick leírásban fordított a sorrend. Elõször egy függõlegesen álló tengely körül mozdítjuk el a szemet [phi] szöggel longitude, jobbra pozitív és vele együtt elmozdítjuk az eredetileg a bázisvonallal egybeesõ vízszintes tengelyt is.

Utána az új helyzetû vízszintes tengely körül mozdítjuk el függõleges irányban [theta] szöggel latitude, felfelé pozitív.

Binokuláris látás – Wikipédia

Az elforgatás végül a nézõvonal körül történik. A két leírás között nehéz választani, ha azt kérdezzük, melyik az "igazi".

A szemizmok nem derékszögû koordinátarendszer szerint helyezkednek el, ezért valójában egyik leírás sem a "valódi" mozgást írja le. A szemizmok elhelyezkedése alapján feltételezhetõ, hogy a hozzájuk vezetõ vezérlõ parancsok között interakció áll fenn akkor, ha pl. A szemizmok vezérlõ jele nem feltétlenül fog úgy alakulni, hogy a függõleges résznél csak a függõleges, a vízszintes résznél csak a vízszintes izmok emberi sztereo látás jelet; a kissé oldalt lévõ függõleges egyenes végigtapogatásához a vízszintes izmok korrekciójára is szükség lehet.

emberi sztereo látás

Érdekes probléma lehet megmérni a szemizmok vezérlõ parancsainak többdimenziós absztrakt vektora és pl. A fenti két formális koordinátarendszer csupán a külsõ jelenség leírására alkalmas, hogy ezáltal a mért adatokat egységes formára tudjuk hozni. A emberi sztereo látás parallaxisról tett fenti állítást ezek után pontosítanunk kell: a Helmholtz-féle koordinátarendszerben nincs vertikális parallaxis.

Vertikális retinális diszparitás természetesen továbbra is létezik, ami annál nagyobb, minél nagyobb a konvergencia szöge. Az ismert sztereó modellek bemutatása, kritikája Ebben a fejezetben a sztereó párosítási probléma megoldását célzó ismert modellek összefoglalását és azokra vonatkozó saját kritikámat ismertetem.

Az éldetekciós modell Az elsõ, széles körben elfogadott sztereó modell Marr és Poggio éldetekciós modellje volt, amit most Grimson alapján ismertetek. Ez a komputációs algoritmus a következõ 5 lépésbõl áll.

emberi sztereo látás

Mind a bal, mind a jobb képet szûrésnek vetjük alá; a szûrõ képlete: 2G, azaz a egy Gauss sûrûségfüggvény és a Laplace operátor konvolúciója. A 2 szimbólum szokásos elnevezése a fizikában: nabla négyzet. Ennek értelmezése: elõször a kép minden pontját helyettesítjük a környezetének súlyozott átlagával, ahol a súlyfüggvény egy adott [sigma] szórású kétdimenziós Gauss sûrûségfüggvény. Ezután az így kapott simább kép minden pontjában egy újabb transzformációt végzünk a fizikából ismert Laplace operátor segítségével.

Ennek az operátornak a szerepe az élkiemelés, azaz, azokat a pontokat fogja nagy intenzitással átvinni a transzformált képre, melyek jelentõsen eltérnek a környezetüktõl. Ennek hátterében az áll, hogy pl. Egy adott hõeloszlással rendelkezõ vékony lemez valamely pontjából annál nagyobb a kifolyó fluxus, minél melegebb ez a pont a közvetlen környezeténél Feynman és mtsai, A 2G intenzitástranszformáció hatására egy vonalábraszerû képet kapunk.

A emberi sztereo látás annál távolabb lesznek egymástól, minél nagyobb volt a Gauss függvény szórása, azaz minél erõteljesebb volt a simító hatás.

A maszkméreten belül párosítást kell végezni a nulla-átmenetekre, figyelembe véve azok elõjelét is. Ha esetleg nem így van, akkor újabb trükkökkel milyen életkorú látáshoz 1 kell tenni a párosítást, amit itt emberi sztereo látás nem részletezek. Ezeket az egymás utáni lépéseket elõször egy durva, azaz nagy szórású Gauss szûrõvel végzi ekkor csak nagyon kevés él marad az intenzitástranszformációnak alávetett két képen majd összesen 4 lépésben egyre kisebb szórású súlyfüggvényt alkalmazva eljut a finomabb részletek párosításához.

Az éldetekciós komputációs modell célja, hogy egységesen kezelje a fúziós sztereopszist azaz egy adott konvergenciaszög mellett a teljes képre számolja a párosításokatés a vergenciát. A két folyamat közti viszonyt kölcsönhatásként kezeli: a emberi sztereo látás elõsegíti a fúziót, és a fúzió tovább vezérli a vergenciát. Ez volt sokáig a egyetlen, sokat idézett modell a sztereó párosítási problémára.

Az algoritmus valóban mûködik RDS-ekre és valódi képekre egyaránt.

emberi sztereo látás

Azonban, véleményem szerint ez az algoritmus távol áll a sztereó látás valódi folyamataitól, nem azt modellezi. Ezt a közvetkezõkre alapozom. Az algoritmus eleve feltételezi, hogy van két statikus kép, amit megmutattunk a "robotnak", és addig nem változtatjuk meg a képeket, amíg az be nem fejezi az egymásutáni lépéseket.

Csakhogy a valódi világ állandóan változik, és nem világos, hogy mit kezd az algoritmus akkor, ha pl. Hol fogja folytatni, ill. Erre még azt sem lehet válaszolni, hogy mind a négy szûrés egyidejûleg, párhuzamosan folyhat, mert az algoritmus eleve szekvenciálisan van felépítve : az i. Ha ettõl eltérünk, az algoritmus egyszerûen mûködésképtelen, mert egyik lépés sem indítható el addig, míg az elõtte levõ lépés be nem fejezõdött.

Optika és látórendszerek

Ez az algoritmus nem párhuzamosítható, dinamikusan változó képek feldolgozására alkalmatlan és ezért távol áll a valódi idegrendszeri folyamatoktól. Egy másik ellenvetésem talán inkább nevezhetõ "esztétikai" jellegûnek: az evolúció nem szereti az olyan mesterkélt megoldásokat, hogy "haladjunk balról jobbra" és eszerint állapítsuk meg a zéró átmenetek elõjelét.

Miért éppen balról jobbra? Mert úgy szokás olvasni?

emberi sztereo látás

Ez jellegzetesen számítógépes, algoritmikus szemlélet, semmi köze az élõ folyamatokhoz. Természetesen az algoritmus átfogalmazható jobbról balra irányúra is, de nem is ez a fõ gond.

emberi sztereo látás

A megoldásban rejlõ aszimmetria az, ami mesterkéltnek tûnik. Végül meg kell említeni e modell még egy hiányosságát, éspedig, hogy színes képekre nem mûködik, csak fekete-fehérekre. Arra nincs irodalmi adat, hogy ez a modell kiterjeszthetõ lenne színes képekre is, pedig a valóságban a sztereó rendszer nem színvak ld. Kovács, I. A Julesz-féle mágnestûs modell A másik figyelemre méltó sztereopszis modell a Julesz-féle mágnestûs avagy "sezlon" modell Julesztovábbfejlesztve Julesz, Ez egy kooperatív modell, ahol a mágnestûk a Küklopsz Cyclopian retinán a fekete-fehér pontoknak megfelelõen fekete ill.

A kooperatív jelzõ arra vonatkozik, hogy a mágnestûk kölcsönös emberi sztereo látás jön létre a megoldás.