RačunalaInformacijske tehnologije

Moderni računalni vid. Zadaci i tehnologiju računalnog vida. Programiranje računalni vid u Pythonu

Kako naučiti računalo razumjeti što je prikazano na slici ili slika? To izgleda jednostavno, ali za računalom, to je samo matrica koja se sastoji od nula i jedinica u kojima želite izvući važne informacije.

Što je računalni vid? To je sposobnost da „vidi” svoje računalo

Vizija - važan izvor informacija za osobe koristeći ga, dobivamo, prema različitim procjenama, od 70 do 90% svih informacija. I, naravno, ako želimo stvoriti pametnu auto, moramo implementirati iste vještine i računalo.

Problem računalnog vida može se reći sasvim jasno. Što je „vidjeti”? Podrazumijeva se da tamo gdje postoje samo gleda. To je zaključio razlike računalnog vida i ljudskog vida. Vizija za nas - to je izvor znanja o svijetu, kao i izvor metričkih podataka - to jest, sposobnost da razumiju udaljenosti i veličine.

Semantička slika koštica

Gledajući sliku, možemo opisati po broju atributa, da tako kažemo, izvući semantičkih informacija.

Na primjer, gleda na ovoj slici, možemo reći da je na otvorenom. Što je gradski promet. Da postoje automobili. možemo nagađati da je to jugoistočne Azije o konfiguraciji zgrade i hijeroglifa. Portret Mao Zedong shvatiti da je to Peking, a ako netko vidio live video ili sam bio tamo, ne bi pogodio da je to poznati Trg Tiananmen.

Ono što mogu reći više o slici, to vidim? Možemo prepoznati objekte u slici, kako kažu, da postoje ljudi ovdje bliže - ograda. Ovdje suncobrani, da zgrada je plakati. To su primjeri klase je vrlo važna objekti, koji su sudjelovali u potrazi za trenutak.

Ipak možemo naučiti neke od značajki ili atribute objekata. Na primjer, ovdje možemo odrediti da to nije portret jednog običnog kineski, naime, Mao Zedonga.

Prema vozila može se odrediti da je objekt u pokretu, a to je teško, da se ne deformira tijekom kretanja. O zastave može se reći da je to predmeti, oni se kreću, ali oni nisu teško, stalno deformirana. I na sceni je vjetar, što se može utvrditi razvijanjem zastave, a može čak i odrediti smjer vjetra, na primjer, on je puhao s lijeva na desno.

Udaljenosti i duljine u računalni vid

Vrlo važno je metrički podaci o računalni vid znanosti. To je sve vrste udaljenosti. Na primjer, za rovera je posebno važno, jer su ekipe od Zemlje oko 20 minuta i odgovoriti koliko. Prema tome, veza tamo i nazad - 40 minuta. A ako ćemo napraviti plan za kretanje naredbe na Zemlji, morate uzeti u obzir.

Uspješno integrirati tehnologiju računalnog vida u video igrama. Prema video, možete izgraditi trodimenzionalne modele objekata, ljudi i fotografije na korisnika može vratiti trodimenzionalne modele gradova. A onda hodati po njima.

računalni vid - prilično širok raspon. To je usko isprepletena s raznim drugim znanostima. Dio računalnog vida Ona snima područje obradu slike, a ponekad izdvaja računalni vid, povijesno.

Analiza, raspoznavanje uzoraka - put do stvaranja vrhunskog inteligencije

Neka nas ispitati ovih koncepata zasebno.

Obrada slike - ovo je područje od algoritama, u kojem je ulaz i izlaz - slika, a imamo ga nešto učiniti.

analiza slike - je područje računalni vid, koji se fokusira na rad s dvodimenzionalnom slike i donositi zaključke iz toga.

Prepoznavanje uzoraka - apstraktna matematička disciplina koja prepoznaje podatke u obliku vektora. To je, na ulazu - vektor i moramo nešto učiniti s njim. Ako je vektor, nismo toliko važno znati.

Računalni vid - to je izvorno bio obnoviti strukturu dvodimenzionalne slike. Danas je ovo područje postalo šire i to se može tumačiti kao prihvaćanje svih fizičkih objekata izrade, na temelju slike. To jest, to je zadatak umjetne inteligencije.

Paralelno s računalnog vida u posve drugom području, u geodeziji, fotogrametrija je evoluirao - mjerenje udaljenosti između objekata na dvodimenzionalne slike.

Roboti mogu „vidjeti”

I na kraju - to je stroj vid. Pod strojnog vida znači viziju robota. To je odluka nekih proizvodnih problema. Možemo reći da je računalni vid - jedna velika znanost. Ona kombinira neke druge znanosti dijela. A kada se računalo vizija dobiva nikakvu posebnu aplikaciju, ona se pretvara u stroj vid.

Računalni vid regija ima masu praktičnih primjena. Ona je povezana s automatizaciju proizvodnje. U poduzećima postati učinkovitiji zamijeniti ručni rad od strane stroja. Uređaj ne umore, ne spava, ona je nepravilan raspored rada, ona je spremna raditi 365 dana u godini. Dakle, pomoću strojnog rada, možemo dobiti zajamčena rezultat na određeno vrijeme, a to je vrlo zanimljivo. Svi zadaci imaju jasnu koristiti za računalo vizije sustava. I ne postoji ništa bolje nego vidjeti rezultate odmah na sliku samo u obračunskom fazi.

Na pragu svijeta umjetne inteligencije

Plus područje - to je teško! Značajan dio mozga odgovoran za vid, a vjeruje se da ako uče računalo da „vidi”, to jest, puna primjena računalnog vida, to je jedan od ciljeva punim umjetne inteligencije. Ako možemo riješiti problem na ljudskoj razini, vjerojatno u isto vrijeme, mi ćemo riješiti problem AI. To je jako dobro! Ili nije vrlo dobar, ako pogledate, „Terminator 2”.

Zašto je vizija - to je teško? Budući da je slika istog objekta može varirati jako ovisi o vanjskim čimbenicima. Ovisno o predmetu točke promatranja izgledati drugačije.

Na primjer, jedan te isti lik, uzeti iz različitih kutova. I što je najzanimljivije na slici može biti jedno oko, dva oka i pol. I ovisno o kontekstu (ako je to slika čovjeka u košulji s obojenim očima), oko može biti više od dva.

Računalo i dalje ne razumije, ali se „vidi”

Još jedan faktor koji otežava - to je rasvjeta. Ista scena s različitim rasvjeta će izgledati drugačije. Veličina objekt može varirati. Osim toga, predmeti bilo koje klase. Kako možete reći o čovjeku koji je njegova visina 2 metra? Ništa. Ljudski rast i može biti 2,3 m, a 80 cm. Kao i kod drugih vrsta objekata, međutim, predmet su iste klase.

Posebno žive predmeti prolaze sojeve. Kosa ljudi, sportaša, životinje. Pogledajte slike konja, utvrditi što se događa s njihovim griva i rep je jednostavno nemoguće. A preklapaju objekti u slici? Ako gurati računalo sliku, čak i najmoćniji stroj naći poteškoća dati pravu odluku.

Sljedeći prikaz - to je maska. Neki predmeti, životinje oponaša okoliš, i prilično vješto. A ista mjesta i bojanje. Ipak, vidimo ih, iako ne uvijek izdaleka.

Drugi problem - pokret. Objekti u pokretu nezamislivog proći deformacije.

Mnogi od objekata su vrlo promjenjive. Evo, na primjer, u dvije slike ispod objektima „stolice”.

A na to se možete sjesti. Ali naučiti stroj, tako da su različite stvari u oblika, boje, materijala, sve je predmet „stolica” - je vrlo teško. To je izazov. Da se integriraju metode računalnog vida - je naučiti stroj razumjeti, analizirati, nagađati.

Integracija računalnog vida u različitim platformama

Masa računalni vid počeo prodirati u 2001, kada je stvorio prvi detektor lica. Napravili smo to dva autora: Viola, Jones. To je bio prvi brz i pouzdan dovoljno algoritam, koji je pokazao moć metoda strojnog učenja.

Sada računalni vid imaju dovoljno novih praktične primjene - prepoznavanje ljudskog lica.

No, kako prepoznati čovjeka kao u filmovima - nasumce kutova, različitim svjetlosnim uvjetima - to je nemoguće. No, da se riješi problem, ili onaj koji je različitih ljudi s različitim osvjetljenjem ili u drugom stavu, slično kao na fotografiji u putovnici, moguće je s visokim stupnjem pouzdanosti.

fotografije za putovnicu zahtjevi uglavnom zbog značajka algoritama za prepoznavanje lica.

Na primjer, ako imate biometrijske putovnice, u nekim modernim zračnim lukama, možete koristiti automatski sustav kontrole putovnica.

Neriješen problem računalnog vida - sposobnost da prepoznaju tekst

Možda netko koristi OCR sustav. Jedan od njih - a Fine Reader, je vrlo popularan u runet sustavu. Postoje mnogi oblici na kojima obnašaju u podacima, oni su savršeno skenirane, informacija je sustav prepoznao vrlo dobro. No, s bilo koji tekst na slici je situacija puno gora. Ovaj problem još uvijek nije riješen.

Igre koje uključuju računalni vid, hvatanje pokreta

Zaseban veliko područje - je stvaranje trodimenzionalnih modela i motion capture (koji je prilično uspješno provedenog u računalnim igrama). Prvi program koji koristi računalni vid - sustav interakcije s računala pokretima. Kada je stvorio bilo je puno stvari otvorene.

Algoritam je dizajniran vrlo jednostavno, ali konfigurirati trebalo stvoriti generator sintetičke slike ljudi kako bi dobili milijun slika. Superračunalo s njima odabrati parametre algoritma, za koji je sada dobro radi.

To je milijun fotografija i tjedan prebrojiv superračunalo vrijeme moguće stvoriti algoritam koji troši 12% kapaciteta jednog procesora i omogućava osobi da vidim položaja u realnom vremenu. Ovaj sustav Microsoft Kinect (2010).

Ključna riječ slike po sadržaju omogućuje upload fotografija na sustav, a rezultati toga će dati sve slike s istim sadržajem i od istog kuta.

Primjeri računalnog vida: Trodimenzionalne i dvodimenzionalne maps sada su napravili s njom. Karte za navigaciju automobila redovito se ažuriraju u skladu s DVR.

Tu je baza podataka s milijardama geografski označenih fotografija. Preuzimanjem sliku u bazi podataka, možete odrediti gdje je napravljen, pa čak i sa nekim perspektive. Naravno, pod uvjetom da je mjesto dovoljno da popularni u jednom trenutku turisti i napravio nekoliko fotografija tog područja bili tamo.

roboti su posvuda

Robotika u današnje vrijeme, svugdje i bez njega na bilo koji način. Sada postoje vozila koja imaju posebne kamere koje prepoznaju pješaka i putokaze za prijenos naredbi vozača (to na neki način računalni program za pregled, pomaže vozaču). I tu je potpuno automatiziran robotskih vozila, ali oni se ne mogu osloniti isključivo na sustav video kamera bez upotrebe velike količine dodatnih informacija.

Moderna kamera - to je obscura analog kamera

Pričajmo o digitalnoj slici. Moderni digitalni fotoaparati su raspoređeni na principu obscure kamere. Samo umjesto rupu kroz koju svjetlost ulazi u zraku i projicira na stražnjem zidu komore predmetne krugu, imamo poseban optički sustav naziva objektiva. Njegov cilj je prikupiti veliki svjetlosni snop i pretvoriti ga tako da sve zrake prošao kroz virtualni točke kako bi se dobila projekciju i formiranje slike na filmu ili matrice.

Moderni digitalni fotoaparati (Matrix) se sastoji od pojedinačnih elemenata - piksela. Svaki piksel može izmjeriti energiju svjetlosti koja je incident na ukupno piksela, te izdati jedan izlazni broj. Dakle, u digitalnom kamerom, dobili smo umjesto skup svjetlosnih mjerenja svjetline slike, uhvaćeni u jednom pikselu - računala vidno polje. Stoga, kad se slika vidimo ne teče linije i jasne konture i mrežu od obojenih kvadrata u različitim bojama - piksela.

Ispod možete vidjeti prvu digitalnu sliku u svijetu.

No, na ovoj slici nije? Boji. Što je boja?

Psihološka percepcija boja

Boja - to je ono što smo vidjeli. Boja jedan i ista stvar za ljude i mačke će biti drugačiji. Budući da mi (ljudi) i životinjskog optički sustav - vizija je drugačija. Dakle, boja - to je psihološka kvaliteta naše vizije koja nastaje kada promatranja objekata i svjetlo. I nije fizičko svojstvo objekta i svjetlosti. Boja - rezultat je interakcije svjetlosti komponenti, te scene našeg vizualnog sustava.

Programiranje računalni vid u Python koriste knjižnicama

Ako ste se odlučili baviti ozbiljno u istraživanju računalnog vida, odmah treba pripremiti za niz poteškoća, ova znanost nije najlakši i skriva brojne zamke. No, „Programiranje računalni vid na Python” autorstvo Jan Erik Solema - knjige koje opisuju svu najviše jednostavnim jezikom. Ovdje će se upoznati s metodama prepoznavanja različitih objekata u 3D-u, naučiti raditi sa stereo sliku, virtualne stvarnosti i mnoge druge primjene računalnog vida. U knjizi su dovoljno primjera u Pythonu. No, objašnjenja su prikazani, da tako kažemo, generalizirani, tako da ne preopteretiti previše istraživanja i tvrdih podataka. Rad pogodan za studente, amatere i entuzijaste. Preuzmite ovu knjigu i drugima oko računalnog vida (pdf-format) može biti u mreži.

U ovom trenutku, postoje open source knjižnica računalni vid algoritama i obradu slike i numeričkih algoritama OpenCV. To se provodi na većini modernih programskih jezika, je open source. Ako govorimo o računalni vid, Python koristi kao programski jezik, ona također ima potporu knjižnice, osim toga, stalno se razvija i ima veliku zajednicu.

Tvrtka „Microsoft” nudi svoje usluge API-moći trenirati na neuronske mreže da rade sa slikama ljudi. Tu je i prilika da se prijave računalni vid, Python koristi kao programski jezik.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hr.delachieve.com. Theme powered by WordPress.