A mesterséges intelligencia már képes képeket generálni – Mit jelent ez az emberek számára? (x)

Kiderült, hogy miután hatalmas adathalmazokon betanították őket, az algoritmusok nem csak azt tudják megmondani, hogy mi egy kép, de akár azt is, hogy egy macska az macska, hanem teljesen eredeti képeket is képesek generálni. Az ezt lehetővé tevő mesterséges intelligencia az elmúlt években jelentősen fejlődött, és bizonyos területeken már nagyon ügyes, más tekintetben azonban még hosszú út áll előtte.

Az informatikusoknak két évtizedbe telt, mire olyan gépeket képeztek ki és fejlesztettek ki, amelyek képesek ”látni” a körülöttük lévő világot – egy újabb példa egy olyan mindennapi képességre, amelyet az emberek természetesnek vesznek, mégis hatalmas nagy kihívás egy gépet betanítani erre.

Az arcfelismerő technológia, amelyet a kiskereskedelemben és a biztonságban egyaránt használnak, az egyik mutatója annak, hogy a mesterséges intelligencia és annak képessége, hogy ”meglássa” a világot, kezd mindennapossá válni. A kiskereskedők az arcfelismerő technológiát a célközönségüknek való jobb marketing és értékesítés érdekében használják.

Az egyik különösen érdekes felhasználási eset szerint egyes kínai irodakomplexumokban olyan automaták működnek, amelyek arcfelismerő technológia segítségével azonosítják a vásárlókat, és nyomon követik az automatából kivett termékeket, hogy végül a vásárlók számláját számlázzák ki. Még a kamerák által a vásárlókról gyűjtött anonim adatok, például az életkor, a nem és a testbeszéd is segíthetnek a kiskereskedőknek javítani marketingtevékenységüket és jobb vásárlói élményt nyújtani.

Amerikában kiskereskedelmi óriás Walmart olyan készletfigyelő robotokat telepített, amelyek számítógépes látás segítségével képesek felismerni, ha egy polcon több termékre van szükség, és figyelmeztetni az ott dolgozókat, hogy a polcokat feltöltsék. Több áruházlánc is hasonló technológiát tesztel.

A Seeing AI, egy iPhone-alkalmazás mesterséges intelligenciát használ, hogy segítse a vak és gyengénlátó embereket a környezetükben való tájékozódásban azáltal, hogy a számítógépes látás segítségével azonosítja és kimondja a látómezejében lévő jelenetekről és tárgyakról tett megfigyeléseit. Az iPhone X feloldásához használt Face ID-től kezdve a bűnözők azonosítására használt utcai kamerákon át a közösségi médiaplatformok algoritmusaiig, amelyek lehetővé teszik a fényképeken szereplő személyek azonosítását, az AI képfelismerés mindenütt jelen van.

AI képgenerálás

Most, hogy a mesterséges intelligencia nagyrészt képes megérteni, hogy mit ábrázol egy kép, és meg tudja különböztetni a stoptáblát egy kutyától, a kutyát egy elefánttól és így tovább, a következő, tökéletesítendő határ a mesterséges intelligencia képgenerálása.

Az egyik korábbi akadálya annak, hogy az AI hihető képeket generáljon, az volt, hogy hatalmas adathalmazokra volt szükség a képzéshez. A mai jelentős számítási kapacitással és a hihetetlen mennyiségű adatgyűjtéssel az AI áttörte ezt a korlátot.

Honnan tudja az AI, hogyan kell végrehajtani, amikor egy kép létrehozásával bízzák meg? Generatív adverzális hálózatot vagy hálókat (GAN) használ, amelyet 2014-ben talált fel Ian Goodfellow, a Google kutatója. Két neurális hálózatot használ; az egyik létrehoz egy képet, a másik pedig a célkép valós példái alapján megítéli, hogy a kép mennyire áll közel a valósághoz. Miután pontozta a kép pontosságát, ezt az információt visszaküldi az eredeti mesterséges intelligencia-rendszerhez. A rendszer tanul a visszajelzésekből, és a következő pontozási körhöz egy módosított képet küld vissza. Ez a folyamat addig folytatódik, amíg a pontozó gép meg nem állapítja, hogy az AI által generált kép megegyezik a ”kontroll” képpel.

Ma már a mesterséges intelligencia képes valósághű képeket és videókat készíteni macskákról és hamburgerekről, a szavaink ábrázolását, olyan arcokat, amelyek nem valódi emberekről készültek, sőt eredeti műalkotásokat is.

Sőt, a mesterséges intelligencia eredeti műalkotásainak még piaca is van – a Google jótékonysági célokra rendezett művészeti kiállítást, ahol a DeepDream szoftverrel készített műveket mutatták be. Egy mesterséges intelligencia által generált műalkotást, amely az ember és a gép együttműködéséből született, 8000 dollárért, valamint egyéb díjakért adtak el. Az együttműködésben részt vevő emberi alkotó (vagy művész), Memo Akten elmagyarázta, hogy a Google jobb ”ecsetet” készített, mint eszközt, de az emberi művész még mindig kritikus fontosságú a 8 ezer dolláros árcédulát érő műalkotás létrehozásához.

Akten érzései egybecsengenek azzal, ahogyan más iparágak is használják a mesterséges intelligenciát az emberi munka kiegészítésére és javítására, ahelyett, hogy teljesen szükségtelenné tennék az emberi közreműködést. A művészeket olyan irányokba inspirálhatja, amelyekre a számítógépes együttműködés nélkül talán nem is gondoltak volna.

Készen állunk vajon arra, hogy együttműködj a mesterséges intelligenciával a saját eredeti műalkotásodon? Nézd meg a Deep Dream Generator vagy Deepart programot, amely képes átalakítani bármely feltöltött képet, és egy adott művészeti stílust követve újat létrehozni. Inspirációra van szüksége ahhoz, amit mások csináltak? Csak nézd meg a felhasználók galériáját. Ha tetszik, amit készítesz, akár ki is nyomtathatod őket, hogy a faladra tehesd!

A mesterséges intelligencia és a számítógépes látás egyre inkább megváltoztatja a munkánkat, az életünket és még az alkotásunkat is. Ki tudja, az is lehet, hogy hamarosan a mesterséges intelligencia olyan, ma még perifériának számító területeken is jelen lesz, mint az online casino oldalak világa, ahol az élő osztókat akár még ezek a programok is felválthatják, vagy csak még izgalmasabb blackjack játékokat kínálhatnak. Sokan tartanak a mesterséges intelligencia fejlődésétől, de az igazság az, hogy nincs mitől tartanunk: amíg az ember a saját hibáit akaratlan is beépíti a szoftverekbe, a gép soha nem tud felülkerekedni.