Vizuális keresés Az iparág egyik legösszetettebb és legsikeresebb versenytársa. A hónap elején, Bing bejelentette új vizuális keresési módját, forró a sarkában Hasonló fejlesztések a Pinteresttől És a Google.
A miénk a képek által közvetített kultúra, ezért érdemes megértetni, hogy a vizuális keresés ilyen fontos szerepet tölt be a világ legnagyobb technológiai vállalatai számára. A fejlődés üteme minden bizonnyal gyorsul; De nincs egyértelmű vizuális kereső “győztes”, és nem lesz semmi hamar.
A keresőipar az elmúlt évtizedben jelentősen fejlődött, a személyre szabott fejlődés, Természetes nyelv Feldolgozási és multimédiás eredményeket. Mégis vitathatjuk, hogy a kép ereje kihasználatlan marad.
Ez nem a figyelem vagy a beruházás hiánya miatt történt. Éppen ellenkezőleg. A vizuális keresés megkerülése technológiai, pszichológiai és neurotudományos know-how kombinációját igényli. Ez a fejlesztés lenyűgöző területe, de az is, amelyet nem lehet könnyen elsajátítani.
Ezért ebben a cikkben a vizuális keresési ágazat vázlatát és a kihívásokkal foglalkozunk, mielőtt elemeznénk a Google, a Microsoft és a Pinterest legutóbbi előrehaladását.
Mi a vizuális keresés?
Mindannyian részt veszünk a vizuális keresésben minden nap. Minden alkalommal, amikor kulcsszavainkat más elemek között kell elhelyeznünk, például agyunk vizuális keresést végez.
Megtanulunk bizonyos célokat felismerni, és egy elfoglalt tájon belül könnyedén megtalálhatjuk őket.
Ez azonban komolyabb feladat egy számítógép számára.
A képkeresés, amelyben a keresőmotor szöveges lekérdezést végez, és megpróbálja megtalálni a legjobb vizuális mérkőzést, finoman különbözik a modern vizuális kereséstől. A vizuális keresés a kép helyett “lekérdezést” eredményezhet. A pontos vizuális keresés érdekében a keresőmotorok sokkal kifinomultabb folyamatokat igényelnek, mint a hagyományos képkereséshez.
Jellemzően, a folyamat részeként a mély neurális hálózatokat olyan kísérletekben végzik el, mint az alábbiak, abban a reményben, hogy imitálják az emberi agy működését a célok azonosításában:

A döntések (vagyis a benne rejlő “elfogultságok”, ahogyan ismertek), amelyek lehetővé teszik számunkra, hogy értelmezzék ezeket a mintákat, nehezebb integrálni egy gépbe. Kép feldolgozásakor, ha a gép prioritást ad a forma, a szín vagy a méret tekintetében? Hogyan csinál ez egy személy? Tudjuk-e még biztosan, vagy csak mi tudjuk a kimenetet?
Mint ilyen, a keresőmotorok továbbra is küzdenek a képek feldolgozásában, ahogy azt elvárják tőlük. Egyszerűen nem értjük meg a saját elfogultságainkat ahhoz, hogy képesek legyenek egy másik rendszerben való reprodukálásra.
Mindazonáltal számos előrelépés történt ezen a területen. A Google képkereső drasztikusan javult a szöveges lekérdezések és egyéb lehetőségek – például a Tineye – válaszaként, és lehetővé teszi számunkra, hogy fordított képkeresést használjunk. Ez egy hasznos tulajdonság, de korlátai nyilvánvalóak.
Évek óta a Facebook képes azonosítani az egyéneket a fotókon, ugyanúgy, ahogy egy személy azonnal felismeri a barátja arcát. Ez a példa a szent grál közelebbi közelítése a vizuális kereséshez; Azonban még mindig rövid. Ebben az esetben a Facebook felállította a hálózatát, hogy keressen arcokat, és egyértelmű célpontot adjon nekik.
Az online vizuális kereső lehetővé teszi számunkra, hogy egy képet bemenetként használjunk és egy másik, kapcsolódó képet kapjunk kimenetként. Ez azt jelentené, hogy egy székekkel ellátott okostelefon segítségével képet kaphatunk, és a technológiát a szőnyeg stílusát kísérő, megfelelő szőnyegekről is visszanyeri.
A középső tipikus “emberi” folyamatot, ahol megfejtenénk egy kép komponensrészeit, és eldönthetnénk, hogy miről van szó, majd fogalmazzuk és osztályozzuk a kapcsolódó elemeket, mély neurális hálózatok vesznek részt. Ezek a hálózatok “felügyelet nélkül” vannak, ami azt jelenti, hogy nincs emberi beavatkozás, mivel megváltoztatják működésüket a visszacsatoló jelek alapján és a kívánt kimenet elérésére.
Az eredmény lenyűgöző lehet, mint Georges Seurat “A vasárnap délután a La Grand Jatte szigetén” A Google neurális hálózata :

Ez azonban csak egy megoldás egy kényes kérdés megválaszolására.
Jelenleg nincs helyes vagy rossz válasz erre a területre; Egyszerűen többé-kevésbé hatékonyak egy adott környezetben.
Ezért értékelni kell néhány technológiai óriás előrehaladását, hogy megfigyeljék az eddigi jelentős lépéseket, de a vizuális kutatás előtt még megakadályozandó akadályok valóban elsajátíthatók.
Bing vizuális keresést
Június elején a TechCrunch 50-ben, a Microsoftban bejelentett Hogy most lehetővé teszi a felhasználók számára, hogy “kép szerint keressenek”.

Ez több okból is megmutatkozik. Először is, bár a Bing képkeresése már régóta jelen van, a Microsoft ténylegesen eltávolította az eredeti vizuális keresési terméket 2012-ben. Az emberek egyszerűen nem használták a 2009-es bevezetés óta, mivel nem volt elég pontos.
Továbbá tisztességes lenne mondani, hogy a Microsoft kicsit mögötte van ebben a versenyben. A rivális keresőmotorok és a közösségi média platformok már néha vizuális keresési funkciókat nyújtanak.
Ennek eredményeként ésszerűnek tűnik azt feltételezni, hogy a Microsoftnak valami kényszerítőnek kell lennie, ha úgy döntöttek, hogy egy ilyen nyilvános bejelentéssel újra belépnek a verekedésbe. Bár nem teljesen forradalmi, az új Bing vizuális keresés még mindig hasznos eszköz, amely jelentősen felépül a képkereső termékén.

A Bing keresi a “konyhai dekorációs ötleteket”, amelyek bemutatják a Bing új vizuális keresési lehetőségeit
A Bing vizuális kereséstől eltekintve a képeken belül kereshet, majd kibonthatja azokat a kapcsolódó objektumokra, amelyek kiegészíthetik a felhasználó kiválasztását.

A felhasználó kiválaszthatja a konkrét objektumokat, befedheti őket, és megvásárolhat hasonló tárgyakat, ha kívánják. A kiskereskedők lehetőségei mind nyilvánvalóak és bőségesek.
Érdemes megemlíteni, hogy a Pinterest vizuális keresése Képes volt erre egy ideig . De a Pinterest képessége és a Bing között ebben a tekintetben fontos különbség az, hogy a Pinterest csak a felhasználókat továbbíthatja a Pins számára, amelyeket a vállalkozások a Pinteresten elérhetővé tettek – és nem mindegyikük lehet shoppable . A Bing viszont indexelheti a kiskereskedői weboldalt, és vizuális keresést használhat arra, hogy a felhasználó felé irányítsa, anélkül, hogy bármelyik félnek extra erőfeszítést kellene tennie.
A Silverlight technológiával működőképesnek kell lennie egy sokkal kifinomultabb megközelítésnek a képek kereséséhez. Microsoft biztosítani A következő megjelenítés, hogy a lekérdezés feldolgozó rendszere hogyan működik ehhez a termékhez:

A Microsoft egyesíti ezt a rendszert a tulajdonában lévő strukturált adatokkal, hogy sokkal gazdagabb, informatívabb keresési élményt nyújtson. Bár néhány keresési kategóriára, például háziárusra, utazásra és sportra korlátozódik, arra számíthatnunk kell, hogy ezt az idén több területre is kiterjeszthetjük.
A következő lépés a folyamat egyes részeinek automatizálása, így a felhasználónak nem kell rajzolni egy objektum kiválasztására szolgáló mezőt. Még mindig messze van a tökéletes vizuális keresés ígéretétől való eljuttatáshoz, de ezeknek a frissítéseknek legalábbis a Microsoftnak meg kell találnia néhány, a Bingen keresztüli keresést.

Google Lens
A Google a közelmúltban bejelentette Lens termékét a 2017-es I / O konferencián májusban. A Lens célja valóban az okostelefon vizuális keresőmotorrá alakítása.

Vidd le a képet bármi ott, és a Google megmondja, hogy mi a tárgy, és minden kapcsolódó entitások. Például egy étterembe irányítsa az okostelefont, és a Google megmondja neked a nevét, hogy a barátaid meglátogatták-e már korábban, és kiemelte az éttermi értékelést is.

A Google lencse segítségével az okostelefon fényképezőgépe nemcsak látja, amit lát, hanem azt is meg fogja érteni, hogy mit lát, hogy segítsen lépéseket tenni. # io17 pic.twitter.com/viOmWFjqk1
– Google (@Google) 2017. május 17
Ezt kiegészíti a Google zavart adatlista, mind a saját tudásgrafika, mind a fogyasztói adatok alapján.
Mindezen adatok táplálhatják és finomíthatják a Google mély neurális hálózatait, amelyek központi szerepet játszanak a Lens termék hatékony működésében.
A Google tulajdonában lévő DeepMind cég élen jár a vizuális keresési innováció terén. Mint ilyen, a DeepMind is különösen jól ismeri, hogy milyen kihívást jelent a technológia elsajátítása.
A kihívás már nem feltétlenül olyan neurális hálózatok létrehozásában, amelyek megértik a képet olyan hatékonyan, mint az ember. A nagyobb kihívás (az úgynevezett “fekete doboz probléma” ezen a területen) az, hogy a következtetések meghozatalához szükséges folyamatok olyan összetettek, homályosak és sokoldalúak, hogy még a Google mérnökei is küzdenek a nyomon követésért.
Ez rámutat arra, hogy a vizuális keresések középpontjában egy meglehetősen zavaró paradoxon áll, és szélesebb körben a mély neurális hálózatok használatát. A cél az emberi agy működésének utánzása; Azonban még mindig nem igazán értjük, hogyan működik az emberi agy.
Ennek eredményeként a DeepMind új módszereket kezdett felfedezni. Lenyűgöző blog bejegyzés A következtetéseket összegezték: a A közelmúltban , Amelyen belül alkalmazták a képek emberi érzékelésében nyilvánvaló induktív érvelést.
A kognitív pszichológia gazdag történelmére támaszkodva (legalábbis a neurális hálózatok új keletű területeivel összehasonlítva) a tudósok ugyanúgy alkalmazhatnák a technológiájukat, mint az emberek, amikor elemeket rendezünk.
A DeepMind a következő kérést használja a gondolkodás megvilágításához:
“A térbeli nyelvész meglátogatta egy kultúrát, amelynek a nyelv teljesen más, mint a miénk. A nyelvész igyekszik megtanulni néhány szót egy hasznos anyanyelvűtől, amikor egy nyúl elhalad. A natív szónok kijelenti, hogy “gavagai”, és a nyelvész hagyja annak következtetését, hogy ez az új szó. A nyelvész számos lehetséges következménnyel szembesül, beleértve azt is, hogy a “gavagai” a nyulakat, az állatokat, a fehér dolgokat, a nyulakat vagy a “nyulak nem tisztázott részeit” jelenti. Van egy végtelen lehetséges következtetés. Hogyan válogathatnak az emberek a helyesnek? ”
A kognitív pszichológiában végzett kísérletek kimutatták, hogy van egy “alakváltozás”; Vagyis kiemeljük azt a tényt, hogy ez nyúl, ahelyett, hogy a színére vagy az állatok szélesebb körű osztályozására koncentrálna. Tisztában vagyunk mindezekkel a tényezőkkel, de a formát a legfontosabb kritériumnak tekintjük.

“Gavagai” Kredit: Misha Shiyanov / Shutterstock
A DeepMind az egyik legfontosabb eleme a Google fejlesztésnek az “AI-first” vállalatba, így a közeljövőben elvárhatjuk, hogy a fentiekhez hasonló eredményeket beépítsünk a vizuális keresésbe. Amikor ezt teszik, nem szabad kizárnunk a Google Glass 2.0 vagy valami hasonlót.
Pinterest Lens
A Pinterest célja, hogy megállapítsa magát, mint a go-to keresőmotor, ha nem rendelkezik a szavakkal, hogy leírja, mit keres.
A Lencse termékének elindítását Ez év márciusában valóságos szándéknyilatkozat és a Pinterest számos felsõbérlõt bízott meg a Google képkeresõ csapataiból az üzemanyagfejlesztéshez.
Egy fizetett kereső termék létrehozásával és a “Shop the Look” (“Shop the Look”) létrehozásával kombinálva növekvő egyetértés van abban, hogy a Pinterest valódi marketinges versenyzővé válhat. Amint az Amazon, a hirdetők szomjúságát élvezni fogja a Google és a Facebookon kívüli további lehetőségek iránt.
Pinterest elnöke, Tim Kendall a közelmúltban a TechCrunch Disrupt-ban jegyezte meg: “Kezdjük tudni a differenciálódást és olyan dolgokat építeni, amelyeket más emberek nem tudnak. Vagy építhetnék, de a termékek természete miatt ez kevésbé lenne értelme. ”
Ez meghajtja az ügy lényegét. A Pinterest felhasználók valami másra jönnek a webhelyre, ami lehetővé teszi a Pinterest számára, hogy különböző termékeket készítsen nekik. Miközben a Google számos fronton háborút küzd, a Pinterest a vizuális keresési kínálat javítására összpontosít.
Nyilvánvaló, hogy továbbra is folyamatban van, de a Pinterest Lens jelenleg a legfejlettebb vizuális keresőeszköz. Okostelefon használatával a Pinner (mint a webhely felhasználóinak ismerete) képes képet készíteni az alkalmazáson belül, és nagy pontossággal feldolgozza a Pinterest technológiáját.
Az eredmények meglehetősen hatékonyak a ruházati cikkek és a háztartások számára, bár még hosszú út áll előttünk, mielőtt a Pinterestet személyes stylistként használjuk. A jövő pazarló pillantása azonban a Pinterest Lens üdvözlendő és lenyűgöző fejlődés.

A következő lépés a bevételszerzés, ami pontosan a Pinterest Tervek szerint . A vizuális keresés része lesz a fizetett hirdetési csomagjának, amely kétségkívül olyan kiskereskedőkre szólít fel, akik túl akarnak lépni a kulcsszó szerinti célzáson és a közösségi médiakereséseken.
Még mindig évek lehetünk a nyertesnek a vizuális keresési felettség elleni küzdelemben való megnyilatkozása miatt, de nyilvánvaló, hogy a győztes jelentős zsákmányokat követel.

Clark Boyd egy SEO stratégia és a Search Engine Watch munkatársa.

Szeretne maradni a legújabb keresési trendek tetején? A legfrissebb információkat és híreket a keresési szakértőktől kaphat.

Kapcsolódó olvasmány

A JavaScript a második legnagyobb hozzászóló az oldal súlya, a képek mögött, ami azt jelenti, hogy fontos szerepet játszhat a mobil webhely sebességének lelassításában. Így csökkentheti a JS-hez való függését és csökkentheti annak hatását a webhelyére.

Mary Meeker 2017-es internetes trendjelentése, a digitális világ egyik leginkább várt éves eseménye, néhány héten belül megjelent … Olvass tovább

A mobil web súlyproblémája van. Túl sok mobil webhely lassan töltődik fel, és felesleges harangokkal és sípokkal puffad, ami rossz felhasználói élményhez vezet. Ez az oszlop ismerteti, hogyan biztosítható legyen, hogy a mobil webhelyén lévő képek könnyűek, eszközre érzékenyek legyenek, és a legjobb formátumot használják a sebesség és a minőség kombinálásához.

Sokat történt a mobilalkalmazások és a mobil web közötti harc. De a kettő közötti vonal már nem olyan világos, mint a Progressive Web Apps és Android Instant Apps bevezetésével.

Ha tetszett, kérlek oszd meg barátaiddal!