Amennyiben bejönnek a számítások, a korábbiaknál 38 százalékkal hatékonyabban szűrheti ki a Google levelezője a kéretlen tartalmakat, amiből lássuk be, egyre több van manapság.
A spamek mappája a legtöbb embernél sosem volt üres, de az utóbbi esztendőkben egyre inkább megszaporodtak a kéretlen levelek. Ezekkel a legnagyobb baj, hogy nem kizárólag azok kerülnek oda, amiket mi spamnek bélyegeztünk meg és nem is csak a reklámszemét megy erre a területre, sajnos rengeteg csalás és adathalász kísérletbe futhatunk bele naponta.
Erre pedig a Google is igyekezett reagálni, ezért a 9To5Google cikke szerint még erősebbé teszik a védelmet a Gmail vadonatúj technikája, az RETVec révén. A név hivatalosan a Resilient & Efficient Text Vectorizer, tehát magyarra fordítva a Rugalmas és hatékony szövegvektorizátor rövidítése. Egy olyan programról van szó, amit a cég az elmúlt évben széles körűen tesztelt, most pedig ez a nyílt forráskódúvá tett megközelítés segít a modelleknek a legmodernebb osztályozási teljesítményt elérni.
Mivel minden nyelvet és minden UTF-8 karaktert támogat a szöveg előfeldolgozása nélkül, így a weben és más nagy méretű felhasználási esetekben egyaránt zökkenőmentesen használható. Az eredmények alapján a jobb szövegazonosításnak köszönhetően a Gmail esetében 38 százalékkal javult a spam-felismerési arányt az alapszinthez képest a Gmailben.
Mindez azért lényeges, mert a spamet küldők gyakran használnak homoglifákat (valódi betűkhöz hasonló karaktereket), láthatatlan karaktereket, kulcsszótömést és más ellenséges szövegmanipulációkat, hogy ezzel is képesek legyenek megkerülni a Gmail szövegosztályozó modelljeit, amelyek azonosítják a káros tartalmakat.