Gmail-ն արհեստական բանականության նոր գործառույթ է ստացել, որն էլ ավելի անվտանգ է դարձնում այն

5 դեկտեմբերի, 2023  10:26

Gmail-ն ստացել է արհեստական բանականությամբ աշխատող սպամ ֆիլտր, ինչը, ըստ ընկերության, վերջին տարիներին անվտանգության իր ամենամեծ թարմացումն է։

Խոսքը տեքստի դասակարգման նոր համակարգը Resilient & Efficient Text Vectorizer (RETVec) փոստային ծառայությանն ինտեգրելու մասին է։ Ըստ մշակողների՝ այն արդյունավետորեն նույնացնում է սպամ հաղորդագրությունները, ներառյալ նամակները, որոնք պարունակում են մեծ թվով հատուկ նիշեր, էմոջիներ, տառասխալներ և այլ տարրեր, որոնք նախկինում տարբերելի էին մարդու համար, սակայն դրանք դժվար էր հայտնաբերում սպամի ֆիլտրը:

Ըստ առկա տվյալների՝ նոր ալգորիթմը արդյունավետ կերպով նույնացնում է, ի թիվս այլ բաների, հաղորդագրությունները, որոնք պարունակում են հոմոգլիֆներ՝ գրաֆիկական առումով իրար շատ նման, սակայն տարբեր իմաստ ունեցող սիմվոլներ։

Ըստ Google-ի՝ RETVec ալգորիթմը ուսուցանվել է արդյունավետ կերպով նույնականացնելու այն հաղորդագրությունները, որոնք պարունակում են ինչ-որ կերպ մանիպուլյացիայի ենթարկված տեքստ, ներառյալ նիշերի տեղադրումը կամ ջնջումը, տառասխալները, հոմոգլիֆները և այլն: Ալգորիթմն ուսուցանվել է՝ օգտագործելով առաջադեմ կոդավորիչ, որն ունակ է արդյունավետ կերպով կոդավորել UTF-8 ձևաչափով ցանկացած նիշ և բառ: Արդյունքում մշակողները ստացել են ալգորիթմ, որն աշխատում է աշխարհի ավելի քան 100 լեզվով:

RETVec-ը, ըստ էության, շատ առումներով աշխատում է այնպես, ինչպես մարդիկ են կարդում տեքստը: Ալգորիթմը կառուցված է TensorFlow արհեստական բանականությամբ աշխատող շրջանակի վրա և բառերի իմաստը որոշելու համար որոշվում է դրանց վիզուալ «նմանությունը», այլ ոչ թե այն նիշերը, որոնցից իրականում բառերը կազմված են:

Ըստ Google-ի՝ նախկինում օգտագործված Gmail-ի տեքստային վեկտորիզատորը RETVec-ով փոխարինելու շնորհիվ 38%-ով բարձրացրել է սպամի հայտնաբերման մակարդակը, իսկ կեղծ դրականի քանակը նվազել է 19,4%-ով։ Միևնույն ժամանակ, մոդելի կողմից օգտագործվող թենզորային մշակման միավորների (TPU) թիվը նվազել է 83%-ով, ինչը ներկայիս թարմացումը դարձնում է Gmail անվտանգության համակարգի ամենամեծ թարմացումներից մեկը վերջին տարիներին։


 
 
 
 
  • Արխիվ