Gemma 2, Gemini 1.5 Flash և Pro, պատկերի հզոր գեներատոր. ԱԲ ի՞նչ պրոդուկտներ են ցուցադրվել Google I/O 2024-ի ժամանակ

15 մայիսի, 2024  12:03

Google ընկերությունը ծրագրավորողների իր ամենամյա համաժողովի՝ Google I/O 2024-ի ժամանակ հայտարարել է մի շարք հետաքրքիր նոր պոդուկտների և թարմացումների մասին՝ սկսած արհեստական բանականությունից (ԱԲ) և մեքենայական ուսուցման նախաձեռնություններից մինչև նոր TPU պրոցեսորներ:

NEWS.am Tech-ն ի մի է բերել Google-ի ներկայացրած ԱԲ բոլոր ամենահետաքրքիր արտադրանքները։

Gemini-ի թարմացում

Ամենահետաքրքիր նոր արտադրանքներից մեկը Gemma 2 բաց կոդով ԱԲ մոդելն է, որը ներառում է 27 մլրդ պարամետր: Դրա գործարկումը սպասվում է այս տարվա հունիսին։

Քսանյոթ միլիարդ պարամետրը զգալի բարելավում է այս տարվա սկզբին թողարկված Gemma 2B և Gemma 7B տարբերակների համեմատ, որոնք ունեն համապատասխանաբար 2 մլրդ և 7 մլրդ պարամետր: Ըստ Google Labs-ի փոխնախագահ Ջոշ Վուդվորդի՝ կոմպակտ չափերով Gemma 2-ը կառաջարկի ոլորտի համար առաջատար կատարողականություն՝ շնորհիվ հաջորդ սերնդի Nvidia GPU-ներով կամ Vertex AI-ում մեկ Google Cloud TPU հոսթով աշխատանքի օպտիմիզացիայի։

Gemini ԱԲ մոդելների շարքն ընդլայնվել է նաև նոր Gemini 1.5 Flash մոդելով, որը կողմնորոշված է բարձր արագություն պահանջող առաջադրանքների վրա. մոդելը կարող է տվյալները մշակել գրեթե կայծակնային արագությամբ՝ առանց ուշացումների: Նեյրոցանցը կարող է մեծ արագությամբ մշակել տեքստ, պատկերներ և տեսանյութեր և հարմար է այն հավելվածների համար, որոնք պահանջում են ակնթարթային պատասխաններ իրական ժամանակում: Այն կարող է օգտագործվել, օրինակ, օգտատերերի կամ հաճախորդների հետ շփվելու կամ ակնթարթորեն պարզ պատկերներ ստեղծելու համար:

Իսկ այն առաջադրանքների համար, որոնք շատ արագ պատասխաններ չեն պահանջում, ավելի հարմար է կատարելագործված Gemini 1.5 Pro մոդելը, որը կարող է վերլուծել մեծ ծավալի տեքստ, կատարել ընդհանրացումներ և թարգմանություններ: Ինչպես հայտնում է The Verge-ը, երկու մոդելներն էլ օգտագործում են 1 մլն թոքենից բաղկացած համատեքստային պատուհան, ինչը թույլ է տալիս ավելի շատ տեղեկություն հաշվի առնել պատասխաններ ստեղծելիս։ Համեմատության համար նշենք, որ GPT-4 համատեքստային պատուհանը կազմում է 128,000 թոքեն:

Imagen 3 և ԱԲ այլ գործիքներ

Մեկ այլ հետաքրքիր հայտարարություն վերաբերում է Imagen ընտանիքի գեներատիվ նեյրոցանցի նոր տարբերակին։ Նոր Imagen 3-ը, որը համարվում է Google-ի պատկերների ամենաառաջադեմ գեներատորը, ավելի ճշգրիտ է հասկանում տեքստային հարցումները, ստեղծում է ավելի մանրամասն պատկերներ, թույլ է տալիս ավելի քիչ սխալներ և, ըստ Google-ի ԱԲ հետազոտությունների ​​բաժնի՝ Deep Mind-ի ղեկավար Դեմիս Հասաբիսի, ստեղծում է ավելի քիչ «շեղող արտեֆակտներ»:

Imagen 3-ը կարող է օգտագործվել դիփֆեյքերի ստեղծումը կանխելու համար․ պատկերների ստեղծման գործընթացում կիրառվում է SynthID տեխնոլոգիան, որն անտեսանելի ծածկագրային ջրանիշներ է ստեղծում մեդիա ֆայլերի վրա:

Մեկ այլ հետաքրքիր նորամուծություն է Veo ԱԲ մոդելը, որով կարելի է մոտ մեկ րոպե տևողությամբ 1080p կետայնությամբ տեսահոլովակներ ստեղծել՝ հիմնվելով տեքստային նկարագրության վրա։ Հնարավոր է օգտագործել տեսողական և կինեմատոգրաֆիկ տարբեր ոճեր և խմբագրել ստեղծված կադրերը։

Gemini-ի ինտեգրումը Google-ի ծառայություններում

Google-ը նախատեսում է իր որոնողական համակարգում ավելացնել ԱԲ-ի ավելի շատ հնարավորություններ: Մասնավորապես, որոշ որոնման արդյունքներ կունենան ամբողջությամբ ԱԲ-ի կողմից ստեղծված պատասխաններ: Իսկ Ask This Video գործառույթը օգտատերերին հնարավորություն կտա օգտագործել Gemini-ն YouTube-ի տեսանյութում կոնկրետ տեղեկություն որոնելու համար։

Gemini-ն նաև կինտեգրվի Gmail-ում՝ օգտատերերին հնարավորություն տալով որոնել, ամփոփել և գրել նամակներ: Ակնկալվում է, որ ԱԲ-ն կկարողանա կատարել էլ ավելի բարդ առաջադրանքներ, օրինակ՝ առցանց խանութում ապրանքների վերադարձի մշակումը:

Android 15-ում կհայտնվի Gemini Live-ը, որն օգտատերերին հնարավորություն կտա լիարժեք ձայնային խոսակցություններ ունենալ ԱԲ օգնականի հետ, որը կարող է տեսնել և արձագանքել օգտատիրոջ շրջապատին սմարթֆոնի տեսախցիկի միջոցով:

Gemini Nano-ն՝ Google-ի ԱԲ ամենակոմպակտ մոդելը, կներկառուցվի անմիջապես Chrome-ի աշխատասեղանի տարբերակում՝ սկսած 126-րդ տարբերակից և ծրագրավորողներին հնարավորություն կտա օգտագործել սարքի ԱԲ մոդելը՝ ստեղծելու իրենց սեփական գործառույթները։

Google Maps-ում մշակողները կկարողանան օգտագործել Gemini-ի հնարավորությունները՝ ստեղծելու վայրերի և տարածքների ԱԲ նկարագրություններ՝ հիմնվելով Google Maps-ի տվյալների վրա:


 
 
 
 
  • Արխիվ