Apple-ը թողարկել է սեփական նեյրոցանցը, որն աշխատում է տեքստի և պատկերների հետ

26 դեկտեմբերի, 2023  20:17

Apple-ը, Կոռնելի համալսարանի գիտնականների աջակցությամբ, առանց ավելորդ աղմուկի, հասանելի է դարձրել իր սեփական մուլտիմոդալ լեզվական մեծ մոդելը՝ Ferret-ը, որը որպես հարցում կարող է ընդունել նաև լուսանկարների հատվածները։

Ուշագրավ է, որ ընկերությունն այս նեյրոցանցը հասանելի է դարձրել դեռևս հոկտեմբերին․ Ferret-ի թողարկումը GitHub-ում հոկտեմբերին չի ուղեկցվել հայտարարություններով, ինչպես որպես կանոն Apple-ն անում է, սակայն նախագիծը հետագայում ներգրավեց ոլորտի փորձագետների մասնակցությունը:

Ferret-ի գործառնական սկզբունքն այն է, որ մոդելն ուսումնասիրում է պատկերի որոշակի հատվածը, նույնականացնում է այս տարածքում գտնվող օբյեկտները և դրանք ուրվագծում շրջանակով:

Համակարգը պատկերի հատվածում ճանաչված օբյեկտներն ընկալում է որպես հարցման մաս, որի պատասխանը տրվում է տեքստային ձևաչափով: Օրինակ՝ օգտատերը կարող է նկարում ընդգծել կենդանուն և խնդրել Ferret-ը ճանաչի այն: Մոդելը կպատասխանի, թե որ տեսակին է պատկանում կենդանին, և հնարավոր կլինի լրացուցիչ հարցեր տալ համատեքստում՝ պարզաբանելով այլ առարկաների կամ գործողությունների մասին տեղեկությունները։

Ferret-ի բաց մոդելը համակարգ է, որը կարող է «հղում անել և հիմնավորել ցանկացած բան, ցանկացած վայրում, ցանկացած մանրամասնությամբ», բացատրել է Apple-ի արհեստական բանականության հարցերով զբաղվող բաժնի հետազոտող Չժե Գանը:

Ոլորտի փորձագետները նշում են նախագծի այս ձևաչափով թողարկման կարևորությունը. դա ցույց է տալիս, որ ավանդաբար փակ ընկերությունն այժմ այլ կերպ է իրեն դրսևորում: Վարկածներից մեկի համաձայն՝ Apple-ը որոշել է գնալ այս քայլին, քանի որ ձգտում է մրցակցել Microsoft-ի և Google-ի հետ, սակայն չունի դրանց հետ համեմատելի հաշվողական ռեսուրսներ։ Այդ պատճառով ընկերությունը չէր կարող հույս դնել ChatGPT-ին սեփական մրցակիցը թողարկելու վրա և ստիպված էր ընտրություն կատարել ամպային ծառայություններ մատուցող խոշոր ընկերության հետ համագործակցելու և նախագիծը բաց ձևաչափով թողարկելու միջև, ինչպես նախկինում արել էր Meta-ն:


 
 
 
 
  • Արխիվ