Հայաստանում մշակվում է լեզվական մեծ մոդել, որը կհասկանա ավելի քան 100 լեզու, այդ թվում՝ խոսակցական հայերեն

21 մայիսի, 2024  15:09

Հայաստանում մշակվում է լեզվական մեծ մոդել (LLM), որը կհասկանա ավելի քան 100 լեզու, այդ թվում, իհարկե, հայերեն։ Միաժամանակ մոդելը կհասկանա ոչ միայն գրավոր հայերեն, այլև բանավոր խոսքը։ Այս մասին NEWS.am Tech-ի հետ զրույցում ասաց UCRAFT-ի և HOORY-ի հիմնադիր Գևորգ Բալյանը։

HOORY-ի արհեստական բանականությամբ գործող հարթակը, որը նույնպես ստեղծել են հայ մասնագետները, հիանալի հասկանում է գրավոր հայերենը, նույնիսկ այն դեպքում, երբ այն գրված է լատինատառ տառադարձությամբ (բայց դեռ ոչ կիրիլիցա): Ճիշտ է, դրան հասնելու համար մասնագետները ստիպված են եղել շատ ջանքեր գործադրել. հիմնական խնդիրը եղել է ոչ թե լատինատառ այբուբենի տառադարձումը, այլ մոդելին սովորեցնելը, որպեսզի հնարավորինս արագ հասկանա, որ տեքստը կոնկրետ հայերեն է գրված, քանի որ լատինատառ գրված շատ բառեր կարող են նմանվել այլ լեզուների բառերին։ Այս պահին, ինչպես նշում է մասնագետը, Hoory-ն մոտ 99% դեպքերում ճիշտ է նույնացնում լատինատառով գրված լեզուն։

HOORY-ի վրա հիմնված չատբոտերն այժմ ակտիվորեն օգտագործվում են որպես ԱԲ օգնականներ մի շարք խաղերի, տեխնոլոգիական ընկերությունների, բանկերի, ստարտափների կայքերում։ Նոր մոդելը կլինի առանձին ծառայություն, որը տարբեր ընկերություններ կկարողանան ինտեգրել իրենց արտադրանքին։ Նաև այս մոդելը, ինչպես նշեց Գևորգ Բալյանը, կարելի է օգտագործել HOORY հարթակում։

Խոսակցական հայերենի ճանաչման մոդելը վարժեցնելու նպատակով Fastbank-ի թիմը հավաքել և պատրաստել է բարձրորակ տվյալների բազա, այդ թվում՝ 10,000 ժամ ձայնագրություն, որում խոսում են տեղացի հայեր։ Այս տվյալների օգնությամբ, ինչպես նշեց Գևորգ Բալյանը, հնարավոր կլինի լուծել խոսքից տեքստ ստանալու խնդիրը և մոդելին վարժեցնել լսված բառերը գրավոր տեքստի վերածելուն։

Մանրամասները դիտեք տեսանյութում։

 


 
  • Ամենաընթերցվածը

ամիս

շաբաթ

օր

 
 
 
 
  • Արխիվ