Չինական սթարթափ DeepSeek-ի ստեղծած AI-չատ բոտի նկատմամբ մոլեգին հետաքրքրությունը երկուշաբթի ցնցեց բաժնետիրական շուկաները և բանավեճեր առաջացրեց ԱՄՆ-ի ու Չինաստանի միջև տնտեսական ու աշխարհքաղաքական մրցակցության մասին՝ AI (Արհեստական բանականություն) տեխնոլոգիաների զարգացման ոլորտում։ DeepSeek-ի AI-ասիստենտը երկուշաբթի դարձել է Apple-ի iPhone-ի հավելվածների խանութում ամենաշատ ներբեռնվող անվճար հավելվածը, ինչը հանգեցրել է տեխնոլոգիական ընկերությունների բաժնետոմսերի անկմանը։
Արդյո՞ք չինական մշակողների արագ առաջընթացը կարող է լրջորեն փոխել գլոբալ տեխնոլոգիական էկոհամակարգը, և ո՞րն է աժիոտաժի պատճառը։ NEWS.am Tech-ի խմբագրությունը որոշել է պարզաբանել այս հարցերը։
Չինական սթարթափը մարտահրավեր է նետում OpenAI-ին
Չինական DeepSeek սթարթափը ցնցել է արդյունաբերությունը՝ թողարկելով նոր մոդել, որը հնարավորություններով համեմատելի է OpenAI-ի վերջին մշակմանը, սակայն պահանջել է զգալիորեն ավելի քիչ ներդրումներ և օգտագործում է ավելի նվազ հզորության չիպեր։ Ստանդարտ թեստերի արդյունքներով՝ մաթեմատիկական և ծրագրավորման ունակությունների վերաբերյալ, DeepSeek-R1-ը ցույց է տվել նույն արդյունքները, ինչ OpenAI-ի o1 մոդելը, հաղորդում է VentureBeat-ը։ DeepSeek-R1-ի մշակման արժեքը գնահատվում է 6 միլիոն դոլար, ընդ որում՝ մոդելի էներգաարդյունավետության բարելավումը այն դարձնում է ավելի մատչելի տարբեր ոլորտների համար։
Մոդելը պարունակում է 670 միլիարդ պարամետր՝ դարձնելով այն ամենամեծ բաց LLM-ը (մեծ լեզվական մոդել)։ Սակայն «մասնագետների խառնուրդ» (mixture of experts) ճարտարապետությունը թույլ է տալիս օգտագործել միայն անհրաժեշտ պարամետրերը կոնկրետ հարցումը մշակելիս՝ միլիարդների փոխարեն տասնյակ միլիարդներ, ինչը նվազեցնում է հաշվողական ծախսերը։ Բացի այդ, DeepSeek-R1-ը օգտագործում է «բազմագլուխ թաքնված ուշադրություն» (multi-head latent attention) մեթոդ՝ հարցումների մշակման արդյունավետությունը բարձրացնելու համար, իսկ տեքստը բառ առ բառ կանխատեսելու փոխարեն՝ միանգամից ստեղծում է մի քանի բառ։ DeepSeek-R1-ի մեկ այլ կարևոր տարբերությունը OpenAI o1-ի նման մրցակիցների հետ կայանում է ուսուցման մեխանիզմում։ Շատ LLM-ներ օգտագործում են արտաքին «քննադատ»՝ լրացուցիչ մոդել, որը վերլուծում և շտկում է պատասխանները։ Մինչդեռ DeepSeek-R1-ում ներկառուցված է ներքին ինքնագնահատման մեխանիզմ, որն օգնում է մոդելին ընտրել լավագույն պատասխանը, գրում է Scientific American-ը։
Երկրորդ լինելը երբեմն ավելի ձեռնտու է
ԵՊՀ-ի մեքենայական ուսուցման խմբի ղեկավար և «ԵրևանԷն» հիմնադրամի տնօրեն Հրանտ Խաչատրյանը NEWS.am Tech-ի հետ
զրույցում նշել է. «Ակնկալելի էր, որ վաղ թե ուշ OpenAI GPT-ի նման բարդ մոդելները հնարավոր կլինի ստեղծել ավելի քիչ ռեսուրսներով։ Այնուամենայնիվ, տպավորիչ է, որ չինական ընկերությունները գտնում են ուղիներ հզոր մոդելներ ստեղծելու համար՝ սահմանափակ ռեսուրսներով։
Ավելի զարմանալի է այն արագությունը, որով նրանք դա անում են։ Եթե մեկ տարի առաջ բաց մոդելը, որը հնարավորություններով համեմատելի էր ամենահզոր փակ մոդելի հետ, հայտնվում էր մեկ տարի անց, ապա այժմ այդ բացը կրճատվել է մինչև 3-4 ամիս։ Օրինակ՝ չինական DeepSeek ընկերությունը ներկայացրել է R1 մոդելը, որը կարողանում է լուծել մաթեմատիկական և ծրագրավորման խնդիրներ։ OpenAI-ը նմանատիպ արտադրանք է թողարկել սեպտեմբերին, ինչը նշանակում է, որ ընդամենը 4 ամսում չինական ընկերությունը հասել է նույն արդյունքներին՝ օգտագործելով բաց կոդ և ավելի քիչ հաշվողական հզորություն»։
Չինական մշակողի հաջողությունների մասին խոսելիս նա ավելացրել է. «Առաջին անգամ նոր մակարդակի մոդել ստեղծելը չափազանց բարդ խնդիր է։ Բայց երբ արդեն կա պատրաստի արտադրանք, երբ տեսնում ես, որ OpenAI-ն այն մշակել է, ի հայտ է գալիս վստահություն, որ դա կարելի է կրկնօրինակել։ Այս առումով երկրորդը լինելը երբեմն ավելի ձեռնտու է»։
Ռեսուրսների դեֆիցիտը նորարարությունների մայրն է
DeepSeek-ի տեխնիկական հնարավորությունների շուրջ դրամայի տակ թաքնված է ԱՄՆ-ի ցանկությունը՝ չեզոքացնել Չինաստանի մրցակցային առավելությունները, հատկապես AI-ի ոլորտում, սակայն այս դեպքում Վաշինգտոնի գործողությունների արդյունքը հակառակն է տեղի ունեցել։
Հրանտ Խաչատրյանը հիշեցրել է, որ 2023 թվականին ԱՄՆ կառավարությունն արգելել է NVIDIA-ին Չինաստան առաջադեմ չիպեր արտահանել, ինչի հետևանքով ընկերությունը թողարկել է թուլացված տարբերակներ՝ հատուկ չինական շուկայի համար։ Սակայն մի քանի ամիս անց պատժամիջոցները խստացվել են՝ ամբողջությամբ արգելելով այս կատեգորիայի չիպերի մատակարարումները։ Փորձագիտի կարծիքով՝ չնայած ԱՄՆ-ի սանկցիաները, որոնք պաշտոնապես սահմանափակում են Չինաստանի հասանելիությունը հզոր հաշվողական ռեսուրսներին, գործնականում դրանք երկրում ավելի շատ են, քան թվում է։
«Շրջանցող ուղիներ կան, և ինչ-որ կերպ այդ չիպերը դեռ հասնում են Չինաստան։ Իհարկե, դրանց ծավալները չեն կարող գերազանցել OpenAI-ի ունեցածը, բայց հենց այս դեֆիցիտն է խթանում չինական ընկերություններին նորարարությունների։ Ռեսուրսների դեֆիցիտը նորարարությունների մայրն է։ Երբ չունես բոլոր անհրաժեշտ ռեսուրսները, ստիպված ես լինում որոնել ոչ ստանդարտ լուծումներ և ռիսկի դիմել։ OpenAI-ն այդպիսի անհրաժեշտություն չունի», ընդգծել է Խաչատրյանը։
Վաթհվանիի Արհեստական բանականության եւ առաջատար տեխնոլոգիաների կենտրոնի տնօրեն Գրեգորի Ալենը PBC News-ին ասաց. «Տեխնոլոգիական նորարարությունը իրական է, բայց թողարկման ժամկետները քաղաքական են: Սա փորձ էր ցույց տալու համար, որ արտահանման վերահսկումը անօգուտ է կամ հակաարդյունավետ: Հենց սա է հիմա Չինաստանի արտաքին քաղաքականության իսկապես կարեւոր նպատակը»:
Չինաստանի միակ հայտը չէ
DeepSeek-ը Չինաստանի միակ հայտը չէ. Alibaba-ն նույնպես «քնած չէ»։
«Այբ» կրթական հիմնադրամի հոգաբարձուների խորհրդի նախագահ Արամ Փախչանյանը իր Facebook-ի էջում ուշադրություն է հրավիրել ընկերության մշակման վրա. «Մինչ մենք հիանում էինք DeepSeek-ի բերած բացարձակ փոթորկով, որը ցնցել էր ԱՄՆ-ի տեղեկատվական տեխնոլոգիաների էկոհամակարգը, Alibaba-ն առանց ավելորդ աղմուկի ներկայացրել է իր Qwen AI-2.5-ի նոր, զգալիորեն բարելավված տարբերակը։ Այն եւս անվճար է։ Կարող է ոչ միայն խելացի պատասխանել հարցերին, այլև ստեղծել պատկերներ և նույնիսկ տեսահոլովակներ։ Մոդելն ունի տարբեր ենթատարբերակներ՝ տարբեր խնդիրների համար։ Հայերենի համար խորհուրդ է տրվում օգտագործել ամենահզոր տարբերակը՝ Qwen 2.5 Max։ Առայժմ այն մի փոքր դանդաղ է աշխատում, հավանաբար բարձր բեռնվածության պատճառով, բայց զարմանալիորեն խելացի է։ Առաջին հայացքից ոչնչով չի զիջում ChatGPT-ին»։
Ի՞նչ սպասել հաջորդը. արագացում
Չինական սթարթափների մրցունակության աճի և DeepSeek ու Qwen-2.5-ի նման ձեռքբերումների հետ AI-ի շուկան կարող է մի քանի էական փոփոխություններ ապրել, այդ թվում՝ մրցակցության աճ, որը կապված կլինի ոչ միայն չինական սթարթափների գործունեության, այլև ներքին մրցակցության սրման հետ։
Հրանտ Խաչատրյանը չի բացառում, որ այժմ շատ ընկերություններ կարող են հետևել Չինաստանի օրինակին. «Վերջերս լսեցի մի ամերիկյան ընկերության ղեկավարի հարցազրույցը, որը զբաղվում է AI-ով աշխատող որոնողական համակարգի մշակմամբ։ Նա ասում էր, որ սկզբում նրանք չէին պատրաստվում մրցակցել OpenAI-ի հետ, այլ նախատեսում էին օգտագործել նրա տեխնոլոգիաները։ Բայց այժմ, երբ բոլորը տեսել են, թե ինչի կարելի է հասնել փոքր ռեսուրսներով, ընկերությունը մտածում է սեփական մոդել ստեղծելու մասին»։
Բացի այդ, չինական սթարթափների հաջողության ֆոնին ծավալվող մրցավազքը կարող է հանգեցնել էական տեխնոլոգիական արագացման։ Չինական սթարթափները, չնայած սահմանափակ ռեսուրսներին, ցուցաբերել են հզոր AI մոդելներ արագ մշակելու ունակություն։ Այս տեխնոլոգիական իմպուլսը կարող է արագացնել նորարարությունները AI ոլորտում, ինչը կազդի բոլոր խոշոր ընկերությունների վրա և կարագացնի նոր լուծումների ներդրումը։