Kush është “babai” i DeepSeek që tronditi SHBA: “Ai dukej si një qullash, nuk e morëm seriozisht”

Në vitin 2021, një sipërmarrës pak i njohur kinez, Liang Wenfeng, filloi të blinte mijëra karta grafike Nvidia për projektin e tij tejet eksperimental të inteligjencës artificiale.

“Kur e takuam për herë të parë, ai ishte një djalë shumë nervoz me një model të tmerrshëm flokësh, i cili foli për ndërtimin e një sistemi kompjuterik me 10 mijë çipa për të trajnuar modelet e tij. Nuk e morëm seriozisht”, thotë një nga partnerët e tij të biznesit.

“Ai nuk mund ta shpjegonte qartë vizionin e tij përveçse të thoshte, ‘Unë dua ta ndërtoj këtë dhe do të jetë revolucionare’. Menduam se ishte diçka që mund të arrihej vetëm nga gjigantë si ByteDance dhe Alibaba”, shton i njëjti person, cituar nga Financial Times.

Katër vjet më vonë Liang është kthyer në një krenari për Kinën, liliputi i cili me forcën e ideve të tij i bëri gjigantët amerikanë të inteligjencës artificiale të dridhen.

Kjo, duke marrë rezultate të ngjashme apo edhe më të mira se ato të OpenAI, Google, Meta apo Anthropic.

Të gjitha këto me shpenzime minimale në krahasim me gjigantët e hiperfinancuar, të ngritura në SHBA.

DeepSeek shkaktoi një tërmet në Silicon Valley dhe një tjetër në Wall Street, ku aksionet e Nvidia-s dhe kompanive të tjera të lidhura me AI regjistruan “një të hënë të zezë” të vërtetë për sektorin.

Disa ditë më parë, Liang ishte i vetmi drejtues i AI i zgjedhur për të marrë pjesë në një takim sipërmarrësish me kryeministrin kinez Li Qiang.

Sipërmarrësve iu tha që të “përqendronin përpjekjet për të bërë hapa përpara në teknologjitë kryesore”.

Studimet dhe kompania e parë

Liang është një i huaj në botën e AI, por ai nuk vjen me një CV të improvizuar.

Sot është 40 vjeç, ka lindur në një qytet të vogël në Guangdong, djali i një mësuesi të shkollës fillore.

Liang ka treguar gjithmonë – sipas informacionit të kufizuar biografik të disponueshëm për të – një kuriozitet të pashuar për teknologjinë.

Pasi u diplomua në inteligjencën artificiale në Universitetin Zhejiang, ai zhvilloi përvojë në vizionin kompjuterik dhe Big Data dhe më pas filloi udhëtimin e tij në botën e financave.

Në vitin 2015, ai themeloi Huanfang Quantitative (High-Flyer), një hedge fund (një fond investimesh offshore – ed.) e cila përqafoi herët AI, duke integruar mësimin e makinerive në strategjitë tregtare.

Tashmë në vitin 2017, AI ishte bërë gurthemeli i vendimeve të saj për investime.

Suksesi, megjithatë, nuk erdhi pa vështirësi: fondi ka përjetuar periudha rëniesh të mprehta, të lidhura me paqëndrueshmërinë e natyrshme të tregjeve financiare.

Liang dhe ekipi i tij i kanë përdorur këto kriza për të përmirësuar vazhdimisht modelet e tyre të AI.

Ekipi i tij, në veçanti, ka fituar ekspertizë të thellë në përdorimin e çipave Nvidia.

Por ambicia e tij e vërtetë ishte më e madhe: të krijonte një AI të aftë për të rivalizuar me më të mirët në botë.

Intuita

DeepSeek kishte një qëllim të qartë: të zhvillonte inteligjencën artificiale që nuk ishte vetëm konkurruese, por edhe e aksesueshme.

“Qëllimi ynë nuk është thjesht të ndërtojmë një model”, tha ai në një intervistë. “Ne duam të ripërcaktojmë rregullat e inovacionit”.

Fjalë ambicioze, të zakonshme për shumë sipërmarrës në botën e startup-eve.

Në rastin e tij, megjithatë, vizioni u realizua në vitin 2024, me lançimin e DeepSeek-V2, një model me open source që tërhoqi menjëherë vëmendjen e profesionistëve, të cilët janë gjithmonë shumë të hapur ndaj modeleve efikase dhe të lira.

“Ne nuk prisnim një reagim kaq të fortë”, pranoi Liang. “Ne thjesht ndoqëm rrugën tonë, duke optimizuar kostot dhe duke vendosur çmime të drejta. Nuk kishim ndërmend të fillonim një luftë çmimesh, por u gjendëm në qendër të saj”.

Çështja e kostos është shumë e rëndësishme në ngritjen e DeepSeek: Emad Mostaque, themeluesi i Stability AI, një nga kompanitë më të njohura në këtë fushë, e krahasoi zbulimin e DeepSeek-ut me “një iPhone që kushton vetëm 30 dollarë në vend të 1 mijë dollarë”.

Ulja e kostos është afërsisht 96 për qind krahasuar me teknologjitë e tjera të AI në SHBA.

Vendimi për të bërë DeepSeek-V2 me open source gjithashtu shkaktoi reagime të përziera. Liang e ka mbrojtur gjithmonë këtë zgjedhje.

“Inovacioni nuk mbrohet me fshehtësi, por me shpejtësi dhe aftësi për t’u përshtatur”, tha ai. “Edhe OpenAI nuk mund t’i ndalojë të tjerët të arrijnë hapin”.

Më pas ardhja e DeepSeek R1, një model me aftësi të avancuara arsyetimi, si o1 i OpenAI, kompletoi kornizën dhe vendosi chatbot-in e tij në qendër të skenës botërore, pavarësisht akuzave për censurë mbi tema të padëshiruara për Pekin-in dhe për një trajtim jo shumë rigoroz të privatësisë.

Një filozofi e inovacionit

Ajo që e dallon Liang nga sipërmarrësit e tjerë në industri është qasja e tij ndaj inovacionit.

Në zemër të fjalëve të tij është një ndryshim strukturor në mënyrën se si Kina merr pjesë në evolucionin e AI.

“Ne e kemi parë gjithmonë AI si diçka që vjen nga Perëndimi”, tha ai. “Por pse duhet të jemi vetëm përdorues dhe jo protagonistë?”, shtoi ai.

DeepSeek nuk është një kompani e fokusuar në aplikacione të menjëhershme tregtare, por më tepër (të paktën për momentin) në kërkime të dëlira.

“Shumica e kompanive kineze kopjojnë dhe përshtaten, ne duam të krijojmë. Për një kohë të gjatë, inovacioni është parë si një luks. Por sot Kina ka burimet për të investuar në kërkimin bazë”.

Kjo qasje reflektohet edhe në filozofinë e tij të rekrutimit.

DeepSeek ka ndërtuar një ekip tërësisht të përbërë nga talente kineze, duke sfiduar paragjykimin se ekspertët më të mirë të AI janë të gjithë jashtë vendit.

“Nëse jeni duke kërkuar për rezultate të menjëhershme, punësoni njerëz me përvojë”, tha ai. “Por nëse doni të ndryshoni botën, ju kërkoni kuriozitetin dhe pasionin”.

Corriere della Sera