Një model i inteligjencës artificiale (AI) i prodhuar në Kinë, i quajtur DeepSeek, ka arritur në krye të shkarkimeve të Apple Store, duke mahnitur investitorët dhe duke fundosur disa aksione të teknologjisë në botë. Ai u publikua më 20 janar, duke lënë mbresa te studiuesit e AI para se të merrte vëmendjen e të gjithë industrisë së teknologjisë dhe botës.
Ajo që e bën DeepSeek kaq të veçantë është se sipas kompanisë, ai është ndërtuar me kosto të ulët krahasuar me modelet kryesore në industri, si OpenAI, pasi përdor më pak çipa të avancuar.
Çfarë është DeepSeek?
Në mënyrën më të thjeshtë, DeepSeek është një chatbot me AI, si ChatGPT.
Ky aplikacion është falas dhe shkarkohet nw celular, ku DeepSeek thotë se është krijuar “për t’iu përgjigjur pyetjeve tuaja dhe për të përmirësuar jetën tuaj në mënyrë efikase”.
Por modeli i inteligjencës artificiale që e fuqizon atë, i quajtur R1, ka rreth 670 miliardë parametra, duke e bërë atë modelin më të madh të gjuhës me burim të hapur deri më tani.
Thuhet se është po aq i fuqishëm sa modeli O1 i OpenAI, i cili fuqizon ChatGPT në matematikë, kodim dhe arsyetim.
Ashtu si shumë modele të tjera kineze të AI, Baidu’s Ernie ose Doubao nga ByteDance, DeepSeek është trajnuar për t’iu shmangur pyetjeve të ndjeshme politikisht.
Censura e qeverisë kineze mendohej të ishte një sfidë e madhe për zhvillimin e AI. Por DeepSeek duket se është trajnuar për një model me burim të hapur, i cili i mundëson atij të kryejë detyra komplekse, duke mbajtur gjithashtu informacione të caktuara.
Prodhuesit thanë se e kanë krijuar me çmim të ulët. Dhe studiuesit që qëndrojnë pas tij pretendojnë se ndërtimi i tij kushtoi 6 milionë dollarë, një buxhet i vogël në krahasim me miliardat e shpenzuara nga firmat e AI në SHBA.
Se si saktësisht e bënë këtë është ende e paqartë. Themeluesi i DeepSeek thuhet se ka krijuar një dyqan të çipave Nvidia A100, të cilët janë ndaluar të eksportohen në Kinë që nga shtatori 2022. Ekspertët besojnë se ky koleksion, të cilin disa vlerësime e vlerësojnë në 50,000, e çoi atë në ndërtimin e një modeli kaq të fuqishëm të inteligjencës artificiale, duke i bashkuar këto çipa me ato më të lira dhe më pak të sofistikuara.