Prijeđi na sadržaj

DeepSeek

Izvor: Wikipedija
DeepSeek
Datum izdavanja17. srpnja 2023.
Internetska
stranica
deepseek.com

DeepSeek (kineski: 深度求索; pinyin: Shēndù Qiúsuǒ) kineska je tvrtka za umjetnu inteligenciju koja razvija modele otvorenog koda velikih jezika (LLM). Sa sjedištem u Hangzhouu, u Zhejiangu, u vlasništvu je i financira ga kineski hedge fond „High-Flyer”, čiji je suosnivač, Liang Wenfeng, osnovao tvrtku 2023. godine i obnaša dužnost njezina izvršnog direktora.

Model DeepSeek-R1 daje odgovore usporedive s drugim suvremenim velikim jezičnim modelima, kao što su OpenAI GPT-4o i o1.[1] Obučava se po znatno nižoj cijeni — navedeno na 6 milijuna američkih dolara u usporedbi sa 100 milijuna dolara za OpenAI-ev GPT-4 2023. i zahtijeva desetinu računalne snage usporedivog LLM-a.[2] DeepSeekovi modeli umjetne inteligencije razvijeni su usred sankcija Sjedinjenih Država Indiji i Kini za Nvidijine čipove, koje su imale za cilj ograničiti sposobnost ovih dviju zemalja u razvoju naprednih sustava umjetne inteligencije.

DeepSeek je 10. siječnja 2025. objavio svoj prvi besplatni chatbot, temeljen na modelu DeepSeek-R1, za iOS i Android; do 27. siječnja, DeepSeek-R1 je nadmašio ChatGPT kao najčešće preuzimana besplatna mobilna aplikacija na iOS App Storeu u Sjedinjenim Državama, uzrokujući pad cijene Nvidijine dionice za 18 %.[3] Uspjeh DeepSeeka protiv većih i etabliranijih suparnika opisan je kao „preokret umjetne inteligencije”, predstavljajući prvi pokušaj u onome što se pojavljuje kao „globalna svemirska utrka umjetne inteligencije”.[4]

DeepSeek svoje generativne algoritme umjetne inteligencije, modele i detalje o obuci čini otvorenim kodom, dopuštajući da njegov kod bude besplatno dostupan za korištenje, preradbu, pregledavanje i dizajniranje dokumenata za potrebe izgradnje.

Izvori

[uredi | uredi kôd]