DeepSeek toi uutta tekoälykehitykseen – Amazonin AWS mukaan

Kuluvan viikon aikana tekoälyalalla on nähnyt murros, joka on vaikuttanut monien tekoälyyn liittyvien teknologiayhtiöiden pörssiarvoon ja odotuksiin. Varsinkin kun kielimalli on koulutettu Nvidian vanhemmilla siruilla, mutta kilpailijoitaan tehokkaammin. Tänään Amazon kertoi ottavansa DeepSeekin R1-mallit AWS-palvelun valikoimiin.

Kiinalainen startup-yhtiö julkaisi runsas viikko sitten oman tekoälypalvelunsa Deepseek R1:n, joka ei ainoastaan kilpaile tunnetuimpien GPT:n, esimerkiksi OpenAI:n GPT-4:n kanssa, vaan haastaa niitä uusilla entistä tehokkaammin toimivilla lähestymistavoilla.

Tämän hetkisten tietojen mukaan Deepseek R1 on suorituskyvyltään samalla tasolla kuin OpenAI:n huipputason tekoälymalli ChatGPT o1, mutta toimii tehokkaammin eli tekoälymallin opettamiseen ja suorittamiseen ei tarvita välttämättä viimeisimpiä Nvidian tekoälylaskentapiirejä tai jättikokoisia datakeskuksia.

Deepseekin mullistavuus on siinä, että Deepseek on ainakin nykytietojen mukaan onnistunut kouluttamaan uusimman R1 mallinsa huomattavasti edullisemmin ja vähemmän energialla kuin länsimaiset kilpailijansa.

Kiinalaisen kielimallin luomisessa ei ole hyödynnetty Nvidian uusimpia tekoälysiruja, vaan Deepseek kertoo käyttäneensä koulutukseen Nvidian vanhempia H800-siruja Kiinan ja Yhdysvaltain kaupparajoitusten takia.

Deepseekin sovellus nousi nopeasti esimerkiksi Applen App Store -sovelluskaupassa Yhdysvalloissa ladatuimmaksi ilmaissovellukseksi ja ohitti kärkipaikkaa pitäneen ChatGPT-tekoälysovelluksen.

Suomessa Deepseek on neljänneksi suosituin.  Vaikka Deepseek on ohittanut latauksissa ChatGPT:n, mutta tämä ei tarkoita, että sovellus olisi kumulatiivisesti suositumpi kuin vakiintuneet kilpailijat, kuten ChatGPT:, Googlen Gemini tai Microsoftin Copilotin.

Kiinalaisyritys on julkaissut kaksi tekoälymallia, joita kutsutaan nimillä Deepseek R1 ja Deepseek V3. Deepseek R1 on tällä hetkellä tarjolla olevista malleista tehokkain, ja V3 sen edeltäjä.

Niistä DeepSeek R1 edustaa uuden sukupolven vahvistusoppimiseen perustuvaa tekoälymalliam jonka ilmoitetaan olevan vahvimmillaan erityisesti matemaattisessa päättelyssä, koodauksessa ja tieteellisessä ongelmanratkaisussa.

Deepseek hyödyntää paljon avoimen koodin teknologioita ja jakaa oman tekoälymallinsa osia pitkälle avoimena koodina. Vaikka Deepseekin mallit eivät osoittautuisi teknologisesti yhtä kehittyneiksi kuin länsimaiset kilpailijansa, niiden edullinen hinnoittelu ja avoimuus voi mahdollistaa uusien tekoälysovellusten kehittämisen nykyistä laajemmalle käyttäjäkunnalle.

Tällä hetkellä Deepseek V3 ja R1 on saatavissa verkon kautta käytettävänä maksullisena verkkopalveluna. Palvelusta on saatavissa myös rajoitettu webbiselaimen kautta toimiva ilmainen kokeiluversio, joka toimii pitkälle samaan tapaan esimerkiksi CharGPT tai Copilot kanssa.

Deepseek tekoälyn käyttö nettiselaimen tai Deepseekin rajapinnan yli nostaa kuitenkin esiin kysymyksen luottamuksesta. Koska kyseessä on kiinalainen yritys, todennäköisesti kaikki palveluun lähettämäsi data siirtyy Kiinaan, eikä ole varmuutta siitä, minne data siellä lopulta päätyy.

Verkkopalvelun lisäksi Deepseek on julkaissut V3- ja R1-mallinsa avoimena lähdekoodina, mikä antaa kehittäjille mahdollisuuden ladata sen ilmaiseksi verkosta. Lisäksi Deepseekin tekoälymalleja voi käyttää omalla tietokoneella tai palvelimella.

Kun mallin laittaa toimimaan paikallisesti ilman yhteyttä kiinalaispalvelimiin, eikä käyttäjien dataa siirry Kiinaan. Ohjelmistoalusta pyörittämiseen ei tarvita satojen tuhansien eurojen tekoälypalvelinta, vaan mallin pienen version saa toimimaan tehokkaalla kotitietokoneella.

Lisää: Deeepseek (LINKKI)

Amazonin AWS-pilveen DeepSeek-mallit

Tänään Amazon ilmoitti, että kiinalaisen AI-startupin DeepSeekin uudet R1-mallit ovat saatavilla AWS-alustalla,  mukaan lukien DeepSeek-R1-Zero (671 miljardia parametria) ja DeepSeek-R1-Distill (1,5–70 miljardia parametria) yrityksen Bedrockin ja Amazon SageMakerin kautta.  Tässä Youtube-opetusvideo (LINKKI),  miten DeepSeek R1:n käyttöönotto onnistuu AWS:n Bedrock-alustalla.

Kuvituskuva: Shutterstock