Az R1 és o1 modell a gyakorlatban nagyon hasonlítanak egymásra: lépésről lépésre, az emberi gondolkodás analógiái szerint működve generálják a válaszokat. Vagyis jóval hosszabb ideig koncentrálnak egy-egy feladatra és műveletre, mint például a sima ChatGPT-4o modell.

A Nature folyóirat arról ír, hogy a DeepSeek-R1 első tesztjei január 20-án azt mutatták, hogy bizonyos kémiai, matematikai és kódolása feladatokban megegyező színvonalú munkát végez, mint a tavaly szeptemberben megjelent OpenAI-o1 modell.

A kínai mélygondolkodású AI-modell ugyanakkor a szaklap írása szerint egy másik okból is kiemelkedő: a modellt létrehozó startup ugyanis egyfajta 'nyílt súlyú' találmánynak szánta az R1-et, ami azt jelenti, hogy a kutatók annak algoritmusát szabadon tanulmányozhatják és továbbfejleszthetik. Ugyanakkor az MIT licenc alá tartozó modell nem teljesen nyílt forráskódú, mivel annak képzési adataihoz nem lehet hozzáférni.

Ettől függetlenül Mario Krenn, a németországi Erlangenben található Max Planck Intézet mesterséges intelligencia laboratóriumának vezetője szerint így is bőven figyelemre méltó a DeepSeek nyitottsága, mivel az OpenAI modelljei ehhez képest tulajdonképpen egyfajta fekete dobozok.

A DeepSeek csak a kezdet, félelmetes AI-t dobott piacra az Alibaba

A kínai vállalat ígérete szerint a Qwen 2.5-Max felül fogja múlni a mesterséges intelligencia piacát felforgató DeepSeek R1 modelljét.
Ha többre kíváncsi, itt olvashat tovább.