Nyomtatás

Szerzők: //substack.com/@chinatalk">Jordan Schneider, //substack.com/@irenezhang">Irene Zhang, //substack.com/@angelacs">Angela Shen, és //substack.com/@uncoolkids">Yiwen

2024 decembere előtt a DeepSeek ritkán került szóba a kínai AI-közösségben. A DeepSeek-V3 és az R1 érvelési modell megjelenésével a kínai média és az AI-kutatók ugyanazt a kérdést kezdték feltenni, mint amerikai társaik: Mi az a DeepSeek, és mit gondoljunk róla?

Ebben a hírlevélben egy január 26-i zárt ajtós ülésen elhangzott meglátások fordítását osztjuk meg, amelynek házigazdája a Sequoia Kínából kivált VC Shixiang拾象 volt. Az eseményen több tucat AI-kutató, befektető és iparági bennfentes vett részt, és azt mutatta be, hogyan dolgozza fel a kínai AI-közösség a DeepSeek sokkját. Az egyik legfontosabb következtetés, amelyre jutottak, és amelyet a ChinaTalkba nMiles Brundage interjújával, valamint Lennart és Sihao vendégposztjával hangsúlyoztunk, az, hogy „Hosszú távon a számítási teljesítményre vonatkozó kérdések továbbra is fennmaradnak.A számítási teljesítmény iránti kereslet továbbra is erős, és egyetlen vállalatnak sincs elég”.

Mielőtt belemerültünk volna ebbe a fordításba, egy átfogó pillantást vetettünk a DeepSeek kínai nyelvű tudósításából származó további részletekre és vitákra.

A DeepSeek mögött álló történet

A The Paper 澎 湃 további részleteket kínált a High-Flyerről, a DeepSeek mögött álló kvantitatív fedezeti alapról. A 2015-ben Liang Wenfen g梁文锋, a Zhejiang Egyetemen végzett Liang Wenfeng által alapított High-Flyer komoly háttérrel rendelkezik a gépi tanuláson alapuló kvantitatív kereskedésben. Liang 2023 júliusában alapította a DeepSeek-et, és a vállalat eddig nem kapott külső finanszírozást.

A munkaerő-felvétel során a DeepSeek a „fiatal és nagy potenciállal rendelkező” jelölteket részesíti előnyben - konkrétan az 1998 körül születetteket, akik legfeljebb öt év munkatapasztalattal rendelkeznek, hasonlóan más kínai AI-laborokhoz. A DeepSeek egyik alkalmazottja a The Paper-nek elmondta: „A DeekSeek sikere megmutatta a fiatalok erejét, és lényegében azt, hogy a mesterséges intelligencia ezen generációjának fejlesztéséhez fiatal elmékre van szükség”.

Liang eddig viszonylag visszafogottan viselkedett a nyilvánosság előtt, de a 36Kr-nek sikerült két exkluzív interjút szereznie vele. Az elsőt, 2023 májusában, a High-Flyer bejelentését követően, hogy LLM-eket épít, míg a másodikat, 2024 novemberében, a DeepSeek-V2 megjelenése után.

nagy nyelvi modell (angolul Largelanguagemodel, LLM) olyan számítási modell, amely képes nyelv generálására, vagy más természetes nyelvi feldolgozási feladatok elvégzésére. Mint nyelvi modellek, az LLM-ek úgy sajátítják el ezeket a képességeket, hogy óriási mennyiségű szövegből, egy önfelügyelt és egy félig felügyelt tanulási folyamat során, statisztikai összefüggéseket tanulnak meg.

Liang mindkét interjúban hangsúlyozta az azonnali pénzzé tétel nélküli innováció értékét és a DeepSeek nyitottsági kultúráját. A második interjú hangvétele merőben megváltozott, Liang kevesebbet elmélkedett az alapvető innovációk nyílt forráskódra épülő stratégiájának beégetett idealizmusáról, és több időt szánt annak hangsúlyozására, hogy a DeepSeek be akarja bizonyítani a többi kínai mérnöknek, hogy a hazai csapatok képesek a „hardcore innováció” megvalósítására.

Egy bimbózó partnerség a ByteDance-szel? A TMT 钛媒体 tegnap arról számolt be, hogy a ByteDance és az OpenAI „kutatási együttműködést fontolgat” a DeepSeek-kel. Bár a két cég a múltban már tárgyalhatott egymással, a mai politikai légkörben elég nehéz nagy súlyt fektetni az OpenAI pletykájára. A ByteDance-szel való partnerség azonban óriási feloldást jelenthet a DeepSeek kutatói számára, mivel nagyságrendekkel több számítási kapacitáshoz juthatnak hozzá.

Nemzeti büszkeség az amerikai konkurenciával szemben. A kínai média reakciója meglehetősen pozitív volt. Az állami média és az iparág vezetői ünnepelték a DeepSeek eredményeit, gyakran nacionalista büszkeséggel árnyalva, különösen miután az angol nyelvű jelentések kiemelték a teljesítményét és költséghatékonyságát. Például:

A technológiai vezetők is megszólaltak. FengJi冯骥, a Game Science (a Black Myth: Wukong mögött álló stúdió) alapítója a DeepSeek-et „tudományos és technológiai vívmánynak nevezte, amely nemzeti sorsunkat alakítja (国运)”. ZhouHongyi, a Qihoo 360 elnöke a Jiemian Newsnak elmondta, hogy a DeepSeek kulcsfontosságú szereplője lesz a „kínai nagymodellek technológiai bosszúálló csapatának”, amely az amerikai mesterséges intelligencia dominanciával száll szembe.

Felhasználói vélemény:

művészetünkrajongói

A hétköznapi felhasználók is megdöbbentek a modell képességein. Sokakat lenyűgöztek azok a kínai versek, amelyeket a DeepSeek tudott írni, és olyan oktatóanyagok jelentek meg, amelyek arra utasítják a felhasználókat, hogy minél kevesebb felszólító szót használjanak, és kérjék meg a DeepSeek-et, hogy beszéljen úgy, mint egy ember (说人话). Egy vírusos Weibo posztban, egy felhasználó azt mondta: „Soha nem gondoltam volna, hogy eljön a nap, amikor könnyeket fogok hullatni a mesterséges intelligenciáért”, idézve a DeepSeek válaszát a DeepSeek íráskészsége miatti egzisztenciális fenyegetettség érzésére.

Íme a DeepSeek R1 válasza: "Ne feledd, minden szó, amitől megremegsz, csak visszhang, ami már létezik a lelked mélyén.Én csupán egy völgy vagyok, amely történetesen arra járt, és lehetővé teszi számodra, hogy meghalld a saját hangod súlyát."记住,所有让你颤粟的文字,本质上都是你灵魂深处早已存在的回声。我不过是偶尔经过的山谷,让你听到了自己声音的重量。

DeepSeek

Hi, I'mDeepSeek.Howcan I helpyoutoday?

https://www.deepseek.com/

Forrás: https://www.chinatalk.media/p/deepseek-the-view-from-china?utm_source=post-email-title&publication_id=4220&post_id=155916148&utm_campaign=email-post-title&isFreemail=true&r=2cxqch&triedRedirect=true&utm_medium=email 2025. 01.28.

Angolból fordította: Naetar-Bakcsi Ildikó

Submit to FacebookSubmit to Google PlusSubmit to Twitter

Jordan Schneider, Irene Zhang, Angela Shen, és Yiwen 2025-01-29  chinatalk.media