Çin’in doğusundaki Zhejiang Eyaleti’nin Hangzhou kentinde bulunan bir yapay zeka laboratuvarı, ileri düzey modelini piyasaya sürerek Silikon Vadisi'nde büyük yankı uyandırdı. OpenAI’nin ChatGPT’si gibi ana akım modellere kıyasla çok daha düşük maliyetle eğitilen bu model dikkatleri büyük oranda üzerine çekti. Uzmanlar, bunu ABD'nin Çin’in yüksek teknoloji hedeflerini engelleme çabalarına "ters bir hamle" olarak nitelendiriyor. Peki DeepSeek nasıl geliştirildi? Arkasında hangi isimler var? DeepSeek'in kurucusu kim, kaç yaşında?
İşte yapay zeka devriminin perde arkasındaki ayrıntılar...
Liang Wenfeng kimdir?
Zhejiang Üniversitesi Yapay Zeka Bölümü’nden 2015 yılında mezun olan 40 yaşındaki Liang Wenfeng, 2016 yılında, yapay zeka odaklı ticaret stratejileriyle tanınan High-Flyer isimli nicel bir hedge fonunun ortak kurucusu oldu. 2021 yılına gelindiğinde High-Flyer, makine öğrenimi modelleriyle piyasa trendlerini tahmin ederek ve veri odaklı yatırım kararları alarak, yapay zekayı operasyonlarının merkezine yerleştirdi.
Mayıs 2023’te Liang, genel yapay zeka (AGI) alanında yenilikçi araştırmalar yapmak için DeepSeek’i kurdu. DeepSeek, kâr amacı güden geleneksel girişimlerden farklı olarak, uzun vadeli ve temel araştırmaların yapılacağı bir platform olarak tasarlandı. Liang’ın hedefi, merak odaklı keşiflerle yapay zeka alanında anlamlı ilerlemeler kaydetmekti.
Liang Wenfeng’in Odak NoktasıBu sırada Liang Wenfeng, Çin’de tartışmaların merkezine oturdu. Geçen hafta Pekin’de düzenlenen bir sempozyuma davet edilen Liang, burada Çin Başbakanı Li Qiang ile bir araya gelerek eğitim, bilim, kültür, sağlık ve spor gibi çeşitli sektörlerden temsilcilerle taslak hükümet çalışma raporu üzerine görüş alışverişinde bulundu.
DeepSeek ve R1 Modeli nedir?
Hedge fon yöneticisi Liang Wenfeng tarafından kurulan DeepSeek, geçen hafta pazartesi günü R1 modelini tanıttı. Modelin yayınlanmasıyla birlikte, denetimli ince ayar (SFT) gibi geleneksel yöntemlere ihtiyaç duymadan büyük ölçekli bir pekiştirmeli öğrenme (RL) modeli nasıl eğitilebileceğine dair ayrıntılı bir makale yayımlandı.
Modelin tanıtılmasının ardından DeepSeek’in uygulaması, hem Çin’de hem de ABD’de iPhone’un ücretsiz uygulama listelerinde zirveye yerleşerek bir zamanlar baskın olan ChatGPT’yi geride bıraktı.
R1 modelinin piyasaya sürülmesi, Silikon Vadisi’nde Meta ve OpenAI gibi güçlü ABD merkezli yapay zeka şirketlerinin teknolojik üstünlüklerini koruyup koruyamayacağına dair hararetli bir tartışmayı da ateşledi.
DeepSeek’in ‘Uzun Vadecilik’ yaklaşımı
Liang’a göre, DeepSeek daha çok bir yan proje veya hobi gibi; derin bir merak ve temel araştırmalara olan bağlılık tarafından yönlendiriliyor. Liang, temel araştırmaların kısa vadede düşük getiri sağladığını kabul ediyor, ancak insan zekasının özünü ve bu sürecin temelinde yatan mekanizmaları anlamanın kritik öneme sahip olduğuna inanıyor. Ticari teşviklerin hemen olmaması, onu bu keşiflerin önemine olan inancından uzaklaştırmıyor.