Hariçten Gazel Haftalık Dış Haberler Bülteni (21-27 Ocak 2025)
Geçtiğimiz hafta Çinli yapay zeka laboratuvarı DeepSeek, kendi adını taşıyan büyük dil modelinin (Large Language Model) R1 kodlu yeni versiyonunu tanıttı ve tüm dünyada yankı uyandıracak gelişmelere sebep oldu. Bu nedenle Hariçten Gazel’in bu sayısında, siyasi gelişmelere biraz ara verip yapay zeka alanındaki son gelişmelere odaklanacağım.
Nitekim, OpenAI ve Google gibi önemli yapay zeka şirketlerinin modellerine eğitim verileri sağlayan ScaleAI firmasının CEO’su Alexandr Wang, geçtiğimiz Perşembe günü İsviçre’nin Davos kentinde düzenlenen Dünya Ekonomik Forumu’nda yaptığı konuşmada DeepSeek’in yeni modelini “dünyayı sarsacak bir model” olarak nitelendirmişti. Ki öyle de oldu.
ABD ve Çin arasında yapay zeka alanında süren savaşta Çin’in tüm yasaklara ve engellemelere rağmen ChatGPT’den daha ucuza mal edilen ve bazı açılardan daha kabiliyetli olduğu düşünülen bir yapay zeka modeli geliştirmesi, ABD’li yapay zeka şirketlerini, mevcut durumlarını sorgulamaya ve inovasyon yapmaya zorlayacak gibi görünüyor.
DeepSeek-R1 büyük dil modelinin (LLM), daha az sayıda çip ve maliyetle ChatGPT’nin son modeli olan o1 seviyesinde performans göstermesi, yapay zeka çipleriyle ünlü Nvidia hisse senetlerinde büyük düşüşe neden oldu.
Elbette bu düşüş tüm sektörü sardı. Pazartesi günü Nasdaq 100 vadeli işlemleri yüzde 3,4; S&P 500 borsası da sabah 5.00 itibarıyla yüzde 2 düşüş yaşadı. Avrupa teknoloji hisseleri de düşüşten nasibi aldı. Hollandalı çip makinesi üreticisi ASML’nin hisseleri yüzde 11 değer kaybetti. Bloomberg’in haberine göre, Nasdaq 100 ve Avrupa’nın Stoxx 600 teknoloji alt endeksi, kayıplar sürerse 1 trilyon dolar civarında değer kaybına uğrayabilir.
DeepSeek-R1’in piyasalarda bomba etkisi yaratmasının temel sebebi ise çok daha az çiple çalışması. ChatGPT’nin eğitim verilerini işlemek için 10.000 Nvidia grafik işlem birimine (GPU) ihtiyaç duyduğu düşünülürken DeepSeek mühendisleri sadece 2.000 GPU ile yakın performansta sonuçlara ulaştıklarını iddia ediyor. Öte yandan DeepSeek-R1’in çok daha kısa zamanda ve az maliyetle inşa edildiği de söylentiler arasında.
Çin’in Hangzhou şehrinde bulunan DeepSeek şirketi, Temmuz 2023’te Zhejiang Üniversitesi mezunu, elektronik mühendisi Liang Wenfeng tarafından kuruldu. DeepSeek’in finansman modeli, dış yatırımcıların baskısı olmadan iddialı yapay zeka projeleri yapmasını ve uzun vadeli araştırma ve geliştirmeye odaklanmasını sağlıyor. DeepSeek ekibi, Çin’in en iyi üniversitelerinden mezun genç ve yetenekli çalışanlardan oluşuyor. Şirketin işe alım sürecinde iş deneyiminden çok teknik becerilere öncelik veriliyor. Tüm bu nedenlerle şirketin yapay zeka modelleri geliştirme konusunda kendine özgü yeni bir bakış açısına sahip olduğu anlaşılıyor.
DeepSeek piyasaya Kasım 2023 yılında kodlama görevleri için tasarlanmış açık kaynaklı bir model olan DeepSeek Coder ile çıktı. Bu modelin ardından, diğer büyük dil modelleriyle rekabet etmeyi amaçlayan DeepSeek LLM geliştirildi. Mayıs 2024’te piyasaya sürülen DeepSeek-V2, güçlü performansına karşın düşük maliyetli olması nedeniyle ilgi çekti. DeepSeek bu sayede Çin piyasasındaki diğer yapay zeka şirketlerinin (ByteDance, Tencent, Baidu ve Alibaba) modellerinin fiyatlarını indirmek zorunda bıraktı ve piyasayı ucuzlattı.
DeepSeek-V2 ise daha sonra yerini, daha gelişmiş bir dil modeli olan DeepSeek-Coder-V2’ye bıraktı. Şirket en son modelleri DeepSeek-V3 ve DeepSeek-R1 ile tüm dünyada yapay zeka alanındaki yerini daha da sağlamlaştırdı. DeepSeek-R1, akıl yürütme, kodlama ve matematik gibi karmaşık görevlere odaklanabiliyor. Bu alandaki yetenekleriyle ChatGPT’nin son modellerinden biri olan o1’e meydan okuyor.
Tüm bunların yanı sıra DeepSeek-R1 son kullanıcıya ücretsiz olarak ve açık kaynak kodlu olarak sunuldu. Kısa sürede tüm dünyada adını duyurması ve ücretsiz olması nedeniyle DeepSeek’in mobil uygulaması da Pazartesi günü ChatGPT’yi geride bırakarak ABD Apple App Store’da en yüksek puanlı ücretsiz uygulama oldu.
Kısa sürede elde edilen bu başarı ne kadar sürdürülebilir bilinmez. Nitekim Forbes’ta yer alan bir analiz, DeepSeek şirketinin öncelikli olarak araştırmaya odaklandığını ve yakın gelecekte ticarileştirmeye yönelik detaylı planlara sahip olmadığını öne sürdü. Yine de DeepSeek şimdiden, başta ChatGPT olmak üzere Google ve META gibi dev şirketlere meydan okudu ve yarışı bir öte seviyeye taşıdı.
Asıl merak edilen ise ABD’nin; Nvdia çipleri, ASML’nin litografi makineleri ve diğer birçok çip ve çip malzemesinin Çin’e ihracatını yasaklamasına rağmen DeepSeek’in R1 modelini nasıl üretebildiği. Bu konuda çeşitli iddialar mevcut. DeepSeek çalışanı ve ABD’de doktora öğrencisi olan Zihan Wang, Çin’in yaptırımlara karşı yenilikçi yollara başvurmak zorunda kaldığını söylüyor.
Bu yeniliklerden biri DeepSeek şirketinin R1 modelini oluşturmak için eğitim sürecini yeniden düzenlemesi. DeepSeek’in en gelişmiş çipleri, Nvidia’nın Çin pazarı için satmaya izinli olduğu çiplerin performansından iki kat hızlı çalışıyor. DeepSeek’in bunu, Nvidia’dan satın aldığı grafik işlem birimleri (GPU) üzerindeki yükü azaltmak için eğitim sürecini yeniden düzenleyerek başardığı düşünülüyor.
DeepSeek’in başarısı konusunda bu yazının genel çerçevesi için fazla teknik kalacak başka başlıklar da bulunuyor. Ancak şunu belirtmek gerekir ki yapay zeka topluluğundan birçok isim, DeepSeek-R1’in OpenAI’ın son sürümü o1’e birçok önemli kriter açısından eşit olduğunu, hatta bazı ölçümlerde ondan da iyi olduğunu ve tüm bunları daha düşük bir maliyetle yaptığını söylüyor
DeepSeek-R1’in başarıyla piyasaya sürülmesi ve sansasyon yaratmasının ardından Çinli yapay zeka modeli dün çok geniş çaplı bir siber saldırıya uğradı. DeepSeek saldırıdan sonra Çin dışından olan kullanıcıların erişimini kısıtlamak zorunda kaldı.
Görevi yeni devralan ABD Başkanı Donald Trump, Çin ile ABD arasındaki yapay zeka mücadelesini oldukça önemsiyor. Göreve geldiği ilk hafta, ABD’nin yapay zeka altyapısına milyarlarca dolar yatırım yapmak için yapay zeka firması OpenAI, yazılım firması Oracle ve Tokyo merkezli SoftBank firmasının ortak bir girişim ile gerçekleştireceği 500 milyar dolarlık Stargate projesini duyurmuştu.
Proje, ABD’de yapay zeka alanında güçlü bir bilgi işlem altyapısı oluşturmayı hedefliyor. İlk etapta Teksas’ta kurulacak 10 veri merkeziyle başlayacak bu büyük girişim, zamanla yeni yatırımlar alarak büyümeyi hedefliyor. Ancak bu projenin iyi planlanmamış olduğu ve ihtiyaç duyulan kaynağa da sahip olmadığına yönelik eleştiriler de var.
DeepSeek-R1’in yayınlanmasından sonra yaşanan gelişmeler üzerine yorum yapan Trump, Çin’in DeepSeek ile gösterdiği başarının ABD teknoloji firmaları için bir “uyanma çağrısı” olduğunu söyledi.
DeepSeek’in bu başarısı ABD’li firmaları ne kadar uyandırır bilinmez. Ancak şunu söyleyebilirim: ABD, yapay zeka ve çipler alanında Çin ile yalnızca yasaklar yoluyla mücadele edemez. DeepSeek-R1 bunu tekrar göstermiş oldu. Aynı zamanda Nvidia başta olmak üzere ABD’li yapay zeka firmalarının son yıllarda artan ünü ve başarılarının ne kadar kırılgan olduğunu da hatırlattı. Trilyon dolarlık yatırımların yapıldığı ve geleceğin en belirleyici teknoloji sektörlerinden biri olacak yapay zeka sektörü, Çin-ABD rekabetinin ve küresel ekonomik mücadelenin en önemli sahnesi olmayı sürdürecek.