DeepSeek Silikon Vadisi için alarm niteliğinde
Kısa bir süre önce OpenAI'ın en yetenekli yapay zeka sistemleri kadar iyi performans gösterdiğini iddia ettiği büyük bir dil modelini açık kaynaklı hale getiren DeepSeek adlı Çinli bir şirket, şu anda yapay zeka topluluğunun ilgi odağı haline geldi. Şirketin teknolojisi, en iyi Amerikan YZ modellerine karşı en iyi açık kaynak rakiplerinden biri olarak övülüyor, Çin'in yoğunlaşan uluslararası YZ yarışındaki gücüne ilişkin endişeleri körüklüyor ve yabancı bir rakibin çok daha az kaynakla çok daha fazlasını yapmasının ardından ABD'li girişimleri kendi çalışmalarını yeniden incelemeye teşvik ediyor.
Aralık ayı sonunda, Hangzhou merkezli küçük Çin laboratuarı, 671 milyar parametreye sahip bir dil modeli olan V3'ü piyasaya sürdü ve bu modelin sadece 5,58 milyon dolara iki ayda eğitildiği duyurdu. Bu tahmini 1,8 trilyon parametreyle daha büyük bir model olan ancak 100 milyon dolarlık bir fiyat etiketiyle üretilen OpenAI'ın GPT-4'ünden çok daha düşük bir maliyet. Geçen hafta DeepSeek, kodlama ve karmaşık matematik ve fen problemlerini çözme gibi muhakeme görevleri olarak adlandırılan konularda OpenAI'ın o1 modeline rakip olduğunu iddia ettiği R-1 adlı bir model yayınlayarak yeni bir meydan okuma daha yaptı. OpenAI bu tür modeller için kullanıcılardan aylık 200 dolar ücret alıyor, DeepSeek ise kendi modelini ücretsiz olarak sunuyor.
Fiyatlarını sorgulatıyor
DeepSeek'in modelinin gücü ve fiyatlandırması, Amerikan yapay zeka girişimlerinin işlerini yürütme şeklini değiştirmeye başladı bile. Müşteri hizmetleri için yapay zeka aracıları geliştiren Decagon'un CEO'su Jesse Zhang Forbes'a yaptığı açıklamada, DeepSeek'in OpenAI gibi yerleşiklerin tekliflerine ucuz ve cazip bir alternatif olduğunu söyledi. DeepSeek'in yeni modeli muhtemelen OpenAI ve Anthropic gibi Amerikan YZ devlerini kendi fiyatlarını yeniden değerlendirmeye zorlayacaktır.
“Girişimler veri toplamaya başladı”
Yazılım mühendisliği için yapay zeka geliştiren Poolside AI'ın CTO'su ve kurucu ortağı Eiso Kant Forbes'a verdiği demeçte DeepSeek'in gücünün daha azıyla daha fazlasını yapabilmeyi sağlayan mühendislik becerisine sahip olduğunu söyledi. Kant, “DeepSeek'in dünyaya gösterdiği şey, eğitiminizi hesaplama açısından verimli hale getirmeye güçlü bir vurgu yaptığınızda, çok şey yapabileceğinizdir. Bu Nvidia çiplerini inanılmaz derecede daha verimli hale getirmek için onlardan çıkarmaya devam edebileceğiniz inanılmaz şeyler var” dedi. Veri etiketleme şirketi Labelbox'ın CEO'su Manu Sharma Forbes'a verdiği demeçte, OpenAI'ın o1 modelinin belirli kıyaslamalarda en iyi olduğu iddia edilirken, bazı girişimlerin daha gelişmiş sistemleri eğitmek için veri toplamaya başladığını söyledi. Sharma, “Bence yapay genel zeka yarışı pek çok açıdan sıfırlandı. Yönetim kurulu genelinde çok daha fazla rekabet göreceğiz” ifadelerini kullandı.
Eğitim verisi devi Scale AI'ın milyarder CEO'su Alexandr Wang, kısa süre önce modeli “dünyayı sarsan” olarak nitelendirdi. 9 milyar dolar değerindeki yapay zeka arama girişimi Perplexity'nin CEO'su Aravind Srinivas modeli ana arama ürününe entegre etti. YZ çip şirketi Groq, DeepSeek'in R1 modelini dil işleme birimlerine çoktan ekledi.
Ancak herkes DeepSeek’ten bu kadar etkilenmiş görünmüyor. Writer CEO'su May Habib Forbes'a yaptığı açıklamada, DeepSeek'in çok daha küçük bir bütçeyle eğitilen modellerinin ABD'deki en akıllı modellerle eşleşebilmesine şaşırmadığını söyledi. Ekim ayında Writer sadece 700 bin dolarlık GPU ile eğitilmiş bir modeli piyasaya sürerken, OpenAI'ın benzer yeteneklere sahip bir model olan GPT-4'ü oluşturmasının 100 milyon dolara mal olduğu bildiriliyor. Writer eğitim maliyetlerini düşürmek için sentetik veri kullandı. Habib,“DeepSeek'in modeli patlamadan önce bile bu modellerin metalaştığını söylüyorduk. Giderek daha fazla dağıtılıyorlar” dedi.
“Kapalı modele yüz milyonlarca dolar ödemek çılgınca”
Hafta sonu, şirket hakkındaki söylentiler arttıkça, DeepSeek Apple'ın uygulama mağazasında ChatGPT'yi geçerek Amerika Birleşik Devletleri'nde ücretsiz uygulama indirmelerinde 1 numaraya yükseldi. Ardından pazartesi günü, DeepSeek'in başarılı model lansmanıyla ilgili paniğin yayılmasıyla birkaç ABD teknoloji hissesi değer kaybetti. Günün sonunda, yapay zeka çip devi Nvidia'nın piyasa değeri yaklaşık 600 milyar dolar düştü. Bu şimdiye kadarki yapay zeka düzeninin sarsıcı bir şekilde altüst olduğu bir gün oldu. Yapay zeka modellerini kıyaslayan kar amacı gütmeyen ARC Prize'ın başkanı Greg Kamradt Forbes'a verdiği demeçte, “Birinin gidip kapalı kaynak bir model için yüz milyonlarca dolar harcayabilmesi biraz çılgınca. Sonra birdenbire ücretsiz olarak sunulan açık kaynaklı bir model ortaya çıkıyor” diye konuştu.
DeepSeek'in modelleri haftalardır Meta'nın baş yapay zeka bilimcisi Yann LeCun, OpenAI kurucu ortağı Andrej Karpathy ve Nvidia'nın kıdemli araştırma bilimcisi Jim Fan gibi yapay zeka dünyasının en önde gelen isimleri tarafından övgüyle karşılanıyor. Ancak şirketin son başarısıyla ilgili haberler, Amerika'nın yapay zeka ağır toplarını Çinli şirketin çok daha az para harcayarak nasıl bu kadar etkileyici sonuçlar elde ettiğini anlamaya yöneltti. Yatırımcı-milyarder Marc Andreessen X'te “Deepseek R1 yapay zekanın Sputnik anıdır” diye yazdı.
ABD üstünlüğünü kaybeder mi?
Trump yönetiminin son yapay zeka duyurularının şatafatına rağmen DeepSeek, özellikle Nvidia'nın son teknoloji yapay zeka çiplerini kullanmasını engelleyen sıkı ABD ihracat kontrollerine rağmen bu kadar başarılı olduğu için ABD'nin yapay zeka üstünlüğünü kaybedebileceği yönündeki korkuları artırdı. Şirketin son başarısı, OpenAI, Oracle ve Japon teknoloji şirketi Softbank'ın ortak girişimi olan ve yapay zeka altyapısına 500 milyar dolar yatırım yapmayı hedefleyen Project Stargate'e karşı ciddi bir karşı duruş oluşturuyor.
Pazartesi günü Florida'da Temsilciler Meclisi Cumhuriyetçileriyle yapacağı toplantı öncesinde Trump tehdidi kabul etti. ABD Başkanı, “Çinli bir şirketin yapay zekası DeepSeek'in piyasaya sürülmesi, kazanmak için rekabet etmeye odaklanmamız gerektiği konusunda sektörlerimiz için bir uyandırma çağrısı olmalıdır” dedi. DeepSeek'in son başarısında dikkat edilmesi gereken bazı konular da var. Araştırmacılar, yapay zeka modellerinin Çin Komünist Partisi (ÇKP) için hassas olan konularda kendi kendini sansürleme eğiliminde olduğunu tespit etti. Güvenlik araştırmacısı Jane Manchun Wong Forbes'a DeepSeek'in modellerinin Çin Devlet Başkanı Şi Cinping ve 1989 Tiananmen Meydanı protestoları hakkındaki sorulara yanıt vermediğini söyledi. Bunun ötesinde, gizlilik endişeleri de var. DeepSeek'in modellerine girilen veriler, politikalarına göre Çin'de bulunan sunucularda saklanıyor.
Ulusal güvenlik danışmanlık firması Beacon Global Strategies'in başkan yardımcısı Divyansh Kaushik DeepSeek'i kapsamlı bir inceleme yapmadan kullananlara karşı uyardı. Kaushik, “Çin modellerinin ulusal güvenlik ve ifade özgürlüğü değerlendirmelerini net bir şekilde yapamadığımız sürece, ÇKP'nin propaganda kolları gibi muamele görmelidirler. Onlara steroidli Huawei muamelesi yapılmalı” dedi.
Sorun DeepSeek'in değeri: OpenAI ve Anthropic gibi şirketler tarafından inşa edilen kapalı, ücrete dayalı yapay zeka dünyasında kullanımı ücretsiz ve açık olan son teknoloji ürünü bir yapay zeka muhakeme modeli. Labelbox'tan Sharma, “Açık kaynak olan bir Çin modeline sahip olmak, kapalı kaynak olan bir Amerikan modeline sahip olmaktan çok daha iyidir” dedi.
"Yapay Zeka" Kategorisinden Daha Fazla İçerik
Yazarlar
Çok Okunanlar
-
forbes.com.tr
Dünyanın en zengin 10 kişisi (Kasım 2024)
-
forbes.com.tr
En zengin Türklerin sıralaması nasıl değişti?
-
forbes.com.tr
Dünyanın en zengin 10 insanı (Ocak 2025)
-
Nilgün Balcı Çavdar
Türk Milyarderler
-
Eren Taşar
2025'te yatırımcıları neler bekliyor?