Çinli şirketin, uygulamasının ChatGPT gibi rakiplerden nasıl farklı olduğu ve sektör için ne anlama geldiği incelendi.
Çinli girişim DeepSeek, OpenAI’nin ChatGPT’sine rakip olarak ücretsiz, açık kaynaklı bir yapay zeka modeli piyasaya sürdükten sonra piyasaları ve Silicon Valley’i sarstı. The Times Gazetesi, şirketin, modelinin rakiplerinden nasıl farklı olduğunu ve sektör için ne anlama geldiğini inceledi.
DeepSeek-R1 Nedir?
DeepSeek-R1, ChatGPT, Claude, Gemini ve diğer sohbet botlarını destekleyen teknolojiye benzer bir yapay zeka yazılımı olan büyük bir dil modelidir.
R1, Çinli DeepSeek tarafından oluşturulmuştur ve OpenAI tarafından geliştirilen en iyi “akıl yürütme” modelinin performansına yakın bir performans gösterdiği görünmektedir. Ayrıca ücretsizdir, bu da uygulamanın ABD indirme listelerinde zirveye çıkmasına neden olmuştur. OpenAI, benzer modeli olan o1’e erişim için ayda 20 dolar talep etmektedir.
Bu kadar mı?
Tam olarak değil. DeepSeek, bu başarıyı, OpenAI ve diğer şirketlerden çok daha düşük maliyetlerle ve daha az gelişmiş çipler kullanarak gerçekleştirmiş gibi görünmektedir; bunu esasen modelin “eğitimi” için yenilikçi yöntemler kullanarak başarmıştır. ABD, en güçlü bilgisayar çiplerinin Çin’e ihracatını yasaklamıştır. DeepSeek ayrıca tüm programı “açık kaynak” olarak yayınlamıştır, bu da dünyanın dört bir yanındaki geliştiricilerin bunu kendi amaçları doğrultusunda kullanmasına, uyarlamasına ve değiştirmesine olanak tanır.
Ancak, DeepSeek, pazartesi günü ilerleyen saatlerde sohbet botu hizmetine üye alımını “büyük ölçekli” bir siber saldırı sonrasında kısıtlayacağını duyurdu. Şirket açıklamasında, “Sürekli hizmet sağlamak için kayıtları geçici olarak kısıtlıyoruz. Mevcut kullanıcılar normal şekilde giriş yapabilir” ifadelerini kullandı. DeepSeek, sorunun bir veri ihlali değil, programın yazılım arayüzünü etkilediğini belirtti.
Piyasalar nasıl tepki veriyor?
Büyük ABD teknoloji şirketlerinin hisselerini satmakla. Birçok şirket, geçen haftayı yapay zeka eğitimi ve hizmeti için devasa veri merkezleri inşa etmek üzere harcayacakları miktarlarla övünerek geçirdi. Artık yatırımcılar bununla ilgili sorgulamalar yapmaya başladı. DeepSeek, modelinin eğitiminin yaklaşık 5.6 milyon dolara mal olduğunu iddia ediyor; bu, ABD rakiplerinin maliyetinin küçük bir kısmı. Anthropic CEO’su Dario Amodei, bir modelin eğitiminin 100 milyon ile 1 milyar dolar arasında bir maliyeti olduğunu belirtti.
DeepSeek gibi verimli modeller, büyük bulut sağlayımlarına olan ihtiyacı da ortadan kaldırabilir. Geçen hafta, OpenAI için 100 milyar dolarlık bir veri merkezi girişimi olan Stargate’ın duyurusu yapıldı. Microsoft’un CEO’su Satya Nadella da bu yıl veri merkezleri için 80 milyar dolarlık taahhütlerini yinelemekte istekliydi. Davos’ta Nadella, DeepSeek’in “son derece etkileyici” ve “son derece hesaplama verimli” olduğunu kabul etti ve “Çin’den gelen gelişmeleri çok, çok ciddiye almalıydık” diye ekledi.
R1’in ‘açık kaynak’ olmasının önemi nedir?
DeepSeek, tüm programı dünya genelinde kullanım ve uyarlama için yayınladı; bu durum, önde gelen teknoloji yatırımcısı Marc Andreessen’in bunu “dünyaya derin bir hediye” olarak nitelendirmesine yol açtı. Bu yayın, yeni bir yenilik dalgasını teşvik edecek, ancak bazı şirketlerin ABD’li firmalar tarafından sağlanan daha pahalı modellere yönelmelerinden vazgeçmelerine de neden olabilir; bu da piyasa düşüşünün bir başka sebebi olabilir. Ayrıca, güçlü yapay zeka modellerinin kısıtlama olmaksızın yayınlanmasının sorumlu ve güvenli olup olmadığına dair tartışmayı yeniden alevlendirecek; çünkü bu modeller kötü niyetli aktörler tarafından kullanılabilir. Batı’da DeepSeek’i uyarlamak isteyenlerin, Tiananmen Meydanı katliamı gibi konuları konuşmasını engelleyen birçok Çin sansür kontrolünü kaldıracak şekilde uyarlaması gerekebilir.
ABD çip ihracat kontrolü için ne anlama geliyor?
Artık Başkan Trump’ın danışmanı olan Andreessen, DeepSeek’i “Sputnik anı” olarak nitelendirerek, Rusya’nın, ABD’yi ilk uydusunu yörüngeye yerleştirerek şok ettiği döneme benzetti. Bu durum, ABD’nin çip ihracatlarını Çin’e kısıtlama etkinliğine dair soru işaretleri doğuruyor. Birçok kişi, bu kontrollerin sadece Çin’in başka yollarla yenilik yapmasına neden olacağını savunuyordu.
Scale AI’nin kurucusu ve CEO’su Alexandr Wang, geçtiğimiz hafta Trump’a “Amerika yapay zeka savaşını kazanmalıdır” başlıklı bir mektup yazdı. Başkan’dan yatırım yapmasını, eğitim vermesini, düzenleme yapmasını ve enerjiyi daha iyi tahsis etmesini istedi. “Eğer Amerika Birleşik Devletleri mevcut rotasında kalırsa, geride kalma ve geride kalma riskimiz var” diye uyardı.
Ancak, Air Street Capital’dan genel ortak Nathan Benaich, “görüntünün son birkaç günün heyecanlı yorumlarından daha karmaşık olduğunu” belirtti çünkü “öncü ABD şirketleri en iyi yeteneklerini gizli tutarken, DeepSeek’in kendi yönetimi, en güçlü donanımlara kısıtlı erişimi ciddi bir dezavantaj olarak nitelendiriyor.