A Yorum
  Acilis Sayfasi Yap Sik Kullanilanlara Ekle  

   
A yorum Kurum
iletisim
login
yayin ilkeleri...



yazi dizileri Ekitap Radyo

Yazı karekteri : (+) Büyük | (-) Küçük

DeepSeek: Çin 'dünyayı sarsacak' yapay zeka modeli üretti

Kategori Kategori: Yapay Zeka | Yorumlar 0 Yorum | 26 Ocak 2025 15:45:26

ChatGPT'nin eğitim verilerini işlemek için 10.000 Nvidia GPU'ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor. Çinli yapay zeka laboratuvarı DeepSeek’in kendi adını taşıyan büyük dil modeli (LLM), ABD'li OpenAI firmasının ChatGPT'sinin en büyük rakiplerinden biri haline gelirken, Silikon Vadisi'ni şaşkınlığa uğrattı.

Bu ay yayınlanan DeepSeek hem son derece hızlı hem de az maliyetle geliştirildi. OpenAI ve Google gibi önemli oyuncuların yapay zeka modellerine eğitim verileri sağlayan ScaleAI firmasının CEO'su Alexandr Wang, perşembe günü İsviçre’nin Davos kentinde düzenlenen Dünya Ekonomik Forumu’nda (WEF) yaptığı konuşmada DeepSeek'in ürününü "dünyayı sarsacak bir model" diye niteledi.



Çinli teknoloji laboratuvarı, ilk modelinin ardından güçlü muhakeme yeteneğine odaklanan DeepSeek-R1 adlı diğer modelini de yayınladı. Bu model de OpenAI'ın yakın zamanda piyasaya sürdüğü o1 ile rekabet halinde.

Üstelik bu denli güçlü bir araç olmasına rağmen DeepSeek-R1 büyük ölçüde açık kaynaklı olarak yayınlandı. Yani isteyen herkes aracın kodlarına erişebiliyor ve bu kodları kullanarak LLM'i kişiselleştirebiliyor. Eğitim verileri ise patentli. Öte yandan OpenAI, o1 modelini kapalı olarak piyasaya sürmüştü ve halihazırda sadece kullanıcılara bile aylık 200 dolarlık paketle satıyor.

Bu arada uzmanlar, Çin'in ABD ihracat kontrollerine çip satışı yasaklarına rağmen nasıl kısa sürede böyle güçlü bir model geliştirebildiğini tartışıyor.

R1'in sırrı ne? Yapay zeka topluluğu R1'in OpenAI'ın o1'ine birçok önemli ölçüt açısından eşit olduğunu, hatta bazı metriklerde onu geçtiğini, ancak maliyetinin çok daha düşük olduğunu söylüyor. Emory Üniversitesi'nde bilgi sistemleri alanında öğretim ütesi Hancheng Cao, MIT Technology Review dergisine verdiği röportajda, "Bu, özellikle Küresel Güney'deki sınırlı kaynaklara sahip araştırmacılar ve geliştiriciler için harika bir eşitleyici atılım olabilir," diyor.

DeepSeek'in başarısı, Çinli yapay zeka şirketlerinin ABD'nin son teknoloji çipler üzerindeki artan ihracat kontrolleri yüzünden karşı karşıya olduğu kısıtlamalar göz önüne alındığında daha da dikkat çekici. R1'in ve son Huawei 5G telefon modellerinin piyasaya sürülmesi, ABD'nin ihracat kontrollerinin amaçlandığı gibi çalışmadığını düşündürüyor. Zira yaptırımlar, Çin'in yeteneklerini zayıflatmaktan ziyade verimliliğe, kaynak havuzunu ve iş birliğini geliştirmeye odaklanarak DeepSeek gibi laboratuvarlar kurmasını sağlamış olabilir.

Yenilikçi yöntemlere başvurdu

MIT Technology Review'a konuşan DeepSeek çalışanı ve Northwestern Üniversitesi'nde bilgisayar bilimi alanında doktora öğrencisi Zihan Wang, Çin'in yaptırımlara karşı yenilikçi yollara başvurmak zorunda kaldığını söylüyor.

Buna göre DeepSeek, R1 modelini oluşturmak için eğitim sürecini yeniden düzenlemek zorunda kaldı. Çünkü çip firması Nvidia'nın Çin pazarı için satmaya izinli olduğu çiplerin performansı, şirketin en iyi ürünlerinin hızının yarısı kadar ediyor. Bu yüzden Çin, Nvidia'dan satın aldığı grafik işlem birimleri (GPU) üzerindeki yükü azaltmak için eğitim sürecini düzenledi.

Diğer bir deyişle, ABD ihracat kontrolleri, R1 geliştiricilerini hesaplama gücü eksikliklerini telafi etmek için daha akıllı, daha enerji verimli algoritmalar oluşturmaya zorladı. ChatGPT'nin eğitim verilerini işlemek için 10.000 Nvidia GPU'ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor.

DeepSeek R1, araştırmacılar tarafından özellikle matematik ve kodlamada karmaşık muhakeme görevlerini yerine getirme becerisiyle övülüyor. Model, o1 tarafından kullanılana benzer bir "düşünce zinciri" yaklaşımı kullanıyor ve bu da sorguları adım adım işleyerek sorunları çözmesine olanak tanıyor.

Microsoft'un AI Frontiers araştırma laboratuvarının baş araştırmacısı Dimitris Papailiopoulos, R1'de kendisini en çok şaşırtan şeyin "mühendislikteki basitlik" olduğunu söylüyor.

"DeepSeek, her mantıksal adımı ayrıntılandırmak yerine doğru yanıtları hedefledi ve yüksek düzeyde etkinliği korurken hesaplama süresini önemli ölçüde azalttı."
Programın ardındaki deha: Liang Wenfeng

Çin'in Hangzhou kentindeki şirket, Temmuz 2023'te bilgi ve elektronik mühendisliği geçmişine sahip Zhejiang Üniversitesi mezunu Liang Wenfeng tarafından kuruldu. Liang'ın 2015'te kurduğu bir fon olan High-Flyer'ın kuluçka programında yer aldı. Liang da sektörün diğer ileri gelen isimleri gibi, çeşitli görevlerde insanlara yetişebilen veya onları geçebilen "yapay genel zeka" seviyesine ulaşmayı hedefliyor.

Ayrıca, ABD'den beklenen yaptırımlardan çok önce Liang, şu anda Çin'e ihracatı yasaklanmış bir tür olan Nvidia A100 çiplerinden önemli miktarda stok satın aldı. Çinli medya kuruluşu 36Kr, şirketin stoklarında 10.000'den fazla birim olduğunu tahmin ediyor. Bazıları bu rakamın 50.000 olduğunu söylüyor.

Bu stokun yapay zeka eğitimi açısından önemini fark eden Liang, DeepSeek'i kurdu ve modellerini geliştirmek için bunları düşük güçteki çiplerle birlikte kullanmaya başladı. Alibaba ve ByteDance gibi teknoloji devleri ve zengin yatırımcılara sahip bir avuç girişim, Çin'in yapay zeka sektöründe hakim konumda. Bu da DeepSeek gibi şirketin nadir görülebileceği anlamına geliyor. Eski DeepSeek çalışanı Zihan Wang, MIT Technology Review'a DeepSeek'te çalışırken bol miktarda bilgi işlem kaynağına erişebildiğini ve deneme özgürlüğüne sahip olduğunu söyledi ve bunu, "herhangi bir şirkette çok az yeni mezunun elde edebileceği bir lüks" diye niteledi.

Liang ise Temmuz 2024'te Çin medya kuruluşu 36Kr ile yaptığı bir röportajda, "Çinli şirketlerin çip yaptırımlarına ek olarak karşılaştıkları ayrı bir zorluk da yapay zeka mühendisliği tekniklerinin daha az verimli olması," demişti. "Biz aynı sonuçları elde etmek için iki kat daha fazla bilgi işlem gücü tüketmek zorundayız. Veri verimliliğindeki boşluklarla birleştiğinde, bu dört kata kadar daha fazla bilgi işlem gücüne ihtiyaç duyulması anlamına gelebilir. Amacımız bu boşlukları sürekli olarak kapatmak."

Ancak DeepSeek, doğruluktan önemli ölçüde ödün vermeden bellek kullanımını azaltmanın ve hesaplamayı hızlandırmanın yollarını buldu. Wang, "Ekip, donanımsal zorluğu inovasyon için bir fırsata dönüştürmeyi seviyor," diyor. Carnegie Endowment for International Peace'de bir yapay zeka araştırmacısı olan Matt Sheehan, "ABD'nin ihracat kontrolleri, Çinli şirketleri sınırlı bilgi işlem kaynaklarıyla çok daha verimli olmak zorunda kalacakları bir konuma sıkıştırdı" ifadelerini kullanıyor.

"Muhtemelen gelecekte bilgi işlem eksikliğiyle ilgili çok fazla işbirliği göreceğiz." Diğer yapay zeka araçlarını gerçekten geçti mi?

Bağımsız araştırmacıların kıyaslama testlerinde, ilk modellerden biri olan DeepSeek-V3, OpenAI'nin GPT-4o ve Anthropic'in Claude Sonnet 3.5'inin yetenekleriyle eşleşmiş, Meta'nın Llama 3.1 ve Alibaba'nın Qwen2.5 gibi diğer modellerini problem çözme, kodlama ve matematik içeren görevlerde geride bırakmıştı. Livescience'a göre 20 Ocak'ta yayınlanan R1 ise aynı testlerin çoğunda ChatGPT'nin en son modeli o1'i de geçti. Diğer modellerin maliyetinin çok daha az bir kısmıyla başarılan bu etkileyici performans, modelin yarı açık kaynaklı yapısı ve önemli ölçüde daha az GPU üzerinde eğitilmiş olmasıyla birlikte yapay zeka uzmanlarını hayrete düşürüyor.

OpenAI'nin stratejik ortağı Microsoft'un CEO'su Satya Nadella, 22 Ocak'ta Dünya Ekonomik Forumu'nda yaptığı açıklamada, "Çin'deki gelişmeleri çok ama çok ciddiye almalıyız," dedi. Öte yandan bu yeni modelin ne kadarının yararlı bilimsel ve teknik uygulamalara dönüşeceği veya DeepSeek'in modelini kıyaslama testlerinde başarılı olacak şekilde kasten eğitip eğitmediği henüz belli değil.

Bilim insanları ve yapay zeka yatırımcıları gelişmeleri yakından izliyor.


Facebook'ta paylaş   |   Twitter'da paylaş


 | Puan: Henüz oy verilmedi / 0 Oy | Yazdırılabilir SayfaYazdır

Yorumlar


Henüz Yorum Yazılmamış

Yorum Yazın



KalınİtalikAltçizgiliLink  
Simge Ekle

    

    

    

    







Kahramanmaraş’ta Polis Tatbikatı ve Toplumsal Çatışmanın Anatomisi
Coca-Cola’nın “Pair Bottle” Deneyi Kapitalizmin İnsan İlişkilerine Müdahalesi
Türkiye’de Bahis Depremi, Peki Diğer Spor Dalları Gerçekten Güvende mi?
Ayakkabılar yapılmaz, yetiştirilir
Yazarlarımızdan Prof. Dr. Şehmus Güzel yaşamını yitirdi.

Avustralya'dan Bondi Plajı saldırısı sonrası silah yasalarını sertleştirme hamlesi
Trump 2.0'ın Gölgesinde Diplomasi
Sadece İsimde Ateşkes: Gazze'nin Uzun Süren Araf Dönemi
Çin Japonya'yı Test Ediyor ve Amerikan Kararlılığının Sınırları…
Emeklilerin Büyük Yürüyüşü Başlıyor: 17 Milyon Kişi Artık Sessiz Değil!

Dijital Yuan Etki Aracı Olarak: Güneydoğu Asya'nın Para Egemenliği ve Stratejik Özerkliği
ABD-Avustralya Kritik Mineraller Anlaşması Pasifik Tedarik Zincirlerinin Geleceğini Nasıl Yeniden Şekillendiriyor?
Kalkınma Hakkında Yanlış Bildiğiniz Şaşırtıcı Gerçek
Avustralya - Çin İlişkileri: Avustralya'da Kavga
Gri listeden çıktık ama... AB'nin 2024 Türkiye raporu'ndan çıkan şaşırtıcı gerçekler!

"En ciddiyetsiz nesil": Z kuşağı neden kasten gülünç olmayı seçiyor?
Güney Karolina'nın Unutulmuş Osmanlıları: Sumter Türklerinin Şaşırtıcı Gerçeği
Köpek ve insanların bazı duyguları aynı genetik kökene sahip
Motokuryelerin Sessiz Çığlığı: Sokağın Gölgesinden Yükselen Sınıf Mücadelesi
Gençlerden sonra emekliler de yurtdışına gidiyor.

Osmanlı İmparatorluğu'nda Kahvehaneler: Bir Sosyo-Politik Etki
Osman Hamdi Bey’i bilmeyen varsa bile herhalde Kaplumbağa Terbiyecisi’ni bilmeyen yoktur ya “Mihrap” tablosu...
JAK İHMALYAN'DAN: “RESİM ANLAYIŞIM”
Jak İhmalyan sergisi İstanbul'da
MADELEİNE RİFFAUD, 1924-2024

Einstein'ın hayran kaldığı filozof: Spinoza'nın aklınızı başınızdan alacak radikal fikri
Adalet Kavramına Filozofların Gözünden Bir Yolculuk
KE.KE.ME. (KKM)
Yapay Zeka Felsefesi
Tutunarak kalmak mı? Bulanmadan donmadan akmak mı?

Yeryüzünü fırına çeviren atmosfer olayı: Isı kubbesi
Dünyanın hareket halindeki en eski buzdağlarından biri yaban hayatı cenneti ile çarpışabilir
Yarasaların azalmasıyla bebek ölümlerinin ilişkili olduğu ortaya çıktı.
AB İklim İzleme Servisi: 2024 yazı kaydedilen en sıcak yaz oldu.
Akdeniz'deki yaşam yok oluşun eşiğine gelmiş.

Avustralyalı teorik fizikçiler: 'Paradoks olmadan zaman yolculuğu yapmak mümkün'
Axiom Raporu: Siber Güvenlik ve Çin-ABD İlişkilerine Etkisi
WhoFi: Wi-Fi sinyaliyle kimlik tespiti dönemi başlıyor.
500 yıllık Da Vinci çizimi sessiz drone teknolojisine ilham verdi.
Çin, HDMI ve DisplayPort alternatifini piyasaya sürdü.

Bilim insanları beynin beş farklı yaşam evresinden geçtiğini açıkladı: Kritik dönüm noktaları 9, 32, 66 ve 83 yaş…
Amerika kıtasında 'olmaması gereken' yeni bir insan türü keşfedildi: Checua nedir? Türkler ile bağlantıları var mı?
NASA'nın en kuvvetli teleskobu, evrendeki beklenmedik gelişmeyi ortaya koydu.
İncil'de sözü edilen mistik ağaç 1000 yıllık tohumla yeniden yetiştirildi.
Karıncaların 66 milyon yıldır tarım yaptığı ortaya çıktı.

Türkiye’de üniversite mezunlarının geliri Avrupa’nın en düşük seviyesinde…
Gerçek işsizlik yüzde 29,6!
Türkiye’de tek kişilik
UNICEF raporunda Türkiye'deki çocuklar son sıralarda
AP'den Türkiye'ye sert mesaj: Kriterler müzakere edilemez

Coğrafya Değil, Kapitalist Sömürü Kaderi Belirler
Tekno-Kapitalizmin Çöküş Aynası Tesla Neden “En Sonda”
Hanuka, Devrim ve Makabiler
Roş Aşanada Şofarın Çığlığı ve Hakikatın Sentezinde Marx ve Hegel
Vatan kirim’a sahip çıkmak: Teslimiyete karşı onurlu direniş

Büyük Konuşmak
HUKUK KARGAŞASI
HAİN Mİ ARARSINIZ
KANAS
Kayyum

Paranın, Lidya Sikkesinden Dijital Cüzdanlara Uzanan 5000 Yıllık Hikayesi
Mimar Sinan: Bir Dehanın Yükselişi ve Osmanlı Mimarisinin Zirvesi
İskandinav Göçleri ve Vikinglerin Avrupa Üzerindeki Etkisi
Hümanizm Nedir?
Osmanlı’da kahve kültürü, Osmanlı’da kahve isimleri..


kose yazarlari En Cok Okunanlar
Son 30 günde en çok okunanlar
En Cok Okunanlar










Basa git