A Yorum
  Acilis Sayfasi Yap Sik Kullanilanlara Ekle  

   
A yorum Kurum
iletisim
login
yayin ilkeleri...



yazi dizileri

Yazı karekteri : (+) Büyük | (-) Küçük

DeepSeek: Çin 'dünyayı sarsacak' yapay zeka modeli üretti

Kategori Kategori: Yapay Zeka | Yorumlar 0 Yorum | 26 Ocak 2025 15:45:26

ChatGPT'nin eğitim verilerini işlemek için 10.000 Nvidia GPU'ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor. Çinli yapay zeka laboratuvarı DeepSeek’in kendi adını taşıyan büyük dil modeli (LLM), ABD'li OpenAI firmasının ChatGPT'sinin en büyük rakiplerinden biri haline gelirken, Silikon Vadisi'ni şaşkınlığa uğrattı.

Bu ay yayınlanan DeepSeek hem son derece hızlı hem de az maliyetle geliştirildi. OpenAI ve Google gibi önemli oyuncuların yapay zeka modellerine eğitim verileri sağlayan ScaleAI firmasının CEO'su Alexandr Wang, perşembe günü İsviçre’nin Davos kentinde düzenlenen Dünya Ekonomik Forumu’nda (WEF) yaptığı konuşmada DeepSeek'in ürününü "dünyayı sarsacak bir model" diye niteledi.



Çinli teknoloji laboratuvarı, ilk modelinin ardından güçlü muhakeme yeteneğine odaklanan DeepSeek-R1 adlı diğer modelini de yayınladı. Bu model de OpenAI'ın yakın zamanda piyasaya sürdüğü o1 ile rekabet halinde.

Üstelik bu denli güçlü bir araç olmasına rağmen DeepSeek-R1 büyük ölçüde açık kaynaklı olarak yayınlandı. Yani isteyen herkes aracın kodlarına erişebiliyor ve bu kodları kullanarak LLM'i kişiselleştirebiliyor. Eğitim verileri ise patentli. Öte yandan OpenAI, o1 modelini kapalı olarak piyasaya sürmüştü ve halihazırda sadece kullanıcılara bile aylık 200 dolarlık paketle satıyor.

Bu arada uzmanlar, Çin'in ABD ihracat kontrollerine çip satışı yasaklarına rağmen nasıl kısa sürede böyle güçlü bir model geliştirebildiğini tartışıyor.

R1'in sırrı ne? Yapay zeka topluluğu R1'in OpenAI'ın o1'ine birçok önemli ölçüt açısından eşit olduğunu, hatta bazı metriklerde onu geçtiğini, ancak maliyetinin çok daha düşük olduğunu söylüyor. Emory Üniversitesi'nde bilgi sistemleri alanında öğretim ütesi Hancheng Cao, MIT Technology Review dergisine verdiği röportajda, "Bu, özellikle Küresel Güney'deki sınırlı kaynaklara sahip araştırmacılar ve geliştiriciler için harika bir eşitleyici atılım olabilir," diyor.

DeepSeek'in başarısı, Çinli yapay zeka şirketlerinin ABD'nin son teknoloji çipler üzerindeki artan ihracat kontrolleri yüzünden karşı karşıya olduğu kısıtlamalar göz önüne alındığında daha da dikkat çekici. R1'in ve son Huawei 5G telefon modellerinin piyasaya sürülmesi, ABD'nin ihracat kontrollerinin amaçlandığı gibi çalışmadığını düşündürüyor. Zira yaptırımlar, Çin'in yeteneklerini zayıflatmaktan ziyade verimliliğe, kaynak havuzunu ve iş birliğini geliştirmeye odaklanarak DeepSeek gibi laboratuvarlar kurmasını sağlamış olabilir.

Yenilikçi yöntemlere başvurdu

MIT Technology Review'a konuşan DeepSeek çalışanı ve Northwestern Üniversitesi'nde bilgisayar bilimi alanında doktora öğrencisi Zihan Wang, Çin'in yaptırımlara karşı yenilikçi yollara başvurmak zorunda kaldığını söylüyor.

Buna göre DeepSeek, R1 modelini oluşturmak için eğitim sürecini yeniden düzenlemek zorunda kaldı. Çünkü çip firması Nvidia'nın Çin pazarı için satmaya izinli olduğu çiplerin performansı, şirketin en iyi ürünlerinin hızının yarısı kadar ediyor. Bu yüzden Çin, Nvidia'dan satın aldığı grafik işlem birimleri (GPU) üzerindeki yükü azaltmak için eğitim sürecini düzenledi.

Diğer bir deyişle, ABD ihracat kontrolleri, R1 geliştiricilerini hesaplama gücü eksikliklerini telafi etmek için daha akıllı, daha enerji verimli algoritmalar oluşturmaya zorladı. ChatGPT'nin eğitim verilerini işlemek için 10.000 Nvidia GPU'ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor.

DeepSeek R1, araştırmacılar tarafından özellikle matematik ve kodlamada karmaşık muhakeme görevlerini yerine getirme becerisiyle övülüyor. Model, o1 tarafından kullanılana benzer bir "düşünce zinciri" yaklaşımı kullanıyor ve bu da sorguları adım adım işleyerek sorunları çözmesine olanak tanıyor.

Microsoft'un AI Frontiers araştırma laboratuvarının baş araştırmacısı Dimitris Papailiopoulos, R1'de kendisini en çok şaşırtan şeyin "mühendislikteki basitlik" olduğunu söylüyor.

"DeepSeek, her mantıksal adımı ayrıntılandırmak yerine doğru yanıtları hedefledi ve yüksek düzeyde etkinliği korurken hesaplama süresini önemli ölçüde azalttı."
Programın ardındaki deha: Liang Wenfeng

Çin'in Hangzhou kentindeki şirket, Temmuz 2023'te bilgi ve elektronik mühendisliği geçmişine sahip Zhejiang Üniversitesi mezunu Liang Wenfeng tarafından kuruldu. Liang'ın 2015'te kurduğu bir fon olan High-Flyer'ın kuluçka programında yer aldı. Liang da sektörün diğer ileri gelen isimleri gibi, çeşitli görevlerde insanlara yetişebilen veya onları geçebilen "yapay genel zeka" seviyesine ulaşmayı hedefliyor.

Ayrıca, ABD'den beklenen yaptırımlardan çok önce Liang, şu anda Çin'e ihracatı yasaklanmış bir tür olan Nvidia A100 çiplerinden önemli miktarda stok satın aldı. Çinli medya kuruluşu 36Kr, şirketin stoklarında 10.000'den fazla birim olduğunu tahmin ediyor. Bazıları bu rakamın 50.000 olduğunu söylüyor.

Bu stokun yapay zeka eğitimi açısından önemini fark eden Liang, DeepSeek'i kurdu ve modellerini geliştirmek için bunları düşük güçteki çiplerle birlikte kullanmaya başladı. Alibaba ve ByteDance gibi teknoloji devleri ve zengin yatırımcılara sahip bir avuç girişim, Çin'in yapay zeka sektöründe hakim konumda. Bu da DeepSeek gibi şirketin nadir görülebileceği anlamına geliyor. Eski DeepSeek çalışanı Zihan Wang, MIT Technology Review'a DeepSeek'te çalışırken bol miktarda bilgi işlem kaynağına erişebildiğini ve deneme özgürlüğüne sahip olduğunu söyledi ve bunu, "herhangi bir şirkette çok az yeni mezunun elde edebileceği bir lüks" diye niteledi.

Liang ise Temmuz 2024'te Çin medya kuruluşu 36Kr ile yaptığı bir röportajda, "Çinli şirketlerin çip yaptırımlarına ek olarak karşılaştıkları ayrı bir zorluk da yapay zeka mühendisliği tekniklerinin daha az verimli olması," demişti. "Biz aynı sonuçları elde etmek için iki kat daha fazla bilgi işlem gücü tüketmek zorundayız. Veri verimliliğindeki boşluklarla birleştiğinde, bu dört kata kadar daha fazla bilgi işlem gücüne ihtiyaç duyulması anlamına gelebilir. Amacımız bu boşlukları sürekli olarak kapatmak."

Ancak DeepSeek, doğruluktan önemli ölçüde ödün vermeden bellek kullanımını azaltmanın ve hesaplamayı hızlandırmanın yollarını buldu. Wang, "Ekip, donanımsal zorluğu inovasyon için bir fırsata dönüştürmeyi seviyor," diyor. Carnegie Endowment for International Peace'de bir yapay zeka araştırmacısı olan Matt Sheehan, "ABD'nin ihracat kontrolleri, Çinli şirketleri sınırlı bilgi işlem kaynaklarıyla çok daha verimli olmak zorunda kalacakları bir konuma sıkıştırdı" ifadelerini kullanıyor.

"Muhtemelen gelecekte bilgi işlem eksikliğiyle ilgili çok fazla işbirliği göreceğiz." Diğer yapay zeka araçlarını gerçekten geçti mi?

Bağımsız araştırmacıların kıyaslama testlerinde, ilk modellerden biri olan DeepSeek-V3, OpenAI'nin GPT-4o ve Anthropic'in Claude Sonnet 3.5'inin yetenekleriyle eşleşmiş, Meta'nın Llama 3.1 ve Alibaba'nın Qwen2.5 gibi diğer modellerini problem çözme, kodlama ve matematik içeren görevlerde geride bırakmıştı. Livescience'a göre 20 Ocak'ta yayınlanan R1 ise aynı testlerin çoğunda ChatGPT'nin en son modeli o1'i de geçti. Diğer modellerin maliyetinin çok daha az bir kısmıyla başarılan bu etkileyici performans, modelin yarı açık kaynaklı yapısı ve önemli ölçüde daha az GPU üzerinde eğitilmiş olmasıyla birlikte yapay zeka uzmanlarını hayrete düşürüyor.

OpenAI'nin stratejik ortağı Microsoft'un CEO'su Satya Nadella, 22 Ocak'ta Dünya Ekonomik Forumu'nda yaptığı açıklamada, "Çin'deki gelişmeleri çok ama çok ciddiye almalıyız," dedi. Öte yandan bu yeni modelin ne kadarının yararlı bilimsel ve teknik uygulamalara dönüşeceği veya DeepSeek'in modelini kıyaslama testlerinde başarılı olacak şekilde kasten eğitip eğitmediği henüz belli değil.

Bilim insanları ve yapay zeka yatırımcıları gelişmeleri yakından izliyor.


Facebook'ta paylaş   |   Twitter'da paylaş


 | Puan: Henüz oy verilmedi / 0 Oy | Yazdırılabilir SayfaYazdır

Yorumlar


Henüz Yorum Yazılmamış

Yorum Yazın



KalınİtalikAltçizgiliLink  
Simge Ekle

    

    

    

    







Papa Françesko yaşamını yitirdi.
Yunanistan Türk yatırımcıların adalara ilgisinden endişeli
Avrupa Konseyi Parlamenter Meclisi'den Avrupa'ya İmamoğlu ile dayanışma çağrısı
Yüzlerce öğrenciden ABD'yi terk etmeleri istendi.
Avrupa'da İmamoğlu çıkmazı: Çıkarlar mı değerler mi?

Gazze'de gıda stokları tükendi: Açlık krizi derinleşiyor
Suriye nasıl kutsallaştırıldı? Suriyeliler umutlu olabilir mi?
Penguen ve foklara da vergi uygulaması…
Trump'ın politikaları ABD'nin 50 eyaletinde protesto ediliyor.
Dünyadaki boykotlar: Kim neyi hedef aldı?

Trump: Çin'den ithal edilen mallara uygulanan gümrük vergisi oranı % 125'e çıkarılacak
Trump yeni gümrük vergisi tarifelerini açıkladı.
Avrupa’nın en az et yiyen ülkesi Türkiye: Fiyatlar 5 yılda % 1230 arttı!
Türkiye'de ekonomi bir kez daha belirsizlik döneminde
ABD-Çin hattında ticaret savaşı: “Soğuk Savaş’tan beri görülmemiş bir rekabet”

Türkiye'de Covid-19 salgını yaşam süresini azalttı.
Uzmanlar uyardı: "Uzun yaşayanlardan tavsiye almayın"
Fahri Kiamil
İki annenin başlattığı akıllı telefon karşıtı hareket çığ gibi büyüdü
Afganistan'da onlarca arkeolojik alan buldozerle yıkılarak yağmaya açıldı.

Jak İhmalyan sergisi İstanbul'da
MADELEİNE RİFFAUD, 1924-2024
KOLLEKTİF OYNAMALI KAZANMAK İÇİN
Oxford Sözlüğü yılın kelimesini seçti: Beyin çürümesi
"İNEK BAYRAMI" ekitap

Yapay Zeka Felsefesi
Tutunarak kalmak mı? Bulanmadan donmadan akmak mı?
Tokyo’dan Hasanlar’a, Kudüs’te bir mahkemeden bizim buralara…
“KADERİMİZ DIŞARDAN YAZILAMAZ - DIŞARI KADERİ BELİRLEYEMEZ…”
Niyetime İlham

Dünyanın hareket halindeki en eski buzdağlarından biri yaban hayatı cenneti ile çarpışabilir
Yarasaların azalmasıyla bebek ölümlerinin ilişkili olduğu ortaya çıktı.
AB İklim İzleme Servisi: 2024 yazı kaydedilen en sıcak yaz oldu.
Akdeniz'deki yaşam yok oluşun eşiğine gelmiş.
Su üzerindeki iklim değişikliği baskısı Türkiye'yi su fakiri olmaya sürüklüyor.

Telefonlar depremi 30 saniye önce bildirdi…
Çin'den gövde gösterisi: Yarı maratonda robotlar insanlarla yarıştı…
Çin'in 10 yıllık yüksek teknoloji planı nasıl işledi?
Devrimsel Bir Teknoloji: Kaykay Şasi
Türkiye, kişisel verileri en çok sızdırılan 19.ülke

NASA'nın en kuvvetli teleskobu, evrendeki beklenmedik gelişmeyi ortaya koydu.
İncil'de sözü edilen mistik ağaç 1000 yıllık tohumla yeniden yetiştirildi.
Karıncaların 66 milyon yıldır tarım yaptığı ortaya çıktı.
Antik Mısır'daki popüler masa oyununun şaşırtıcı kökenleri ortaya çıktı.
At binmenin kökenine dair ezber bozuldu.

"Türkiye'de gazeteciler baskı ve yıldırma ile karşı karşıya"
Uluslararası Şeffaflık Örgütü tarafından 2024 yılı yolsuzluk algı endeksi açıklandı!
Türkiye OECD’de gelir eşitsizliğinin en yüksek olduğu 4. ülke
2023 yılında Türkye’de çocukların cinsel istismarı hakkında 40.000'den fazla dosya açıldı.
Çalışanların geliri son 20 yılda azaldı.

Kakao Endüstrisinde Çocuk İşçiliği: Tadı Kadar Tatlı Değil
Dan O’Dowd, Tesla’nın Zehirli Kültürü, Başarısız Abartı ve BYD’nin Yükselişi Üzerine
ANALAR(IMIZ) SİZLER ÇOK YAŞAYIN
Amerika dış yardım yumuşak gücünden vazgeçiyor mu?
Zelenski: Kolezyum Politikasının Kurbanı

KURBANIM BUGÜN
KAZ DAĞI
GÜNÜN HABERİ
NE İSEN O
KILAVUZ KARGA

Mimar Sinan: Bir Dehanın Yükselişi ve Osmanlı Mimarisinin Zirvesi
İskandinav Göçleri ve Vikinglerin Avrupa Üzerindeki Etkisi
Hümanizm Nedir?
Osmanlı’da kahve kültürü, Osmanlı’da kahve isimleri..
Amerika’da Ayrımcı Politikalar ve Siyahi Mücadele Tarihi


kose yazarlari En Cok Okunanlar
Son 30 günde en çok okunanlar
En Cok Okunanlar










Basa git