A Yorum
  Acilis Sayfasi Yap Sik Kullanilanlara Ekle  

   
A yorum Kurum
iletisim
login
yayin ilkeleri...



yazi dizileri

Yazı karekteri : (+) Büyük | (-) Küçük

DeepSeek: Çin 'dünyayı sarsacak' yapay zeka modeli üretti

Kategori Kategori: Yapay Zeka | Yorumlar 0 Yorum | 26 Ocak 2025 15:45:26

ChatGPT'nin eğitim verilerini işlemek için 10.000 Nvidia GPU'ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor. Çinli yapay zeka laboratuvarı DeepSeek’in kendi adını taşıyan büyük dil modeli (LLM), ABD'li OpenAI firmasının ChatGPT'sinin en büyük rakiplerinden biri haline gelirken, Silikon Vadisi'ni şaşkınlığa uğrattı.

Bu ay yayınlanan DeepSeek hem son derece hızlı hem de az maliyetle geliştirildi. OpenAI ve Google gibi önemli oyuncuların yapay zeka modellerine eğitim verileri sağlayan ScaleAI firmasının CEO'su Alexandr Wang, perşembe günü İsviçre’nin Davos kentinde düzenlenen Dünya Ekonomik Forumu’nda (WEF) yaptığı konuşmada DeepSeek'in ürününü "dünyayı sarsacak bir model" diye niteledi.



Çinli teknoloji laboratuvarı, ilk modelinin ardından güçlü muhakeme yeteneğine odaklanan DeepSeek-R1 adlı diğer modelini de yayınladı. Bu model de OpenAI'ın yakın zamanda piyasaya sürdüğü o1 ile rekabet halinde.

Üstelik bu denli güçlü bir araç olmasına rağmen DeepSeek-R1 büyük ölçüde açık kaynaklı olarak yayınlandı. Yani isteyen herkes aracın kodlarına erişebiliyor ve bu kodları kullanarak LLM'i kişiselleştirebiliyor. Eğitim verileri ise patentli. Öte yandan OpenAI, o1 modelini kapalı olarak piyasaya sürmüştü ve halihazırda sadece kullanıcılara bile aylık 200 dolarlık paketle satıyor.

Bu arada uzmanlar, Çin'in ABD ihracat kontrollerine çip satışı yasaklarına rağmen nasıl kısa sürede böyle güçlü bir model geliştirebildiğini tartışıyor.

R1'in sırrı ne? Yapay zeka topluluğu R1'in OpenAI'ın o1'ine birçok önemli ölçüt açısından eşit olduğunu, hatta bazı metriklerde onu geçtiğini, ancak maliyetinin çok daha düşük olduğunu söylüyor. Emory Üniversitesi'nde bilgi sistemleri alanında öğretim ütesi Hancheng Cao, MIT Technology Review dergisine verdiği röportajda, "Bu, özellikle Küresel Güney'deki sınırlı kaynaklara sahip araştırmacılar ve geliştiriciler için harika bir eşitleyici atılım olabilir," diyor.

DeepSeek'in başarısı, Çinli yapay zeka şirketlerinin ABD'nin son teknoloji çipler üzerindeki artan ihracat kontrolleri yüzünden karşı karşıya olduğu kısıtlamalar göz önüne alındığında daha da dikkat çekici. R1'in ve son Huawei 5G telefon modellerinin piyasaya sürülmesi, ABD'nin ihracat kontrollerinin amaçlandığı gibi çalışmadığını düşündürüyor. Zira yaptırımlar, Çin'in yeteneklerini zayıflatmaktan ziyade verimliliğe, kaynak havuzunu ve iş birliğini geliştirmeye odaklanarak DeepSeek gibi laboratuvarlar kurmasını sağlamış olabilir.

Yenilikçi yöntemlere başvurdu

MIT Technology Review'a konuşan DeepSeek çalışanı ve Northwestern Üniversitesi'nde bilgisayar bilimi alanında doktora öğrencisi Zihan Wang, Çin'in yaptırımlara karşı yenilikçi yollara başvurmak zorunda kaldığını söylüyor.

Buna göre DeepSeek, R1 modelini oluşturmak için eğitim sürecini yeniden düzenlemek zorunda kaldı. Çünkü çip firması Nvidia'nın Çin pazarı için satmaya izinli olduğu çiplerin performansı, şirketin en iyi ürünlerinin hızının yarısı kadar ediyor. Bu yüzden Çin, Nvidia'dan satın aldığı grafik işlem birimleri (GPU) üzerindeki yükü azaltmak için eğitim sürecini düzenledi.

Diğer bir deyişle, ABD ihracat kontrolleri, R1 geliştiricilerini hesaplama gücü eksikliklerini telafi etmek için daha akıllı, daha enerji verimli algoritmalar oluşturmaya zorladı. ChatGPT'nin eğitim verilerini işlemek için 10.000 Nvidia GPU'ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor.

DeepSeek R1, araştırmacılar tarafından özellikle matematik ve kodlamada karmaşık muhakeme görevlerini yerine getirme becerisiyle övülüyor. Model, o1 tarafından kullanılana benzer bir "düşünce zinciri" yaklaşımı kullanıyor ve bu da sorguları adım adım işleyerek sorunları çözmesine olanak tanıyor.

Microsoft'un AI Frontiers araştırma laboratuvarının baş araştırmacısı Dimitris Papailiopoulos, R1'de kendisini en çok şaşırtan şeyin "mühendislikteki basitlik" olduğunu söylüyor.

"DeepSeek, her mantıksal adımı ayrıntılandırmak yerine doğru yanıtları hedefledi ve yüksek düzeyde etkinliği korurken hesaplama süresini önemli ölçüde azalttı."
Programın ardındaki deha: Liang Wenfeng

Çin'in Hangzhou kentindeki şirket, Temmuz 2023'te bilgi ve elektronik mühendisliği geçmişine sahip Zhejiang Üniversitesi mezunu Liang Wenfeng tarafından kuruldu. Liang'ın 2015'te kurduğu bir fon olan High-Flyer'ın kuluçka programında yer aldı. Liang da sektörün diğer ileri gelen isimleri gibi, çeşitli görevlerde insanlara yetişebilen veya onları geçebilen "yapay genel zeka" seviyesine ulaşmayı hedefliyor.

Ayrıca, ABD'den beklenen yaptırımlardan çok önce Liang, şu anda Çin'e ihracatı yasaklanmış bir tür olan Nvidia A100 çiplerinden önemli miktarda stok satın aldı. Çinli medya kuruluşu 36Kr, şirketin stoklarında 10.000'den fazla birim olduğunu tahmin ediyor. Bazıları bu rakamın 50.000 olduğunu söylüyor.

Bu stokun yapay zeka eğitimi açısından önemini fark eden Liang, DeepSeek'i kurdu ve modellerini geliştirmek için bunları düşük güçteki çiplerle birlikte kullanmaya başladı. Alibaba ve ByteDance gibi teknoloji devleri ve zengin yatırımcılara sahip bir avuç girişim, Çin'in yapay zeka sektöründe hakim konumda. Bu da DeepSeek gibi şirketin nadir görülebileceği anlamına geliyor. Eski DeepSeek çalışanı Zihan Wang, MIT Technology Review'a DeepSeek'te çalışırken bol miktarda bilgi işlem kaynağına erişebildiğini ve deneme özgürlüğüne sahip olduğunu söyledi ve bunu, "herhangi bir şirkette çok az yeni mezunun elde edebileceği bir lüks" diye niteledi.

Liang ise Temmuz 2024'te Çin medya kuruluşu 36Kr ile yaptığı bir röportajda, "Çinli şirketlerin çip yaptırımlarına ek olarak karşılaştıkları ayrı bir zorluk da yapay zeka mühendisliği tekniklerinin daha az verimli olması," demişti. "Biz aynı sonuçları elde etmek için iki kat daha fazla bilgi işlem gücü tüketmek zorundayız. Veri verimliliğindeki boşluklarla birleştiğinde, bu dört kata kadar daha fazla bilgi işlem gücüne ihtiyaç duyulması anlamına gelebilir. Amacımız bu boşlukları sürekli olarak kapatmak."

Ancak DeepSeek, doğruluktan önemli ölçüde ödün vermeden bellek kullanımını azaltmanın ve hesaplamayı hızlandırmanın yollarını buldu. Wang, "Ekip, donanımsal zorluğu inovasyon için bir fırsata dönüştürmeyi seviyor," diyor. Carnegie Endowment for International Peace'de bir yapay zeka araştırmacısı olan Matt Sheehan, "ABD'nin ihracat kontrolleri, Çinli şirketleri sınırlı bilgi işlem kaynaklarıyla çok daha verimli olmak zorunda kalacakları bir konuma sıkıştırdı" ifadelerini kullanıyor.

"Muhtemelen gelecekte bilgi işlem eksikliğiyle ilgili çok fazla işbirliği göreceğiz." Diğer yapay zeka araçlarını gerçekten geçti mi?

Bağımsız araştırmacıların kıyaslama testlerinde, ilk modellerden biri olan DeepSeek-V3, OpenAI'nin GPT-4o ve Anthropic'in Claude Sonnet 3.5'inin yetenekleriyle eşleşmiş, Meta'nın Llama 3.1 ve Alibaba'nın Qwen2.5 gibi diğer modellerini problem çözme, kodlama ve matematik içeren görevlerde geride bırakmıştı. Livescience'a göre 20 Ocak'ta yayınlanan R1 ise aynı testlerin çoğunda ChatGPT'nin en son modeli o1'i de geçti. Diğer modellerin maliyetinin çok daha az bir kısmıyla başarılan bu etkileyici performans, modelin yarı açık kaynaklı yapısı ve önemli ölçüde daha az GPU üzerinde eğitilmiş olmasıyla birlikte yapay zeka uzmanlarını hayrete düşürüyor.

OpenAI'nin stratejik ortağı Microsoft'un CEO'su Satya Nadella, 22 Ocak'ta Dünya Ekonomik Forumu'nda yaptığı açıklamada, "Çin'deki gelişmeleri çok ama çok ciddiye almalıyız," dedi. Öte yandan bu yeni modelin ne kadarının yararlı bilimsel ve teknik uygulamalara dönüşeceği veya DeepSeek'in modelini kıyaslama testlerinde başarılı olacak şekilde kasten eğitip eğitmediği henüz belli değil.

Bilim insanları ve yapay zeka yatırımcıları gelişmeleri yakından izliyor.


Facebook'ta paylaş   |   Twitter'da paylaş


 | Puan: Henüz oy verilmedi / 0 Oy | Yazdırılabilir SayfaYazdır

Yorumlar


Henüz Yorum Yazılmamış

Yorum Yazın



KalınİtalikAltçizgiliLink  
Simge Ekle

    

    

    

    







İşçiyi Bırak Kutlasın
Erişim engeli sonrası X'te Ekrem İmamoğlu akımı
Papa Françesko yaşamını yitirdi.
Yunanistan Türk yatırımcıların adalara ilgisinden endişeli
Avrupa Konseyi Parlamenter Meclisi'den Avrupa'ya İmamoğlu ile dayanışma çağrısı

Güney Çin Denizi: Süregelen Rekabetin Arenası
Trump’ın yardım kesintileri 14 milyon kişiyi öldürecek.
Hint - Pasifik'teki Güç Oyunları: Dörtlü İttifak ve Deniz Hakimiyeti İçin Mücadele
Suriye, Irak ve İran'daki PKK uzantıları ne olacak?
Hindistan-Pakistan Savaşı Senaryosu

Trump: Çin'den ithal edilen mallara uygulanan gümrük vergisi oranı % 125'e çıkarılacak
Trump yeni gümrük vergisi tarifelerini açıkladı.
Avrupa’nın en az et yiyen ülkesi Türkiye: Fiyatlar 5 yılda % 1230 arttı!
Türkiye'de ekonomi bir kez daha belirsizlik döneminde
ABD-Çin hattında ticaret savaşı: “Soğuk Savaş’tan beri görülmemiş bir rekabet”

Avrupa gözünü ABD'li akademisyenlere dikti.
Türkiye'de Covid-19 salgını yaşam süresini azalttı.
Uzmanlar uyardı: "Uzun yaşayanlardan tavsiye almayın"
Fahri Kiamil
İki annenin başlattığı akıllı telefon karşıtı hareket çığ gibi büyüdü

Osman Hamdi Bey’i bilmeyen varsa bile herhalde Kaplumbağa Terbiyecisi’ni bilmeyen yoktur ya “Mihrap” tablosu...
JAK İHMALYAN'DAN: “RESİM ANLAYIŞIM”
Jak İhmalyan sergisi İstanbul'da
MADELEİNE RİFFAUD, 1924-2024
KOLLEKTİF OYNAMALI KAZANMAK İÇİN

Yapay Zeka Felsefesi
Tutunarak kalmak mı? Bulanmadan donmadan akmak mı?
Tokyo’dan Hasanlar’a, Kudüs’te bir mahkemeden bizim buralara…
“KADERİMİZ DIŞARDAN YAZILAMAZ - DIŞARI KADERİ BELİRLEYEMEZ…”
Niyetime İlham

Yeryüzünü fırına çeviren atmosfer olayı: Isı kubbesi
Dünyanın hareket halindeki en eski buzdağlarından biri yaban hayatı cenneti ile çarpışabilir
Yarasaların azalmasıyla bebek ölümlerinin ilişkili olduğu ortaya çıktı.
AB İklim İzleme Servisi: 2024 yazı kaydedilen en sıcak yaz oldu.
Akdeniz'deki yaşam yok oluşun eşiğine gelmiş.

500 yıllık Da Vinci çizimi sessiz drone teknolojisine ilham verdi.
Çin, HDMI ve DisplayPort alternatifini piyasaya sürdü.
Telefonlar depremi 30 saniye önce bildirdi…
Çin'den gövde gösterisi: Yarı maratonda robotlar insanlarla yarıştı…
Çin'in 10 yıllık yüksek teknoloji planı nasıl işledi?

NASA'nın en kuvvetli teleskobu, evrendeki beklenmedik gelişmeyi ortaya koydu.
İncil'de sözü edilen mistik ağaç 1000 yıllık tohumla yeniden yetiştirildi.
Karıncaların 66 milyon yıldır tarım yaptığı ortaya çıktı.
Antik Mısır'daki popüler masa oyununun şaşırtıcı kökenleri ortaya çıktı.
At binmenin kökenine dair ezber bozuldu.

UNICEF raporunda Türkiye'deki çocuklar son sıralarda
AP'den Türkiye'ye sert mesaj: Kriterler müzakere edilemez
Af Örgütü: Türkiye'de yargıya müdahale derinleşti
"Türkiye'de gazeteciler baskı ve yıldırma ile karşı karşıya"
Uluslararası Şeffaflık Örgütü tarafından 2024 yılı yolsuzluk algı endeksi açıklandı!

BABAM
YAZ-IN SÖZLÜ TARİHLE YAZ-IN SÖZLÜ TARİHLE YÜRÜMEK
İKİ DİRENİŞ
Bu sistemdeki bir kusur değil, sistemin kendisi
Post-truth dünyada adalet nedir?

LOZAN (Lousanne)
KORE...
DOĞUM ORANI
İKNA YETENEĞİ
ATMA RECEP

Mimar Sinan: Bir Dehanın Yükselişi ve Osmanlı Mimarisinin Zirvesi
İskandinav Göçleri ve Vikinglerin Avrupa Üzerindeki Etkisi
Hümanizm Nedir?
Osmanlı’da kahve kültürü, Osmanlı’da kahve isimleri..
Amerika’da Ayrımcı Politikalar ve Siyahi Mücadele Tarihi


kose yazarlari En Cok Okunanlar
Son 30 günde en çok okunanlar
En Cok Okunanlar










Basa git