A Yorum
  Acilis Sayfasi Yap Sik Kullanilanlara Ekle  

   
A yorum Kurum
iletisim
login
yayin ilkeleri...



yazi dizileri

Yazı karekteri : (+) Büyük | (-) Küçük

DeepSeek: Çin 'dünyayı sarsacak' yapay zeka modeli üretti

Kategori Kategori: Yapay Zeka | Yorumlar 0 Yorum | 26 Ocak 2025 15:45:26

ChatGPT'nin eğitim verilerini işlemek için 10.000 Nvidia GPU'ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor. Çinli yapay zeka laboratuvarı DeepSeek’in kendi adını taşıyan büyük dil modeli (LLM), ABD'li OpenAI firmasının ChatGPT'sinin en büyük rakiplerinden biri haline gelirken, Silikon Vadisi'ni şaşkınlığa uğrattı.

Bu ay yayınlanan DeepSeek hem son derece hızlı hem de az maliyetle geliştirildi. OpenAI ve Google gibi önemli oyuncuların yapay zeka modellerine eğitim verileri sağlayan ScaleAI firmasının CEO'su Alexandr Wang, perşembe günü İsviçre’nin Davos kentinde düzenlenen Dünya Ekonomik Forumu’nda (WEF) yaptığı konuşmada DeepSeek'in ürününü "dünyayı sarsacak bir model" diye niteledi.



Çinli teknoloji laboratuvarı, ilk modelinin ardından güçlü muhakeme yeteneğine odaklanan DeepSeek-R1 adlı diğer modelini de yayınladı. Bu model de OpenAI'ın yakın zamanda piyasaya sürdüğü o1 ile rekabet halinde.

Üstelik bu denli güçlü bir araç olmasına rağmen DeepSeek-R1 büyük ölçüde açık kaynaklı olarak yayınlandı. Yani isteyen herkes aracın kodlarına erişebiliyor ve bu kodları kullanarak LLM'i kişiselleştirebiliyor. Eğitim verileri ise patentli. Öte yandan OpenAI, o1 modelini kapalı olarak piyasaya sürmüştü ve halihazırda sadece kullanıcılara bile aylık 200 dolarlık paketle satıyor.

Bu arada uzmanlar, Çin'in ABD ihracat kontrollerine çip satışı yasaklarına rağmen nasıl kısa sürede böyle güçlü bir model geliştirebildiğini tartışıyor.

R1'in sırrı ne? Yapay zeka topluluğu R1'in OpenAI'ın o1'ine birçok önemli ölçüt açısından eşit olduğunu, hatta bazı metriklerde onu geçtiğini, ancak maliyetinin çok daha düşük olduğunu söylüyor. Emory Üniversitesi'nde bilgi sistemleri alanında öğretim ütesi Hancheng Cao, MIT Technology Review dergisine verdiği röportajda, "Bu, özellikle Küresel Güney'deki sınırlı kaynaklara sahip araştırmacılar ve geliştiriciler için harika bir eşitleyici atılım olabilir," diyor.

DeepSeek'in başarısı, Çinli yapay zeka şirketlerinin ABD'nin son teknoloji çipler üzerindeki artan ihracat kontrolleri yüzünden karşı karşıya olduğu kısıtlamalar göz önüne alındığında daha da dikkat çekici. R1'in ve son Huawei 5G telefon modellerinin piyasaya sürülmesi, ABD'nin ihracat kontrollerinin amaçlandığı gibi çalışmadığını düşündürüyor. Zira yaptırımlar, Çin'in yeteneklerini zayıflatmaktan ziyade verimliliğe, kaynak havuzunu ve iş birliğini geliştirmeye odaklanarak DeepSeek gibi laboratuvarlar kurmasını sağlamış olabilir.

Yenilikçi yöntemlere başvurdu

MIT Technology Review'a konuşan DeepSeek çalışanı ve Northwestern Üniversitesi'nde bilgisayar bilimi alanında doktora öğrencisi Zihan Wang, Çin'in yaptırımlara karşı yenilikçi yollara başvurmak zorunda kaldığını söylüyor.

Buna göre DeepSeek, R1 modelini oluşturmak için eğitim sürecini yeniden düzenlemek zorunda kaldı. Çünkü çip firması Nvidia'nın Çin pazarı için satmaya izinli olduğu çiplerin performansı, şirketin en iyi ürünlerinin hızının yarısı kadar ediyor. Bu yüzden Çin, Nvidia'dan satın aldığı grafik işlem birimleri (GPU) üzerindeki yükü azaltmak için eğitim sürecini düzenledi.

Diğer bir deyişle, ABD ihracat kontrolleri, R1 geliştiricilerini hesaplama gücü eksikliklerini telafi etmek için daha akıllı, daha enerji verimli algoritmalar oluşturmaya zorladı. ChatGPT'nin eğitim verilerini işlemek için 10.000 Nvidia GPU'ya ihtiyaç duyduğu düşünülüyor. DeepSeek mühendisleri sadece 2.000 GPU ile benzer sonuçlara ulaştıklarını söylüyor.

DeepSeek R1, araştırmacılar tarafından özellikle matematik ve kodlamada karmaşık muhakeme görevlerini yerine getirme becerisiyle övülüyor. Model, o1 tarafından kullanılana benzer bir "düşünce zinciri" yaklaşımı kullanıyor ve bu da sorguları adım adım işleyerek sorunları çözmesine olanak tanıyor.

Microsoft'un AI Frontiers araştırma laboratuvarının baş araştırmacısı Dimitris Papailiopoulos, R1'de kendisini en çok şaşırtan şeyin "mühendislikteki basitlik" olduğunu söylüyor.

"DeepSeek, her mantıksal adımı ayrıntılandırmak yerine doğru yanıtları hedefledi ve yüksek düzeyde etkinliği korurken hesaplama süresini önemli ölçüde azalttı."
Programın ardındaki deha: Liang Wenfeng

Çin'in Hangzhou kentindeki şirket, Temmuz 2023'te bilgi ve elektronik mühendisliği geçmişine sahip Zhejiang Üniversitesi mezunu Liang Wenfeng tarafından kuruldu. Liang'ın 2015'te kurduğu bir fon olan High-Flyer'ın kuluçka programında yer aldı. Liang da sektörün diğer ileri gelen isimleri gibi, çeşitli görevlerde insanlara yetişebilen veya onları geçebilen "yapay genel zeka" seviyesine ulaşmayı hedefliyor.

Ayrıca, ABD'den beklenen yaptırımlardan çok önce Liang, şu anda Çin'e ihracatı yasaklanmış bir tür olan Nvidia A100 çiplerinden önemli miktarda stok satın aldı. Çinli medya kuruluşu 36Kr, şirketin stoklarında 10.000'den fazla birim olduğunu tahmin ediyor. Bazıları bu rakamın 50.000 olduğunu söylüyor.

Bu stokun yapay zeka eğitimi açısından önemini fark eden Liang, DeepSeek'i kurdu ve modellerini geliştirmek için bunları düşük güçteki çiplerle birlikte kullanmaya başladı. Alibaba ve ByteDance gibi teknoloji devleri ve zengin yatırımcılara sahip bir avuç girişim, Çin'in yapay zeka sektöründe hakim konumda. Bu da DeepSeek gibi şirketin nadir görülebileceği anlamına geliyor. Eski DeepSeek çalışanı Zihan Wang, MIT Technology Review'a DeepSeek'te çalışırken bol miktarda bilgi işlem kaynağına erişebildiğini ve deneme özgürlüğüne sahip olduğunu söyledi ve bunu, "herhangi bir şirkette çok az yeni mezunun elde edebileceği bir lüks" diye niteledi.

Liang ise Temmuz 2024'te Çin medya kuruluşu 36Kr ile yaptığı bir röportajda, "Çinli şirketlerin çip yaptırımlarına ek olarak karşılaştıkları ayrı bir zorluk da yapay zeka mühendisliği tekniklerinin daha az verimli olması," demişti. "Biz aynı sonuçları elde etmek için iki kat daha fazla bilgi işlem gücü tüketmek zorundayız. Veri verimliliğindeki boşluklarla birleştiğinde, bu dört kata kadar daha fazla bilgi işlem gücüne ihtiyaç duyulması anlamına gelebilir. Amacımız bu boşlukları sürekli olarak kapatmak."

Ancak DeepSeek, doğruluktan önemli ölçüde ödün vermeden bellek kullanımını azaltmanın ve hesaplamayı hızlandırmanın yollarını buldu. Wang, "Ekip, donanımsal zorluğu inovasyon için bir fırsata dönüştürmeyi seviyor," diyor. Carnegie Endowment for International Peace'de bir yapay zeka araştırmacısı olan Matt Sheehan, "ABD'nin ihracat kontrolleri, Çinli şirketleri sınırlı bilgi işlem kaynaklarıyla çok daha verimli olmak zorunda kalacakları bir konuma sıkıştırdı" ifadelerini kullanıyor.

"Muhtemelen gelecekte bilgi işlem eksikliğiyle ilgili çok fazla işbirliği göreceğiz." Diğer yapay zeka araçlarını gerçekten geçti mi?

Bağımsız araştırmacıların kıyaslama testlerinde, ilk modellerden biri olan DeepSeek-V3, OpenAI'nin GPT-4o ve Anthropic'in Claude Sonnet 3.5'inin yetenekleriyle eşleşmiş, Meta'nın Llama 3.1 ve Alibaba'nın Qwen2.5 gibi diğer modellerini problem çözme, kodlama ve matematik içeren görevlerde geride bırakmıştı. Livescience'a göre 20 Ocak'ta yayınlanan R1 ise aynı testlerin çoğunda ChatGPT'nin en son modeli o1'i de geçti. Diğer modellerin maliyetinin çok daha az bir kısmıyla başarılan bu etkileyici performans, modelin yarı açık kaynaklı yapısı ve önemli ölçüde daha az GPU üzerinde eğitilmiş olmasıyla birlikte yapay zeka uzmanlarını hayrete düşürüyor.

OpenAI'nin stratejik ortağı Microsoft'un CEO'su Satya Nadella, 22 Ocak'ta Dünya Ekonomik Forumu'nda yaptığı açıklamada, "Çin'deki gelişmeleri çok ama çok ciddiye almalıyız," dedi. Öte yandan bu yeni modelin ne kadarının yararlı bilimsel ve teknik uygulamalara dönüşeceği veya DeepSeek'in modelini kıyaslama testlerinde başarılı olacak şekilde kasten eğitip eğitmediği henüz belli değil.

Bilim insanları ve yapay zeka yatırımcıları gelişmeleri yakından izliyor.


Facebook'ta paylaş   |   Twitter'da paylaş


 | Puan: Henüz oy verilmedi / 0 Oy | Yazdırılabilir SayfaYazdır

Yorumlar


Henüz Yorum Yazılmamış

Yorum Yazın



KalınİtalikAltçizgiliLink  
Simge Ekle

    

    

    

    







'Büyük Osmanlı Soygunu': 10 maddede Eric Adams davası…
İSTİHAB HADDİ
Türbülans vakaları iklim değişikliği etkisi mi?
Dünyanın gözü kulağı Ortadoğuda: İran-İsrail gerilimi tırmanıyor.
İsrail, Gazze'de yardım konvoyunu hedef aldı: Biri Avustralyalı 7 kişi öldürüldü

ABD'de Suriye'den asker çekme hazırlıkları başladı.
Trump'ın Gazze'nin kontrolünü alma planı ve tepkiler
Kaliforniya, ABD'den ayrılmak için ilk adımı attı
Trump Grönland ve Panama Kanalı'nı neden istiyor?
Esnafa konum vergisi: Bu da, 'haritayı kullandın' parası

Türkiye işçiler için bir cehennem
İkinci Trump dönemi: Küresel ekonomi nasıl etkilenecek?
AB, çoğunluk sağlanamamasına rağmen Çinli elektrikli araçlara ek gümrük vergisini onayladı.
Türkiye'de ekonomi politikaları konkordato ve iflasları patlattı.
Türkiye'de açlık sınırı 20 bin TL'ye dayandı

Türkiye'de Covid-19 salgını yaşam süresini azalttı.
Uzmanlar uyardı: "Uzun yaşayanlardan tavsiye almayın"
Fahri Kiamil
İki annenin başlattığı akıllı telefon karşıtı hareket çığ gibi büyüdü
Afganistan'da onlarca arkeolojik alan buldozerle yıkılarak yağmaya açıldı.

MADELEİNE RİFFAUD, 1924-2024
KOLLEKTİF OYNAMALI KAZANMAK İÇİN
Oxford Sözlüğü yılın kelimesini seçti: Beyin çürümesi
"İNEK BAYRAMI" ekitap
Dünya tarihini şekillendiren 6 içecek türü

Tutunarak kalmak mı? Bulanmadan donmadan akmak mı?
Tokyo’dan Hasanlar’a, Kudüs’te bir mahkemeden bizim buralara…
“KADERİMİZ DIŞARDAN YAZILAMAZ - DIŞARI KADERİ BELİRLEYEMEZ…”
Niyetime İlham
KİBİRLİ GÜÇ ZEHİR - ERDEMLİ BİLİM PANZEHİR

Dünyanın hareket halindeki en eski buzdağlarından biri yaban hayatı cenneti ile çarpışabilir
Yarasaların azalmasıyla bebek ölümlerinin ilişkili olduğu ortaya çıktı.
AB İklim İzleme Servisi: 2024 yazı kaydedilen en sıcak yaz oldu.
Akdeniz'deki yaşam yok oluşun eşiğine gelmiş.
Su üzerindeki iklim değişikliği baskısı Türkiye'yi su fakiri olmaya sürüklüyor.

Devrimsel Bir Teknoloji: Kaykay Şasi
Türkiye, kişisel verileri en çok sızdırılan 19.ülke
Apple otomobili ABD'de üretime bir adım daha yaklaştı.
Yaşgünün Kutlu Olsun James Webb Uzay Teleskobu
Su ve deterjan olmadan çalışan bir çamaşır makinesi

NASA'nın en kuvvetli teleskobu, evrendeki beklenmedik gelişmeyi ortaya koydu.
İncil'de sözü edilen mistik ağaç 1000 yıllık tohumla yeniden yetiştirildi.
Karıncaların 66 milyon yıldır tarım yaptığı ortaya çıktı.
Antik Mısır'daki popüler masa oyununun şaşırtıcı kökenleri ortaya çıktı.
At binmenin kökenine dair ezber bozuldu.

Türkiye OECD’de gelir eşitsizliğinin en yüksek olduğu 4. ülke
2023 yılında Türkye’de çocukların cinsel istismarı hakkında 40.000'den fazla dosya açıldı.
Çalışanların geliri son 20 yılda azaldı.
Türkiye’den göç eden Türklerin sayısında 5 yılda %243 artış
BM: Dünya nüfusu 2084'ten itibaren gerileyecek

Madeleine Riffaud est partie
GELDİKLERİ GİBİ GİDERLER
JOYCE BLAU, 18 Mart 1932-24 Ekim 2024
HIZLANAN TARİH
DERTLİ-MİR-DÖNE

KRAL ÇIPLAK
2024 YILI İCMALİ
ARABIN ZEKERİ
SADAKAT
RENK CÜMBÜŞÜ

Mimar Sinan: Bir Dehanın Yükselişi ve Osmanlı Mimarisinin Zirvesi
İskandinav Göçleri ve Vikinglerin Avrupa Üzerindeki Etkisi
Hümanizm Nedir?
Osmanlı’da kahve kültürü, Osmanlı’da kahve isimleri..
Amerika’da Ayrımcı Politikalar ve Siyahi Mücadele Tarihi


kose yazarlari En Cok Okunanlar
Son 30 günde en çok okunanlar
En Cok Okunanlar










Basa git