Çin’den yeni yapay zeka hamlesi

Çinli e-ticaret ve teknoloji grubu Alibaba, yapay zeka modeli Qwen3’ün açık kaynaklı versiyonunu piyasaya sürdü.

AA’nın aktardığına göre modeli şirketin bulut bilişim birimi Alibaba Cloud geliştirdi.

‘Qwen3-Next-80B-A3B’ adlı model hakkındaki notta, önceki versiyonu ‘Qwen3-32B’den 10 kat ucuza eğitildiği, buna karşın 10 kat daha güçlü işlem yapabildiği belirtildi.

Sınırlı işlemci, yüksek performans

80 milyar parametreli model, sınırlı işlemci gücü ve sağladığı yüksek performansla yapay zekanın yaygın kullanımını daha etkin hale getirebilir.

Şirket, Qwen-3’ün akıl yürütme modelini de Next mimarisiyle güncelledi.

Çin’in yeni modeli Gemini’dan daha iyi performans gösterdi

‘Qwen3-Next-80B-A3B-Thinking’ adı verilen model, bağımsız testlerde çok sayıda alanda önceki versiyonuna kıyasla Google’ın ‘Gemini-2.5-Flash-Thinking’den daha iyi performans gösterdi.

Qwen3’ün akıl yürütme modeli, daha önce yapılan testlerde ABD’li yapay zeka şirketi OpenAI’ın o1 ve Çinli yapay zeka şirketi DeepSeek’in R1 modellerini yakalayan veya aşan performanslar göstermişti.

Alibaba, 600 milyondan 235 milyara kadar parametreye sahip sekiz gelişmiş yapay zeka modelinden oluşan Qwen3 ailesini nisanda piyasaya sürmüştü.

Şirket, bugüne kadarki en büyük modeli 1 trilyon parametreli ‘Qwen3-Max-Preview’ modelini de 8 Eylül’de kullanıma açmıştı.

Model, California Üniversitesinin yapay zeka değerlendirme platformu LMArena’da ‘metin çözümleme’ alanında 6’ncı sırada yer almıştı.

Bir yapay zeka modelinin parametre sayısındaki artış, modelin veri kapasitesini yükseltse de hem verileri işlemek için gereken bilgisayar gücü ihtiyacını hem maliyetleri de artırıyor.

Yapay zeka: Çin ile ABD arasında bayrak yarışı sürüyor

Bu yıl Çinli iki şirket açık kaynaklı modeller arasında üstünlük sağlamıştı.

Çin’de High-Flyer Quant yatırım fonunun desteklediği DeepSeek, diğer yapay zeka şirketlerine kıyasla düşük maliyetle ve az sayıda çip kullanarak açık kaynaklı yeni modeli R1’i geliştirmiş, 20 Ocak’ta da piyasaya sürmüştü.

Kısa sürede yoğun ilgi gören bu yapay zeka modeli, uygulama mağazalarında ABD merkezli ChatGPT’yi de geride bırakarak en fazla indirilen yapay zeka uygulaması olmuştu.

DeepSeek’in yapay zeka modelinin ABD’de büyük yatırımlarla geliştirilen muadillerinden çok daha düşük bütçeyle daha iyi performans sergilemesi, teknoloji dünyasında sarsıntıya yol açmış ve teknoloji hisseleri düşmüştü.

Demokrat Gündem

Exit mobile version