Google’ın duyurusunun donanım ihtiyacını azaltması beklenmiyor Hakan Kaplan 2 Nisan 2026 Posted in Ekonomi Google tarafından duyurulan ve yapay zeka dünyasında teknik bir devrim olarak nitelendirilen TurboQuant uygulaması sonrası RAM üreten şirketlerin hisselerinde yaşanan büyük düşüşler tüm dünyada tartışılmaya devam ediyor. Büyük yapay zeka modellerinin bellek kullanımını 6 kat azaltması beklenen algoritma ile devasa sistemlerin daha yüksek performansla çalışması bekleniyor. SETA araştırmacısı ve ETAI Direktörü Dr. Gloria Shkurti Özdemir, Google’ın “TurboQuant” duyurusu etrafında oluşan spekülasyonların önemli bir kısmının teknik içeriğin tam olarak anlaşılmamasından olduğu kadar Cloudflare Üst Yöneticisi (CEO) Matthew Prince gibi etkili isimlerin bunu “Google’ın DeepSeek anı” olarak nitelendirmesi gibi abartılı kıyaslamalardan ve piyasa mekanizmalarının bu sinyallere aşırı duyarlılığından kaynaklandığını söyledi. TurboQuant’ın donanım ihtiyacını ortadan kaldıran bir teknoloji değil, büyük dil modellerinde çıkarım sırasında oluşan KV önbelleğini (key-value cache) optimize etmeye yönelik bir vektör kuantizasyon algoritması olduğunun altını çizen Özdemir, “Modelin tamamını değil, bağlam bilgisini geçici olarak depolayan bu önbelleği hedef alır. Bellek gereksinimlerini 6 kat azaltan bir teknolojinin harcamaları da aynı oranda azaltacağı varsayımı ise temelsizdir, zira bellek, veri merkezinin yalnızca bir bileşenidir. Kuantizasyon teknikleri, modellerin daha düşük bit hassasiyetiyle çalışmasını sağlayarak hem inference (çıkarım) maliyetlerini düşürür hem de bellek kullanımını optimize eder. Bu yaklaşım yeni değil, ancak Google’ın burada yaptığı şey bu süreci daha agresif ve verimli hale getirmek.” ifadelerini kullandı. “RAM üreticilerinin hisselerindeki düşüş biraz abartılı” Gloria Shkurti Özdemir, piyasadaki sert reaksiyonun özellikle de RAM üreticilerinin hisselerindeki düşüşün bu noktada biraz abartılı ve kısa vadeli bir yorum olarak değerlendirilebileceğine dikkati çekerek, “Çünkü bu tür teknolojiler ‘daha az donanım ihtiyacı’ anlamına gelmez. Daha doğru bir ifadeyle ‘aynı donanımla daha fazla iş yapılabilmesi’ anlamına gelir. Bu da uzun vadede genellikle talebi azaltmaz, aksine genişletir.” diye konuştu. Özdemir, sözlerini şöyle sürdürdü: Burada kritik olan daha yapısal bir nokta var, yapay zeka piyasaları şu anda çok yüksek beklentiler ve narratifler üzerinden hareket eden, oldukça hassas bir yapıya sahip. Bunu yakın zamanda DeepSeek’in model duyurusunda da gördük ve şimdi TurboQuant ile benzer bir durum tekrarlandı. Teknik gelişmenin kendisinden ziyade, piyasa bu gelişmeleri ‘mevcut iş modellerini veya donanım talebini nasıl etkiler?’ sorusu üzerinden fiyatlıyor. Bu da özellikle yarı iletken ve bellek gibi sektörlerde orantısız ve ani fiyat hareketlerine yol açabiliyor. Ayrıca şunu da vurgulamak önemli, yapay zeka tarafında sürekli ilerleme var, ancak piyasanın beklentisi genelde büyük, paradigma değiştirici sıçramalar yönünde. Bu nedenle bu tür duyurular, gerçek etkilerinden bağımsız olarak, ‘büyük kırılma olabilir’ algısını tetikleyerek kısa vadeli volatilite yaratıyor. Dünyada uzun zamandır devam eden RAM krizi ile ilgili bilgiler veren Özdemir, krizin tek bir nedene indirgenemeyecek kadar çok katmanlı bir mesele olduğunu belirtti. Özdemir, bunun en temel nedenlerden birinin yapay zeka uygulamalarının ve özellikle büyük dil modellerinin hızla yaygınlaşmasıyla birlikte bellek talebinde yaşanan keskin artış olduğuna değinerek, “Bu sistemler yalnızca işlem gücü değil, aynı zamanda yüksek bant genişliğine sahip bellek gerektiriyor ve bu da mevcut üretim kapasitesi üzerinde ciddi bir baskı oluşturuyor.” dedi. Bunun yanında yarı iletken üretiminin son derece maliyetli ve esnekliği sınırlı bir alan olduğuna vurgu yapan Özdemir, şöyle devam etti: “Yeni üretim

