Home Teknoloji Yapay zeka şirketleri ‘küçük’ dil modellerinden büyük kar elde ediyor

Yapay zeka şirketleri ‘küçük’ dil modellerinden büyük kar elde ediyor

20
0

Ücretsiz güncellemelerden haberdar olun

Üretken yapay zeka ürünlerini güçlendirmek için büyük dil modelleri olarak adlandırılan modelleri oluşturmak için milyarlarca dolar harcayan yapay zeka şirketleri, artık gelirlerini artırmak için yeni bir yola yöneliyor: küçük dil modelleri.

Apple, Microsoft, Meta ve Google yakın zamanda daha az “parametreye” (bir yapay zeka sistemini eğitmek ve çıktısını şekillendirmek için kullanılan değişken sayısı) sahip ancak yine de güçlü yeteneklere sahip yeni yapay zeka modelleri yayınladı.

Bu hamleler, teknoloji gruplarının, OpenAI’nin ChatGPT’si gibi popüler sohbet robotlarının temelini oluşturan teknoloji türü olan büyük dil modellerini çalıştırmak için gereken maliyetler ve bilgi işlem gücü konusunda endişeleri olan işletmeler tarafından yapay zekanın benimsenmesini teşvik etme çabasıdır.

Genel olarak parametre sayısı ne kadar yüksek olursa, yapay zeka yazılımının performansı o kadar iyi olur ve görevleri de o kadar karmaşık ve incelikli olabilir. Her ikisi de bu hafta duyurulan OpenAI’nin en son modeli GPT-4o ve Google’ın Gemini 1.5 Pro’nun 1 trilyondan fazla parametreye sahip olduğu tahmin ediliyor ve Meta, açık kaynaklı Llama modelinin 400 milyar parametreli bir versiyonunu eğitiyor.

Bazı kurumsal müşterileri, üretken yapay zeka ürünlerini çalıştırmak için gereken büyük meblağları ödemeye ikna etme çabasının yanı sıra, benimsemeyi engelleyen veri ve telif hakkı yükümlülüğüne ilişkin endişeler de mevcut.

Bu, Meta ve Google gibi teknoloji gruplarının, eğitmek ve çalıştırmak için daha az güç gerektiren, aynı zamanda hassas verileri de sınırlayabilen, daha ucuz, enerji tasarruflu, özelleştirilebilir alternatifler olarak yalnızca birkaç milyar parametreli küçük dil modelleri sunmalarına yol açtı.

Eric Boyd, “Bu kadar çok kaliteyi daha düşük bir maliyet noktasında elde ederek, aslında müşterilerin çok daha fazla uygulamaya girip, bu yatırımdan gerçekten bunu yapmayı haklı çıkaracak kadar yeterli getirisi olmayan şeyler yapmalarını sağlıyorsunuz” dedi. İşletmelere yapay zeka modelleri satan Microsoft’un Azure Yapay Zeka Platformu’nun kurumsal başkan yardımcısı.

Google, Meta, Microsoft ve Fransız start-up Mistral da ilerleyen yetenekleri gösteren ve belirli uygulamalara daha iyi odaklanabilen küçük dil modelleri yayınladı.

Meta’nın küresel ilişkiler başkanı Nick Clegg, Llama 3’ün yeni 8 milyar parametreli modelinin GPT-4 ile karşılaştırılabilir olduğunu söyledi. “Sanırım aklınıza gelebilecek hemen hemen her ölçümde üstün performansı görüyorsunuz” dedi. Microsoft, 7 milyar parametreli Phi-3-small modelinin, OpenAI modelinin önceki bir sürümü olan GPT-3.5’ten daha iyi performans gösterdiğini söyledi.

Küçük modeller, buluta bilgi göndermek yerine görevleri yerel olarak bir cihazda işleyebilir; bu da bilgilerin dahili ağlarda tutulmasını sağlamak isteyen gizlilik bilincine sahip müşterilere hitap edebilir.

Bankalara danışmanlık yapan bir hukuk firması olan Addleshaw Goddard’ın yönetici ortağı Charlotte Marshall, üretken yapay zeka ürünlerini benimsemede “birçok müşterimizin karşılaştığı zorluklardan birinin” verilerin işlenmesi ve aktarılmasıyla ilgili düzenleyici gerekliliklere uymak olduğunu söyledi. Daha küçük modellerin “işletmelere yasal ve maliyetle ilgili endişelerin üstesinden gelme fırsatı” sağladığını söyledi.

Daha küçük modeller ayrıca AI özelliklerinin cep telefonu gibi cihazlarda çalışmasına da olanak tanır. Google’ın “Gemini Nano” modeli, en yeni Pixel telefonunun ve Samsung’un en yeni S24 akıllı telefonunun içine yerleştirilmiştir.

Apple aynı zamanda en çok satan iPhone’unda çalışacak yapay zeka modelleri geliştirdiğini de ima etti. Geçtiğimiz ay Silikon Vadisi devi, metin tabanlı görevleri gerçekleştirmek üzere tasarlanmış küçük bir model olan OpenELM modelini piyasaya sürdü.

Microsoft’tan Boyd, daha küçük modellerin “telefonlardan dizüstü bilgisayarlara kadar ilginç uygulamalara” yol açacağını söyledi.

OpenAI şefi Sam Altman Kasım ayında, San Francisco merkezli start-up’ın müşterilere “ayrı amaçlara hizmet eden” farklı boyutlu yapay zeka modelleri sunduğunu ve bu seçenekleri oluşturup satmaya devam edeceğini söyledi.

“Küçük modellerin gerçekten işe yarayacağı bazı şeyler var” diye ekledi. “Bunun için heyecanlıyım.”

Ancak Altman, OpenAI’nin akıl yürütme, planlama ve görevleri yürütme ve sonunda insan düzeyinde zekaya ulaşma yeteneği de dahil olmak üzere ölçeklendirilmiş yeteneklere sahip daha büyük yapay zeka modelleri oluşturmaya odaklanmaya devam edeceğini ekledi.

“İnsanların sadece en iyi modeli istediğini düşündüğüm birçok zaman var” dedi. “İnsanların çoğunlukla istediği şeyin bu olduğunu düşünüyorum.”

San Francisco’daki George Hammond’un ek raporlaması

Kaynak

LEAVE A REPLY

Please enter your comment!
Please enter your name here