Foxconn ilk büyük dil modelini tanıttı

11.03.2025

Dünyanın en büyük elektronik fason üreticisi ve Apple’ın başlıca iPhone tedarikçisi olan Foxconn Technology Group, Tayvanlı şirketin fabrikalarda yapay zeka (AI) kullanımını ilerletmesiyle birlikte geleneksel karakterler üzerine eğitilmiş ilk Çince büyük dil modelini (LLM) piyasaya sürdü.

Foxconn, Yapay Zeka Destekli Üretim için Geleneksel Çince Büyük Dil Modelini Piyasaya Sürüyor

Resmi adıyla Hon Hai Precision Industry olarak bilinen Foxconn tarafından Pazartesi günü yapılan açıklamaya göre, yeni FoxBrain modeli sadece dört hafta içinde “daha verimli ve daha düşük maliyetli” bir yöntemle eğitildi ve Tayvan’ın yapay zeka teknolojisinin gelişiminde yeni bir kilometre taşı oluşturdu.

Foxconn’a göre, 120 Nvidia H100 grafik işlem birimi (GPU) tarafından desteklenen bir eğitim sürecine sahip olan FoxBrain, matematik ve mantıksal muhakeme konularında üstünlük sağlıyor. Başlangıçta şirket içi uygulamalar için tasarlandı, ancak Foxconn, uygulamalarını genişletmek ve üretimde yapay zekayı teşvik etmek için teknoloji ortaklarıyla işbirliği yapma çabalarının bir parçası olarak gelecekte açık kaynaklı olacağını söyledi.

Dünyanın dört bir yanından en önemli konular ve trendler hakkında sorularınız mı var? Ödüllü ekibimiz tarafından size sunulan açıklayıcılar, SSS’ler, analizler ve infografikler içeren yeni içerik platformumuz SCMP Knowledge ile yanıtları alın.

Foxconn, Yapay Zeka Destekli Üretim için Geleneksel Çince Büyük Dil Modelini Piyasaya Sürüyor

LLM’ler, OpenAI’nin ChatGPT’si gibi üretken yapay zeka hizmetlerinin temelini oluşturan teknolojidir. Açık kaynak, bir yazılımın kaynak koduna kamusal erişim sağlayarak üçüncü taraf geliştiricilerin tasarımı değiştirmesine veya paylaşmasına, bozuk bağlantıları düzeltmesine veya yeteneklerini artırmasına olanak tanır.

Foxconn’un son girişimi, şirketin üretim verimliliği açısından kendi yapay zeka atılımlarını zorlama hedefini yansıtıyor.

Bu, Çinli start-up DeepSeek’in bu yılın başlarında OpenAI, Google ve Meta Platforms gibi daha büyük şirketlerin yapay zeka modellerinin maliyetinin çok altında bir maliyetle açık kaynaklı olarak geliştirdiği yüksek performanslı R1 akıl yürütme modelini piyasaya sürmesinin ardından geldi.

Üreticinin araştırma kolu olan Hon Hai Araştırma Enstitüsü Yapay Zeka Araştırma Merkezi Direktörü Li Yung-Hui yaptığı açıklamada, “Son aylarda, muhakeme yeteneklerinin derinleştirilmesi ve GPU’ların verimli kullanımı giderek yapay zeka alanında ana akım gelişme haline geldi” dedi.

“FoxBrain modelimiz, körü körüne bilgi işlem gücü biriktirmek yerine eğitim sürecini optimize etmeye odaklanan çok verimli bir eğitim stratejisi benimsedi” dedi.

Yeni model 70 milyar parametreye sahip Meta Llama 3.1 mimarisine dayanıyordu. Foxconn, Llama-3 mimarisi kullanılarak geleneksel Çince karakterler ve İngilizce veriler üzerinde ince ayar yapılmış bir başka açık kaynaklı model olan Llama-3-Taiwan-70B’nin, geleneksel Çince dilinin anlaşılması için bir ölçüt olan TMMLU+’nın çoğu kategorisinde daha iyi performans gösterdiğini iddia etti.

DeepSeek gibi Çinli şirketler tarafından geliştirilen modeller genellikle anakarada kullanılan basitleştirilmiş Çince karakterlerin daha iyi anlaşılması için eğitiliyor.

Geçtiğimiz Kasım ayında şirket, üretim ve tedarik zinciri yönetiminde “dijital ikiz” teknolojisinden yararlanmak için Nvidia ile birlikte çalıştığını açıkladı. Girişim, küresel fabrika operasyonlarını düzene sokmak, esnekliği artırmak ve tutarlı kaliteyi sağlamak için Nvidia’nın Omniverse’ini kullanıyor.