Meituan’dan LongCat-Video-Avatar 1.5: MIT Lisanslı Audio-Driven Dijital İnsan Video Üretimi
Çin’in en büyük gıda teslimat ve hizmet platformlarından Meituan, AI iştiraki LongCat aracılığıyla audio-driven digital insan video üretimi alanında yeni bir versiyonu açık kaynak yaptı: LongCat-Video-Avatar-1.5. MIT lisanslı, ses kaydından gerçekçi insan video’su üreten bu model, lip-sync kalitesinden multi-person interaction’a kadar production-grade bir avatar üretim çerçevesi sunuyor. Avatar üretimi neden bu kadar zor? Bir insanın…
