14 March 2024
دو هفته پس از انتشار #هوش_مصنوعی SORA، شرکت Alibaba هوش مصنوعی Audio-to-Video خودش رو با عنوان EMO‌ منتشر کرده.این هوش مصنوعی با ورودی یک تصویر Portrait و یک صدا، ویدئویی رو از اون تصویر ارائه میده.
5 MB
1 MB
Profile picture of ‌محمدعلی سیفی‌
محمدعلی سیفی

@moalseifi  •  16 February 2024

#هوش_مصنوعی Text-to-Video (تبدیل متن-به-ویدئو) شرکت OpenAI‌ به نام Sora چند ساعت پیش منتشر شد.یک ساعته دارم ویدئو های مربوط بهش رو میبینم و هنوز در شوک هستم...به هیچ وجه احتمال نمی‌دادم به این زودی به این سطح کیفی و Temporal Consistancy (ثبوت تصویر) توی تولید ویدئو از متن برسیم.openai.com/sora
openai.com

Sora: Creating video from text

2 MB
2 MB
3 MB
2 MB
Profile picture of ‌محمدعلی سیفی‌
@moalseifi14 March 2024
نکته جالبی که این هوش مصنوعی داره، دقت بالای اون در شبیه‌سازی حرکات سر و بدن و حرکات ثانویه صورت انسان، صرفا از روی یک صوت هستش.(امثال) این هوش مصنوعی،پتانسیل ایجاد نسل جدیدی از محتوا های Deepfake رو دارند.https://humanaigc.github.io/emote-portrait-alive/
humanaigc.github.io

EMO

EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions

یک نکته بامزه در ارائه این هوش مصنوعی هم استفاده از تصویر تولید شده توسط هوش مصنوعی SORA‌ به عنوان Reference برای متحرک سازی بود.پ.ن: یه جورایی میشه گفت Alibaba داره به OpenAI‌ دیس میده 😂.
05:25 - 14 March 2024

4 Reactions
6094 Views