یک نکته بامزه در ارائه این هوش مصنوعی هم استفاده از تصویر تولید…

14 March 2024
دو هفته پس از انتشار #هوش_مصنوعی SORA، شرکت Alibaba هوش مصنوعی Audio-to-Video خودش رو با عنوان EMO‌ منتشر کرده.این هوش مصنوعی با ورودی یک تصویر Portrait و یک صدا، ویدئویی رو از اون تصویر ارائه میده.
01:34
5 MB
00:26
1 MB
محمدعلی سیفی
@moalseifi • 16 February 2024
#هوش_مصنوعی Text-to-Video (تبدیل متن-به-ویدئو) شرکت OpenAI‌ به نام Sora چند ساعت پیش منتشر شد.یک ساعته دارم ویدئو های مربوط بهش رو میبینم و هنوز در شوک هستم...به هیچ وجه احتمال نمی‌دادم به این زودی به این سطح کیفی و Temporal Consistancy (ثبوت تصویر) توی تولید ویدئو از متن برسیم.openai.com/sora
openai.com
Sora: Creating video from text
00:15
2 MB
00:20
2 MB
00:17
3 MB
00:10
2 MB

محمدعلی سیفی
@moalseifi14 March 2024
نکته جالبی که این هوش مصنوعی داره، دقت بالای اون در شبیه‌سازی حرکات سر و بدن و حرکات ثانویه صورت انسان، صرفا از روی یک صوت هستش.(امثال) این هوش مصنوعی،پتانسیل ایجاد نسل جدیدی از محتوا های Deepfake رو دارند.https://humanaigc.github.io/emote-portrait-alive/
humanaigc.github.io
EMO
EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions

محمدعلی سیفی

@moalseifi

یک نکته بامزه در ارائه این هوش مصنوعی هم استفاده از تصویر تولید شده توسط هوش مصنوعی SORA‌ به عنوان Reference برای متحرک سازی بود.پ.ن: یه جورایی میشه گفت Alibaba داره به OpenAI‌ دیس میده 😂.

05:25 - 14 March 2024

4 Reactions

6094 Views