清華大佬整活：馬斯克穿上東北大花襖、李白穿上背帶褲

發(fā)帖時(shí)間：2024-12-29 14:54:50

[百科] 來源：下愚不移網(wǎng)

粉色連衣裙、清華黑色大波浪的大佬美女，驚恐轉(zhuǎn)身后，整活露出了一神似張宋小寶的克穿褲嬌俏面龐。微張的上東嘴唇，欲語還休。北大背帶

清華大佬整活：馬斯克穿上東北大花襖、李白穿上背帶褲

美國的花襖三好青年馬斯克，身著東北大花襖，李白站在微風(fēng)陣陣的穿上白宮前邊。小手一揣，清華略帶局促地露出一抹拘謹(jǐn)、大佬正派的整活微笑。

而另一邊，克穿褲魔卡少女小櫻也正拉著隔壁的上東蕾姆，在三里屯商場里逛街。北大背帶當(dāng)然了，世超知道見識過各種 P 圖軟件和 AI 技術(shù)的你。估計(jì)看到這些效果，也是輕輕一笑說：

早半年前，哥就見過這種效果了。哥不僅能讓馬斯克換裝，就是讓他跳段舞，也是手拿把掐了。

但且慢，上面這些視頻的生成方法，可能跟你以前見過的都不一樣。這個用的是生數(shù)科技聯(lián)合清華團(tuán)隊(duì)推出的視頻模型 Vidu 1.5 ，這個模型有一個新的能力：多主體一致性。

用大白話來說，就是我們可以上傳多張圖片來生成視頻。并且保證這些復(fù)雜的元素不會變形。比如上傳角色、物體和地點(diǎn)的圖，它可以用你指定的這些元素，做出一條視頻來。

這樣我們在生成的時(shí)候，就可以自己設(shè)定人物、物體還有場景。像馬斯克這條視頻，就是用了一張馬斯克的大頭照，一件花襖，還有一張白宮的圖片，生成出來的。

丟一句簡單的提示詞， Vidu 就可以復(fù)刻出一條以假亂真的視頻。讓馬斯克，穿上你給的大花襖，在白宮前秀一段。

這么整的好處顯而易見，我們可以手動控制AI 生成的素材，讓視頻更合我們心意。以前我們只能扔一句話，或者扔一張照片，讓 AI 自由發(fā)揮。最后結(jié)果很容易就脫離我們的預(yù)期。

比如你直接說讓馬斯克穿著大花襖，它就會真的在馬褂上，畫幾朵大花。

如果 AI 的詞庫里，就沒有大花襖這個東西。不論我們怎么調(diào)整提示詞，最后都沒法生成出來。

可現(xiàn)在，你不用使勁憋提示詞了，只需要閉眼甩一張圖。之前還沒有視頻模型可以做到這樣，很多時(shí)候能把一張上傳的圖片處理明白，就已經(jīng)相當(dāng)?shù)脛帕?。所以?Vidu 這個模型一發(fā)布。外網(wǎng)的各種網(wǎng)友們，立馬就驚呼，然后開機(jī)上手了。

大家也可以直接打開 Vidu 的官方，上手試試看。不過，現(xiàn)在只有三次的免費(fèi)機(jī)會，后面每次試用就會需要消耗 4 個積分。為了給大家整個明白，世超試用了一天。大伙可以往下滑，看看我的效果，再決定要不要玩。按照編輯部的約定俗成，咱們的吉祥物一般都是我第一個試的。

這回，我整了兩張火鍋戴頭盔的照片，又上傳了一張抹茶綠的雅迪電動車。輸入提示詞：金毛犬在騎雅迪電動車。

大概幾十秒之后，帶著黑色防風(fēng)鏡的火鍋，就這么絲滑地騎上了小電驢。連胸前藍(lán)色的掛飾，還有雅迪的橙色車標(biāo)，都完整的保留了下來。這個一致性效果還是挺驚艷的。

還貼心地加上了吐舌頭和搖尾巴的小細(xì)節(jié)。

?雖然火鍋這個滑滑板一樣的騎車動作，是肯定沒法上路的。不過，因?yàn)楣繁緛砭筒粫T電驢，咱們也不能強(qiáng)求。后面，世超換了張喬布斯的大頭照，這個效果就很可以了。而且，我還特地上了點(diǎn)難度。讓喬布斯也和馬斯克一樣，穿上了咱們特色服飾軍大衣。

硬朗五官配上筆挺大衣，效果還是非常板正的。喬布斯應(yīng)該也沒想到，自己有一天會坐上雅迪的橘色雅座吧。雖然只有正臉照，但是鏡頭轉(zhuǎn)到側(cè)方的時(shí)候，人物的特征（比如小禿頭）還是還原得挺精準(zhǔn)。

不過，上面這些都還是單一的人物主體，外加一個場景或者物品。抓取起來還是比較簡單。

一般來說，我們加入的主體越多，大模型就可能抓取錯誤。于是我試了一下上傳一張?zhí)撇Ⅻc(diǎn)秋香里經(jīng)典圖，然后要求把臉部替換成我給的另一張圖。

它從一堆人的背影里，精準(zhǔn)地找到秋香。讓她把臉緩緩轉(zhuǎn)過來，微微露出側(cè)臉。雖然沒有全臉示人，但眉眼就足夠一眼丁真。

后面，我又加上了難度。不僅要替換服裝，還要加上動作。讓語文課本上的李白和蔡徐坤來個對換：李白穿著背帶褲在打籃球。

這次， Vidu 給的效果就相當(dāng)抽象了。它直接給坤換了個畫風(fēng)，整出了一個動畫版。雖說保留的格子褲花紋小細(xì)節(jié)，足以體現(xiàn)用心。

但這個李白 260 °水調(diào)大轉(zhuǎn)頭，畫面實(shí)在過于詭異了。也沒有完成我輸入的【打籃球】的指令。

在后面測試中，世超發(fā)現(xiàn) Vidu 雖然能摳主體。但是，如果動作比較大，或者畫面變化比較多，就容易出現(xiàn)上面突然轉(zhuǎn)頭的小 bug 。比如，讓它把胖虎的玩具人偶放在冰雪女王的手上。

它確實(shí)能處理多個主體，讓塑膠胖虎憑空變出來，而且，冰雪女王的動作和場景連貫性，基本可以以假亂真。但是，換進(jìn)去的胖虎的動作，就明顯有點(diǎn)小崩。在五秒里，連續(xù)抽搐變形了數(shù)次。

在一下午的測試?yán)铮?Vidu 的生成效果總是時(shí)好時(shí)壞。世超一直在上一秒驚艷，下一秒驚嚇的反復(fù)中來來回回。比如讓雷軍坐到問界的車?yán)飺]手。雷軍就這么水靈靈地掉到了車外面，而且，臉也早已經(jīng)崩壞了。

但是，同時(shí)它又能完美地讓樂高國王，在城堡上舉起長劍，激昂演講。保持場景和人物，都連貫一致。

崩多了之后，我甚至摸出了一些門道。如果你看完文章后，打算去試試，那么在給主體照片的時(shí)候，最好找背景比較干凈的圖片。主體越好摳出來，生成的準(zhǔn)確率就越高。

同時(shí)，給一個主體上傳多個角度的照片，也能讓他動起來更自然。因?yàn)槟Ｐ涂梢詷?gòu)建出一個更完整的人物。

雖然根據(jù) Vidu 官方的說法，他們這次放棄了業(yè)界主流的 LoRA 微調(diào)的方法。因?yàn)槟欠N方法，很容易出現(xiàn)過擬合，就是在理解主體的過程中，會遺忘大量原先的知識。所以，主體的動作和肢體很容易崩壞，難以控制。畫面里東西越多，變化越多，就越容易失控。而 Vidu 的新模型是用類似于大語言模型的技術(shù)，把所有輸入都處理成視覺數(shù)據(jù)，并和大語言模型一樣能 “ 上下文記憶 ” 地處理這些輸入數(shù)據(jù)。這確實(shí)讓 Vidu 在多主體的處理上，邁出了一大步。

但與此同時(shí)，經(jīng)過簡單測試后，世超覺得 Vidu 的這個技術(shù)還有很長一段路需要走。其實(shí)， Vidu 暴露的問題跟早期的文成視頻很像。就是意思都到了，但是細(xì)節(jié)還不夠，效果不穩(wěn)定，時(shí)不時(shí)抽一下風(fēng)。像這個電動車和公路場景，再怎么切換鏡頭都沒有變形。就是運(yùn)動的時(shí)候，人物出現(xiàn)了影分身。

指定圖片：初音未來、雅迪電動車和公路

如果你想用它完全替代視頻工作者的工作，世超覺得還是得等等。但 Vidu 肯定是值得上手玩玩看的。畢竟誰不想讓喜歡的角色穿上我們挑選的衣服，不想讓心意的 IP 角色或者明星，跨界同框一下呢。

分享到：新浪微博 QQ空間騰訊微博人人網(wǎng) 點(diǎn)點(diǎn)網(wǎng) 復(fù)制網(wǎng)址打印

相關(guān)內(nèi)容

[流言板]恐怖火力！灰熊背靠背2場得到287分，場均143.5分
《最終幻想7》蒂法新3D美圖黑絲緊身衣制服誘惑
錯失機(jī)會！姆巴佩底線回做，羅德里戈射門被撲住
逐步走出低谷！姆巴佩皇馬生涯首次連場貢獻(xiàn)傳射
太陽報(bào)：拉什福德言論讓曼聯(lián)隊(duì)友憤怒，他目前在隊(duì)里沒有親密朋友
一女子為躲狗跑入機(jī)動車道被撞身亡：狗主人賠償45萬
起售價(jià)不超30萬！比亞迪全新中大型MPV夏有望1月8日上市
第50000臺小鵬MONA M03量產(chǎn)下線：當(dāng)前每72秒可生產(chǎn)一臺

隨機(jī)閱讀

熱門排行

亚洲嫩模在线观看,日韩视频特黄色大片,乱色中文视频在线,动漫免费观看

清華大佬整活：馬斯克穿上東北大花襖、李白穿上背帶褲

清華大佬整活：馬斯克穿上東北大花襖、李白穿上背帶褲