更新時間:2024-07-22 08:26:46作者:佚名
在人工智能時代,一切皆有可能。
近日,郭德綱表演英文相聲、趙本山用倫敦口音接受采訪、馬保國說一口流利日語當上馬大校等視頻在網絡上走紅,而這背后的核心技術,來自于一款AI視頻工具。
據悉,該技術支持300多個聲音、40多種語言,不僅能精準打出節拍,而且音色和說母語時很相似,連唇形都能對應。
面對洶涌而來的AI浪潮,這次誰將“失業”?
網絡奇才教趙本山、郭德綱說英語,人工智能取代人類的進程是否正在加速?
自上周以來,郭德綱說英文的視頻在抖音、微博等平臺上瘋傳。在這些視頻中,郭德綱不僅用英文接受采訪,還會用英文說相聲。這些視頻不是簡單的配音或AI變聲,而是與角色的聲音和風格高度吻合,甚至連嘴型都吻合,真實程度讓圍觀者震驚。
本周一,趙本山用倫敦口音接受采訪的視頻也因同樣的原因爆紅。受這兩起極具娛樂性案例啟發,有網友認為這是誰的英文,未來翻譯工作很有可能被人工智能取代,而好萊塢大罷工所擔心的“AI換演員”危機似乎已初現端倪。
藍鯨記者采訪了多部爆款視頻的創作者 Cyber?? Mage。他告訴藍鯨記者,這些視頻的火爆都在他預料之中。“在發布之前、還在制作過程中,我就知道會火。”他表示,自己本身就是媒體和新媒體行業出身,從事 AI 相關內容創作也有半年多時間,認為自己對自己的網感、對 AI 的發展有一定的信心。“作品還在制作時這是誰的英文,我就忍不住感嘆,太像了。我們 AI 相關創作者更清楚 AI 現在發展到什么程度,我們的門檻比普通人要高。連我都驚嘆,普通人看到肯定會佩服的東西。”
除了技術本身帶來的震撼,這類爆紅視頻的主角也是經過精心挑選的。Cyber?? Mage說,“主要是對比感。趙本山和郭德綱都是老派語言表演藝術家,公眾形象比較土氣,沒有那么洋氣。所以想象一下,當觀眾看到他們突然說英語,會是什么感覺?我就是想抓住這種對比感,讓他們第一時間吸引觀眾的耳朵和眼睛。”
但從AI孫燕姿開始,版權就如同一把懸在創作者頭上的達摩克利斯之劍。賽博法師也未能免受這種擔憂。他告訴藍鯨記者,雖然自己在嗶哩嗶哩和抖音上同時發布相關視頻,但趙本山和郭德綱在抖音上沒能爆紅,很大程度上就是因為流量限制。“我還是很擔心版權問題,目前這只是對原視頻的翻譯,如果直接修改人物的臺詞內容,會造成名譽受損、謠言四起等后果,就太嚴重了。”
AI郭德綱技術來自深圳創業公司,已實現盈利
據Cyber?? Mage介紹,AI郭德綱的實現主要基于一款AI視頻工具HeyGen,用戶只需上傳視頻、選擇語言,就能生成帶有自動翻譯、語調調整、唇形匹配等功能的視頻。
HeyGen背后是一家成立于深圳的公司AIGC。
HeyGen 的開發團隊為詩云科技。顧名思義,公司名稱中的“詩云”取自劉慈欣的科幻小說《詩云》,寓意人類的創造力無法被技術取代,但機器可以大大優化創作流程和效率。現實中,詩云科技想做的是用 AI 生成內容,讓用戶以更低的成本完成內容創作。
天眼查APP顯示,詩云科技法定代表人為許卓,公司已完成兩輪數百萬美元融資。2021年3月,詩云科技宣布獲得紅杉中國種子基金、真格基金天使輪投資;同年8月30日,詩云科技宣布獲得數百萬美元Pre-A輪融資,由IDG資本領投,紅杉中國種子基金、真格基金跟投。
徐卓的英文名叫Joshua,畢業于同濟大學自動化專業,后赴卡內基梅隆大學攻讀計算機科學碩士學位。作為明星應用Snapchat的百強員工之一,徐卓從零開始打造了Snapchat廣告平臺、推薦算法系統和機器學習平臺Barista,并負責AI相機的技術和產品研發,經驗豐富。他的創業伙伴王亮此前曾擔任字節跳動北美設計總監,兩人都是大公司的精英。
HeyGen于2022年7月正式上線,據36氪報道貝語網校,HeyGen在7個月內實現了100萬美元的ARR(年度經常性收入)。
HeyGen的營收主要來自付費訂閱。據Cyber??magic介紹,這款應用有年費和月費兩種訂閱方式,最低的月費是29美元,包含15分鐘的生成時間。還有好幾個檔位,主要是生成時間不同。Cyber??magic認為,這樣的收費對普通用戶來說并不便宜。“每月29美元的起步價對美國人來說可能不算什么,但對國內用戶來說就太貴了,畢竟才200多元。”
但同時,他也對HeyGen的技術給予了肯定:“半年前AI技術還需要二三十分鐘的聲音素材才能訓練出一個語音模型,而HeyGen只需要幾十秒,目前還沒有同類產品能像HeyGen一樣實現口型同步。”
從AI孫燕姿到AI郭德綱,AIGC是玩具還是工具?
自從ChatGPT在國內掀起AI熱潮后,各大公司紛紛加入戰局。但現實是,當初對標ChatGPT的大模型應用要么尚未面世,要么并未引起太大轟動。相反,一系列具體的實用應用卻小有成就。
2023年5月,AI孫燕姿爆紅網絡,背后的黑科技就是“SO-VITS-SVC”。
“SO-VITS-SVC”源于2021年6月11日發布的“VITS”開源項目。“VITS”是一個可以達到“文聲”效果的語音合成模型。但是“VITS”模型需要海量的訓練數據,高度依賴人們對語料數據的文本標注,因此應用門檻很高。2022年8月26日,一位名為“Rcell”的嗶哩嗶哩用戶在“VITS”的基礎上開發了“SO-VITS-SVC”模型,并與Soft-vc、VIsinger等相結合。“SO-VITS-SVC”可以理解為一個音色轉換的AI模型,只需要十幾分鐘的音頻數據,就可以將其擬合成一個具有特定主音色的工具。
2023年8月,國內首個AIGC爆款應用喵牙相機在網絡上爆紅。這是一款基于大型AI模型的應用,也是阿里文娛投資的創業項目。產品發布后,一些與排隊高峰、個人隱私相關的話題引發關注。
2023年10月,HeyGen隨著AI郭德綱、趙本山走進公眾視野。
縱觀國內幾款受到大眾關注的AIGC應用,我們可以發現,“玩具屬性”似乎才是它們走紅的基礎。原本對標“第四次工業革命”的AI創業浪潮,并未在大眾層面給生產力環節帶來相應的驚喜。AIGC究竟會在多大程度上真正影響我們的生活?
對此,Cyber?? Mage認為,一項技術從出現到被人們熟知需要一個過程。以“玩具”的形式出現在大眾面前并不一定是壞事,同樣的技術既可以做成玩具,也可以做成工具。“比如我以前是個攝影師,在我手里,我覺得單反相機更有用,手機只是用來玩,不能拍出和相機一樣的效果。但在普通人手里,相機確實沒有手機那么好用。使用門檻的高低,直接決定了適用人群,可以是玩具,也可以是工具,主要看誰用。”