全球最資訊丨國產(chǎn)AI作畫神器:更懂中文,竟然還能做周邊!
最近在“ 一句話生成畫作”這個圈子里,又一個AI工具悄然火起來了。不是你以為的Disco Diffusion、DALL·E,再或者Imagen……而是全圈子都在講中國話的那種。瞧,已經(jīng)入圈的小伙伴們,都開始紛紛曬自己搞出來的杰作了:
訪問:
阿里云服務(wù)器精選特惠:1核1G云服務(wù)器低至0.9元/月
(資料圖片)
從網(wǎng)友們上傳的諸多畫作來看,這個AI可以cover的 風(fēng)格還真不少。
腦洞大開的《熊貓騎摩托》,中國山水畫里的春天小雨,絢麗的概念插畫《亞特蘭蒂斯》,甚至一只黑白色調(diào)的戴帽子抽煙的狗……
那這個既能支持中文,又能hold住眾多畫風(fēng)的AI工具,到底是什么來頭?
不賣關(guān)子。
它的廬山真面目,正是百度最新對外發(fā)布的一款中文作畫AI—— 文心·一格。
類似這種“你說我畫”的AI,聽說在國外已經(jīng)火了很長一段時間。
現(xiàn)在終于等到了個 國產(chǎn)版的,那么它到底好不好用呢?
“文心·一格”的初體驗(yàn)
既然在這個圈子流行講中文,那咱就先從“中國風(fēng)”開始上手。
例如輸進(jìn)去極具古典韻味的“江南水鄉(xiāng)”,然后在方向和風(fēng)格上選擇“傳統(tǒng)”、“中國風(fēng)”。
僅需等待片刻時間,“啪的一下”,一幅符合語義和風(fēng)格的畫作就誕生了:
嘿~還別說,這畫還真有一股子“小橋流水人家”的味道。
既然是國風(fēng),那就更傳統(tǒng)一點(diǎn),直接輸入一句古詩詞,看文心·一格會作何反應(yīng):
云深不知處。
云深不知處。
?
?
整體來說,這幅畫作確實(shí)是把“云之深”韻味展現(xiàn)得到位了。
據(jù)了解,文心·一格還可以繼續(xù)加大難度。針對AI圖像生成技術(shù)的資深用戶,一格即將開放 高級自定義功能,支持文本描述結(jié)合參數(shù)設(shè)置的方式探索更多創(chuàng)意。
當(dāng)然,也可以在”藝術(shù)家精品畫廊”里先瀏覽下內(nèi)測用戶已經(jīng)生成的圖片,像下面這張:
講真,若非知道這是AI創(chuàng)作的,第一眼還以為是哪個動漫中的場景,是有夠絢爛的了。
還有下面這一張,也同樣稱得上是驚艷絕倫。
但正所謂“貨比三家”,那么文心·一格作為AI作畫這條賽道的“后起之秀”,和國外的產(chǎn)品相比又如何呢?
下一個挑戰(zhàn)環(huán)節(jié),就是國內(nèi)AI vs. 國外AI——惡犬咆哮。
較為明顯的是,Disco Diffusion的風(fēng)格更趨向于狂野;而文心·一格則是更偏向現(xiàn)實(shí)主義一些。
再拿文心·一格和DALL·E 2做個比較——畢加索風(fēng)格的貓:
在看完這兩者的創(chuàng)作對比,你覺得誰家的更畢加索一些呢?
不過在這般效果背后,對應(yīng)的問題也隨之而來:
要生成風(fēng)格更全面的圖片,文心·一格的用法會更復(fù)雜嗎?
懂中文,也懂“懶人”
用起來,并不復(fù)雜。
我們從操作界面、提示詞要求和性能要求幾方面,對Disco Diffusion和文心·一格等AI畫畫產(chǎn)品進(jìn)行了簡單對比。
操作界面上,Disco Diffusion開放的接口不能說很復(fù)雜,但確實(shí)有點(diǎn)門檻。
它直接在GoogleColab上運(yùn)行,需要申請賬號后使用 (圖片生成后保存在云盤),圖像分辨率、尺寸需要手動輸入,此外還有一些模型上的設(shè)置。
好處是可更改的參數(shù)更多,對于高端玩家來說可操作性更強(qiáng),只是比較適合專門研究AI算法的人群:
相比之下,文心·一格的操作只需三個步驟:輸入文字,鼠標(biāo)選擇風(fēng)格&尺寸,點(diǎn)擊生成。
前文已經(jīng)提到,文心·一格同樣也具備Disco Diffusion的“高級自定義”功能,隨后便會開放,對于想擁有更多“參數(shù)自由”的小伙伴們來說,同樣是個不錯的選擇。
至于 提示詞,Disco Diffusion的設(shè)置還要更麻煩一些。
除了描述畫面的內(nèi)容以外,包括畫作類別和參考的藝術(shù)家風(fēng)格也都得用提示詞來設(shè)置,通常大伙兒會在其他文檔中編輯好,再直接粘過來。
關(guān)鍵一旦提示詞設(shè)置得不好,生成的效果就不盡如人意,需要反復(fù)嘗試、不斷細(xì)化,AI最終才能生成合適的畫面效果。
相比之下文心·一格倒是沒有格式要求,輸入150字的句子或詞組都可以:
當(dāng)然,輸入畫家名字如莫奈,也能輸出對應(yīng)風(fēng)格:
最后是 性能要求上,Disco Diffusion是有GPU使用限制的,每天只能免費(fèi)跑3小時。抱抱臉 (HuggingFace)上部分AI文生圖算法的Demo雖然操作簡單些,但一旦網(wǎng)速不行,就容易加載不出來:
△測試mini DALL·E時加載就失敗過
相比之下,文心·一格除了使用高峰期以外,基本上都是2分鐘就能生成,對使用設(shè)備也沒有要求。
總體來看,同樣是文字生成圖片AI,實(shí)際相比文心·一格的“真·一句話生成圖片”,DALL·E和Disco Diffusion的生成過程都不太輕松。
所以在這背后,文心·一格生成圖像,究竟是基于一個怎樣的邏輯?
我們以輸入“云深不知處”為例,希望能輸出一幅中國風(fēng)的畫作。當(dāng)接收到這幾個字詞 (query)后,AI的腦細(xì)胞就開始“運(yùn)作”了起來,從語法、詞法、語義等角度對文本進(jìn)行分析。
如果將生成過程可視化,這個階段還看不出什么效果,處于AI理解文本的階段:
很快,AI“拆解”文本后,理解要怎么畫這幅畫了,于是在特定尺寸 (用戶可選)的畫紙上,構(gòu)思出整體的輪廓,兼具云的元素和中國畫的風(fēng)格:
隨后,基于擴(kuò)散生成模型的原理,迭代地完善并修正畫面細(xì)節(jié),不斷提高清晰度、反復(fù)檢查圖文描述一致性,用更精確的配色替代噪聲:
最后,生成名為《云深不知處》的完整畫作:
看似“一句話生成圖片”不難,其實(shí)對 AI語義理解和 圖像生成能力提出了進(jìn)一步要求。
為了能更好地理解文本、提升輸出效果,文心·一格還在百度文心的圖文生成跨模態(tài)模型 ERNIE-VilG的基礎(chǔ)上,進(jìn)行了更詳細(xì)的優(yōu)化。
為了提升圖文理解能力,在知識增強(qiáng)的基礎(chǔ)上,引入 跨模態(tài)多視角對比學(xué)習(xí);
為了降低輸入要求同時提升效果,采用 基于知識的文本聯(lián)想能力,讓模型學(xué)會自己擴(kuò)展提示詞的細(xì)節(jié)和風(fēng)格;
為了提升圖像生成能力,采用 漸進(jìn)式擴(kuò)散模型訓(xùn)練算法,讓模型來選擇效果最好的生成網(wǎng)絡(luò)。
此外,在訓(xùn)練和數(shù)據(jù)上,文心大模型的產(chǎn)業(yè)級能力也進(jìn)一步給文心·一格提供了幫助,例如AI訓(xùn)練數(shù)據(jù)和平時在產(chǎn)業(yè)實(shí)踐中積累的經(jīng)驗(yàn),都能應(yīng)用到文心·一格的模型中去;至于百度知識圖譜的算法能力,則進(jìn)一步提升了模型通用性。
值得一提的是,如果開發(fā)者想將文心·一格的能力用到產(chǎn)品中,直接調(diào)用ERNIE-VilG的API接口就行,可以說是非常方便了。
One More Thing
我們在試玩文心·一格的時候,還發(fā)現(xiàn)了左下角這些有意思的應(yīng)用場景,一鍵就能生成預(yù)覽:
例如,頗有自如風(fēng)格的裝飾畫:
老板批量發(fā)年貨時印的編織袋 (手動狗頭):
其實(shí),這也是文心·一格區(qū)別于Disco Diffusion、OpenAI的DALL·E 2的另一個特點(diǎn)——更強(qiáng)的實(shí)用性。
不僅普通玩家可以用來生成自己想畫但畫不出來的內(nèi)容, 絕不會有兩幅相同的畫作,腦洞再放大點(diǎn),就連媒體作者等文字內(nèi)容創(chuàng)作者,也能用它高質(zhì)量高效率配圖。
(嗯,以后你看量子位的文章,說不定有些配圖就是用AI生成的)
專業(yè)畫師、或是設(shè)計(jì)師和藝術(shù)家,更可以用它來啟發(fā)靈感、輔助創(chuàng)作。
當(dāng)然,從官網(wǎng)看來,這個產(chǎn)品還在更新迭代、進(jìn)一步優(yōu)化中。
至于未來是否會在更多數(shù)字藏品、插畫、海報和電影動漫中,看見文心·一格的畫作?
我們拭目以待。
關(guān)鍵詞: 人工智能 國產(chǎn)AI作畫神器更懂中文,竟然還能做周邊
推薦
-
極氪新款小型SUV曝光 配備尾翼強(qiáng)調(diào)運(yùn)動屬性
汽車博主 @德鹵愛開車在微博上公布了一組極氪新車的偽裝諜照,新車暫且命名為BX1E。從外觀來看,極氪新...
來源:鋒出行 -
國產(chǎn)操作系統(tǒng)通用新增市場規(guī)模 將在2024年達(dá)到34.1億元
近日,億歐智庫針對國產(chǎn)操作系統(tǒng)通用市場發(fā)布了《2022年中國操作系統(tǒng)發(fā)展研究報告》。報告顯示,國產(chǎn)操...
來源:人民郵電報 -
-
總建筑面積超34000平方米 蘇州納維科技研發(fā)和生產(chǎn)總部大樓封頂
蘇州納維科技研發(fā)和生產(chǎn)總部大樓封頂。據(jù)悉,該項(xiàng)目于 2021 年 1 月 27 日奠基,項(xiàng)目占地面積超 ...
來源:愛集微 -
石家莊完成高鐵站5G網(wǎng)絡(luò)升級 峰值速率達(dá)到941Mbps
近日,石家莊聯(lián)通完成石家莊高鐵站5G網(wǎng)絡(luò)覆蓋工作。5G網(wǎng)絡(luò)容量、速率等各項(xiàng)指標(biāo)得到全面提升,語音通話...
來源:人民郵電報 -
SK 海力士、美光、三星電子相繼發(fā)布財(cái)報 對下半年預(yù)期均較為悲觀
近日,SK 海力士、美光、三星電子相繼發(fā)布財(cái)報,從三大存儲巨頭的財(cái)報中發(fā)現(xiàn),雖然存儲芯片 DRAM 和...
來源:愛集微 -
提高一線支撐效能 莆田電信“五個一”提升IT智能化運(yùn)營水平
為有效提升用戶感知,進(jìn)一步提高一線支撐效能,發(fā)揮專業(yè)優(yōu)勢滿足客戶需求,今年以來,中國電信福建莆田...
來源:人民郵電報 -
承擔(dān)不下一代互聯(lián)網(wǎng)重任 元宇宙前景不夠清晰無法代表下一代互聯(lián)網(wǎng)
在2022新京報貝殼財(cái)經(jīng)夏季峰會下一代互聯(lián)網(wǎng)離我們有多遠(yuǎn)數(shù)字技術(shù)主題論壇上,中國工程院院士、中國互聯(lián)...
來源:人民郵電報 -
助力常態(tài)化防疫工作精準(zhǔn)高效 泉州構(gòu)筑智能健康驛站
近期,為助力常態(tài)化防疫工作精準(zhǔn)高效,福建泉州電信基于5G建設(shè)和云網(wǎng)融合技術(shù),分析研究健康驛站(方艙)...
來源:人民郵電報 -
上半年全國消協(xié)組織共受理消費(fèi)者投訴551780件 同比增長5.71%
不論是在現(xiàn)實(shí)中的各大民生領(lǐng)域,還是線上的精神消費(fèi)范疇里,相關(guān)經(jīng)營者的誠實(shí)守信、用戶至上原則始終不...
來源:人民郵電報
直播更多》
-
印尼希望特斯拉在當(dāng)?shù)厣a(chǎn)電動汽車 并愿意花時間說服馬斯克
印尼希望特斯拉公司能在該國生產(chǎn)電動汽...
-
印尼希望特斯拉在當(dāng)?shù)厣a(chǎn)電動汽車 并愿意花時間說服馬斯克
印尼希望特斯拉公司能在該國生產(chǎn)電動汽...
-
助力多行業(yè)構(gòu)筑智能備電系統(tǒng) 安徽銅陵鐵塔與有色銅冠簽訂備電服務(wù)合作協(xié)議
日前,安徽銅陵鐵塔與銅陵有色銅冠智能...
-
迫降“黑飛”制式無人機(jī)12架次 黑龍江“電波衛(wèi)士”為世界5G大會保駕護(hù)航
2022世界5G大會于8月9日至12日在黑龍江...
-
半導(dǎo)體應(yīng)用硅晶圓市場將增長到160億美元 全球晶圓出貨量預(yù)計(jì)將創(chuàng)歷史新高
提供商業(yè)和技術(shù)信息的電子材料咨詢機(jī)構(gòu)...
-
升級線上線下客戶服務(wù)體驗(yàn) 上海電信發(fā)布“六項(xiàng)服務(wù)承諾”
8月15日,中國電信上海公司(以下簡稱上...
資訊更多》
-
推特索要信息太多...
-
數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)...
-
推動產(chǎn)業(yè)主體與金...
-
沃爾瑪與派拉蒙達(dá)...
-
定期開展測溫槍巡...
-
美國圣地亞哥聯(lián)邦...
焦點(diǎn)
- 電動汽車被排除出《通脹削減法案》 韓國政府通過多個渠道向美方表示擔(dān)憂
- 發(fā)揮央企“穩(wěn)定器”作用 安徽電信翼支付平臺助力提振消費(fèi)
- 新版《河北省中小企業(yè)促進(jìn)條例》審議通過 將于2022年10月1日起實(shí)施
- 多地電力供需緊張發(fā)布限電通知 四川已對工業(yè)用戶開啟限電模式
- 預(yù)警處置各類異常號碼 數(shù)智警察為反詐工作再添生力軍
- 華上光電第2季財(cái)務(wù)報告凈值為負(fù)數(shù) 即將面臨中國臺灣證券交易所營業(yè)細(xì)則規(guī)定下市
- 六方面達(dá)到行業(yè)領(lǐng)先標(biāo)準(zhǔn) 中國移動智慧中臺通過評估
- 黑龍江省工業(yè)和信息化廳無線電管理系統(tǒng) 舉辦新招錄人員第二階段入職培訓(xùn)班
- 提升工業(yè)互聯(lián)網(wǎng)安全保障能力 陜西啟動工業(yè)互聯(lián)網(wǎng)安全深度行活動
- 重要政策文件陸續(xù)發(fā)布 數(shù)字經(jīng)濟(jì)成當(dāng)下經(jīng)濟(jì)形態(tài)熱度“頂流”