【驚人理解力】Nvidia人工智能成像再進化輸入文字自動變成風景相

By wepro180 編輯部

發佈於 January 3, 2022

AI 的理解能力愈來愈高，好似 Nvidia 的人工智能研究項目 GauGAN，前年示範時已可以將小學生塗鴉神奇地轉化為實物風景相。來到今年的 GauGAN2 就更得人驚，只要輸入描述文字例如「ocean waves hittingrocks on the beach」，期間 GauGAN 就會跟隨所輸入的字眼，由生成一張純海浪相片，逐漸變成石灘浪潮相，認真驚人！

GauGAN 是 Nvidia 一款專門研究將人工智能神經元網絡應用於繪畫、生成圖像的計劃，通過向人工智能系統提供大量圖像數據資料進行機械訓練，令系統建立起不同的關聯資料庫。以兩年前研究隊伍示範的 GauGAN 影片為例，只要研究員在電子畫板上繪畫出各種風景圖案，例如用綠色畫出一片草地、藍色畫出天空，GauGAN 便會自動生成一張藍天綠草風景相，然後隨著研究員繼續畫上樹形圖案，相片中亦會顯示出新的樹木，而且在光源方面只要微細破綻，令觀眾了解到 GauGAN 的理解能力有多驚人。

事隔兩年，GauGAN2 正式登場，這次研究員將它訓練成可從文字生成相片，研究員說人類不再需要自己仔細地繪畫圖像或執圖，只要準確說出圖像內要包含的東西，系統便會因應描述生成出需要的風景相。研究員以繪畫一幅自然山景畫為例，用家只要先輸入山景及樹林等字眼，之後再輸入其他要求如要高一點的山、要藍天白雲背景，GauGAN2 便可逐一實現。研究人員指出，他們共為 GauGAN2 提供超過一千萬張相片進行訓練，而 GauGAN2 分為生成及識別兩個系統，前者會不斷創造圖像去瞞過後者的偵測，從而提升人工智能生成影像的準確及細緻程度，讓肉眼難以找出破綻。

不過，外界一直關注用於訓練人工智能的資料庫有否歧視內容，例如用於訓練人工智能 DALL-E 的資料庫 CLIP，便被研究員發現它會傾向將黑人種族與保姆或工人聯繫起來，特別是應用於人工智能求職系統上，令特定種族人士受到不公平待遇。Nvidia 方面就未有透露 GauGAN2 如何能達到沒有歧視內容，但發言人就表示它目前主要應用於風景生成方面，因此並不會涉及歧視或偏見等問題。

資源來源：https://bit.ly/3pFlu8C

#AI #DALLE #GauGAN #GauGAN2 #MachineLearning #NVIDIA #texttoimage #人工智能 #機械學習 #自動生成

【驚人理解力】Nvidia人工智能成像再進化輸入文字自動變成風景相

【我上網見到鬼】社交媒體超過一半唔係人

【Tech Data劇場】實用、高效、擴充靈活　HPE Nimble Storage dHCI 全面提升企業效率

【Mac友注意】變種OceanLotus木馬肆虐東南亞越南黑客專攻政府及企業

【第 N 波危機管理】疫後生還戰氣候變化資安對策

【驚人理解力】Nvidia人工智能成像再進化 輸入文字自動變成風景相

想知最新科技新聞？ 立即免費訂閱！

相關文章

【我上網見到鬼】社交媒體超過一半唔係人

【Tech Data劇場】實用、高效、擴充靈活 HPE Nimble Storage dHCI 全面提升企業效率

【Mac友注意】變種OceanLotus木馬肆虐東南亞 越南黑客專攻政府及企業

【第 N 波危機管理】疫後生還戰 氣候變化資安對策

登記訂閱香港最大IT社群wepro180， 掌握獨家消息、業界活動、技術教學， 拓展人脈。

感謝您的訂閱！

【驚人理解力】Nvidia人工智能成像再進化輸入文字自動變成風景相

想知最新科技新聞？立即免費訂閱！

【Tech Data劇場】實用、高效、擴充靈活　HPE Nimble Storage dHCI 全面提升企業效率

【Mac友注意】變種OceanLotus木馬肆虐東南亞越南黑客專攻政府及企業

【第 N 波危機管理】疫後生還戰氣候變化資安對策

登記訂閱香港最大IT社群wepro180，
掌握獨家消息、業界活動、技術教學，拓展人脈。