Nature:AI遊戲設計師問世,自學成才,無需任何先前知識
文|學術頭條
在當今數位化時代,創意產業正經歷著一場由生成式人工智慧(AI)引發的變革。 從文字、影像到音訊、視頻,AI正以前所未有的速度和規模生成各種內容,為創意工作者提供了全新的工具和思路。
然而,
將這些科技無縫融入創意實踐並非易事,尤其是在遊戲開發這一複雜且富有創意的領域
。
遊戲開發不僅需要生成新穎的內容,更需要在保持遊戲世界
一致性
、
多樣性
和用戶修改
持續性
方面達到高度平衡。
近日,一篇發表在 ; Nature 上的研究論文 ; World and Human Action Models towards Gameplay Ideation 揭示了如何
利用生成式AI模型推動遊戲玩法創意的生成
。
論文連結:
https://www.nature.com/articles/s41586-025-08600-3
論文報導了一個由微軟研究院領導的研究團隊,開發的可協助電子遊戲設計師反覆運算設計遊戲的生成式AI模型—& mdash;
世界與人類行動模型
(World and Human Action Model,
WHAM
),其
生成的魯棒3D世界能遵循設計用於電子遊戲的機制
。
他們認為,考慮到由於 ;
WHAM無需任何先前知識,僅通過玩遊戲的訓練就能學會生成序列
,這個工具或能輕鬆轉換用於生成來自其他電子遊戲的關卡,為遊戲開發行業帶來新的可能。
AI還可以做好遊戲創意開發?
電子遊戲在娛樂產業中占最大份額,全球有數十億人玩和購買電子遊戲。 然而,遊戲開發是一個涉及多學科、多技能的複雜過程,從概念設計、角色建模到關卡設計、遊戲機制程式設計,
每一個環節都需要創意人員投入大量的時間和精力
。傳統的遊戲開發流程往往受限於人力和時間成本,難以快速反覆運算和生成多樣化的遊戲內容。
生成式AI為解决這一問題提供了可能
。通過訓練AI模型學習大量的遊戲數據,理論上可以生成新的遊戲玩法序列、關卡設計甚至角色行為,從而輔助創意人員更高效地進行遊戲開發。
然而,現有的生成式AI模型在遊戲開發領域的應用
仍面臨諸多挑戰
,如生成內容的一致性、多樣性以及對用戶修改的持續性支持不足等。
囙此,在這項工作中,研究團隊旨在
開發一種能够更好地支持遊戲開發創意實踐的生成式AI模型
。
為了深入瞭解遊戲開發創意人員的實際需求,研究團隊邀請了來自不同遊戲工作室創意團隊的27名電子遊戲設計師,開展了半結構化訪談,這些電子遊戲設計師涵蓋了遊戲開發的多個領域,包括工程、設計和藝術等。
在訪談過程中,研究團隊使用了一種名為
“ 設計探針”
的工具,通過類比一個虛構但具體的遊戲開發場景,激發參與者對生成式AI在遊戲創意中的潜在應用的思考。
參與者們積極分享了他們對AI輔助遊戲創意的看法和期望,認為當前用於打造電子遊戲的AI方案缺乏生成許多不同創意(發散性思維)的能力,並強調
在保持遊戲世界一致性的同時,實現多樣化創意的重要性,以及通過設計過程來持續微調遊戲各方面(反覆運算實踐)
的重要性。
具體來說,參與者們認為,生成式AI應該能够幫助他們在遊戲開發過程中實現以下幾個目標:
- 提供多樣化的內容
: AI模型應該能够生成多種不同的遊戲玩法序列和關卡設計,以激發創意人員的靈感; - 保持一致性
:生成的內容應該與遊戲的整體風格和機制保持一致,避免出現與遊戲世界不協調的元素; - 支持反覆運算實踐
:創意人員希望能夠通過直接修改生成的內容來進行反覆運算,而不是僅僅依賴於文字提示; - 持續性
:用戶對生成內容的修改應該能够持續地保留,而不是在後續生成過程中消失。
基於用戶需求調研的結果,研究團隊開發了WHAM。
圖|WHAM模型(來源:論文)
WHAM模型使用了3D多玩家戰鬥模擬器《嗜血邊緣》中大量的人類玩家玩法數據,包括遊戲視覺畫面和控制器動作。 採用Transformer架構作為其序列預測的骨幹網絡,並使用VQGAN影像編碼器將影像編碼為離散的token序列,
通過對真實人類遊戲玩法數據的訓練,WHAM能够準確預測遊戲環境的3D結構、控制器動作的效果以及遊戲的時空結構
。
為遊戲開發提供一種全新工具
研究團隊發現,WHAM能够設計出符合《嗜血邊緣》預存在機制的複雜3D電子遊戲序列,其關卡設計也具有明顯的多樣性,且創意人員可對輸出進行反覆運算調整。 他們還開發了WHAM示範器,作為供用戶操作和自定義WHAM輸出的一個視覺化介面。
為了評估WHAM的效能,他們還
提出了一套針對生成式AI模型的評估方法
,重點關注模型在一致性、多樣性和持續性這三個關鍵能力上的表現。
在一致性評估方面
,他們使用Fré; chet Video Distance(FVD)名額來衡量生成的遊戲玩法與真實遊戲玩法在視覺和時空動態上的一致性。 通過將WHAM生成的遊戲畫面與真實玩家的遊戲畫面進行對比,發現隨著模型規模的增大和計算資源的新增,FVD分數逐漸降低,表明模型生成的內容與真實遊戲數據的一致性不斷提高。
在多樣性評估方面
,他們採用Wasserstein距離來衡量模型生成的動作分佈與真實玩家動作分佈之間的差异。 結果表明,WHAM能够生成與真實玩家行為相似的動作序列,且在訓練過程中,Wasserstein距離逐漸减小,說明模型在保持一致性的同時,能够生成多樣化的遊戲玩法。
圖|WHAM模型的多樣性評估
在持續性評估方面
,研究人員通過手動編輯遊戲影像,插入不同的遊戲元素(如道具、角色和地圖元素),並讓WHAM在這些編輯後的影像條件下生成新的遊戲畫面,來評估模型對用戶修改的持續性支持。 實驗結果顯示,當模型基於更多的編輯後的影像進行生成時,插入的元素在生成畫面中持續存在的比例顯著提高,表明WHAM能够較好地將用戶的修改融入到生成的遊戲內容中。
總體而言,研究團隊通過深入的用戶需求調研和嚴謹的模型開發與評估,成功開發出了一種能够支持遊戲開發創意實踐的生成式AI模型。 該模型在一致性、多樣性和持續性這三個關鍵能力上表現出色,能够生成與真實遊戲玩法高度一致且多樣化的遊戲內容,並有效地支持用戶對生成內容的修改和反覆運算。
研究團隊指出,WHAM的出現為遊戲開發行業提供了一種全新的工具,能够生成多樣化、一致性强的遊戲內容,
激發創意人員的靈感,有望在未來的遊戲中創造出更加豐富、創新的遊戲體驗
。同時,該研究也為生成式AI在其他創意領域的應用提供了有益的借鑒和啟示,推動了AI科技與人類創意的深度融合。
雖然WHAM在遊戲開發領域的應用已經取得了顯著的成果,但也
存在著一些局限性和挑戰
。例如,收集和處理大量真實人類遊戲玩法數據是一項複雜且耗時的任務,需要投入大量的時間和資源; 而且,訓練和優化生成式AI模型需要大量的計算資源和專業知識,對研究團隊的科技能力也提出了較高的要求。
不過,研究團隊也指出,隨著AI科技的不斷發展,WHAM的模型架構和訓練方法也可以進一步改進,不僅能够低成本高效率地以生成更加複雜、智慧的遊戲內容,還可以探索如何將WHAM與其他遊戲開發工具和流程更好地集成,以提高整個遊戲開發流程的效率和創意性。
我們有理由相信,在不久的將來,AI將在遊戲開發乃至整個創意產業中發揮更加重要的作用。
原文網址:https://zh.gushiio.com/ai/2305.html