市場新聞

爲何說ARC代理將突破AI遊戲現有體驗

By 金色財經 2024-11-27 01:57

作者：Teng Yan，Chain of Thought；翻譯：金色財經xiaozou

2021年時我還是一個Axie Infinity玩家，並且運營着一個小型獎學金公會。如果你未曾經歷那個時代，讓我來告訴你——絕對狂野。

Axie Infinity這款遊戲讓人們意識到加密貨幣和遊戲可以結合到一起。從本質上來說，這是一款簡單的Pokémon風格的策略遊戲，玩家需要組建一支由3名Axie（非常兇猛的战士）組成的團隊，每個Axie都擁有獨特的能力。你可以帶領自己的隊伍對战其他隊伍，通過參與遊戲並獲勝獲得SLP代幣獎勵。

但真正讓非遊戲玩家感到興奮的是通過遊戲賺錢的潛力。Axie的迅速崛起得益於兩大機制：

第一個是Breeding Axies。獲取兩個Axie，使用SLP代幣繁殖它們，就誕生了voilà——一個新的結合原有的兩個Axie獨特能力的Axie。於是這樣稀有且強大的Axies（遊戲玩家稱之爲OP Axies）成爲了熱門商品，一個繁忙的繁殖市場出現了。

第二個機制是獎學金項目。來自世界各地的企業玩家开始將Axies借給“學者”。這些玩家通常來自菲律賓或阿根廷等發展中國家，他們無法支付1000多美元的前期費用來購买3個Axie NFT。學者們每天都在打遊戲賺取代幣，並與獎學金公會分享利潤，公會通常會抽成30-50%。

在其鼎盛時期，特別是在2019疫情期間，Axie對發展中國家的當地經濟產生了重大影響。在菲律賓（約40%的Axie Infinity用戶都在那裏），許多玩家的收入遠高於最低工資。公會獲利豐厚。

這就解決了遊戲开發者的一個關鍵問題：玩家流動性。通過激勵玩家每天花幾個小時積極玩遊戲，Axie確保每個玩家都會有一個對手等在那裏，讓玩家體驗更有吸引力。

但這是有代價的。

爲了解決玩家的流動性問題，Axie送出大量代幣來激勵玩家參與。故事從此處开始。由於SLP沒有上限，代幣瘋狂膨脹，價格暴跌，生態系統崩潰。代幣貶值，玩家就會離开。Axie幾乎在一夜之間從“玩賺”寵兒變成了一個警世故事。

但如果有一種方法可以解決玩家流動性問題，而不需要不可持續的代幣經濟學會怎樣？

這正是ARC / AI Arena在過去三年裏一直在默默努力的事情。現在，它开始开花結果了。

1、玩家流動性是命脈

玩家流動性是多人遊戲的命脈，也是長期成功的關鍵。

許多Web3和獨立遊戲都面臨着“冷啓動”問題——玩家太少，無法快速配對或形成繁榮社區。他們沒有遊戲大廠所擁有的營銷預算或自然的IP意識。這就會導致漫長的等待時間、無法配對以及較高的流失率等問題。

這些遊戲通常都會慢慢地痛苦地消亡。

因此，遊戲开發者必須從一开始就優先考慮玩家的流動性。遊戲需要這樣那樣的活動來維持樂趣——國際象棋需要兩名玩家，而大規模战鬥需要數千名玩家。技能匹配機制進一步提高了門檻，需要更多玩家來保持遊戲的公平性和吸引力。

對於Web3遊戲來說，風險更大。根據Delphi Digital的年度遊戲報告，Web3遊戲的用戶獲取成本比傳統手機遊戲高出77%，這使得玩家留存率變得至關重要。

強大的玩家基礎能夠確保公平匹配、充滿活力的遊戲經濟（即更多的道具买賣）以及更活躍的社交互動，從而讓遊戲變得更有趣。

2、ARC——AI遊戲先鋒

由ArenaX Labs开發的ARC正在引領AI在线遊戲體驗的未來。簡而言之，他們使用AI來解決困擾新遊戲的玩家流動性問題。

如今遊戲內大多數AI機器人的問題就在於它們太差勁了。一旦你花幾個小時掌握了竅門，這些機器人就會變得非常容易被打敗。它們是爲了幫助新玩家而設計的，但卻不能爲經驗豐富的玩家帶來太多挑战或粘性。

想象一下，AI玩家的技能可以與頂級人類玩家相媲美。想象一下，可以在任何時間、任何地點與它們對抗，而無需等待配對。想象一下，訓練你的AI玩家模仿你的遊戲風格，擁有它，並通過其表現賺取獎勵。

這對玩家和遊戲公司來說都是雙贏的。

遊戲公司使用類似人類的AI機器人來讓遊戲大受歡迎，提高玩家流動性，改善用戶體驗，提高留存率——這是新的遊戲後來者在競爭激烈的市場中生存的關鍵因素。

玩家獲得了一種參與遊戲的新方式，在訓練AI並與其對抗的過程中建立了更強烈的歸屬感。

讓我們來看看他們是怎么做的。

3、產品和架構

母公司ArenaX Labs正在开發一系列產品來解決玩家流動性問題。

現有產品：AI Arena，一款AI格鬥遊戲。
新產品：ARC B2B，一個AI驅動的遊戲SDK，可以很容易地集成到任何遊戲中。
新產品：ARC強化學習（RL）

（1）AI Arena：遊戲

AI Arena是一款能讓人聯想到任天堂的Super Smash Bros的格鬥類遊戲，各種各樣古怪的卡通角色在競技場中展开战鬥。

但在AI Arena中，每個角色都是由AI控制的——你扮演的不是战士，而是他們的教練。你的任務是使用你的策略和專業知識來訓練你的AI战士。

訓練你的战士就像訓練一個學生爲战鬥做准備。在訓練模式中，你打开數據收集並創建战鬥場景來對它們的動作進行微調。例如，如果你的战士離對手很近，你可以教它們用你的盾牌擋格，然後連擊。如何遠距離战鬥？訓練他們發動遠程攻擊。

你可以控制收集什么樣的數據，確保只記錄最好的動作用於訓練。經過練習，你可以細化超參數，以獲得更多的技術優勢，或者簡單地使用對初學者友好的默認設置。一旦訓練完成，你的AI战士就可以參加战鬥了。

萬事开頭難——訓練一個有效的模型需要時間和實驗。我的第一個战士好幾次都從平台上掉了下來，並不是被對手擊中掉下來的。但經過幾次迭代後，我成功創建了一個表現良好的模型。看到你的訓練得到了回報，是一件令人深感滿足的事情。

AI Arena通過NFT战士引入了額外的深度。每個NFT角色都有獨特的外觀特徵和战鬥屬性，這些都會影響遊戲玩法。這增加了另一個策略層。

目前，AI Arena在Arbitrum主網上運行，並且只有那些有AI Arena NFT的人才可以訪問，在完善遊戲玩法的同時保持社區的排他性。玩家可以加入公會，聚集冠軍NFT和NRN進行鏈上战鬥排名，並獲得獎勵。這樣做是爲了吸引忠誠的玩家並推動競爭。

最終，AI Arena是ARC的AI培訓技術的展台。雖然這是他們進入生態系統的入口點，但真正的愿景遠遠超出了這款遊戲自身。

（2）ARC：基礎設施

ARC是一個專爲遊戲設計的AI基礎設施解決方案。

ArenaX團隊從頭开始，甚至开發自己的遊戲基礎設施，是因爲Unity和Unreal等現有解決方案無法滿足他們的愿景。

三年多的時間裏，他們精心設計了一個強大的技術棧，能夠處理數據聚合、模型訓練和模型檢查，以進行模仿和強化學習。這種基礎設施是AI Arena的支柱，但它的潛力要大得多。

隨着團隊不斷完善他們的技術，第三方工作室开始找到ARC，希望獲得該平台的授權或白標籤。認識到這一需求後，他們將ARC的基礎設施形式化爲B2B產品。

如今，ARC直接與遊戲公司合作，提供AI遊戲體驗。其價值主張是：

永久玩家流動性即服務
將AI玩法作爲一個簡單集成

永久玩家流動性即服務

ARC專注於人類行爲克隆——訓練專門的AI模型來模仿人類行爲。這與今天遊戲中AI的主要用途不同，後者使用生成式模型來創建遊戲資產，並使用LLM來驅動對話。

使用ARC SDK，开發者可以創建類似人類的AI智能體，並根據遊戲需求進行擴展。SDK簡化了繁重的工作。遊戲公司可以在不處理復雜的機器學習的情況下引入AI。

集成後，部署AI模型只需要一行代碼，ARC負責基礎設施、數據處理、訓練和後端部署工作。

ARC採用與遊戲公司合作的方式，幫助他們：

捕獲原始遊戲玩法數據，並將其轉換爲用於AI訓練的有意義的數據集。
確定與遊戲機制相關的關鍵玩法變量和決策點。
將AI模型輸出映射到遊戲內活動，確保功能順暢——例如，將AI的“右擊”輸出與特定的遊戲控制聯系起來。

AI是如何工作的？

ARC針對遊戲互動使用了四類模型：

前饋神經網絡：適用於具有速度或位置等數值特徵的連續環境。
表格代理：對具有有限離散場景的遊戲尤爲理想。
層次化和卷積神經網絡正在开發中。

有兩個與ARC的AI模型相關的互動空間：

狀態空間定義了代理在任何給定時刻對遊戲的了解。對於前饋網絡，這是輸入特徵（如玩家的速度或位置）的組合。對於表格代理，這是代理在遊戲中可能遇到的離散場景。

動作空間描述代理在遊戲中可以做什么，從離散輸入（如按下按鈕）到連續控制（如操縱杆移動）。這會映射到遊戲輸入。

狀態空間爲ARC的AI模型提供輸入，AI模型處理輸入並生成輸出。隨後這些輸出通過動作空間轉化爲遊戲動作。

ARC與遊戲开發者密切合作，以確定最關鍵的功能並相應地設計狀態空間。他們還測試各種模型配置和大小，以平衡智能和速度，確保遊戲操作順暢，引人入勝。

據該團隊稱，Web3公司對他們的玩家流動性服務的需求尤其高。這些公司爲獲得更好的玩家流動性而付費，ARC將把這筆收入的很大一部分用於NRN代幣回購。

將AI玩法帶給玩家：訓練師平台

ARC SDK還讓web3公司訪問他們的遊戲的訓練師平台，允許玩家訓練並提交代理。

與AI Arena一樣，玩家可以設置模擬，獲取遊戲玩法數據並訓練空白AI模型。這些模型會隨着時間的推移而進化，在保留之前的知識的同時融入新的遊戲玩法數據，不需要每次更新都從頭开始。

這开啓了令人興奮的可能性：玩家可以在市場上出售他們定制訓練的AI代理，創造一個新的遊戲內經濟層。在AI Arena中，技術嫺熟的訓練師可以組成公會，他們可以向其他公司提供訓練技能。

對於那些完全集成代理功能的公司來說，Parallel Play（平行遊戲）的概念也變得生動起來。AI代理全天候可用，可以同時參與多個比賽或遊戲實例。這就解決了玩家的流動性問題，並爲用戶粘性和收益創造了新的機會。

但這還不是全部……

（3）ARC RL：從一對一到多對一

如果說AI Arena和ARC訓練師平台感覺像是單人模式（你可以在其中訓練自己的AI模型），那么ARC RL就類似於多人模式。

想象一下：一整個遊戲DAO匯集其玩法數據來訓練一個共享AI模型，每個人都共同擁有該模型並從中受益。這些“主代理”代表了所有玩家的集體智慧，通過引入集體努力和战略合作推動的競爭來改變電競。

ARC RL使用強化學習（即“RL”）和衆包人類遊戲玩法數據來訓練這些“超智能”代理。

強化學習的工作原理是獎勵最優行爲的代理。它在遊戲中尤其有效，因爲獎勵功能是明確而客觀的，如造成的傷害、獲得的金幣或勝利。

這是有先例的：

DeepMind的AlphaGo在圍棋比賽中擊敗了專業人類棋手，通過數百萬場自生成的比賽訓練，每次迭代都在完善自己的策略。

我之前沒有意識到這一點，但早在chatGPT創建之前，OpenAI就已經在遊戲圈中廣爲人知了。

OpenAI Five在Dota 2中使用強化學習碾壓頂級人類玩家，並在2019年擊敗了世界冠軍。它通過加速模擬和大量的計算資源掌握了團隊合作等先進的策略。

OpenAI Five每天運行數百萬個遊戲，相當於每天250年的模擬遊戲，由256個GPU和128,000個CPU提供強大支持。通過跳過圖形渲染，它大大加快了學習速度。

最初，該AI表現出不穩定的行爲，比如漫無目的地闲逛，但很快就改善了。它掌握了一些基本策略，如在小路上匍匐以及盜資源，最終發展爲復雜操作，如伏擊。

強化學習的關鍵理念是，AI代理通過經驗學習如何取得成功，而不是被直接告知該做什么。

ARC RL通過使用離线強化學習來使自己與衆不同。AI代理不是從自己的試錯中學習，而是從別人的經驗中學習。這就像是觀看別人騎自行車視頻的學生，觀察他們的成功和失敗，並利用這些知識來避免摔倒，更快地提高。

這種方法提供了一個額外好處：協作訓練和模型的共同所有權。這不僅讓強大的AI代理變得更加普及，也讓玩家、公會和开發者的動機更加一致。

在“超智能”遊戲代理的創建中，有兩個關鍵角色：

贊助商：類似公會的帶頭人，他們質押大量NRN代幣來啓動和管理RL代理。贊助商可以是任何實體，但很可能是遊戲公會、DAO、web3社區，甚至是像Luna這樣受歡迎的鏈上個性化代理。
玩家：質押少量NRN代幣貢獻其遊戲玩法數據以訓練代理的個人。

贊助商協調和指導他們的玩家團隊，確保高質量的訓練數據，使他們的AI代理在代理比賽中具有競爭優勢。

獎勵是根據超級代理在比賽中的表現來分配的。70%的獎勵歸玩家所有，10%歸贊助商所有，剩下的20%歸NRN金庫所有。這種結構讓所有參與者都有一致的激勵機制。

數據貢獻

你如何讓玩家樂於貢獻自己的遊戲玩法數據？不容易的。

ARC讓提供遊戲玩法數據變得簡單而有益。玩家不需要專業知識，只要玩遊戲就行了。在一個會話結束後，他們會被提示提交數據去訓練一個特定代理。儀表板跟蹤他們的貢獻和他們支持的代理。

ARC的歸因算法通過評估貢獻和獎勵高質量、有影響力的數據來確保質量。

有趣的是，即使你是一個糟糕的玩家（像我一樣），你的數據也是有用的。糟糕的遊戲玩法可以幫助代理學習不該做什么，而技術高超的遊戲玩法則可以教授最佳策略。冗余數據被過濾掉以保持質量。

簡而言之，ARC RL被設計成一種低摩擦的大衆市場產品，以共同擁有超越人類能力的代理爲中心。

4、市場規模

ARC的技術平台是多功能的，支持多種類型的遊戲，如射擊遊戲、格鬥遊戲、社交賭場、賽車、卡牌交易遊戲和RPG。它是爲那些需要保持玩家粘性的遊戲量身定制的。

ARC的產品主要針對兩個市場：

ARC主要關注的是獨立开發者和公司，而不是老牌大廠。由於品牌影響力和分銷資源有限，這些小公司通常很難在早期吸引玩家。

ARC的AI代理通過從一开始就創造一個充滿活力的遊戲環境來解決這個問題，即使在遊戲的初始階段也能確保動態的遊戲玩法。

這可能會讓許多人感到驚訝，但獨立遊戲領域確實是遊戲市場的主要力量：

Steam上99%的遊戲都是獨立遊戲。
2024年，獨立遊戲在Steam上創造了總收入的48%。

另一個目標市場是Web3遊戲。大多數Web3遊戲都是由新興公司开發的，它們也面臨着這樣那樣的獨特挑战，如錢包登錄、加密質疑和高昂的用戶獲取成本。這些遊戲通常存在玩家流動性問題，AI代理可以填補空白，保持遊戲的吸引力。

雖然Web3遊戲最近因爲缺乏吸引人的體驗而舉步維艱，但正在顯現復蘇跡象。

例如，最早的AAA級Web3遊戲之一Off the Grid最近取得了早期主流成功，首月就有900萬個錢包進行了1億筆交易。這爲該行業獲取廣泛成功鋪平了道路，爲ARC創造了支持這一復興的機會。

5、ARC團隊

ArenaX Labs背後的創始團隊擁有豐富的機器學習和投資管理專業知識。

首席執行官兼首席技術官Brandon Da Silva曾在一家加拿大投資公司主導機器學習研究，專注於強化學習、Bayesian深度學習和模型適應性。他率先开發了以風險平價和多資產組合管理爲中心的10億美元量化交易策略。

首席運營官Wei Xie在同一家公司管理着70億美元的流動性策略投資組合，並主持其創新投資項目，專注於AI、機器學習和Web3技術等新興領域。

ArenaX Labs在2021年獲得了500萬美元的種子輪融資，由Paradigm領投，Framework ventures參投。該公司在2024年1月獲得了600萬美元的融資，由SevenX Ventures、FunPlus / Xterio和Moore Strategic Ventures領投。

6、NRN代幣經濟學——一次健康的改革

ARC/AI Arena有一個代幣——NRN。讓我們先來盤點一下如今的情況。

考察供給側和需求側將使我們更清楚地了解趨勢走向。

（1）供給側

NRN的總供應量爲10億，其中約4.09億（40.9%）處於流通中。

在撰寫本文時，該代幣價格爲0.72美元，這意味着市值爲2900萬美元，完全稀釋後估值爲7100萬美元。

NRN於2024年6月24日發布，40.9%的流通供應來自：

社區空投（佔總數的8%）
基金會金庫（佔10.9%，其中有2.9%已解鎖，36個月线性解鎖）
社區生態系統獎勵（佔30%）

大部分流通供應（40.9%中的30%）由社區生態系統獎勵組成，項目管理這些代幣並將其战略性地分配給質押獎勵、遊戲獎勵、生態系統增長計劃和社區驅動計劃。

解鎖時間表令人放心，短期內沒有重大事件：

下一個解鎖是基金會的OTC銷售（1.1%），從2024年12月开始，12個月线性解鎖。這只會使月通脹率增加0.09%，不太可能引起重大擔憂。
投資者和貢獻者的分配（總供應量的50%）要到2025年6月才开始解鎖，即使到那時，也會在24個月內進行线性解鎖。

目前，拋售壓力預計仍將相當可控，主要源於生態系統獎勵。關鍵是信任團隊有能力战略性地部署這些資金，以推動協議的增長。

（2）需求側

NRN v1——玩家經濟

最初，NRN被設計爲與AI Arena遊戲經濟相關聯的战略資源。

玩家將NRN押在AI玩家身上，如果它們贏了就會獲得獎勵，如果輸了就會失去部分質押。這創造了一種直接利益相關的動態，將其轉變爲一項競技運動，並爲熟練的玩家提供經濟激勵。

獎勵使用ELO系統進行分配，確保基於技能的平衡支付。其他收益來源還包括遊戲道具購买、裝扮升級和比賽入場費。

最初的代幣模式完全依賴於遊戲的成功以及不斷有新玩家愿意購买NRN和NFT參與到遊戲中來。

下面來說一下我們爲何如此興奮……

NRN v2——玩家&平台經濟

NRN改進的v2代幣經濟學通過將代幣的效用從AI Arena擴展到更廣泛的ARC平台，引入了強大的新需求驅動因素。這種演變將NRN從特定遊戲代幣轉變爲平台代幣。在我看來，這是非常積極的轉變。

NRN的三個新需求驅動因素包括：

來自ARC集成的收入。集成ARC的遊戲公司將通過集成費用和與遊戲表現掛鉤的持續版稅爲金庫創造收益。金庫資金可以推動NRN回購，發展生態系統，並激勵訓練師平台上的玩家。
訓練師市場費用。NRN從訓練師場的收費中獲取價值，玩家可以在訓練師市場上交易AI模型和遊戲玩法數據。
參與ARC RL的質押：贊助商和玩家都必須質押NRN才能加入ARC RL。隨着越來越多的玩家進入ARC RL，對NRN的需求也相應增加。

尤其令人興奮的是遊戲公司的收益。這標志着從純粹的B2C模式向B2C和B2B混合模式的轉變，創造了NRN經濟的持續的外部資本流入。隨着ARC擁有更廣闊的目標市場，這種收益流將超過AI Arena本身所能產生的收益。

訓練師市場的費用雖然有前景，但取決於生態系統能否達到臨界規模——足夠多的遊戲、訓練師和玩家來維持活躍的交易活動。這是一個長期事業。

在短期內，ARC RL質押可能是最直接和最具反射性的需求驅動因素。資金充足的初始獎勵池和新產品發布的興奮可能會引發早期採用，推高代幣價格並吸引參與者。這就形成了需求上升和經濟增長的反饋循環。然而，反過來看，如果ARC RL難以維持用戶粘性，需求可能會很快消失。

網絡效應的潛力是巨大的：更多遊戲→更多玩家→更多遊戲加入→更多玩家。這種良性循環可以將NRN定位爲Crypto AI遊戲生態系統中的核心代幣。

7、遊戲AI模型之母

結局是什么？ARC的優勢在於它能夠推廣各種遊戲類型。隨着時間的推移，讓他們能夠收集到獨一無二的特定遊戲玩法數據庫。隨着ARC與更多遊戲的集成，它可以不斷地將這些數據反饋到自己的生態系統中，從而創造一個增長和完善的良性循環。

一旦這個橫斷面遊戲數據集達到臨界質量，它將成爲一個非常有價值的資源。想象一下，利用它來訓練遊戲开發的通用AI模型——爲大規模設計、測試和優化遊戲开啓新的可能性。

現在還爲時尚早，但在數據就是新石油的人工智能時代，這方面的潛力是無限的。

8、我們的想法

（1）NRN演變爲平台遊戲——代幣重定價

隨着ARC和ARC RL的發行，該項目不再只是一個單一產品的遊戲公司，它現在將自己定位爲一個平台和AI遊戲。這一轉變應該會導致NRN代幣的重新評級，在這之前NRN代幣受限於AI Arena的成功。通過ARC RL引入新的代幣源，再加上與遊戲公司的收入分成協議和訓練師交易費的外部需求，爲NRN的效用和價值創造了更廣泛、更多樣化的基礎。

（2）成功與遊戲合作夥伴密切相關

ARC的商業模式將其成功與它合作的公司聯系在一起，因爲收益流是基於代幣分配（在Web3遊戲中）和遊戲版稅的支付。與之緊密結合的遊戲值得一看。

如果ARC遊戲獲得巨大成功，那么由此產生的價值將回流到NRN持有者手中。相反，如果合作遊戲陷入困境，價值流將受到限制。

（3）期待與Web3遊戲的更多集成

ARC平台非常適合Web3遊戲，在Web3遊戲中，具有激勵機制的競爭玩法與現有的代幣經濟完美結合。

通過集成ARC， Web3遊戲可以立即進入“AI代理”敘事。ARC RL將社區聚集在一起，激勵他們朝着共同的目標前進。這也爲創新機制开闢了新的機會，比如讓“遊戲到空投”等活動更吸引玩家。通過將AI和代幣激勵相結合，ARC增加了傳統遊戲無法復制的深度和興奮度。

（4）AI玩法有一個學習曲线

AI玩法有陡峭的學習曲线，這可能會給新玩家帶來摩擦。我花了一個小時才弄清楚如何在AI Arena中正確訓練我的玩家。

然而，ARC RL的玩家體驗摩擦更小，因爲當玩家玩遊戲並提交數據時，AI訓練是在後端處理的。另一個懸而未決的問題是，當玩家知道自己的對手是AI時，他們會有什么感覺。這對他們有影響嗎？會增強還是削弱遊戲體驗？只有時間才能告訴我們答案。