拳打谷歌ChatGPT火出圈！投資人稱更需警惕投資泡沫化跟風(fēng)

2022年12月07日 14:54　來源：第一財(cái)經(jīng)

大字體

小字體

分享到：

　　一夕之間，ChatGPT突然火了。

　　所謂ChatGPT，是在今年11月30日，由人工智能實(shí)驗(yàn)室OpenAI上線的新模型，其網(wǎng)頁應(yīng)用允許用戶免費(fèi)使用，目前用戶與ChatGPT之間的對話互動(dòng)包括了普通聊天、信息咨詢、撰寫詩詞作文、修改代碼等，甚至令用戶產(chǎn)生ChatGPT能否取代谷歌等搜索引擎的疑慮。

　　一位技術(shù)領(lǐng)域人士認(rèn)為，讓ChatGPT 類平臺(tái)、以及短視頻平臺(tái)或購物社交平臺(tái)來取代搜索引擎，容易讓知識(shí)來源單一化，這是危險(xiǎn)的。東吳證券團(tuán)隊(duì)也認(rèn)為，ChatGPT模型仍無法很好解決虛假信息的問題，甚至過度猜測用戶意圖導(dǎo)致回答偏差較大，因此其本質(zhì)仍偏向AIGC內(nèi)容生產(chǎn)工具，而非搜索引擎。

　　此外，ChatGPT火速出圈，但對話過程中也經(jīng)常會(huì)發(fā)生因語料積累不足而產(chǎn)生的“事故”。多位AI界行業(yè)人士對第一財(cái)經(jīng)記者表示，無需因ChatGPT的智能而對AI產(chǎn)生恐懼，ChatGPT的出圈本質(zhì)是算力與樣本量提升后得到的自然結(jié)果，更需警惕的是將ChatGPT歸屬于AIGC賽道后引發(fā)的創(chuàng)業(yè)與投資泡沫。

　　“上癮”的聊天AI

　　據(jù)官網(wǎng)介紹，計(jì)算模型GPT-3.5支持的通用聊天機(jī)器人ChatGPT，能回答連續(xù)性的問題、承認(rèn)自己的錯(cuò)誤、質(zhì)疑不正確的假設(shè)，甚至拒絕不合理的需求。從寫劇本、寫詩、設(shè)計(jì)游戲，到給程序找bug，乃至制定一份“毀滅人類”的計(jì)劃，這個(gè)AI能做的事情超乎想象。

　　美國企業(yè)家馬斯克詢問了ChatGPT如何設(shè)計(jì)Twitter，AI回答稱：“為了使用戶更容易查看線程互聯(lián)網(wǎng)對話并與之交互，你可以將線性一維界面轉(zhuǎn)換為二維無限網(wǎng)格?！?/p>

　　有人認(rèn)為，ChatGPT的出現(xiàn)堪比AlphaGo打敗李世石。12月5日，OpenAI創(chuàng)始人兼CEO阿爾特曼(Sam Altman)發(fā)布推文表示，ChatGPT用戶數(shù)已突破了100萬。在這條推特下，馬斯克詢問“每次聊天的平均費(fèi)用是多少”，阿爾特曼回復(fù)表示，“用戶平均每次聊天所花費(fèi)的可能是個(gè)位數(shù)美分?！?/p>

　　目前ChatGPT仍處于免費(fèi)測試階段，不限量向公眾開放，基于其破百萬的用戶數(shù)，平臺(tái)所花費(fèi)的成本不算小。不過，在使用過程中，用戶提供的反饋對OpenAI也是最有價(jià)值的信息，可以不斷訓(xùn)練語言模型，修正錯(cuò)誤答案。

　　第一財(cái)經(jīng)記者注冊并體驗(yàn)了一下ChatGPT對話。雖然目前ChatGPT并沒有開放給中國地區(qū)的用戶，但界面仍可使用中文。記者首先讓AI自我介紹，其回復(fù)，“我是Assistant，一個(gè)由 OpenAI 訓(xùn)練的大型語言模型。我的工作是幫助人們回答各種問題，盡可能提供準(zhǔn)確和詳細(xì)的信息。我可以回答各種問題，無論是關(guān)于歷史、科學(xué)、人文還是其他話題?！?/p>

　　計(jì)算機(jī)領(lǐng)域從業(yè)人士高毅對第一財(cái)經(jīng)表示，試用ChatGPT的體驗(yàn)很奇妙，一個(gè)聊天AI 能寫代碼，能用“意念”分析代碼，甚至能用“意念”分析一個(gè)超時(shí)程序的運(yùn)行結(jié)果，“一開始以為他打開了個(gè)gcc 或者 python 之類的外部進(jìn)程輔助分析，但試下來感覺并不是這樣，而是他真的像人一樣在試圖理解這些代碼?！?/p>

　　高毅故意提供了一些有問題的輸入程序，使其根本無法正確執(zhí)行，還故意給了個(gè)有生之年無法運(yùn)行結(jié)束的程序，而ChatGPT像人而非機(jī)器一樣，無視了上述這些不重要的問題，轉(zhuǎn)而專注于問題的核心點(diǎn)，并在有限時(shí)間內(nèi)給出了解答，“雖然他回答有小的錯(cuò)誤，但能夠做到這一步真的已經(jīng)非常厲害了?！?/p>

　　東吳證券研報(bào)分析認(rèn)為，ChatGPT的模型經(jīng)歷從GPT到GPT3的升級，優(yōu)化主要來自算力增加。GPT、GPT-2和GPT-3在算法模型并沒有太大改變，但參數(shù)量從1.17億增加到1750億，預(yù)訓(xùn)練數(shù)據(jù)量從5GB增加到45TB，其中GPT-3訓(xùn)練一次的費(fèi)用是460萬美元，總訓(xùn)練成本達(dá)1200萬美元。雖然訓(xùn)練數(shù)據(jù)量和算力大幅增加使GPT-3有顯著優(yōu)化，但高額投入也使其只能走B端變現(xiàn)。

　　此次ChatGPT出圈，其技術(shù)模型最大變化出現(xiàn)在2022年推出的GPT3.5，技術(shù)迭代成優(yōu)化來源于1月發(fā)布的InstructGPT模型中增加了人類對模型輸出結(jié)果的演示，并在對結(jié)果進(jìn)行排序的基礎(chǔ)上訓(xùn)練，加上指令調(diào)整的幫助，雖然其只有13億個(gè)參數(shù)，但回答準(zhǔn)確率、道德表現(xiàn)卻好于GPT-3。

　　ChatGPT雖然強(qiáng)大，仍然有其局限性，比如偶爾會(huì)犯錯(cuò)誤，有一定的誤導(dǎo)性；作為一個(gè)AI，它也不能提供對人或事件的判斷和評價(jià)。但基于其反饋強(qiáng)化學(xué)習(xí)系統(tǒng)，ChatGPT也在不斷學(xué)習(xí)完善。有用戶表示，前幾天問ChatGPT的時(shí)候提供的錯(cuò)誤答案，過了一天之后就已經(jīng)被修正，或許是很多用戶的反饋幫助ChatGPT對正確的答案進(jìn)行了排序。

　　日常對ChatGPT進(jìn)行調(diào)戲逗樂僅是娛樂項(xiàng)目，一旦作為嚴(yán)肅工作內(nèi)容，則需要嚴(yán)謹(jǐn)對待。據(jù)了解，程序員交友網(wǎng)站Stack Overflow上已出現(xiàn)大量通過ChatGPT自動(dòng)生成的內(nèi)容，給Stack Overflow的質(zhì)量管理造成影響。Stack Overflow方面發(fā)布公告稱，由于從ChatGPT中獲得正確答案的平臺(tái)比率太低，發(fā)布由ChatGPT創(chuàng)建的答案對網(wǎng)站和詢問者以及尋找正確答案的用戶都有很大危害?！敖褂肅hatGPT直接生成垃圾答案，否則封號(hào)。這是一個(gè)臨時(shí)性規(guī)定，目的是應(yīng)對目前論壇上ChatGPT生成內(nèi)容的泛濫之勢?！?/p>

　　對此，ChatGPT回應(yīng)稱，“因?yàn)锳I生成的答案不總是準(zhǔn)確或相關(guān)的，可能會(huì)導(dǎo)致Stack Overflow上混淆錯(cuò)誤答案，誤導(dǎo)在尋求幫助的用戶。”“Stack Overflow禁止用AI生成答案是合理的?！卑柼芈脖硎?，正試圖阻止ChatGPT隨機(jī)編造，現(xiàn)階段讓其與當(dāng)前技術(shù)保持平衡是很棘手的。隨著時(shí)間的推移，會(huì)根據(jù)用戶反饋來改進(jìn)。

　　對AI無需過分恐慌

　　開發(fā)出ChatGPT的公司是何來頭？公開信息顯示，ChatGPT由人工智能公司OpenAI開發(fā)，成立至今已經(jīng)七年，坊間傳言其最新估值已達(dá)到兩百億美元。

　　OpenAI最初是由馬斯克、阿爾特曼等六人在2015年聯(lián)合創(chuàng)辦，最初為非營利性機(jī)構(gòu)。2018年馬斯克宣布退出，2019年，OpenAI宣布重組為一家“有限營利(capped-profit)企業(yè)”，并接受了微軟10億美元的投資，雙方表示將合作替Azure云端平臺(tái)服務(wù)開發(fā)人工智能技術(shù)。此次推出的ChatGPT也是在微軟Azure AI服務(wù)器上完成的訓(xùn)練。

　　阿爾特曼在12月6日發(fā)布的推文中感謝微軟和Azure，他表示，微軟和Azure做了大量的工作，構(gòu)建了迄今為止最好的AI 基礎(chǔ)設(shè)施，但目前并沒有因?yàn)镺penAI 推出的東西而獲得足夠的榮譽(yù)。

　　此次ChatGPT的火熱出圈也引發(fā)外界對AI是否即將戰(zhàn)勝人類的恐慌。但多位AI界面人士對記者稱，目前ChatGPT更多是算力與語料調(diào)教后的正常結(jié)果。

　　據(jù)國盛證券研報(bào)，ChatGPT的背后離不開大模型、大數(shù)據(jù)、大算力，其技術(shù)底座使用的是微調(diào)后的GPT-3.5系列模型，有著多達(dá)1750億個(gè)模型參數(shù)，OpenAI主要使用的公共爬蟲數(shù)據(jù)集有著超過萬億單詞的人類語言數(shù)據(jù)集。GPT-3.5在微軟Azure AI超算基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練，總算力消耗約3640PF-days(即每秒一千萬億次計(jì)算，運(yùn)行3640個(gè)整日)。

　　針對外界認(rèn)為ChatGPT可以取代搜索引擎的觀點(diǎn)，前Google總部科學(xué)家、出門問問創(chuàng)始人李志飛認(rèn)為，相對于語音助手和搜索引擎，ChatGPT目前還有很多不能干或干不好的實(shí)情，如不能查詢附近的川菜館，不能進(jìn)行打電話、定日歷、播放歌曲等手機(jī)本地操作。此外，ChatGPT大概率不能回答訓(xùn)練時(shí)它沒有看到的最新網(wǎng)頁知識(shí)，不一定能正確回答一個(gè)五年前政治人物今年的年齡，大概率不能做對簡單的邏輯題和加減乘除題。

　　總結(jié)來說，李志飛認(rèn)為，ChatGPT的“認(rèn)知”建立在虛擬訓(xùn)練文本上，沒有跟實(shí)時(shí)的數(shù)據(jù)庫或信息連接，也沒有顯式的邏輯推理，仍有些“空中樓閣”的味道，所以特別適合插科打諢。

　　雖有不少聲音將ChatGPT與谷歌等搜索引擎對比，但東吳證券團(tuán)隊(duì)認(rèn)為，由于ChatGPT模型仍無法很好解決虛假信息的問題，甚至過度猜測用戶意圖導(dǎo)致回答偏差較大，因此其本質(zhì)仍偏向AIGC內(nèi)容生產(chǎn)工具。搜索引擎核心是海量信息集合，而非信息創(chuàng)造；但在“存在標(biāo)準(zhǔn)答案”的編碼、數(shù)學(xué)計(jì)算等領(lǐng)域，ChatGPT或?qū)λ阉饕娈a(chǎn)生一定沖擊。其次，相比更多面向B端客戶的GPT-3，C端學(xué)習(xí)和使用成本低、產(chǎn)出效果好的ChatGPT有望助力AIGC破圈，并在接收海量用戶反饋的過程中繼續(xù)迭代，推動(dòng)AIGC文字內(nèi)容生產(chǎn)走向全民化。

　　不少游戲人士和插畫人士也開始關(guān)注ChatGPT，但不少用戶在使用之后反饋表示ChatGPT并沒有想象中那么智能。有一位游戲行業(yè)人士發(fā)現(xiàn)，ChatGPT對于2021年之后發(fā)生的事情似乎了解得并不多，“問它《原神》，它不知道稻妻(原神的一個(gè)地名)是哪里?！痹撚脩粽f。另有用戶向ChatGPT提問“《原神》的開發(fā)公司是哪家”，得到的回應(yīng)不是米哈游而是騰訊。

　　對此，另一位用戶表示，目前ChatGPT的學(xué)習(xí)的數(shù)據(jù)樣本只截止到2021年，等到訓(xùn)練的人數(shù)增加了，反饋內(nèi)容的質(zhì)量便會(huì)有所提升。此外，部分用戶向記者反饋認(rèn)為，ChatGPT在不同語種的識(shí)別和解讀上存在差異，使用中文和同樣內(nèi)容轉(zhuǎn)譯成的英文輸入得到的反饋結(jié)果并不相同。

　　盡管目前ChatGPT僅能實(shí)現(xiàn)文字應(yīng)答，但是不少插畫人士也開始利用ChatGPT工作。一位插畫師告訴記者，對于目前市面上流行的AI繪畫軟件stablediffusion，插畫師?？嘤诜磸?fù)修改提示語但仍無法得到理想的結(jié)果。不過ChatGPT提供了一個(gè)新的思路：用于生成指導(dǎo)AI作畫的提示語模板，即利用AI告訴AI如何作畫?！跋喈?dāng)于把ChatGPT當(dāng)成一個(gè)人類慣用語和ai繪畫能理解的語言中間的翻譯器，只需要在它生成的模板中填寫幾個(gè)關(guān)鍵詞然后粘貼到stablediffusion就好了，經(jīng)過ChatGPT轉(zhuǎn)換后的指令成的圖比原先手動(dòng)輸入的內(nèi)容相比要好很多。”

　　相較而言，人工智能研究專家、創(chuàng)新工場人工智能工程院執(zhí)行院長王詠剛持有更謹(jǐn)慎的態(tài)度，他表示，其一，AI創(chuàng)作目前在知識(shí)教育領(lǐng)域爭議很大，例如王詠剛杜撰了一個(gè)學(xué)術(shù)概念“鏡像等離子規(guī)范場”，但ChatGPT竟然真的一本正經(jīng)地進(jìn)行了解讀。

　　王詠剛稱，ChatGPT的模仿能力和文筆越好，這個(gè)未來風(fēng)險(xiǎn)就越值得重視且需要提前應(yīng)對。今天的AI生成理論，還沒辦法保證生成內(nèi)容的邏輯正確與合理；建立人類領(lǐng)域?qū)＜覅⑴c的AI訓(xùn)練過程，發(fā)展與正確性相關(guān)的增強(qiáng)學(xué)習(xí)算法可能會(huì)是未來的一個(gè)AI科研熱點(diǎn)。

　　其二的擔(dān)憂點(diǎn)在于AI/CS專業(yè)人需保持冷靜，王詠剛認(rèn)為，面對大幅提升多輪對話能力的ChatGPT，越是AI/CS的從業(yè)者越是不能一味地頂禮膜拜；最起碼，應(yīng)該有測試和驗(yàn)證的精神，不斷探索新模型的能力上限，甄別模型生成答案時(shí)真正的“記憶認(rèn)知”和基于特征相似性的“模仿游戲”。

　　警惕盲目跟風(fēng)

　　ChatGPT的火爆讓國內(nèi)創(chuàng)投圈再次熱議AIGC的投資價(jià)值，AIGC 全稱AI-Generated Content，指利用AI技術(shù)尋找數(shù)據(jù)規(guī)律并泛化生成的內(nèi)容。

　　國泰君安研發(fā)分析稱，AI繪畫是AIGC的一大重要分支，目前處于由簡單的降本增效向創(chuàng)造額外價(jià)值升級的階段，跨文字和圖像的多模態(tài)內(nèi)容成為關(guān)鍵的發(fā)展節(jié)點(diǎn)。2022年8月，Stable Diffusion、Midjourney等AI繪畫應(yīng)用因《太空歌劇院》作品的獲獎(jiǎng)而在海外迅速出圈，此后熱度蔓延至國內(nèi)，無界版圖AI、意間AI等應(yīng)用于9月底相繼上線，其中意間AI用戶數(shù)在42天內(nèi)突破百萬。此次ChatGPT僅用5天便實(shí)現(xiàn)百萬用戶數(shù)，AI問答及其他分支應(yīng)用的熱度有望持續(xù)攀升。

　　就技術(shù)層面而言，國泰君安稱，模型效率、素材庫豐富度是AIGC應(yīng)用的核心競爭力。以AI繪畫為例，此前流行的GAN模型存在一定局限性，包括從噪聲/條件到最終結(jié)果的一步到位式生成方式難度較高，面對復(fù)雜數(shù)據(jù)時(shí)容易訓(xùn)練失敗，跨模態(tài)生成效果較差等。但2022年出現(xiàn)的Diffusion模型在這三方面均有改善，模型迭代驅(qū)動(dòng)多個(gè)AI繪畫應(yīng)用出圈。

　　并且此次OpenAI發(fā)布的ChatGPT模型較前代而言有較大進(jìn)步，如減少不真實(shí)回答、避免有害回答、挑戰(zhàn)用戶問題前提等，同時(shí)還具備連續(xù)對話的記憶能力，人機(jī)交互體驗(yàn)更為逼真。豐富的內(nèi)容素材庫保障模型得到充分訓(xùn)練，并最終生成高質(zhì)量內(nèi)容，是AIGC應(yīng)用的另一核心競爭力。

　　因此，浙商證券研報(bào)認(rèn)為，ChatGPT模型的出現(xiàn)對于文字模態(tài)的AIGC應(yīng)用具有重要意義。從下游相關(guān)受益應(yīng)用來看，包括但不限于代碼機(jī)器人、小說衍生器、對話類搜索引擎、語伴、語音工作助手、對話虛擬人等。從上游增加需求來看，包括算力、數(shù)據(jù)標(biāo)注、自然語言處理(NLP)等。

　　至于ChatGPT加入后對行業(yè)造成的“威脅”，高毅表示，ChatGPT不一定能完全替代所有人，但可能是相對基礎(chǔ)的那部分，“具體到軟件行業(yè)，今天能離譜地生成和分析代碼，那明天很有可能 PRD 文檔都能直接生成軟件產(chǎn)品，僅需少量資深產(chǎn)品研發(fā)測試等人力介入。作為從業(yè)者，平時(shí)還是得多想想，哪些技能是更深的、不那么容易被替代的?！?/p>

　　就目前ChatGPT存在的問題而言，主要是來自于訓(xùn)練過程和數(shù)據(jù)集的局限性，此次面向用戶免費(fèi)開放能夠進(jìn)一步強(qiáng)化訓(xùn)練，從而完善模型質(zhì)量。國盛證券研究所發(fā)現(xiàn)，目前OpenAI等巨頭已著手自建計(jì)算集群來滿足AIGC的要求，這種集中式的訓(xùn)練對GPU、存儲(chǔ)、機(jī)房、供電等基礎(chǔ)設(shè)施均有巨大需求。國內(nèi)部分創(chuàng)業(yè)團(tuán)隊(duì)目前基于公有云訓(xùn)練，隨著需求的增加，也有望轉(zhuǎn)向自建集群。

　　今年以來，我國“東數(shù)西算”戰(zhàn)略自上而下快速推進(jìn)，作為數(shù)字經(jīng)濟(jì)的基礎(chǔ)，“算力即權(quán)力”，其重要性不言而喻，此前國內(nèi)廠商的更多互聯(lián)網(wǎng)應(yīng)用聚焦于“存”而非“算”，隨著AIGC技術(shù)在全球的興起，“東數(shù)西算”的算力需求將越來越顯著。

　　未來隨著深度學(xué)習(xí)模型不斷完善、開源模式的推動(dòng)、大模型探索商業(yè)化的可能，AIGC有望加速發(fā)展。但針對此次ChatGPT再次點(diǎn)燃創(chuàng)投圈內(nèi)AIGC賽道的火熱，王詠剛持有謹(jǐn)慎態(tài)度。2022年11月，王詠剛前往硅谷，拜訪了多家投資公司、科技公司、創(chuàng)業(yè)團(tuán)隊(duì)，他發(fā)現(xiàn)科技圈里幾乎人人都在談?wù)揂IGC，似乎沒有AIGC包裝的創(chuàng)業(yè)項(xiàng)目就不是好項(xiàng)目，沒有AIGC概念的科研就發(fā)不出好論文。

　　但實(shí)情的確如此嗎？在后續(xù)與OpenAI兩位聯(lián)合創(chuàng)始人的交流中，王詠剛發(fā)現(xiàn)，對方會(huì)通過非常技術(shù)化、務(wù)實(shí)的心態(tài)談?wù)撈涔ぷ饔?jì)劃與技術(shù)思考，但他們并不知道AIGC到底是什么意思，這令王詠剛非常詫異，思考之后王詠剛認(rèn)為，“從科技上開創(chuàng)AIGC這個(gè)新領(lǐng)域的OpenAI創(chuàng)始人，其實(shí)并不需要知道類似AIGC之類純粹用來包裝科技概念的新名詞。他們要研究的是大模型結(jié)構(gòu)、并行訓(xùn)練加速、神經(jīng)網(wǎng)絡(luò)優(yōu)化等等具體科學(xué)與技術(shù)。這樣的人才是真正的創(chuàng)建者和領(lǐng)航者。”

　　目前國內(nèi)AIGC一片火熱，在王詠剛看來，其中一部分創(chuàng)業(yè)者、投資者、或?qū)IGC快速包裝成應(yīng)用產(chǎn)品的大多數(shù)，其實(shí)只是并無能力決定科技大方向的跟風(fēng)者?！捌谕L(fēng)者在AIGC這個(gè)大舞臺(tái)上，不要過于頭腦發(fā)熱，還是要多判斷一下，自己構(gòu)建的所謂‘產(chǎn)品’，到底是有益于人類進(jìn)步的，還是向已經(jīng)碎片化的內(nèi)容世界繼續(xù)灌水或傾倒垃圾的。”王詠剛表示。

【編輯:彭婧如】

更多精彩內(nèi)容請進(jìn)入財(cái)經(jīng)頻道