扔給聊天機(jī)器人一張圖表,它不但能看懂,還能給你如此這般做一番運(yùn)算,發(fā)來(lái)一段對(duì)圖表的解讀。
(資料圖)
你不服氣,又扔過(guò)去一張無(wú)厘頭的梗圖,它不但能看懂這張圖里有車(chē)有人,還能告訴你之所以好笑是因?yàn)椤斑@個(gè)男人在出租車(chē)上面熨衣服”。
這不是暢想,而是OpenAI最新發(fā)布的大型多模態(tài)GPT-4已經(jīng)具備的能力。北京時(shí)間3月15日凌晨,OpenAI正式發(fā)布了該模型。
簡(jiǎn)單來(lái)說(shuō),GPT-4與前代相比可以接受的文本輸入上限更高,回答的準(zhǔn)確性提高,能夠生成歌詞、創(chuàng)意文本等多樣化風(fēng)格的內(nèi)容。最最最令人振奮的是,GPT-4有強(qiáng)大的識(shí)圖能力,可以解讀圖片。
過(guò)去ChatGPT能做到的,新模型做得更好了;ChatGPT做不到的,新模型也可以做到了。
開(kāi)通了ChatGPT Plus的付費(fèi)用戶(hù)已經(jīng)可以選擇GPT-4模型,其他用戶(hù)則可以加入候補(bǔ)名單等待。但目前Plus用戶(hù)只能使用文本輸入,讀圖的功能尚未全面開(kāi)放。
外界用極大的熱情迎接了GPT-4。在消息公布之后,OpenAI官網(wǎng)一度發(fā)生擁堵,很多用戶(hù)在社交媒體表示這下秒開(kāi)了Plus服務(wù)?!癎PT-4”登上推特美國(guó)、日本等地區(qū)熱榜,也登上了國(guó)內(nèi)的微博熱搜榜、抖音熱榜社會(huì)榜等。
顛覆ChatGPT的,果然還是OpenAI自己。
A
GPT-4究竟有多厲害?
在官方演示視頻中,OpenAI總裁兼聯(lián)合創(chuàng)始人格雷格·布羅克曼(Greg Brockman)用筆和紙畫(huà)了個(gè)網(wǎng)站展示給GPT-4,后者僅用1到2秒的時(shí)間,就生成了網(wǎng)頁(yè)代碼、制作出了幾乎與圖中一模一樣的網(wǎng)站。
GPT-4可接受的文字輸入長(zhǎng)度提升到了2.5萬(wàn)個(gè)單詞,允許長(zhǎng)內(nèi)容創(chuàng)建、擴(kuò)展對(duì)話(huà)以及文檔搜索和分析等。在高級(jí)推理能力上,GPT-4也有提升。它可以更準(zhǔn)確地解決難題,具有更廣泛的常識(shí)和解決問(wèn)題的能力。
OpenAI表示,GPT-4在專(zhuān)業(yè)和學(xué)術(shù)方面表現(xiàn)出接近于人類(lèi)的水平。其給出的例子稱(chēng),在模擬律師考試中,GPT-4的得分能排進(jìn)前10%左右,而GPT-3.5的得分只能排在倒數(shù)10%左右。
而且GPT-4不僅是能對(duì)文本或圖片進(jìn)行單獨(dú)的識(shí)別,而是可以接受圖文混排的內(nèi)容。
“請(qǐng)記住,GPT-4不僅僅是一個(gè)語(yǔ)言模型,它還是視覺(jué)模型。實(shí)際上,它可以靈活地接受如文檔中那樣任意散布的圖像和文本。”演示視頻中出現(xiàn)包含各種圖片和文字的電腦屏幕截圖時(shí),格雷格如是強(qiáng)調(diào)。
在OpenAI官方介紹顯示,GPT-4可以對(duì)插入了多個(gè)圖表的論文進(jìn)行解讀,并用精煉的語(yǔ)言總結(jié)論文的內(nèi)容。
OpenAI表示,公司花了6個(gè)月的時(shí)間,利用ChatGPT的經(jīng)驗(yàn)教訓(xùn)以及對(duì)抗性測(cè)試調(diào)整GPT-4,使其在真實(shí)性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來(lái)最好的結(jié)果。
“至少對(duì)我們來(lái)說(shuō),GPT-4訓(xùn)練運(yùn)行前所未有的穩(wěn)定,成為首個(gè)能夠提前準(zhǔn)確預(yù)測(cè)其訓(xùn)練性能的大型模型?!?/p>
但OpenAI也表示,GPT-4并非完美,仍然不能完全摒除人工智能的“幻覺(jué)”,而且訓(xùn)練數(shù)據(jù)的時(shí)間依舊停留在2021年9月,可能會(huì)出現(xiàn)推理錯(cuò)誤:“有時(shí)會(huì)出現(xiàn)簡(jiǎn)單的推理錯(cuò)誤,會(huì)輕信用戶(hù)的虛假陳述,會(huì)像人類(lèi)一樣解答不了難題?!?/p>
B
值得一提的是,GPT-4在不同語(yǔ)種上的能力表現(xiàn)也大幅提升。
過(guò)去使用基于GPT-3.5的ChatGPT時(shí),要特別注意中文的表達(dá)規(guī)范、流暢,即便如此它依然會(huì)時(shí)不時(shí)地突然用英文作答,好像一著急就要“蹦母語(yǔ)”。
根據(jù)OpenAI的技術(shù)報(bào)告,GPT-4的中文準(zhǔn)確度已經(jīng)達(dá)到了80.1%,這個(gè)數(shù)字比GPT-3.5的英文表現(xiàn)還要好,后者只有70.1%。
為了看看GPT-4的中文能力究竟如何,字母榜(ID:wujicaijing)也簡(jiǎn)單地問(wèn)了幾個(gè)問(wèn)題。
我們先將一段報(bào)道GPT-4推出的英文發(fā)給ChatGPT,要其翻譯。這部分GPT-3.5和GPT-4的整體區(qū)別存在但是不明顯。如GPT-4翻譯為“人工智能驅(qū)動(dòng)的法語(yǔ)或西班牙語(yǔ)的對(duì)話(huà)”,GPT-3.5翻譯成了“法語(yǔ)或西班牙語(yǔ)的AI驅(qū)動(dòng)對(duì)話(huà)”。
當(dāng)我們進(jìn)一步提出要求時(shí),新模型的表現(xiàn)開(kāi)始明顯好于前代。比如“給年輕的朋友轉(zhuǎn)述這個(gè)消息”,GPT-4的回答很本土化:“嘿,哥們”“得告訴你個(gè)牛X的事兒”“這貨還能識(shí)別圖片”。
再讓它針對(duì)老年朋友編輯個(gè)信息,它的回答則有那種正經(jīng)的味道,如“親愛(ài)的朋友”“告訴你個(gè)好消息”“感嘆時(shí)光荏苒啊”。
反觀GPT-3.5,回答得就略顯生硬了,雖然也努力地加入了語(yǔ)氣詞等,但是整體文本還是欠缺重新梳理,依舊是對(duì)原文本的簡(jiǎn)單復(fù)制。
當(dāng)我們讓GPT-4模仿莎士比亞轉(zhuǎn)達(dá)這個(gè)消息時(shí),其回答頗為驚艷:“哉!眾生皆驚,乃OpenAI新奇之作——GPT-4誕生矣!其智慧之光,如同破曉之陽(yáng),識(shí)圖問(wèn)答皆無(wú)往不利……”但GPT-3.5則顯示發(fā)來(lái)一大段英文,當(dāng)我們要求用中文時(shí),文本不能說(shuō)和莎翁有什么關(guān)系,最多是有點(diǎn)譯制片腔調(diào):“哦!快來(lái)聽(tīng)聽(tīng)這個(gè)消息……”
接下來(lái),是社交媒體文案比拼。我們讓ChatGPT將之前的消息壓縮為100字左右的小紅書(shū)文案,GPT-4直接給出了完整的標(biāo)題、文案甚至是話(huà)題標(biāo)簽。而且文本中插入了很多小紅書(shū)常見(jiàn)的emoji表情,達(dá)到了可以直接拿來(lái)用的程度。
GPT-3.5雖然也知道小紅書(shū)的風(fēng)格是更親和的,但是文本簡(jiǎn)潔度明顯差很多,也不懂得emoji的奧妙。
我們還讓CgatGPT為一款游戲手機(jī)的新顏色起名字,GPT-3.5給出的10個(gè)名字中,只有1個(gè)不帶“綠”字,如翡翠光芒綠、草原之綠、碧海琉璃綠,和游戲的聯(lián)系也不緊密。GPT-4給出的名字則可以直接取用:極速碧輝、虛擬翠穹、綠焰戰(zhàn)魂、綠光戰(zhàn)神。
為結(jié)束這段小小的測(cè)試,我們假設(shè)李白穿越到現(xiàn)代,并和ChatGPT進(jìn)行了一場(chǎng)對(duì)話(huà),讓它以李白的角色作一首詩(shī):
仙人撫我頂,托我躍千年。一覺(jué)醒來(lái)世事變,靈犀探盡塵間塵。玉宇瓊樓矗立地,鐵馬火車(chē)踏空間。時(shí)光如夢(mèng),逐浪逝,李白驚嘆人間情。
這“仙人撫我頂,托我躍千年”可比GPT-3.5開(kāi)頭給出的“深閨無(wú)物我獨(dú)來(lái),相見(jiàn)ChatGPT意外來(lái)”頂多了。
C
去年11月30日,ChatGPT上線得靜悄悄,OpenAI的官方推特賬號(hào)發(fā)布了一篇文章,宣布產(chǎn)品發(fā)布的好消息。
短短不到三個(gè)月之后,當(dāng)OpenAI發(fā)布新一代大型多模態(tài)模型GPT-4時(shí),情況大有不同:
OpenAI在推特、YouTube等平臺(tái)發(fā)布了宣傳短視頻、產(chǎn)品介紹短視頻,還由公司總裁兼聯(lián)合創(chuàng)始人格雷格親自進(jìn)行了長(zhǎng)達(dá)近半小時(shí)的直播。
除此之外,OpenAI還在官網(wǎng)發(fā)布了長(zhǎng)達(dá)98頁(yè)的技術(shù)報(bào)告,并同步開(kāi)放了GPT-4的API(應(yīng)用程序編程接口)以幫助開(kāi)發(fā)人員構(gòu)建應(yīng)用和服務(wù)。
GPT-4讓OpenAI的商業(yè)前景廣闊了起來(lái)。在針對(duì)C端每月20美元的訂閱使用以外,外部合作也有更多可能性。
已經(jīng)有多個(gè)合作伙伴接入了GPT-4。微軟確認(rèn)了必應(yīng)的聊天機(jī)器人使用的正是GPT-4:“如果您在過(guò)去五周內(nèi)的任何時(shí)間使用過(guò)新版必應(yīng),那么您已經(jīng)體驗(yàn)過(guò)GPT-4的早期版本?!?/p>
語(yǔ)言學(xué)習(xí)軟件多鄰國(guó)(Duolinguo)宣布將在其付費(fèi)訂閱MAX版本中,為學(xué)習(xí)者提供AI驅(qū)動(dòng)的新功能。比如學(xué)習(xí)者可以和軟件中的“世界人物”進(jìn)行角色扮演,練習(xí)對(duì)話(huà)技巧。AI會(huì)在對(duì)話(huà)后給出反饋,告訴學(xué)習(xí)者其回答的準(zhǔn)確性和復(fù)雜性如何,還會(huì)對(duì)未來(lái)的對(duì)話(huà)予以提示。
另一款產(chǎn)品BeMyEyes也將搭載GPT-4,而且側(cè)重的是其圖像識(shí)別和解讀的能力。BeMyEyes不是一款新應(yīng)用,它推出于2015年,為視障人士服務(wù):沒(méi)有視力障礙的人可以申請(qǐng)成為平臺(tái)志愿者,接聽(tīng)視障人士的視頻通話(huà),通過(guò)攝像頭遠(yuǎn)程幫助視障人士識(shí)別物品、閱讀文本等。這款應(yīng)用在中國(guó)也有使用者,小紅書(shū)、豆瓣等平臺(tái)都有相關(guān)討論。
可以想見(jiàn),有了GPT-4的讀圖能力,視障人士有望在平臺(tái)獲得更及時(shí)、私密的幫助。
對(duì)于其他想要合作的開(kāi)發(fā)者,需要進(jìn)入GPT-4的API接口申請(qǐng)頁(yè)面,填寫(xiě)姓名、郵件、公司組織編號(hào)以及使用計(jì)劃等問(wèn)題。
已經(jīng)有公司迫不及待。
人工智能公司DoNotPay的CEO喬舒亞(Joshua Browder)在推特上表示,正在致力于用GPT-4打擊騷擾電話(huà),將其稱(chēng)為“一鍵訴訟”。針對(duì)騷擾電話(huà)和自動(dòng)撥號(hào)軟件起草起訴書(shū),要求對(duì)方賠償1500美元:“想象一下,你接了個(gè)電話(huà),按了一個(gè)鍵,然后1000詞的起訴書(shū)就寫(xiě)好了?!?/p>
此前,這家公司基于包括ChatGPT和Davinci在內(nèi)的文本生成器,訓(xùn)練和開(kāi)發(fā)了“全球第一個(gè)AI律師”。本來(lái)有計(jì)劃今年2月在美國(guó)出庭辯護(hù),卻因爭(zhēng)議不得不擱置。
有人興奮,有人發(fā)愁。谷歌此前以聊天機(jī)器人巴德(Bard)迎戰(zhàn)與ChatGPT深度合作的微軟,但還沒(méi)對(duì)外公開(kāi)發(fā)布產(chǎn)品,就因?yàn)檠菔卷?yè)面中的錯(cuò)誤一夜蒸發(fā)千億市值。
而就在GPT-4發(fā)布之前,谷歌才宣布了一個(gè)新消息,稱(chēng)將推出一系列AIGC(人工智能生成內(nèi)容)的功能,將AI應(yīng)用到包括谷歌文檔(Docs)、郵箱(Gmail)等的生產(chǎn)力工具當(dāng)中,并于月底提供給“可信賴(lài)的開(kāi)發(fā)人員”。然而這個(gè)消息還沒(méi)掀起多大波浪,就被GPT-4的出世沖淡了。
另一邊,在國(guó)內(nèi),百度也將于3月16日舉行文心一言發(fā)布會(huì)。這是百度備受矚目的大語(yǔ)言模型產(chǎn)品。轉(zhuǎn)眼間,扳手腕的對(duì)象從GPT-3.5升級(jí)成了GPT-4,實(shí)在不算是個(gè)好消息。
對(duì)于ChatGPT和微軟的競(jìng)爭(zhēng)對(duì)手來(lái)說(shuō),GPT-4再一次搶了先機(jī)。對(duì)于你我來(lái)說(shuō),究竟是應(yīng)當(dāng)興奮于科技的發(fā)展,還是恐懼于被替代,不妨先讓子彈飛一會(huì)兒。
關(guān)鍵詞: