當(dāng)前位置:首頁(yè) > 外匯資訊 > 正文內(nèi)容

解決AI落地的最大障礙,OpenAI找到辦法了?

激石外匯2023-06-01 11:59:37外匯資訊331

激石Pepperstone(http://xcvvvm.com/)報(bào)道:

OpenAI似乎找到了解決生成式人工智能“一本正經(jīng)胡說(shuō)八道”的辦法。

5月31日,OpenAI在其官網(wǎng)宣布,已經(jīng)訓(xùn)練了一個(gè)模型,能夠有助于消除生成式AI常見(jiàn)的“幻覺(jué)”和其他常見(jiàn)問(wèn)題。

OpenAI表示,可以訓(xùn)練獎(jiǎng)勵(lì)模型來(lái)檢測(cè)幻覺(jué),獎(jiǎng)勵(lì)模型又分為結(jié)果監(jiān)督(根據(jù)最終結(jié)果提供反饋)或過(guò)程監(jiān)督(為思維鏈中的每個(gè)步驟提供反饋)模型。

也就是說(shuō),過(guò)程監(jiān)督獎(jiǎng)勵(lì)推理的每個(gè)正確步驟,而結(jié)果監(jiān)督只是簡(jiǎn)單地獎(jiǎng)勵(lì)正確的答案。

OpenAI表示,相比之下,過(guò)程監(jiān)督有一個(gè)重要的優(yōu)勢(shì)——它直接訓(xùn)練模型以產(chǎn)生由人類(lèi)認(rèn)可的思維鏈

過(guò)程監(jiān)督與結(jié)果監(jiān)督相比有幾個(gè)一致性?xún)?yōu)勢(shì)。它直接獎(jiǎng)勵(lì)遵循一致的思維鏈的模型,因?yàn)檫^(guò)程中的每一步都得到了精確的監(jiān)督。

過(guò)程監(jiān)督也更有可能產(chǎn)生可解釋的推理,因?yàn)樗膭?lì)模型遵循人類(lèi)批準(zhǔn)的過(guò)程

結(jié)果監(jiān)督可能會(huì)獎(jiǎng)勵(lì)一個(gè)不一致的過(guò)程,而且通常更難審查。

OpenAI在數(shù)學(xué)數(shù)據(jù)集上測(cè)試了這兩種模型,發(fā)現(xiàn)過(guò)程監(jiān)督方法導(dǎo)致了“顯著更好的性能”。

但需要注意的是,到目前為止,過(guò)程監(jiān)督方法僅在數(shù)學(xué)領(lǐng)域進(jìn)行了測(cè)試,并且需要更多的工作來(lái)觀察它如何更普遍地執(zhí)行。

此外,OpenAI沒(méi)有說(shuō)明這一研究需要多長(zhǎng)時(shí)間才能應(yīng)用在ChatGPT,它仍然處于研究階段。

雖然最初的結(jié)果是好的,但OpenAI確實(shí)提到,更安全的方法會(huì)產(chǎn)生降低的性能,稱(chēng)為對(duì)齊稅(alignment tax)。

目前的結(jié)果顯示,在處理數(shù)學(xué)問(wèn)題時(shí),過(guò)程監(jiān)督不會(huì)產(chǎn)生對(duì)齊稅,但在一般的信息上的情況尚不知曉。

生成式AI的“幻覺(jué)”

生成式AI問(wèn)世以來(lái),圍繞其編造虛假信息、“產(chǎn)生幻覺(jué)”的指控從未消失,這也是目前生成式AI模型最大的問(wèn)題之一。

今年2月,谷歌為應(yīng)對(duì)微軟資助下ChatGPT,倉(cāng)促推出了聊天機(jī)器人Bard,結(jié)果卻被發(fā)現(xiàn)在演示中出現(xiàn)了常識(shí)性錯(cuò)誤,導(dǎo)致谷歌股價(jià)大跌。

導(dǎo)致AI出現(xiàn)幻覺(jué)的原因有多種,輸入數(shù)據(jù)欺騙AI程序進(jìn)行錯(cuò)誤分類(lèi)是其中一種。

例如,開(kāi)發(fā)人員使用數(shù)據(jù)(如圖像、文本或其他類(lèi)型)來(lái)訓(xùn)練人工智能系統(tǒng),如果數(shù)據(jù)被改變或扭曲,應(yīng)用程序?qū)⒁圆煌姆绞浇忉屳斎氩a(chǎn)生不正確的結(jié)果。

幻覺(jué)可能會(huì)出現(xiàn)在像ChatGPT這樣的基于語(yǔ)言的大型模型中,這是由于不正確的轉(zhuǎn)換器解碼,導(dǎo)致語(yǔ)言模型可能會(huì)產(chǎn)生一個(gè)沒(méi)有不合邏輯或模糊的故事或敘述。?????????

掃描二維碼推送至手機(jī)訪問(wèn)。

版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請(qǐng)注明出處。

本文鏈接:http://xcvvvm.com/news/1705.html

標(biāo)簽: OpenAI

“解決AI落地的最大障礙,OpenAI找到辦法了?” 的相關(guān)文章

中國(guó)恒大首次被提請(qǐng)清盤(pán) 知情人士:不會(huì)對(duì)未來(lái)重組產(chǎn)生實(shí)質(zhì)性影響

激石Pepperstone(http://xcvvvm.com/)報(bào)道:6月27日,中國(guó)香港高等法院網(wǎng)站顯示,Top?Shine?Global?Limited?of?Intershore?Consult?(Samoa)?Limited已于香港高等法院向中國(guó)恒大集團(tuán)提出清盤(pán)呈請(qǐng),案件編號(hào)為H...

A股三大指數(shù)均漲超1% 旅游等消費(fèi)板塊大漲 房地產(chǎn)回調(diào)

A股三大指數(shù)均漲超1% 旅游等消費(fèi)板塊大漲 房地產(chǎn)回調(diào)

激石Pepperstone(http://xcvvvm.com/)報(bào)道:6月30日,A股三大指數(shù)早間沖高后小幅回落,隨后再度拉升走強(qiáng)。截至發(fā)稿,深成指漲1.5%,滬指漲1.1%,創(chuàng)業(yè)板指漲1.5% 個(gè)股漲多跌少,兩市超3400股飄紅。 板塊方面,酒店、旅游、民航、飲料制造等大消費(fèi)板塊大漲...

一個(gè)時(shí)代的終結(jié):Naspers、軟銀各自從騰訊、阿里抽身

一個(gè)時(shí)代的終結(jié):Naspers、軟銀各自從騰訊、阿里抽身

激石Pepperstone(http://xcvvvm.com/)報(bào)道: 一則公告打掉騰訊4400億港元市值。 這個(gè)“砸盤(pán)”方叫Naspers。 6月27日午間,騰訊控股公告稱(chēng),其主要股東Prosus(該公司由Naspers擁有大多數(shù)股權(quán))及Naspers將開(kāi)啟一項(xiàng)長(zhǎng)期、開(kāi)放式的回購(gòu)...

地產(chǎn)會(huì)不會(huì)成為宏觀交易的預(yù)期差?

激石Pepperstone(http://xcvvvm.com/)報(bào)道: 從自上而下的視角看,未來(lái)2個(gè)月有五條宏觀交易線索值得關(guān)注。第一,部分城市放松地產(chǎn)政策,疊加房貸利率快速下行,地產(chǎn)銷(xiāo)售可能出現(xiàn)超預(yù)期反彈。第二,半年報(bào)季高景氣板塊的業(yè)績(jī)與預(yù)期賽跑。第三,美國(guó)衰退預(yù)...

恒指、恒生科技雙雙跌超1% 新能源汽車(chē)股逆勢(shì)拉升 蔚小理集體沖高

恒指、恒生科技雙雙跌超1% 新能源汽車(chē)股逆勢(shì)拉升 蔚小理集體沖高

激石Pepperstone(http://xcvvvm.com/)報(bào)道:7月6日,港股開(kāi)盤(pán)走勢(shì)分化,恒指低開(kāi)0.35%,恒生科技指數(shù)漲0.14%。 隨后,恒指、恒生科技指數(shù)跌幅雙雙擴(kuò)大至超1%。 盤(pán)面上,科技股走低,石油股跌幅繼續(xù)擴(kuò)大,新能源汽車(chē)股持續(xù)走高。 科技股走低,京東跌幅一度擴(kuò)...

馬斯克終止并購(gòu)?fù)铺?,推特:“法庭?jiàn)”,股價(jià)盤(pán)后跌9%

馬斯克終止并購(gòu)?fù)铺?,推特:“法庭?jiàn)”,股價(jià)盤(pán)后跌9%

激石Pepperstone(http://xcvvvm.com/)報(bào)道:話說(shuō)天下大事合久必分,分久必合,而在特斯拉CEO馬斯克和社交媒體推特的世紀(jì)收購(gòu)案中,這段耗時(shí)多月一路磕磕絆絆的收購(gòu)仍然無(wú)法以馬斯克單方面“分手快樂(lè)”而告終,因?yàn)橥铺囟聲?huì)回應(yīng)其對(duì)這宗并購(gòu)協(xié)議仍有信心,并表示會(huì)恪守承諾執(zhí)...