導讀 6月28日消息,OpenAI公布了一個基于GPT-4訓練的模型CriticGPT,主要用于捕捉ChatGPT代碼輸出中的錯誤。簡單來說,通過這一模型,人類訓練者...
6月28日消息,OpenAI公布了一個基于GPT-4訓練的模型CriticGPT,主要用于捕捉ChatGPT代碼輸出中的錯誤。
簡單來說,通過這一模型,人類訓練者可以利用GPT-4查找并改進GPT-4自身的不足,OpenAI的實驗顯示,在CriticGPT的輔助下,訓練師發(fā)現(xiàn)錯誤的能力提升了60%。
CriticGPT的工作機制包括對ChatGPT提供的代碼進行評審,并提出改進建議,盡管CriticGPT的建議并非總是完美無缺,但它的引入顯著提升了訓練師在發(fā)現(xiàn)模型問題上的能力。
OpenAI表示,因為沒有更好的工具,所以人們目前難以評估高級AI的表現(xiàn),而CriticGPT意味著,OpenAI向能夠評估高級AI系統(tǒng)輸出的目標邁進了一步。
OpenAI也坦誠地指出了CriticGPT的局限性,包括對長任務理解的不足、幻覺錯誤的產(chǎn)生、分散錯誤的識別難題,以及在面對極端復雜任務時的評估局限。
CriticGPT的發(fā)布也引發(fā)了熱烈討論,有網(wǎng)友用左腳踩右腳上天”來形容這一自我改進的過程。