【智快網(wǎng)】11月10日消息,OpenAI宣布了一項新的數(shù)據(jù)合作伙伴計劃,旨在生成用于訓(xùn)練AI模型的公共和私有數(shù)據(jù)集。該合作伙伴關(guān)系的目標是擴大AI技術(shù)的應(yīng)用范圍,從更有用的模型中受益。
根據(jù)OpenAI的博客文章,他們提到:“為了最終使AI更加安全且造福于全人類,我們希望AI模型能夠深入理解所有主題、行業(yè)、文化和語言,這需要盡可能廣泛的訓(xùn)練數(shù)據(jù)集。”
作為數(shù)據(jù)合作伙伴計劃的一部分,OpenAI計劃收集“反映人類社會”的“大規(guī)模”數(shù)據(jù)集,這些數(shù)據(jù)目前不容易在網(wǎng)上獲取。盡管OpenAI計劃涵蓋多種數(shù)據(jù)類型,包括圖像、音頻和視頻,但他們特別強調(diào)了對不同語言、主題和格式的數(shù)據(jù),以更好地“表達人類意圖”,例如長篇寫作或?qū)υ挕?/p>
OpenAI表示,他們將采取必要的步驟,包括使用光學(xué)字符識別和自動語音識別工具,對訓(xùn)練數(shù)據(jù)進行數(shù)字化,并在必要時刪除敏感或個人信息。
OpenAI計劃創(chuàng)建兩種類型的數(shù)據(jù)集:一個是公開開源數(shù)據(jù)集,可供任何人在AI模型訓(xùn)練中使用,另一個是私有數(shù)據(jù)集,用于訓(xùn)練特定領(lǐng)域的專有AI模型。
此外,OpenAI還強調(diào)私有數(shù)據(jù)集的重要性,特別適用于那些希望保持數(shù)據(jù)私密性但又希望OpenAI的模型能更好地理解其領(lǐng)域的組織。OpenAI已經(jīng)與冰島政府和Mieeind ehf合作,提高了GPT-4對冰島語的理解能力,并與自由法律項目合作,提高了其模型對法律文件的理解。這一合作伙伴計劃標志著OpenAI在共同推動AI技術(shù)發(fā)展方面邁出的重要一步。