看火爆全網的ChatGPT如何評價“數據標注”？

2023-02-10 10:27:16來源：壹點網

OpenAI創(chuàng)始人山姆·奧特曼曾說:“十年前的傳統(tǒng)觀點認為,人工智能首先會影響體力勞動,然后是認知勞動,再然后,也許有一天可以做創(chuàng)造性的工作。現(xiàn)在看起來,它會以相反的順序進行。”ChatGPT的出現(xiàn)印證了這一點!

ChatGPT的一炮而紅即將為OpenAI帶來約290億美元的融資,然而這樣的成功背后不止有技術天才和資金,2022年OpenAI的預訓練語言模型在技術路線上作出了新的選擇:“基于人工標注數據+強化學習的推理和生成”。據美國《時代》雜志調查發(fā)現(xiàn),為訓練ChatGPT,OpenAI招募了大量數據標注人員,甚至還投入了大量博士級別的專業(yè)人士來完成高質量的標注任務,著眼長遠,將大量資金投入在人工數據標注上是OpenAI成功的關鍵決策。

OpenAI在博客中寫道,ChatGPT是從GPT3.5系列中的模型進行微調而誕生的。以往的預訓練模型都是為了減少監(jiān)督學習對高質量標注數據的依賴。而正是ChatGPT在GPT-3.5大規(guī)模語言模型的基礎上,又開始依托大量人工標注數據,才得以實現(xiàn)理解人類指令,更精準更有“人味”的自動輸出。

業(yè)內普遍認為,ChatGPT是人工智能里程碑,更是分水嶺,這意味著AI技術發(fā)展到臨界點。在人工智能領域深耕數十年的百度能否乘其東風完成自我變革,引發(fā)業(yè)界關注。在外界看來,ChatGPT或成為下一代搜索產品的雛形。

另一方面,互聯(lián)網在擁有知識的同時也存在惡意和偏見的內容,通過數據標注建立一個額外的人工智能驅動的安全機制,運用文本分類標注、對話語料構建等標注類型來幫助模型調優(yōu),OpenAI才能控制這種危害,生產出適合日常使用的聊天機器人,避免出口成臟,性別歧視或者發(fā)表種族主義言論的出現(xiàn)。

盤石數據標注助力AI語音模型的進化發(fā)展

盤石數據深耕數據標注業(yè)務,積累了豐富的文本標注經驗并針對語音模型訓練提供優(yōu)質的標注服務,包括:

對話評價——從多個方面針對自動生成的對話進行評價,如情感、正確性、流暢性等多個方面。

故事改寫——根據情節(jié)對自動生成的故事進行改寫,使其語義通順,邏輯完整。

摘要抽取——針對長文本進行摘要抽取,保證情節(jié)完整,篇幅簡短,表達流暢。

邏輯推理——根據推理題目的信息,給出正確答案并提供解題思路。

角色扮演——構建角色并與該角色進行對話,避免出現(xiàn)邏輯錯誤、人設不符、不通順、錯字等情況。

以下為ChatGPT關于“數據標注”的觀點

國際領先的基礎數據服務商——盤石數據

遼寧盤石數據科技有限公司是一家擁有自然語言處理技術(NLP)基因的人工智能基礎能力服務商,從數據(Data)、算法(Algorithm)、人才(Talent)、智能應用(Application)、服務(Service)全方位助力人工智能發(fā)展。為全球提供有競爭力的“DATAS”數據建設解決方案。

業(yè)務合作可直接與我司取得聯(lián)系,18640068358(微信同步),我們會在第一時間回復您。

免責聲明：市場有風險，選擇需謹慎！此文僅供參考，不作買賣依據。

關鍵詞：

每天都在汆肉中醒来青梅,好男人www在线观看,少妇无码自慰毛片久久久久久,国产欧美另类久久久精品丝瓜

看火爆全網的ChatGPT如何評價“數據標注”？

推薦內容