3月10日,在中國人工智能學會、浙江省數字經濟聯合會等機構聯合主辦的“ChatGPT技術的創新與突破”專項論壇上,遠傳科技CEO嵇望先生分享了遠傳科技在推動ChatGPT在知識領域應用的思考和實踐。
2022年杭州市數字經濟高質量發展大會指出,杭州將以高水平重塑全國數字經濟第一城,并堅持把發展新一代人工智能作為建設全國“數字經濟第一城”和“數字治理第一城”的重要領域。
而今年以來,人工智能領域的ChatGPT火爆全球。兩會期間,ChatGPT更是成功“火到兩會”,成為代表們熱議話題。
ChatGPT火爆的背后,反映了AI技術持續進步、應用場景不斷拓展的趨勢。同時,ChatGPT的成功,也預示著人工智能產業界的新機遇。
對近期ChatGPT的爆火,杭州人工智能領域的政府領導、學術專家、企業代表共濟一堂,探索ChatGPT技術的創新與突破,為杭州AI產業發展尋找新機遇出謀劃策,為杭州重塑全國數字經濟第一城獻計獻策。
遠傳科技CEO嵇望先生表示,ChatGPT在泛知識管理有望得到廣泛應用。
知識應用領域主要分為知識管理和知識應用兩大類,知識管理主要有知識管理平臺和知識共享平臺,而知識圖譜、智能知識庫與問答對話系統則是知識應用重要組成部分。
對知識的可用性取決于數據的可靠性和準確性、語義一致性、可查詢性與可解釋性。基于ChatGPT在包括文本生成、回答問題、翻譯文本、邏輯及思維鏈能力等多方面不俗的表現,其在數據采集、數據標注、數據生成、問答對抽取、三元抽取五方面賦能知識工程。
·在數據采集方面,ChatGPT可以從各種在線資源中抓取文本數據,并將其整理成結構化數據。并且對從不同來源獲取的數據進行清洗,從而提高數據的質量和可用性。
·在數據采集完成后,ChatGPT可以使用自動標注算法來標注數據,然后通過人工審核來修正錯誤。ChatGPT還可以使用傳統的機器學習算法和深度學習算法來標注數據。
數據獲取后,ChatGPT進行數據結構化處理,主要包括問答式抽取和三元組抽取兩種途徑。
·對于問答對抽取這種方式,ChatGPT可以使用自然語言處理技術來從文本數據中提取問答對。ChatGPT可以使用命名實體識別和關系提取技術來識別問題和答案,并將其匹配成一對。
·而三元組抽取,CHATgpt可以使用命名實體識別技術來識別文本中的實體與關系,根據已有的三元組和實體關系來構建知識圖譜。
遠傳科技不斷擴展人工智能的使用范圍,積極加速ChatGPT相關領域布局,在知識工程應用探索了三大應用場景:
·基于PDF文件問答對生成
用戶上傳 PDF 文件后,可以對它提問任何關于這份PDF的問題,只要上傳完成,便如同完全理解了這份PDF文檔一樣,立刻就可以提取出PDF文檔中的核心要點,并提示用戶可以根據提示要點來提問。
·知識圖譜三元組抽取
以構建基本知識圖譜的三元組抽取為核心,抽取包括主體、客體、主體與客體之間關系,在一段標準知識輸入后,可以自動輸出由實體、屬性和值組成的三元組答案,能在很大程度上解決當前ChatGPT的事實謬誤問題,提高答案的可解釋性。
·數據標注
在數據標注方面,則可以在輸入需標注語料后,根據已設定的規則,將需標注語料打上標簽、自主識別、自動分解并輸出經過標注后數據信息。通過這種標記、注釋分類的過程,更好地識別和理解信息,提升問答的準確性。
小結
作為數字經濟第一城, 杭州有著人工智能的場景優勢。面臨新機遇,搶抓新賽道。遠傳科技借鑒ChatGPT等大規模語言模型與技術,結合自身的智能交互技術優勢,將AI前沿技術與城市、與產業緊密結合,基于AI技術的數字化研究、場景化應用,為杭州乃至全國數字化進程貢獻自己的力量。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
關鍵詞: