全班第一的論文是它寫出來的、89%的美國學生用它來完成作業、2個月內超過1億用戶向它提問……最近一段時間,聊天機器人ChatGPT火遍全球,它以強大的語言處理能力、海量的數據積累等特點讓用戶感到驚訝甚至震撼。但隨著使用的人越來越多,ChatGPT開始暴露在一些場景下的缺陷和不足,讓網友吐槽“智障”。
另外,ChatGPT在中文語境下的表現也差強人意,存在很多錯誤,也經常胡編亂造。究其原因,ChatGPT等大型語言模型需要大量的計算資源和數據才能夠進行訓練,而目前,ChatGPT被“投喂”的數據主要都是英文數據,處理文本時也是基于處理英文的方法理解和生成,而中文的語法與英語有很大不同,受到語言障礙、文化差異的影響,ChatGPT勢必對中文、中國文化“水土不服”,無法適應中國的環境和要求。
因此,中國需要自己的生成式AI,哪怕不完美。即將上線的百度文心一言,代表中國生成式AI產品站在了全球技術競賽場上,是巨大的勝利,意義非凡。
ChatGPT=人工智障?
對于ChatGPT的“人工智障”表現,用戶反映最多的問題是它經常“一本正經地胡說八道”。經常存在事實性錯誤,無法判斷它回答的對錯。不僅僅是在中文相關的題材下,就連在西方知識題材中也會胡言亂語。將王勃《滕王閣序》的詩句說成出自王煥之《登鸛雀樓》,將鋼琴女祭司瑪塔·阿格里奇說成20世紀最杰出的小提琴家之一。
并且有時結果并不穩定,換個問法后甚至刷新一下ChatGPT的回答可能會變化。
并且ChatGPT并不誠實,也無法查詢獲知最新的信息和知識。這在一些垂直領域的使用中,特別是像高校科研這種需要前沿研究和實時數據的場景下,實屬不便。問詢前沿問題,讓它幫忙查找一篇論文,它的回答看起來有條有理,但DOI指向的是另一篇論文,題目和作者甚至都是捏造不存在的。
對于互聯網上含有大量非英語語言,比如中文,沒有豐富的中文訓練數據,它有時就會胡言亂語。甚至當問題就是錯的時,ChatGPT仍然會順著往下說,一騙就上當。
再退一步,不在query設置專業限定詞,而是簡單問題,ChatGPT在中文語境的錯誤還是比較多的。
當ChatGPT脫離通用領域來到需要極其豐厚的領域知識的垂直領域,它還不一定合適。下圖是ChatGPT在中文字詞相關問題上的回復,涉及拼音相關的知識,盡管好像有一些道理,但結果是錯誤的。
文心一言:中國自己的生成式AI
以上提到的一些缺陷,無疑說明了ChatGPT距離“完美”依然有著不小的距離,比如中文基準的自然語言處理效果、面對國內用戶的限制、不能獲取新的知識等。在當前全球的ChatGPT熱潮下,中國更應該有自己的生成式AI產品,哪怕不完美。
在這樣的背景下,百度文心一言,作為一家中國自研的生成式AI產品,站在了全球技術競賽場上,與世界爭鋒,即使不完美,也是英雄。這不僅對于我國人工智能技術的發展和國際數據爭奪意義重大,也彌補了我國缺乏與國外人工智能對話機器人相匹配的人工智能技術帶來的一系列隱患。
據介紹,文心一言由最新大語言模型(LLM)提供支持,是繼文心一格之后百度的又一個生成式AI產品。文心一言的全部代碼、訓練平臺全部是百度自研,放眼中國,目前為止還沒有第二家能夠做到。
百度在人工智能領域深耕十多年,在技術上有綜合優勢,基礎能力已完全具備。百度創始人、董事長兼CEO李彥宏曾表示,人類進入人工智能時代,IT技術的技術棧發生了根本性的變化。過去基本分為三層:芯片層,操作系統層和應用層。現在可以分為四層:芯片層、框架層、模型層和應用層。百度是全球為數不多、進行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,各個層面都有領先業界的關鍵自研技術,可以實現端到端優化,大幅提升效率。
文心一言處于四層技術架構中的模型層。根據百度官方對外披露的信息,百度的文心大模型,在2019年就已經推出,并且已經迭代了多代,從單一的自然語言理解延伸到多模態,包括視覺、文檔、文圖、語音等多模態多功能,百度文心系列大模型在行業已普遍應用,而能支撐該訓練模型的框架,目前國內沒有誰可以超越百度飛槳。
在國內,百度的文心一言,還可能在一些地方實現對ChatGPT的超越。
百度有多年的搜索經營積累,在真實數據和用戶需求理解方面,有較強的先發優勢。因此,相比ChatGPT,文心一言能夠基于檢索增強提升時效性和準確性,并基于知識增強提升多輪推理對話。
此外,百度擁有最先進的中文領域自然語言處理能力,可以說在這方面中國絕對沒有一家公司水平接近百度。文心大模型是中國本土AI模型,具備對中文、甚至中國文化的更深理解。相比之下, 文心一言會更適合中文和中國市場。
據悉,文心一言發布后,普通用戶注冊賬號可以使用,而隨著內測和開放,使用的人越來越多,文心一言將建立起真實的用戶、開發者調用和模型迭代之間的飛輪,模型將越來越聰明、越來越完美。
上場即是勝利,哪怕不完美。中國一定要有自己的生成式AI,無論是面向C端市場,還是面向B端市場,國內市場都將因為這項技術,迎來一輪新的發展契機。而文心一言,也將成為與世界爭鋒的英雄,期待未來它能創造屬于中國生成式AI產品的奇跡。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
關鍵詞: