行業洞察 | 聽說，大語言模型無法接近人類水平智能？

發布時間 : 2022-09-02 閱讀量 : 1408

近日，圖靈獎得主 Yann LeCun 對于人工智能的前景提出最新思考，“語言只承載了所有人類知識的一小部分；大部分人類知識、所有動物知識都是非語言的；因此，大語言模型是無法接近人類水平智能的”。Yann LeCun認為，當前流行的大規模語言模型存在明顯的極限。未來 AI 領域努力的方向或許應該是讓機器優先理解真實世界其他層面意義上的知識。

而就在不久前，Google工程師Blake Lemonine對外宣稱谷歌的大型語言模型LaMDA具有人類的“自我意識”，在他的看法中，即便藉由OpenAI開源架構形式建構的最大語言神經模型GPT-3打造的人工智能，亦可能出現“人”的意識。

關于人工智能到底是否具有“人格”的討論遍布國內外社交平臺，領域內的研究者持有著各自不同的看法。

「AI到底有沒有“意識”，其智能極限是否有限？」

關于AI是否有“意識”這個問題，從客觀唯物主義思想看，答案是否定的。即使AI能夠遍覽全書通曉古今，也不能定義其具有“意識”。人類的自我意識除了能理解書面表達意識之外，具有因個人過往經歷不同，從而擁有不同的思維與共情模式的特征。

例如，人類之間的交流，當提到“媽媽”這個詞的時候，因為不同的經歷或者與對話者共同的經歷，我們會有不同的話題延拓，大腦中大量的信息、情感區域都會產生聯動。AI也可以談論所有這些事情，但并不意味著它理解正在談論的內容。

縱然AI能夠集百家之所長，但是卻無法集一個人的平生經歷或者經驗與一體。如Yann LeCun所提，最根本的問題在于語言的有限性。一旦我們放棄了關于意識和語言之間聯系的假設，這些系統就注定只能有關于世界的膚淺理解，永遠無法接近人類的“全面思維”。

而即便大語言模型LaMDA能夠對人類的對話做出合理的預測，它也不過是接受了數十億單詞的訓練，將文本轉換為“Token”和“嵌入(Embedding)”，然后對嵌入進行處理以添加其他維度。比如文本序列中單詞之間的關系以及它們在句子和段落中的作用，并學會通過預測下一個單詞序列來回應提示。

「與其爭論AI意識與智能水平，何不善假于物呢？」

荀子曰“君子生非異也，善假于物也”。意思是：君子的本性同一般人沒有什么差別，但是他們善于借助外物進行學習。其實人類社會中，有很多美好的靈魂都被邊緣化，他們就是殘障人士，中國總共八千萬殘疾人，但我們在大街上很少遇到殘疾人，即便再高貴的靈魂和自我意識，外在軀體的不方便仍讓他們珠玉蒙塵。倘若讓AI的外在能力輔助殘障人士的生活和工作，豈不是獲得共贏。

目前，國內已有團隊開始進行這方面的研究。天津理工大學“鯨言創益”無障礙智能科技研發團隊用近5年時間，構建視頻語料庫，研發“復雜場景下中國手語實時翻譯系統”。在聽障人士打手語的同時，屏幕上就能夠自動“翻譯”出文字，只為讓更多聽障人士被“聽見”。

無獨有偶，上海首個盲人咖啡“種子店”在浦東新區華潤時代廣場開啟試營業。雙胞胎兄弟殷天保、殷天佑是兩個盲人，但是他們現在已經依靠在線語音識別技術輔助自我在社會上實現了個人價值。

而訓練這些AI的語音和自然語言相關的語料，通常由專業數據團隊提供，通過更多的數據才能讓AI變得更加“Smart”。Magic Data作為一家為眾多AI產品提供數據的專業數據采集、標注公司，其中涵蓋各個領域與語種的對話數據、自然語言處理數據以及圖像數據，其樣例如下：

中文人機交互語料庫：點擊查看詳情

廣東粵語語料庫：點擊查看詳情

英文車載命令控制語料庫：點擊查看詳情

產品推介｜LLM多領域超自然SFT多輪對話文本數據集

晴數智慧深耕對話式AI領域多年，構建了累計千萬輪LLM多領域超自然SFT多輪對話文本數據集，覆蓋近20個語種及方言，語料話題分布廣泛，涉及休閑娛樂、衣食住行、教育醫療等近20個領域。

勇立潮頭！高品質SFT語音數據實現Zero-Shot語音復刻大模型

文本到語音合成（Text to Speech，TTS）作為生成式人工智能（Generative AI 或 AIGC）的重要課題，在近年來取得了飛速發展。為了實現高效合成既自然又高質量的人類語音，有不少機構及企業都進行了相關項目的研究，包括微軟亞洲研究院機器學習組和微軟 Azure 語音團隊去年推出的NaturalSpeech（https://speechresearch.github.io/naturalspeech2/）還有Meta今年發布的Voicebox（https://voicebox.metademolab.com/），都是利用大數據、大模型和零樣本（zero-shot)合成技術，實現語音合成的音色、韻律、風格的多樣性的代表。

巴別塔再現？高質量端到端數據助力Meta推出AI模型SeamlessM4T

追求卓越與無限的精神一直流淌在人類的基因里。圣經中有故事：在古代，人們說著同一種語言，決定建造一座高聳入云，塔頂能觸及天堂的塔，被稱為巴別塔，以彰顯人類的力量和創造力。然而上帝看到人類的意圖，并認為這個塔的建造是人們的傲慢和自大的表現。上帝讓人類的語言變得不同，使他們無法相互理解。這導致了混亂和分裂，無法繼續合作建造塔。語言不通讓人類的溝通變得低效和困難。近日，Meta推出AI模型SeamlessM4T，該模型可翻譯和轉錄近百種語言，似乎將破除因語言不同而導致的溝通障礙。可謂是人類構建“巴別塔”的又一次嘗試。

助力數據要素市場標準化，晴數智慧發布大模型數據集企業標準

數據確權授權的標準制定，首先是對數據進行分級分類。結合在高質量數據上多年積累，晴數智慧首發了大模型數據集企業標準。晴數智慧將大模型數據集生產分為L1到L3三個標準，級別越高，數據精度越高。晴數智慧希望通過這套企業標準劃分不同的數據處理層級，規范并提升數據質量，并確保數據的可靠性、有效性和知識產權的清晰性。

晴數智慧推出MagicData-CLAM高質量SFT數據集，助力大模型實現更優效果

如果開源大模型使得企業不再制肘于自研大模型，那么基于大模型的生成式AI決勝關鍵將只有一個答案：數據。

新聞

行業洞察 | 聽說，大語言模型無法接近人類水平智能？

即刻與 Magic Data 建立聯系？