第五百一十二章智輔的計算
計算機自然也可以模擬。
通過大量的人力標注,告訴計算機哪些是斑馬線,哪些是路燈,哪些是車輛,區分人和垃圾桶。
李前能夠讀懂兩份文件,它們足夠簡練,將複雜的知識形象的展現在麵前。
這些大量的人工經驗反饋給計算機,算法進行比對,就能得出更準確答案,快速分析圖像。
此外,還能夠人工調整參數權重,以提高回答準確率。
比如計算機分析數字8。
從09的數字中,找出數字8。
沒有任何經驗,計算機可能給出9和6和8三個答案。
人工標注錯誤的答案,調低9和6的參數,那麼下次給出的就是準確答案。
但是,現實生活中的應用,複雜度遠不是分辨數字8那樣簡單。
從靜止的街道景物,到一張張圖片組成的動態景象,每一秒的計算量都是海量的。
無數的參數在一層又一層的計算中,不停地變化。
計算機計算的過程,產生的那些參數,對於現在的人類來說等同於黑箱,難以研究。
一旦出錯,都不知道錯在哪裡。
因而,調參是一個非常複雜重要的工作。
尤其智輔過於龐大,涉及方方麵麵。
人的大腦也是一樣。
人腦有著幾百億個神經細胞,更多的神經突觸。
大腦對人類而言,也是黑箱,思維意識的運轉自然神秘無比。
後來,櫻花國工程師,提出‘自注意力機製’。
該機製,造就了大語言模型。
使得計算機從識彆圖像,邁入識彆人類語言的階段。
可以回答問題,推理甚至是學習。
迄今為止,人類積累的所有知識,誕生的全部精神,抽象的數學概念等,都是用語言描述。
而語言的邊界,就是世界的邊界。
人類不了解認知之外的事情,比如可觀測宇宙之外。
宇宙之外又是什麼樣子?
因為不知道,所以無法用語言描述。
有的人讀書多,能夠組成更多的詞句,所以他思想深刻。
有的人經曆得多,麵臨過各種現實複雜問題並解決,當他遇到新的難題,快速找到問題關鍵,並想出解決之法。
可以說這個人經驗豐富,能力強。
理論而言,世界上所有的一切,都可以使用文字語言描述清楚——除非詞窮。
那麼大語言模型,是如何認知和使用人類的語言?
閱讀到了這裡,李前有點兒吃力,他開啟通天祗,請教一直靜靜等待的林朝初和張琳。
林朝初看了眼張琳,張琳道:
“大語言模型使用統計學,推算文字排列組合的概率。”
她接過李前手裡的平板,放在茶幾上進行演示。
點開瀏覽器,輸入一串文字:
‘這顆星球上最厲害的人是誰?’
“當我點下回車,算法會將這行文字,以單獨文字和符號為單位,轉化為數列,我們稱之為token,token之間以向量連接。”
向量在數學的高維中,可以用空間坐標係表示。
智能模型,輸入、計算、輸出的計算過程,分為許多個維度。