首頁 / 放.高論 / 大人物時代
放.高論
大人物時代

【大人物時代】誰讓柯南失業

2024.09.17
09:05am
/ 文周周

看到ChatGPT-o1所強調的思考推理功能,也讓人不禁聯想到自從大語言模型(LLM)熱潮下,另一個最常被討論的問題,就是AI是否已經獲得了感知能力?

 

OpenAI上週推出了新「草莓」系列人工智慧模型的第一個版本:ChatGPT-o1。這使其成為第一家邁向AI第2級的公司。根據 OpenAI 的說法,在國際數學奧林匹克 (IMO) 資格考試中,新模型正確解決了83%的問題,而其前身 GPT-4o僅解決了13%。在編碼競賽中,該模型在 Codeforces 競賽中達到了第 89 個百分位。且在物理、生物和化學領域上超過人類博士水準。

 



ChatGPT-o1的獨特之處

 

Tracking AI網站對於市面上的AI模型測試,ChatGPT-o1的IQ測試成績是 120 分,人類智商的平均值大約是100 ,其他家推出的模型都在100分以下。

 

ChatGPT-o1的獨特之處在於它在回答之前會”推理”,將大問題分解為小步驟,並嘗試確定其中一個步驟的正確或錯誤。在人工智慧模型實現通用人工智慧(AGI)之前,必須先建立這種”推理”能力,AGI指的是人工智慧可以像人類一樣通過任何可以想像的測試。

 

ChatGPT-o1問世的意義,在於人工智慧的開發,又邁入到下一階段。AI有哪些等級?根據 OpenAI 對AGI發展的願景,這會發生在 5 個不同的階段:

 

AGI願景五階段

 

對話式 AI(例如 ChatGPT-4 以及 Claude、Gemini、Grok 和 Llama 的當前模型):進行自然對話。
推理人工智慧(ChatGPT-o1):解決基本問題,類似博士級或已獲得博士學位的人。在他們擅長的任務上,人工智慧的表現比人類的 50% 還要好。

 

自主人工智慧:長時間獨立行動,無需人工干預。人工智慧在其擅長的任務上表現優於 90% 的人類。
創新人工智慧:開發新的想法和解決方案。人工智慧在其擅長的任務上表現優於99%的人類。
組織人工智慧:人工智慧研究人員的終極水準,它在整個組織中執行任務,並且表現優於100%的員工。

 

OpenAI 預計在2030年左右達到第5級(AGI)的目標。目前發布的ChatGPT-o1預覽版本仍然缺少 ChatGPT-4o 的一些功能,例如語音功能、查詢網路、以及上傳文件和圖像。ChatGPT-o1擅長推理和回答複雜問題,但模型的使用成本大約是ChatGPT-4o 的四倍。以功能及速度來看,ChatGPT-4o仍然是目前大多數使用者的最佳選擇。OpenAI CEO Sam Altman也說:「ChatGPT-o1仍然有缺陷,功能仍然有限,第一次使用似乎比花了更多時間使用後更令人印象深刻」。


看到ChatGPT-o1所強調的思考推理功能,也讓人不禁聯想到自從大語言模型(LLM)熱潮下,另一個最常被討論的問題,就是AI是否已經獲得了感知能力?

 

空間智能是人工智慧拼圖中的關鍵一環

 

知名AI教母,史丹佛教授,也是以人為本人工智慧研究院(HAI)院長的李飛飛,曾和同事John Etchemendy 教授,共同寫了一篇時代雜誌文章,文中駁斥了LLM 有感覺的說法,李飛飛列舉了大量例子來證明這一觀點。在提到超級電腦深藍時,李飛飛表示,雖然這款下棋程式可以擊敗世界冠軍,但如果房間突發意外情況如失火,深藍不會有停止遊戲的意識,而人類會有。更進一步的,李飛飛認為人類飢餓時,伴隨一系列生理反應,如低血糖、肚子叫等,而LLM 無法擁有這些狀態的主觀經驗,即無法有感覺能力,只是在概略性地完成任務而已。

 

李飛飛今年創辦了World Labs,目前已經是估值超過10億美金的新創獨角獸。「空間智能是人工智慧拼圖中的關鍵一環」,這是李飛飛創辦World Labs的原因。李飛飛認為,語言只是人類推理和溝通的一種方式。從出生的那一刻起,人類理解物質世界的方式就是空間的。早在語言發展之前,人們先了解世界是如何運作的,並透過觀察世界並與之互動來學習推理。舉例來說,如果看到一張圖片,裡面是一個傾斜的水杯,沒有推理能力的AI,只能分析圖片裡的元素。但融入物理空間的AI,則可以判斷這是一個需要介入去防止水灑出來的場景,如果是在電器旁,還可以分析風險因子。

 

不管是World Labs或ChatGPT-o1,接下來的發展都在建立更大、更複雜的模型版本來提高推理能力。以ChatGPT-o1目前發佈的測試,能夠發揮化繁為簡,更精準地回答使用者的問題。而World Labs,則能夠透過攝影機看到的,輸入至背後的電腦大腦,將這種視覺影像轉化為推理、生成和最終的互動。達到了這個境地,又是人工智慧發展下一個值得期待的時刻。最不樂見的,或許是名偵探柯南吧?

 

 

編輯部說明:迎接「大」數據、「人」工智慧、「物」聯網浪潮,《放言》推出以科技創新發展為主題的專欄《大人物時代》,由科技專業人士撰文,帶讀者進入「大人物」的世界。

 

 

圖片來源:維基百科,openai官網;示意圖製作:放言視覺設計部  傅建文

最新新聞
文周周
「春有百花秋有月,夏有涼風冬有雪」,從社會時事、科技、體育、政治,事事關心的「工人」智慧鍵盤大叔。
延伸閱讀
最新新聞