什么是人工智能(AI)?
這取決于你問誰?
早在20世紀50年代,該領(lǐng)域之父明斯基和麥卡錫將人工智能描述為由機器執(zhí)行的任何任務(wù),這些任務(wù)以前被認為需要人類智慧。這顯然是一個相當廣泛的定義,這就是為什么你有時會看到關(guān)于某物是否是真正的人工智能的爭論。對創(chuàng)造智能意味著什么的現(xiàn)代定義則更為具體。谷歌的人工智能研究員、機器學習軟件庫Keras的創(chuàng)建者Francois Chollet說,智能與一個系統(tǒng)在新環(huán)境中適應(yīng)和隨機應(yīng)變的能力聯(lián)系在一起,能夠概括其知識并將其應(yīng)用于陌生的場景。
他說:"智能是你在以前沒有準備的任務(wù)中獲得新技能的效率。智力不是技能本身;不是你能做什么;而是你能多好地、多有效地學習新事物。"
這是一個定義,根據(jù)這個定義,現(xiàn)代人工智能驅(qū)動的系統(tǒng),如虛擬助手,將被描述為展示了"狹義的人工智能",即在執(zhí)行一組有限的任務(wù)(如語音識別或計算機視覺)時概括其訓練的能力。
通常情況下,人工智能系統(tǒng)至少表現(xiàn)出與人類智能相關(guān)的以下一些行為:計劃、學習、推理、解決問題、知識表示、感知、運動和操縱,以及在較小的程度上,社會智能和創(chuàng)造力。
人工智能的用途有哪些?
今天,人工智能無處不在,它被用來推薦你接下來應(yīng)該在網(wǎng)上買什么,理解你對虛擬助手說的話,如亞馬遜的Alexa和蘋果的Siri,識別照片中的人和事物,發(fā)現(xiàn)垃圾郵件,或發(fā)現(xiàn)垃圾郵件檢測信用卡欺詐。
人工智能的不同類型是什么?
在一個非常高的水平上,人工智能可以分為兩大類型;
狹義人工智能
狹義的人工智能是我們今天在計算機中看到的一切--智能系統(tǒng)已經(jīng)被教導或已經(jīng)學會了如何執(zhí)行特定的任務(wù),而沒有被明確地編程如何去做。
這種類型的機器智能在蘋果iPhone上的Siri虛擬助手的語音和語言識別中,在自動駕駛汽車的視覺識別系統(tǒng)中,或者在根據(jù)你過去購買的產(chǎn)品來推薦你可能喜歡的產(chǎn)品的推薦引擎中都很明顯。與人類不同,這些系統(tǒng)只能學習或被教導如何做確定的任務(wù),這就是為什么它們被稱為狹義人工智能。
通用人工智能
一般人工智能非常不同,它是在人類中發(fā)現(xiàn)的那種可適應(yīng)的智力,是一種靈活的智力形式,能夠?qū)W習如何執(zhí)行大量不同的任務(wù),從理發(fā)到建立電子表格或根據(jù)其積累的經(jīng)驗對各種主題進行推理。
這種人工智能在電影中比較常見,如《2001》中的HAL或《終結(jié)者》中的天網(wǎng),但今天并不存在--而且人工智能專家對它多久會成為現(xiàn)實存在激烈的分歧。
狹義人工智能能做什么?狹義人工智能有大量的新興應(yīng)用;
(1)分析無機對基礎(chǔ)設(shè)施(如石油管道)進行視覺檢查的視頻資料。
(2)組織個人和企業(yè)的日歷。
(3)回應(yīng)簡單的客戶服務(wù)查詢。
(4)與其他智能系統(tǒng)協(xié)調(diào),執(zhí)行任務(wù),如在合適的時間和地點預(yù)訂酒店。
(5)幫助放射科醫(yī)生在X光片中發(fā)現(xiàn)潛在的腫瘤。
(6)標記網(wǎng)上的不適當內(nèi)容,從物聯(lián)網(wǎng)設(shè)備收集的數(shù)據(jù)中檢測電梯的磨損情況。
(7)從衛(wèi)星圖像中生成世界的三維模型......這個清單不勝枚舉。
這些學習系統(tǒng)的新應(yīng)用一直在出現(xiàn)。圖形卡設(shè)計者Nvidia最近披露了一個基于人工智能的系統(tǒng)Maxine,它允許人們進行高質(zhì)量的視頻通話,幾乎不受互聯(lián)網(wǎng)連接速度的限制。該系統(tǒng)通過不在互聯(lián)網(wǎng)上傳輸完整的視頻流,而是對通話者的少量靜態(tài)圖像進行動畫處理,旨在實時再現(xiàn)通話者的面部表情和動作,并與視頻無異,從而將此類通話所需的帶寬降低了10倍。
然而,盡管這些系統(tǒng)有很多未開發(fā)的潛力,但有時對技術(shù)的雄心超過了現(xiàn)實。一個典型的例子是自動駕駛汽車,它本身是由人工智能驅(qū)動的系統(tǒng)(如計算機視覺)所支撐的。電動汽車公司特斯拉落后于首席執(zhí)行官埃隆-馬斯克的原定時間表,即汽車的自動駕駛系統(tǒng)從更有限的輔助駕駛能力升級為"完全自動駕駛",而完全自動駕駛選項最近才作為測試計劃的一部分向選定的專家司機推出。
通用人工智能能做什么?
2012/13年,人工智能研究人員文森特-C-穆勒和哲學家尼克-博斯特羅姆在四組專家中進行了一項調(diào)查,報告稱人工通用智能(AGI)將在2040至2050年之間開發(fā)出50%的可能性,到2075年上升到90%。該小組甚至走得更遠,預(yù)測所謂的"超級智能"--Bostrom將其定義為"在幾乎所有感興趣的領(lǐng)域大大超過人類認知能力的任何智力"--預(yù)計在AGI實現(xiàn)后約30年。
然而,最近人工智能專家們的評估更為謹慎。現(xiàn)代人工智能研究領(lǐng)域的先鋒人物,如杰弗里-辛頓(Geoffrey Hinton)、德米斯-哈薩比斯(Demis Hassabis)和揚-勒昆(Yann LeCun)說,社會遠未發(fā)展出AGI。鑒于現(xiàn)代人工智能領(lǐng)域的領(lǐng)軍人物的懷疑態(tài)度,以及現(xiàn)代狹義人工智能系統(tǒng)與AGI的性質(zhì)截然不同,擔心通用人工智能將在不久的將來擾亂社會,也許沒有什么依據(jù)。
盡管如此,一些人工智能專家認為,鑒于我們對人腦的了解有限,這種預(yù)測是非常樂觀的,并認為AGI仍然是幾個世紀以后的事情。
在人工智能的發(fā)展中,最近有哪些里程碑式的事件?
IB+M
雖然現(xiàn)代狹義的人工智能可能僅限于執(zhí)行特定的任務(wù),但在其專業(yè)領(lǐng)域內(nèi),這些系統(tǒng)有時能夠?qū)崿F(xiàn)超人的表現(xiàn),在某些情況下甚至表現(xiàn)出超強的創(chuàng)造力,而這一特征通常被認為是人類的內(nèi)在特征。
已經(jīng)有太多的突破,無法列出一個明確的清單,但一些亮點包括;
(1)2009年,谷歌展示了其自動駕駛的豐田普銳斯可以完成10次以上的旅程,每次100英里,使社會走上了無人駕駛汽車的道路。
(2)2011年,計算機系統(tǒng)IBM Watson在美國智力競賽節(jié)目《Jeopardy!》中獲勝,擊敗了該節(jié)目有史以來最好的兩名選手,成為全球頭條新聞。為了贏得這個節(jié)目,沃森使用了自然語言處理和分析大量的數(shù)據(jù)庫,這些數(shù)據(jù)庫經(jīng)過處理后回答人類提出的問題,通常只需幾分之一秒。
(3)2012年,另一項突破預(yù)示著人工智能有可能解決眾多新任務(wù),這些任務(wù)以前被認為對任何機器來說都過于復雜。這一年,AlexNet系統(tǒng)在ImageNet大規(guī)模視覺識別挑戰(zhàn)賽中取得了決定性的勝利。AlexNet的準確度很高,與圖像識別競賽中的對手系統(tǒng)相比,它的錯誤率減少了一半。
AlexNet的表現(xiàn)顯示了基于神經(jīng)網(wǎng)絡(luò)的學習系統(tǒng)的力量,這種機器學習的模式已經(jīng)存在了幾十年,但由于摩爾定律使架構(gòu)的完善和并行處理能力的飛躍,它的潛力終于得到了實現(xiàn)。機器學習系統(tǒng)在執(zhí)行計算機視覺方面的能力也成為當年的頭條新聞,谷歌訓練了一個系統(tǒng)來識別互聯(lián)網(wǎng)的最愛:貓的照片。
下一個引起公眾注意的機器學習系統(tǒng)的功效展示是2016年谷歌DeepMind AlphaGo人工智能在圍棋中戰(zhàn)勝了一位人類大師,這是一種古老的中國游戲,其復雜性讓計算機困惑了幾十年。圍棋每回合可能有200步,而國際象棋則是20步。在一盤棋的過程中,有這么多可能的棋步,從計算的角度來看,提前搜索每一個棋步以確定最佳棋局的代價太大。相反,AlphaGo被訓練如何下棋,它采用了人類專家在3000萬場圍棋比賽中的棋步,并將其輸入深度學習神經(jīng)網(wǎng)絡(luò)。
訓練這些深度學習網(wǎng)絡(luò)可能需要很長的時間,需要攝取大量的數(shù)據(jù),并在系統(tǒng)逐漸完善其模型時進行迭代,以達到最佳效果。
然而,最近,谷歌用AlphaGo Zero完善了訓練過程,這個系統(tǒng)與自己進行"完全隨機"的游戲,然后從中學習。谷歌DeepMind首席執(zhí)行官德米斯-哈薩比斯(Demis Hassabis)也公布了新版AlphaGo Zero,該系統(tǒng)已經(jīng)掌握了國際象棋和象棋的游戲。
人工智能繼續(xù)沖刺新的里程碑:由OpenAI訓練的系統(tǒng)在在線多人游戲Dota 2的一對一比賽中擊敗了世界頂級選手。
同年,OpenAI創(chuàng)造了人工智能代理,他們發(fā)明了自己的語言,以便更有效地合作和實現(xiàn)他們的目標,隨后Facebook訓練代理進行談判和撒謊。
2020年,一個人工智能系統(tǒng)似乎獲得了像人類一樣編寫和談?wù)搸缀跞魏文隳芟氲降脑掝}的能力。
該系統(tǒng)被稱為生成性預(yù)訓練變壓器3或簡稱GPT-3,是一個根據(jù)公開網(wǎng)絡(luò)上的數(shù)十億篇英語文章訓練的神經(jīng)網(wǎng)絡(luò)。
從它被非營利組織OpenAI提供測試后不久,互聯(lián)網(wǎng)就被GPT-3生成幾乎任何主題的文章的能力搞得沸沸揚揚,這些文章乍一看往往很難與人寫的文章區(qū)分開。同樣,在其他領(lǐng)域也取得了令人印象深刻的結(jié)果,它能夠令人信服地回答關(guān)于廣泛主題的問題,甚至能夠讓一個JavaScript編碼新手通過。
但是,雖然許多GPT-3生成的文章具有真實性,但進一步的測試發(fā)現(xiàn),生成的句子往往不合格,提供了表面上可信但混亂的語句,以及有時是完全的廢話。
人們對使用該模型的自然語言理解作為未來服務(wù)的基礎(chǔ)仍有很大興趣。通過OpenAI的測試版API,選定的開發(fā)者可以將其納入軟件。它也將被納入未來通過微軟的Azure云平臺提供的服務(wù)中。
也許人工智能潛力的最引人注目的例子是在2020年末,當時谷歌基于注意力的神經(jīng)網(wǎng)絡(luò)AlphaFold 2展示了一個被一些人稱為值得獲得諾貝爾化學獎的結(jié)果。
該系統(tǒng)能夠觀察蛋白質(zhì)的組成部分,即氨基酸,并推導出蛋白質(zhì)的三維結(jié)構(gòu),這可能對理解疾病和開發(fā)藥物的速度產(chǎn)生深遠影響。在蛋白質(zhì)結(jié)構(gòu)預(yù)測的關(guān)鍵評估競賽中,AlphaFold 2確定了一個蛋白質(zhì)的三維結(jié)構(gòu),其準確性可與晶體學相媲美,而晶體學是令人信服的蛋白質(zhì)建模的黃金標準。
與需要數(shù)月才能得出結(jié)果的晶體學不同,AlphaFold 2可以在數(shù)小時內(nèi)為蛋白質(zhì)建模。由于蛋白質(zhì)的三維結(jié)構(gòu)在人類生物學和疾病中發(fā)揮著如此重要的作用,這樣的速度被譽為醫(yī)學科學的一個里程碑式的突破,更不用說在生物技術(shù)中使用酶的其他領(lǐng)域的潛在應(yīng)用。
什么是機器學習?
實際上,迄今為止提到的所有成就都源于機器學習,這是人工智能的一個子集,占了近年來該領(lǐng)域絕大多數(shù)的成就。當人們今天談?wù)撊斯ぶ悄軙r,他們一般都是在談?wù)摍C器學習。
目前,機器學習在某種程度上正在復蘇,簡單地說,機器學習是指計算機系統(tǒng)學習如何執(zhí)行一項任務(wù),而不是被編程如何去做。對機器學習的這種描述可以追溯到1959年,當時它是由阿瑟-塞繆爾(Arthur Samuel)提出的,他是該領(lǐng)域的先驅(qū),開發(fā)了世界上最早的自學系統(tǒng)之一--塞繆爾跳棋游戲程序。
為了學習,這些系統(tǒng)被輸入大量的數(shù)據(jù),然后用這些數(shù)據(jù)來學習如何執(zhí)行一項特定的任務(wù),如理解語音或給照片加標題。這個數(shù)據(jù)集的質(zhì)量和規(guī)模對于建立一個能夠準確執(zhí)行其指定任務(wù)的系統(tǒng)非常重要。例如,如果你要建立一個機器學習系統(tǒng)來預(yù)測房價,訓練數(shù)據(jù)應(yīng)該不僅僅包括房產(chǎn)的大小,還包括其他突出的因素,如臥室的數(shù)量或花園的大小。
什么是神經(jīng)網(wǎng)絡(luò)?
機器學習成功的關(guān)鍵是神經(jīng)網(wǎng)絡(luò)。這些數(shù)學模型能夠調(diào)整內(nèi)部參數(shù),以改變其輸出內(nèi)容。一個神經(jīng)網(wǎng)絡(luò)被送入數(shù)據(jù)集,教它在訓練期間遇到某些數(shù)據(jù)時應(yīng)該吐出什么。具體而言,該網(wǎng)絡(luò)可能被輸入0到9之間的數(shù)字的灰度圖像,以及一串二進制數(shù)字--0和1--表明每個灰度圖像中顯示的是哪個數(shù)字。然后,該網(wǎng)絡(luò)將被訓練,調(diào)整其內(nèi)部參數(shù),直到它對每張圖像中顯示的數(shù)字進行高度準確的分類。然后,這個經(jīng)過訓練的神經(jīng)網(wǎng)絡(luò)可以用來對其他0到9之間的數(shù)字的灰度圖像進行分類。Yann LeCun在1989年發(fā)表的一篇顯示神經(jīng)網(wǎng)絡(luò)應(yīng)用的開創(chuàng)性論文中使用了這樣一個網(wǎng)絡(luò),并被美國郵政局用于識別手寫的郵政編碼。
神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能非常松散地基于大腦中神經(jīng)元之間的連接。神經(jīng)網(wǎng)絡(luò)是由相互連接的算法層組成的,它們將數(shù)據(jù)輸入到彼此之間。當數(shù)據(jù)在這些層之間傳遞時,可以通過修改賦予數(shù)據(jù)的重要性來訓練它們執(zhí)行特定任務(wù)。在這些神經(jīng)網(wǎng)絡(luò)的訓練過程中,當數(shù)據(jù)在各層之間傳遞時,附加在數(shù)據(jù)上的權(quán)重將繼續(xù)變化,直到神經(jīng)網(wǎng)絡(luò)的輸出非常接近于所需的結(jié)果。在這一點上,該網(wǎng)絡(luò)將"學會"如何執(zhí)行一項特定任務(wù)。所需的輸出可能是任何東西,從正確標記圖像中的水果到根據(jù)傳感器數(shù)據(jù)預(yù)測電梯可能發(fā)生故障。
機器學習的一個子集是深度學習,其中神經(jīng)網(wǎng)絡(luò)被擴展為具有大量大型層的龐大網(wǎng)絡(luò),并使用大量數(shù)據(jù)進行訓練。這些深度神經(jīng)網(wǎng)絡(luò)推動了當前計算機執(zhí)行語音識別和計算機視覺等任務(wù)的能力的飛躍發(fā)展。
有各種類型的神經(jīng)網(wǎng)絡(luò)具有不同的優(yōu)勢和劣勢。遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是一種特別適合于自然語言處理(NLP)--理解文本的含義--和語音識別的神經(jīng)網(wǎng)絡(luò),而卷積神經(jīng)網(wǎng)絡(luò)起源于圖像識別,具有推薦系統(tǒng)和NLP等多種用途。神經(jīng)網(wǎng)絡(luò)的設(shè)計也在不斷發(fā)展,研究人員完善了一種更有效的深度神經(jīng)網(wǎng)絡(luò)形式,稱為長短期記憶或LSTM--一種用于NLP和股票市場預(yù)測等任務(wù)的RNN架構(gòu)--使其運行速度足以用于谷歌翻譯等按需系統(tǒng)中。
2025-06-03 18:34
2025-06-03 18:33
2025-06-03 18:30
2025-05-28 21:29
2025-05-28 21:24
2025-05-28 21:20
2025-05-26 18:37
2025-05-26 18:35
2025-05-22 13:30
2025-05-19 17:48