什么是人工智能(AI)?
這取決于你問(wèn)誰(shuí)?
早在20世紀(jì)50年代,該領(lǐng)域之父明斯基和麥卡錫將人工智能描述為由機(jī)器執(zhí)行的任何任務(wù),這些任務(wù)以前被認(rèn)為需要人類智慧。這顯然是一個(gè)相當(dāng)廣泛的定義,這就是為什么你有時(shí)會(huì)看到關(guān)于某物是否是真正的人工智能的爭(zhēng)論。對(duì)創(chuàng)造智能意味著什么的現(xiàn)代定義則更為具體。谷歌的人工智能研究員、機(jī)器學(xué)習(xí)軟件庫(kù)Keras的創(chuàng)建者Francois Chollet說(shuō),智能與一個(gè)系統(tǒng)在新環(huán)境中適應(yīng)和隨機(jī)應(yīng)變的能力聯(lián)系在一起,能夠概括其知識(shí)并將其應(yīng)用于陌生的場(chǎng)景。
他說(shuō):"智能是你在以前沒(méi)有準(zhǔn)備的任務(wù)中獲得新技能的效率。智力不是技能本身;不是你能做什么;而是你能多好地、多有效地學(xué)習(xí)新事物。"
這是一個(gè)定義,根據(jù)這個(gè)定義,現(xiàn)代人工智能驅(qū)動(dòng)的系統(tǒng),如虛擬助手,將被描述為展示了"狹義的人工智能",即在執(zhí)行一組有限的任務(wù)(如語(yǔ)音識(shí)別或計(jì)算機(jī)視覺(jué))時(shí)概括其訓(xùn)練的能力。
通常情況下,人工智能系統(tǒng)至少表現(xiàn)出與人類智能相關(guān)的以下一些行為:計(jì)劃、學(xué)習(xí)、推理、解決問(wèn)題、知識(shí)表示、感知、運(yùn)動(dòng)和操縱,以及在較小的程度上,社會(huì)智能和創(chuàng)造力。
人工智能的用途有哪些?
今天,人工智能無(wú)處不在,它被用來(lái)推薦你接下來(lái)應(yīng)該在網(wǎng)上買什么,理解你對(duì)虛擬助手說(shuō)的話,如亞馬遜的Alexa和蘋果的Siri,識(shí)別照片中的人和事物,發(fā)現(xiàn)垃圾郵件,或發(fā)現(xiàn)垃圾郵件檢測(cè)信用卡欺詐。
人工智能的不同類型是什么?
在一個(gè)非常高的水平上,人工智能可以分為兩大類型;
狹義人工智能
狹義的人工智能是我們今天在計(jì)算機(jī)中看到的一切--智能系統(tǒng)已經(jīng)被教導(dǎo)或已經(jīng)學(xué)會(huì)了如何執(zhí)行特定的任務(wù),而沒(méi)有被明確地編程如何去做。
這種類型的機(jī)器智能在蘋果iPhone上的Siri虛擬助手的語(yǔ)音和語(yǔ)言識(shí)別中,在自動(dòng)駕駛汽車的視覺(jué)識(shí)別系統(tǒng)中,或者在根據(jù)你過(guò)去購(gòu)買的產(chǎn)品來(lái)推薦你可能喜歡的產(chǎn)品的推薦引擎中都很明顯。與人類不同,這些系統(tǒng)只能學(xué)習(xí)或被教導(dǎo)如何做確定的任務(wù),這就是為什么它們被稱為狹義人工智能。
通用人工智能
一般人工智能非常不同,它是在人類中發(fā)現(xiàn)的那種可適應(yīng)的智力,是一種靈活的智力形式,能夠?qū)W習(xí)如何執(zhí)行大量不同的任務(wù),從理發(fā)到建立電子表格或根據(jù)其積累的經(jīng)驗(yàn)對(duì)各種主題進(jìn)行推理。
這種人工智能在電影中比較常見,如《2001》中的HAL或《終結(jié)者》中的天網(wǎng),但今天并不存在--而且人工智能專家對(duì)它多久會(huì)成為現(xiàn)實(shí)存在激烈的分歧。
狹義人工智能能做什么?狹義人工智能有大量的新興應(yīng)用;
(1)分析無(wú)機(jī)對(duì)基礎(chǔ)設(shè)施(如石油管道)進(jìn)行視覺(jué)檢查的視頻資料。
(2)組織個(gè)人和企業(yè)的日歷。
(3)回應(yīng)簡(jiǎn)單的客戶服務(wù)查詢。
(4)與其他智能系統(tǒng)協(xié)調(diào),執(zhí)行任務(wù),如在合適的時(shí)間和地點(diǎn)預(yù)訂酒店。
(5)幫助放射科醫(yī)生在X光片中發(fā)現(xiàn)潛在的腫瘤。
(6)標(biāo)記網(wǎng)上的不適當(dāng)內(nèi)容,從物聯(lián)網(wǎng)設(shè)備收集的數(shù)據(jù)中檢測(cè)電梯的磨損情況。
(7)從衛(wèi)星圖像中生成世界的三維模型......這個(gè)清單不勝枚舉。
這些學(xué)習(xí)系統(tǒng)的新應(yīng)用一直在出現(xiàn)。圖形卡設(shè)計(jì)者Nvidia最近披露了一個(gè)基于人工智能的系統(tǒng)Maxine,它允許人們進(jìn)行高質(zhì)量的視頻通話,幾乎不受互聯(lián)網(wǎng)連接速度的限制。該系統(tǒng)通過(guò)不在互聯(lián)網(wǎng)上傳輸完整的視頻流,而是對(duì)通話者的少量靜態(tài)圖像進(jìn)行動(dòng)畫處理,旨在實(shí)時(shí)再現(xiàn)通話者的面部表情和動(dòng)作,并與視頻無(wú)異,從而將此類通話所需的帶寬降低了10倍。
然而,盡管這些系統(tǒng)有很多未開發(fā)的潛力,但有時(shí)對(duì)技術(shù)的雄心超過(guò)了現(xiàn)實(shí)。一個(gè)典型的例子是自動(dòng)駕駛汽車,它本身是由人工智能驅(qū)動(dòng)的系統(tǒng)(如計(jì)算機(jī)視覺(jué))所支撐的。電動(dòng)汽車公司特斯拉落后于首席執(zhí)行官埃隆-馬斯克的原定時(shí)間表,即汽車的自動(dòng)駕駛系統(tǒng)從更有限的輔助駕駛能力升級(jí)為"完全自動(dòng)駕駛",而完全自動(dòng)駕駛選項(xiàng)最近才作為測(cè)試計(jì)劃的一部分向選定的專家司機(jī)推出。
通用人工智能能做什么?
2012/13年,人工智能研究人員文森特-C-穆勒和哲學(xué)家尼克-博斯特羅姆在四組專家中進(jìn)行了一項(xiàng)調(diào)查,報(bào)告稱人工通用智能(AGI)將在2040至2050年之間開發(fā)出50%的可能性,到2075年上升到90%。該小組甚至走得更遠(yuǎn),預(yù)測(cè)所謂的"超級(jí)智能"--Bostrom將其定義為"在幾乎所有感興趣的領(lǐng)域大大超過(guò)人類認(rèn)知能力的任何智力"--預(yù)計(jì)在AGI實(shí)現(xiàn)后約30年。
然而,最近人工智能專家們的評(píng)估更為謹(jǐn)慎。現(xiàn)代人工智能研究領(lǐng)域的先鋒人物,如杰弗里-辛頓(Geoffrey Hinton)、德米斯-哈薩比斯(Demis Hassabis)和揚(yáng)-勒昆(Yann LeCun)說(shuō),社會(huì)遠(yuǎn)未發(fā)展出AGI。鑒于現(xiàn)代人工智能領(lǐng)域的領(lǐng)軍人物的懷疑態(tài)度,以及現(xiàn)代狹義人工智能系統(tǒng)與AGI的性質(zhì)截然不同,擔(dān)心通用人工智能將在不久的將來(lái)擾亂社會(huì),也許沒(méi)有什么依據(jù)。
盡管如此,一些人工智能專家認(rèn)為,鑒于我們對(duì)人腦的了解有限,這種預(yù)測(cè)是非常樂(lè)觀的,并認(rèn)為AGI仍然是幾個(gè)世紀(jì)以后的事情。
在人工智能的發(fā)展中,最近有哪些里程碑式的事件?
IB+M
雖然現(xiàn)代狹義的人工智能可能僅限于執(zhí)行特定的任務(wù),但在其專業(yè)領(lǐng)域內(nèi),這些系統(tǒng)有時(shí)能夠?qū)崿F(xiàn)超人的表現(xiàn),在某些情況下甚至表現(xiàn)出超強(qiáng)的創(chuàng)造力,而這一特征通常被認(rèn)為是人類的內(nèi)在特征。
已經(jīng)有太多的突破,無(wú)法列出一個(gè)明確的清單,但一些亮點(diǎn)包括;
(1)2009年,谷歌展示了其自動(dòng)駕駛的豐田普銳斯可以完成10次以上的旅程,每次100英里,使社會(huì)走上了無(wú)人駕駛汽車的道路。
(2)2011年,計(jì)算機(jī)系統(tǒng)IBM Watson在美國(guó)智力競(jìng)賽節(jié)目《Jeopardy!》中獲勝,擊敗了該節(jié)目有史以來(lái)最好的兩名選手,成為全球頭條新聞。為了贏得這個(gè)節(jié)目,沃森使用了自然語(yǔ)言處理和分析大量的數(shù)據(jù)庫(kù),這些數(shù)據(jù)庫(kù)經(jīng)過(guò)處理后回答人類提出的問(wèn)題,通常只需幾分之一秒。
(3)2012年,另一項(xiàng)突破預(yù)示著人工智能有可能解決眾多新任務(wù),這些任務(wù)以前被認(rèn)為對(duì)任何機(jī)器來(lái)說(shuō)都過(guò)于復(fù)雜。這一年,AlexNet系統(tǒng)在ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽中取得了決定性的勝利。AlexNet的準(zhǔn)確度很高,與圖像識(shí)別競(jìng)賽中的對(duì)手系統(tǒng)相比,它的錯(cuò)誤率減少了一半。
AlexNet的表現(xiàn)顯示了基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)系統(tǒng)的力量,這種機(jī)器學(xué)習(xí)的模式已經(jīng)存在了幾十年,但由于摩爾定律使架構(gòu)的完善和并行處理能力的飛躍,它的潛力終于得到了實(shí)現(xiàn)。機(jī)器學(xué)習(xí)系統(tǒng)在執(zhí)行計(jì)算機(jī)視覺(jué)方面的能力也成為當(dāng)年的頭條新聞,谷歌訓(xùn)練了一個(gè)系統(tǒng)來(lái)識(shí)別互聯(lián)網(wǎng)的最愛:貓的照片。
下一個(gè)引起公眾注意的機(jī)器學(xué)習(xí)系統(tǒng)的功效展示是2016年谷歌DeepMind AlphaGo人工智能在圍棋中戰(zhàn)勝了一位人類大師,這是一種古老的中國(guó)游戲,其復(fù)雜性讓計(jì)算機(jī)困惑了幾十年。圍棋每回合可能有200步,而國(guó)際象棋則是20步。在一盤棋的過(guò)程中,有這么多可能的棋步,從計(jì)算的角度來(lái)看,提前搜索每一個(gè)棋步以確定最佳棋局的代價(jià)太大。相反,AlphaGo被訓(xùn)練如何下棋,它采用了人類專家在3000萬(wàn)場(chǎng)圍棋比賽中的棋步,并將其輸入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。
訓(xùn)練這些深度學(xué)習(xí)網(wǎng)絡(luò)可能需要很長(zhǎng)的時(shí)間,需要攝取大量的數(shù)據(jù),并在系統(tǒng)逐漸完善其模型時(shí)進(jìn)行迭代,以達(dá)到最佳效果。
然而,最近,谷歌用AlphaGo Zero完善了訓(xùn)練過(guò)程,這個(gè)系統(tǒng)與自己進(jìn)行"完全隨機(jī)"的游戲,然后從中學(xué)習(xí)。谷歌DeepMind首席執(zhí)行官德米斯-哈薩比斯(Demis Hassabis)也公布了新版AlphaGo Zero,該系統(tǒng)已經(jīng)掌握了國(guó)際象棋和象棋的游戲。
人工智能繼續(xù)沖刺新的里程碑:由OpenAI訓(xùn)練的系統(tǒng)在在線多人游戲Dota 2的一對(duì)一比賽中擊敗了世界頂級(jí)選手。
同年,OpenAI創(chuàng)造了人工智能代理,他們發(fā)明了自己的語(yǔ)言,以便更有效地合作和實(shí)現(xiàn)他們的目標(biāo),隨后Facebook訓(xùn)練代理進(jìn)行談判和撒謊。
2020年,一個(gè)人工智能系統(tǒng)似乎獲得了像人類一樣編寫和談?wù)搸缀跞魏文隳芟氲降脑掝}的能力。
該系統(tǒng)被稱為生成性預(yù)訓(xùn)練變壓器3或簡(jiǎn)稱GPT-3,是一個(gè)根據(jù)公開網(wǎng)絡(luò)上的數(shù)十億篇英語(yǔ)文章訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
從它被非營(yíng)利組織OpenAI提供測(cè)試后不久,互聯(lián)網(wǎng)就被GPT-3生成幾乎任何主題的文章的能力搞得沸沸揚(yáng)揚(yáng),這些文章乍一看往往很難與人寫的文章區(qū)分開。同樣,在其他領(lǐng)域也取得了令人印象深刻的結(jié)果,它能夠令人信服地回答關(guān)于廣泛主題的問(wèn)題,甚至能夠讓一個(gè)JavaScript編碼新手通過(guò)。
但是,雖然許多GPT-3生成的文章具有真實(shí)性,但進(jìn)一步的測(cè)試發(fā)現(xiàn),生成的句子往往不合格,提供了表面上可信但混亂的語(yǔ)句,以及有時(shí)是完全的廢話。
人們對(duì)使用該模型的自然語(yǔ)言理解作為未來(lái)服務(wù)的基礎(chǔ)仍有很大興趣。通過(guò)OpenAI的測(cè)試版API,選定的開發(fā)者可以將其納入軟件。它也將被納入未來(lái)通過(guò)微軟的Azure云平臺(tái)提供的服務(wù)中。
也許人工智能潛力的最引人注目的例子是在2020年末,當(dāng)時(shí)谷歌基于注意力的神經(jīng)網(wǎng)絡(luò)AlphaFold 2展示了一個(gè)被一些人稱為值得獲得諾貝爾化學(xué)獎(jiǎng)的結(jié)果。
該系統(tǒng)能夠觀察蛋白質(zhì)的組成部分,即氨基酸,并推導(dǎo)出蛋白質(zhì)的三維結(jié)構(gòu),這可能對(duì)理解疾病和開發(fā)藥物的速度產(chǎn)生深遠(yuǎn)影響。在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的關(guān)鍵評(píng)估競(jìng)賽中,AlphaFold 2確定了一個(gè)蛋白質(zhì)的三維結(jié)構(gòu),其準(zhǔn)確性可與晶體學(xué)相媲美,而晶體學(xué)是令人信服的蛋白質(zhì)建模的黃金標(biāo)準(zhǔn)。
與需要數(shù)月才能得出結(jié)果的晶體學(xué)不同,AlphaFold 2可以在數(shù)小時(shí)內(nèi)為蛋白質(zhì)建模。由于蛋白質(zhì)的三維結(jié)構(gòu)在人類生物學(xué)和疾病中發(fā)揮著如此重要的作用,這樣的速度被譽(yù)為醫(yī)學(xué)科學(xué)的一個(gè)里程碑式的突破,更不用說(shuō)在生物技術(shù)中使用酶的其他領(lǐng)域的潛在應(yīng)用。
什么是機(jī)器學(xué)習(xí)?
實(shí)際上,迄今為止提到的所有成就都源于機(jī)器學(xué)習(xí),這是人工智能的一個(gè)子集,占了近年來(lái)該領(lǐng)域絕大多數(shù)的成就。當(dāng)人們今天談?wù)撊斯ぶ悄軙r(shí),他們一般都是在談?wù)摍C(jī)器學(xué)習(xí)。
目前,機(jī)器學(xué)習(xí)在某種程度上正在復(fù)蘇,簡(jiǎn)單地說(shuō),機(jī)器學(xué)習(xí)是指計(jì)算機(jī)系統(tǒng)學(xué)習(xí)如何執(zhí)行一項(xiàng)任務(wù),而不是被編程如何去做。對(duì)機(jī)器學(xué)習(xí)的這種描述可以追溯到1959年,當(dāng)時(shí)它是由阿瑟-塞繆爾(Arthur Samuel)提出的,他是該領(lǐng)域的先驅(qū),開發(fā)了世界上最早的自學(xué)系統(tǒng)之一--塞繆爾跳棋游戲程序。
為了學(xué)習(xí),這些系統(tǒng)被輸入大量的數(shù)據(jù),然后用這些數(shù)據(jù)來(lái)學(xué)習(xí)如何執(zhí)行一項(xiàng)特定的任務(wù),如理解語(yǔ)音或給照片加標(biāo)題。這個(gè)數(shù)據(jù)集的質(zhì)量和規(guī)模對(duì)于建立一個(gè)能夠準(zhǔn)確執(zhí)行其指定任務(wù)的系統(tǒng)非常重要。例如,如果你要建立一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)來(lái)預(yù)測(cè)房?jī)r(jià),訓(xùn)練數(shù)據(jù)應(yīng)該不僅僅包括房產(chǎn)的大小,還包括其他突出的因素,如臥室的數(shù)量或花園的大小。
什么是神經(jīng)網(wǎng)絡(luò)?
機(jī)器學(xué)習(xí)成功的關(guān)鍵是神經(jīng)網(wǎng)絡(luò)。這些數(shù)學(xué)模型能夠調(diào)整內(nèi)部參數(shù),以改變其輸出內(nèi)容。一個(gè)神經(jīng)網(wǎng)絡(luò)被送入數(shù)據(jù)集,教它在訓(xùn)練期間遇到某些數(shù)據(jù)時(shí)應(yīng)該吐出什么。具體而言,該網(wǎng)絡(luò)可能被輸入0到9之間的數(shù)字的灰度圖像,以及一串二進(jìn)制數(shù)字--0和1--表明每個(gè)灰度圖像中顯示的是哪個(gè)數(shù)字。然后,該網(wǎng)絡(luò)將被訓(xùn)練,調(diào)整其內(nèi)部參數(shù),直到它對(duì)每張圖像中顯示的數(shù)字進(jìn)行高度準(zhǔn)確的分類。然后,這個(gè)經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以用來(lái)對(duì)其他0到9之間的數(shù)字的灰度圖像進(jìn)行分類。Yann LeCun在1989年發(fā)表的一篇顯示神經(jīng)網(wǎng)絡(luò)應(yīng)用的開創(chuàng)性論文中使用了這樣一個(gè)網(wǎng)絡(luò),并被美國(guó)郵政局用于識(shí)別手寫的郵政編碼。
神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能非常松散地基于大腦中神經(jīng)元之間的連接。神經(jīng)網(wǎng)絡(luò)是由相互連接的算法層組成的,它們將數(shù)據(jù)輸入到彼此之間。當(dāng)數(shù)據(jù)在這些層之間傳遞時(shí),可以通過(guò)修改賦予數(shù)據(jù)的重要性來(lái)訓(xùn)練它們執(zhí)行特定任務(wù)。在這些神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,當(dāng)數(shù)據(jù)在各層之間傳遞時(shí),附加在數(shù)據(jù)上的權(quán)重將繼續(xù)變化,直到神經(jīng)網(wǎng)絡(luò)的輸出非常接近于所需的結(jié)果。在這一點(diǎn)上,該網(wǎng)絡(luò)將"學(xué)會(huì)"如何執(zhí)行一項(xiàng)特定任務(wù)。所需的輸出可能是任何東西,從正確標(biāo)記圖像中的水果到根據(jù)傳感器數(shù)據(jù)預(yù)測(cè)電梯可能發(fā)生故障。
機(jī)器學(xué)習(xí)的一個(gè)子集是深度學(xué)習(xí),其中神經(jīng)網(wǎng)絡(luò)被擴(kuò)展為具有大量大型層的龐大網(wǎng)絡(luò),并使用大量數(shù)據(jù)進(jìn)行訓(xùn)練。這些深度神經(jīng)網(wǎng)絡(luò)推動(dòng)了當(dāng)前計(jì)算機(jī)執(zhí)行語(yǔ)音識(shí)別和計(jì)算機(jī)視覺(jué)等任務(wù)的能力的飛躍發(fā)展。
有各種類型的神經(jīng)網(wǎng)絡(luò)具有不同的優(yōu)勢(shì)和劣勢(shì)。遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是一種特別適合于自然語(yǔ)言處理(NLP)--理解文本的含義--和語(yǔ)音識(shí)別的神經(jīng)網(wǎng)絡(luò),而卷積神經(jīng)網(wǎng)絡(luò)起源于圖像識(shí)別,具有推薦系統(tǒng)和NLP等多種用途。神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)也在不斷發(fā)展,研究人員完善了一種更有效的深度神經(jīng)網(wǎng)絡(luò)形式,稱為長(zhǎng)短期記憶或LSTM--一種用于NLP和股票市場(chǎng)預(yù)測(cè)等任務(wù)的RNN架構(gòu)--使其運(yùn)行速度足以用于谷歌翻譯等按需系統(tǒng)中。
2025-04-24 15:08
2025-04-21 12:14
2025-04-21 12:11
2025-04-18 08:54
2025-04-18 08:53
2025-04-17 08:16
2025-04-17 08:13
2025-04-16 10:55
2025-04-16 08:50
2025-04-14 14:57