我們擅長商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
據(jù) Emergen Research 分析稱,到 2028 年,全球深度學(xué)習(xí)市場規(guī)模預(yù)計(jì)將以 39.1% 的穩(wěn)定復(fù)合年增長率達(dá)到 933.4 億美元,推動(dòng)其市場收入的關(guān)鍵因素是采用基于云的技術(shù)和在大數(shù)據(jù)分析中使用深度學(xué)習(xí)系統(tǒng)。
那么,究竟什么是深度學(xué)習(xí)?它如何工作?
據(jù)《VentureBeat》在近日《這就是深度學(xué)習(xí)如此強(qiáng)大的原因》一文中總結(jié)道:深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,它使用神經(jīng)網(wǎng)絡(luò)來執(zhí)行學(xué)習(xí)和預(yù)測。深度學(xué)習(xí)在各種任務(wù)中都表現(xiàn)出了驚人的表現(xiàn),無論是文本、時(shí)間序列還是計(jì)算機(jī)視覺。深度學(xué)習(xí)的成功主要來自大數(shù)據(jù)的可用性和計(jì)算能力,這使得深度學(xué)習(xí)的表現(xiàn)遠(yuǎn)遠(yuǎn)優(yōu)于任何經(jīng)典的機(jī)器學(xué)習(xí)算法。
深度學(xué)習(xí)的本質(zhì):神經(jīng)網(wǎng)絡(luò)和函數(shù)
有網(wǎng)友曾笑言,“當(dāng)你想要擬合任何函數(shù)或者任何分布,而又沒有思路時(shí),試試神經(jīng)網(wǎng)絡(luò)吧!”
先上兩個(gè)重要結(jié)論:
神經(jīng)網(wǎng)絡(luò)是一個(gè)相互連接的神經(jīng)元網(wǎng)絡(luò),每個(gè)神經(jīng)元都是一個(gè)有限函數(shù)逼近器。這樣,神經(jīng)網(wǎng)絡(luò)被視為通用函數(shù)逼近器。
深度學(xué)習(xí)是具有許多隱藏層(通常大于 2 個(gè)隱藏層)的神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)是從層到層的函數(shù)的復(fù)雜組合,從而找到定義從輸入到輸出的映射的函數(shù)。

在高中數(shù)學(xué)我們會(huì)學(xué)到,函數(shù)就是從輸入空間到輸出空間的映射。一個(gè)簡單的 sin (x)函數(shù)是從角空間(-180°到 180°或0°到 360°)映射到實(shí)數(shù)空間(-1 到1)。函數(shù)逼近問題是函數(shù)論的重要組成部分,涉及的基本問題是函數(shù)的近似表示問題。
那么,為什么神經(jīng)網(wǎng)絡(luò)被認(rèn)為是通用函數(shù)逼近器呢?
每個(gè)神經(jīng)元學(xué)習(xí)一個(gè)有限的函數(shù):f(.)=g(W*X)其中W是要學(xué)習(xí)的權(quán)重向量,X是輸入向量,g(.)是非線性變換。W*X可以可視化為高維空間(超平面)中的一條線,而g(.)可以是任何非線性可微函數(shù),如 sigmoid、tanh、ReLU 等(常用于深度學(xué)習(xí)領(lǐng)域)。
在神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)無非就是找到最佳權(quán)重向量W。例如,在y=mx+c中,我們有 2 個(gè)權(quán)重:m和c?,F(xiàn)在,根據(jù)二維平面空間中點(diǎn)的分布,我們找到滿足某些標(biāo)準(zhǔn)的m及c的最佳值,那么對于所有數(shù)據(jù)點(diǎn),預(yù)測y和實(shí)際點(diǎn)之間的差異最小。
神經(jīng)網(wǎng)絡(luò)“層”效果:學(xué)習(xí)具體到類別概括的映射
如果輸入是獅子的圖像,輸出是屬于獅子類的圖像分類,那么深度學(xué)習(xí)就是學(xué)習(xí)將圖像向量映射到類的函數(shù)。類似地,輸入是單詞序列,輸出是輸入句子是否具有正面/中性/負(fù)面情緒。因此,深度學(xué)習(xí)是學(xué)習(xí)從輸入文本到輸出類的映射:中性或正面或負(fù)面。
如何實(shí)現(xiàn)上述任務(wù)呢?
每個(gè)神經(jīng)元都是一個(gè)非線性函數(shù),我們將幾個(gè)這樣的神經(jīng)元堆疊在一個(gè)“層”中,每個(gè)神經(jīng)元接收相同的一組輸入但學(xué)習(xí)不同的權(quán)重W。因此,每一層都有一組學(xué)習(xí)函數(shù):f1,f2,…,fn,稱為隱藏層值。這些值再次組合,在下一層:h(f1,f2,...,fn)等等。這樣,每一層都由前一層的函數(shù)組成(類似于h(f(g(x))))。已經(jīng)表明,通過這種組合,我們可以學(xué)習(xí)任何非線性復(fù)函數(shù)。
深度學(xué)習(xí)是具有許多隱藏層(通常大于 2 個(gè)隱藏層)的神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)是從層到層的函數(shù)的復(fù)雜組合,從而找到定義從輸入到輸出的映射的函數(shù)。
深度學(xué)習(xí)作為曲線擬合的插值:過度擬合挑戰(zhàn)與泛化目標(biāo)
深度學(xué)習(xí)先驅(qū) Yann LeCun(卷積神經(jīng)網(wǎng)絡(luò)的創(chuàng)造者和圖靈獎(jiǎng)獲得者)曾在推特上發(fā)帖稱,“深度學(xué)習(xí)并沒有你想象的那么令人驚嘆,因?yàn)樗鼉H僅是美化曲線擬合的插值。但是在高維中,沒有插值之類的東西。在高維空間,一切都是外推。”
插值(interpolation)是離散函數(shù)逼近的重要方法,利用它可通過函數(shù)在有限個(gè)點(diǎn)處的取值狀況,估算出函數(shù)在其他點(diǎn)處的近似值。
從生物學(xué)的解釋來看,人類通過逐層解釋圖像來處理世界的圖像,從邊緣和輪廓等低級特征,到對象和場景等高級特征。神經(jīng)網(wǎng)絡(luò)中的函數(shù)組合與此一致,其中每個(gè)函數(shù)組合都在學(xué)習(xí)關(guān)于圖像的復(fù)雜特征。用于圖像最常見的神經(jīng)網(wǎng)絡(luò)架構(gòu)是 CNN (Convolutional Neural Networks,卷積神經(jīng)網(wǎng)絡(luò)),它以分層方式學(xué)習(xí)這些特征,然后一個(gè)完全連接的神經(jīng)網(wǎng)絡(luò)將圖像特征分類為不同的類別。
比如,給定一組平面上的數(shù)據(jù)點(diǎn),我們嘗試通過插值擬合曲線,該曲線在某種程度上代表了定義這些數(shù)據(jù)點(diǎn)的函數(shù)。我們擬合的函數(shù)越復(fù)雜(例如在插值中,通過多項(xiàng)式次數(shù)確定),它就越適合數(shù)據(jù);但是,它對新數(shù)據(jù)點(diǎn)的泛化程度越低。
這就是深度學(xué)習(xí)面臨挑戰(zhàn)的地方,也就是通常所說的過度擬合問題:盡可能地?cái)M合數(shù)據(jù),但在泛化方面有所妥協(xié)。幾乎所有深度學(xué)習(xí)架構(gòu)都必須處理這個(gè)重要因素,才能學(xué)習(xí)在看不見的數(shù)據(jù)上表現(xiàn)同樣出色的通用功能。
深度學(xué)習(xí)如何學(xué)習(xí)?問題決定了神經(jīng)網(wǎng)絡(luò)架構(gòu)
那么,我們?nèi)绾螌W(xué)習(xí)這個(gè)復(fù)雜的函數(shù)呢?
這完全取決于手頭的問題,其決定了神經(jīng)網(wǎng)絡(luò)架構(gòu)。如果我們對圖像分類感興趣,那么我們使用 CNN。如果我們對時(shí)間相關(guān)的預(yù)測或文本感興趣,那么我們使用 RNN(Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò)) 或 Transformer,如果我們有動(dòng)態(tài)環(huán)境(如汽車駕駛),那么我們使用強(qiáng)化學(xué)習(xí)。
除此之外,學(xué)習(xí)還涉及處理不同的挑戰(zhàn):
·通過使用正則化(regularization,用來防止訓(xùn)練的模型產(chǎn)生過擬合與欠擬合現(xiàn)象)處理確保模型學(xué)習(xí)通用函數(shù),而不僅僅適合訓(xùn)練數(shù)據(jù)。
·根據(jù)手頭的問題,選擇損失函數(shù)。粗略地說,損失函數(shù)是我們想要的(真實(shí)值)和我們當(dāng)前擁有的(當(dāng)前預(yù)測)之間的誤差函數(shù)。
·梯度下降是用于收斂到最優(yōu)函數(shù)的算法。決定學(xué)習(xí)率變得具有挑戰(zhàn)性,因?yàn)楫?dāng)我們遠(yuǎn)離最優(yōu)時(shí),我們想要更快地走向最優(yōu),而當(dāng)我們接近最優(yōu)時(shí),我們想要慢一些,以確保我們收斂到最優(yōu)和全局最小值。
·大量隱藏層需要處理梯度消失問題。跳過連接和適當(dāng)?shù)姆蔷€性激活函數(shù)等架構(gòu)變化,有助于解決這個(gè)問題。
基于神經(jīng)架構(gòu)與大數(shù)據(jù):深度學(xué)習(xí)帶來計(jì)算挑戰(zhàn)
現(xiàn)在我們知道深度學(xué)習(xí)只是一個(gè)學(xué)習(xí)復(fù)雜的函數(shù),它帶來了其他計(jì)算挑戰(zhàn):
要學(xué)習(xí)一個(gè)復(fù)雜的函數(shù),我們需要大量的數(shù)據(jù);為了處理大數(shù)據(jù),我們需要快速的計(jì)算環(huán)境;因此,我們需要一個(gè)支持這種環(huán)境的基礎(chǔ)設(shè)施。
使用 CPU 進(jìn)行并行處理不足以計(jì)算數(shù)百萬或數(shù)十億的權(quán)重(也稱為 DL 的參數(shù))。神經(jīng)網(wǎng)絡(luò)需要學(xué)習(xí)需要向量(或張量)乘法的權(quán)重。這就是 GPU 派上用場的地方,因?yàn)樗鼈兛梢苑浅?焖俚剡M(jìn)行并行向量乘法。根據(jù)深度學(xué)習(xí)架構(gòu)、數(shù)據(jù)大小和手頭的任務(wù),我們有時(shí)需要 1 個(gè) GPU,有時(shí),數(shù)據(jù)科學(xué)家需要根據(jù)已知文獻(xiàn)或通過測量 1 個(gè) GPU 的性能來做出決策。
通過使用適當(dāng)?shù)纳窠?jīng)網(wǎng)絡(luò)架構(gòu)(層數(shù)、神經(jīng)元數(shù)量、非線性函數(shù)等)以及足夠大的數(shù)據(jù),深度學(xué)習(xí)網(wǎng)絡(luò)可以學(xué)習(xí)從一個(gè)向量空間到另一個(gè)向量空間的任何映射。這就是讓深度學(xué)習(xí)成為任何機(jī)器學(xué)習(xí)任務(wù)的強(qiáng)大工具的原因。
?。?a href="http://m.rzslsm.com/wechat/">邯鄲小程序開發(fā))


小米應(yīng)用商店發(fā)布消息稱 持續(xù)開展“APP 侵害用戶權(quán)益治理”系列行動(dòng) 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線 加速數(shù)字技術(shù)在實(shí)體經(jīng)濟(jì)中的落地和應(yīng)用 11:34:49
樂視回應(yīng)還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購物車擴(kuò)展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺(tái)推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區(qū)分公司 09:53:13