這里主要介紹線性編碼有關(guān)內(nèi)容

線性編碼

術(shù)語(yǔ)代數(shù)編碼理論表示編碼原理的子領(lǐng)域,其編碼性質(zhì)以代數(shù)術(shù)語(yǔ)表示,然后進(jìn)一步研究 。

代數(shù)編碼理論基本上分為兩大類代碼:

線性分組碼

卷積碼

它分析一個(gè)編碼的以下三個(gè)特性-主要是:

碼字長(zhǎng)度

有效代碼字總數(shù)

兩個(gè)有效代碼字之間的最小距離,主要使用漢明距離,有時(shí)也使用其他距離像Lee距離。

線性分組碼

線性分組碼具有的特性的線性度,即,任何兩個(gè)碼字的總和也是一個(gè)編碼字,并且它們被應(yīng)用到組的源比特中,因此稱為線性分組碼。有分組碼不是線性的,但是很難證明編碼是沒有這個(gè)屬性的編碼。

線性分組碼由其符號(hào)字母(例如,二進(jìn)制或三元)和參數(shù)(n,m,

)組成,其中

n是碼字的長(zhǎng)度,以符號(hào)表示,

m是將一次用于編碼的源符號(hào)的數(shù)量,

是編碼的最小漢明距離。

有許多類型的線性分組碼,如循環(huán)碼(如漢明碼)、重復(fù)代碼、奇偶校驗(yàn)碼、多項(xiàng)式編碼(例如BCH碼)、里德 - 所羅門編碼、代數(shù)幾何編碼、里德 - 穆勒編碼、完美編碼。

編碼原理使用N維球體模型。例如,可以在桌面上或三維中將多少便士包裝成圓圈,可以將多少個(gè)彈珠包裝在一個(gè)球面上。其他注意事項(xiàng)輸入編碼的選擇。例如,六邊形包裝成矩形框的約束將在角落留下空的空間。隨著尺寸越來(lái)越大,空白空間的百分比越來(lái)越小。但是在某些維度上,包裝使用所有空間,這些代碼是所謂的“完美”代碼。唯一非常重要和有用的完美編碼是距離為3漢明碼,其參數(shù)滿足(2 r - 1,2 r - 1 - r,3)和[23,12,7]二進(jìn)制和[11,6,5 ]三重Golay碼。

另一個(gè)編碼屬性是單個(gè)碼字可能具有的鄰居的數(shù)量。再次,以便士為例。首先我們把便士打包成矩形網(wǎng)格。每一分錢將有4個(gè)鄰近的鄰居(在距離更遠(yuǎn)的角落有4個(gè))。在六邊形,每一分錢將有6個(gè)近鄰。當(dāng)我們?cè)黾映叽鐣r(shí),近鄰的數(shù)量增加非??臁=Y(jié)果是使接收端選擇鄰居(因此錯(cuò)誤)的噪聲的方式也增加。這是分組碼以及所有編碼的基本限制??赡芨y對(duì)單個(gè)鄰居造成錯(cuò)誤,但鄰居數(shù)量可能足夠大,因此總錯(cuò)誤概率實(shí)際上會(huì)受到影響。

線性分組碼的屬性可以應(yīng)用于很多應(yīng)用。例如,線性分組碼的校正子集合唯一性被用網(wǎng)格成形,是最有名的形狀碼之一。傳感器網(wǎng)絡(luò)中使用相同的屬性進(jìn)行分布式源代碼編碼。

卷積碼

如果特定的一致監(jiān)督關(guān)系不是在一個(gè)碼字中實(shí)現(xiàn),而是在個(gè)碼字中實(shí)現(xiàn),這種碼稱為卷積碼。卷積碼可用移位寄存器來(lái)實(shí)現(xiàn),這種卷積編碼器的輸出可看作是輸入信息碼元序列與編碼器響應(yīng)函數(shù)的卷積。能糾正突發(fā)錯(cuò)誤的哈格伯爾格碼也是一種卷積碼。在平穩(wěn)高斯噪聲干擾的信道上采用序貫譯碼方法的卷積碼有很好的性能,能用于衛(wèi)星通信和深空通信。

UTF-8 編碼原理

為了統(tǒng)一全世界各國(guó)語(yǔ)言文字和專業(yè)領(lǐng)域符號(hào)(例如數(shù)學(xué)符號(hào)、樂譜符號(hào))的編碼,ISO制定了ISO 10646標(biāo)準(zhǔn),也稱為UCS(Universal Character Set)。UCS編碼的長(zhǎng)度是31位,可以表示231個(gè)字符。如果兩個(gè)字符編碼的高位相同,只有低16位不同,則它們屬于一個(gè)平面(Plane),所以一個(gè)平面由216個(gè)字符組成。目前常用的大部分字符都位于第一個(gè)平面(編碼范圍是U-00000000~U-0000FFFD),稱為BMP(Basic Multilingual Plane)或Plane 0,為了向后兼容,其中編號(hào)為0~256的字符和Latin-1相同。UCS編碼通常用U-xxxxxxxx這種形式表示,而BMP的編碼通常用 U xxxx這種形式表示,其中x是十六進(jìn)制數(shù)字。在ISO制定UCS的同時(shí),另一個(gè)由廠商聯(lián)合組織也在著手制定這樣的編碼,稱為Unicode,后來(lái)兩家聯(lián)手制定統(tǒng)一的編碼,但各自發(fā)布各自的標(biāo)準(zhǔn)文檔,所以UCS編碼和Unicode碼是相同的。

有了字符編碼,另一個(gè)問題就是這樣的編碼在計(jì)算機(jī)中怎么表示?,F(xiàn)在已經(jīng)不可能用一個(gè)字節(jié)表示一個(gè)字符了,最直接的想法就是用四個(gè)字節(jié)表示一個(gè)字符,這種表示方法稱為UCS-4或UTF- 32,UTF是Unicode Transformation Format的縮寫。一方面這樣比較浪費(fèi)存儲(chǔ)空間,由于常用字符都集中在BMP,高位的兩個(gè)字節(jié)通常是0,如果只用ASCII碼或Latin-1,高位的三個(gè)字節(jié)都是0。另一種比較節(jié)省存儲(chǔ)空間的辦法是用兩個(gè)字節(jié)表示一個(gè)字符,稱為UCS-2或UTF-16,這樣只能表示BMP中的字符,但BMP中有一些擴(kuò)展字符,可以用兩個(gè)這樣的擴(kuò)展字符表示其它平面的字符,稱為Surrogate Pair。無(wú)論是UTF-32還是UTF-16都有一個(gè)更嚴(yán)重的問題是和C語(yǔ)言不兼容,在C語(yǔ)言中0字節(jié)表示字符串結(jié)尾,庫(kù)函數(shù)strlen、 strcpy等等都依賴于這一點(diǎn),如果字符串用UTF-32存儲(chǔ),其中有很多0字節(jié)并不表示字符串結(jié)尾,這就亂套了。

UNIX之父Ken Thompson提出的UTF-8編碼很好地解決了這些問題,現(xiàn)在得到廣泛應(yīng)用。UTF-8具有以下性質(zhì):

* 編碼為U 0000~U 007F的字符只占一個(gè)字節(jié),就是0x00~0x7F,和ASCII碼兼容。

* 編碼大于U 007F的字符用2~6個(gè)字節(jié)表示,每個(gè)字節(jié)的最高位都是1,而ASCII碼的最高位都是0,因此非ASCII碼字符的表示中不會(huì)出現(xiàn)ASCII碼字節(jié)(也就不會(huì)出現(xiàn)0字節(jié))。

* 用于表示非ASCII碼字符的多字節(jié)序列中,第一個(gè)字節(jié)的取值范圍是0xC0~0xFD,根據(jù)它可以判斷后面有多少個(gè)字節(jié)也屬于當(dāng)前字符的編碼。后面每個(gè)字節(jié)的取值范圍都是0x80~0xBF,見下面的詳細(xì)說(shuō)明。

* UCS定義的所有231個(gè)字符都可以用UTF-8編碼表示出來(lái)。

* UTF-8編碼最長(zhǎng)6個(gè)字節(jié),BMP字符的UTF-8編碼最長(zhǎng)三個(gè)字節(jié)。

* 0xFE和0xFF這兩個(gè)字節(jié)在UTF-8編碼中不會(huì)出現(xiàn)。

具體來(lái)說(shuō),UTF-8編碼有以下幾種格式:

U-00000000 – U-0000007F: 0xxxxxxx

U-00000080 – U-000007FF: 110xxxxx 10xxxxxx

U-00000800 – U-0000FFFF: 1110xxxx 10xxxxxx10xxxxxx

U-00010000 – U-001FFFFF: 11110xxx 10xxxxxx10xxxxxx 10xxxxxx

U-00200000 – U-03FFFFFF: 111110xx 10xxxxxx10xxxxxx 10xxxxxx 10xxxxxx

U-04000000 – U-7FFFFFFF: 1111110x 10xxxxxx10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

第一個(gè)字節(jié)要么最高位是0(ASCII字節(jié)),要么最高兩位都是1,最高位之后1的個(gè)數(shù)決定后面有多少個(gè)字節(jié)也屬于當(dāng)前字符編碼,例如111110xx,最高位之后還有四個(gè)1,表示后面有四個(gè)字節(jié)也屬于當(dāng)前字符的編碼。后面每個(gè)字節(jié)的最高兩位都是10,可以和第一個(gè)字節(jié)區(qū)分開。這樣的設(shè)計(jì)有利于誤碼同步,例如在網(wǎng)絡(luò)傳輸過程中丟失了幾個(gè)字節(jié),很容易判斷當(dāng)前字符是不完整的,也很容易找到下一個(gè)字符從哪里開始,結(jié)果頂多丟掉一兩個(gè)字符,而不會(huì)導(dǎo)致后面的編碼解釋全部混亂了。上面的格式中標(biāo)為x的位就是UCS編碼,最后一種6字節(jié)的格式中x位有31個(gè),可以表示31位的UCS編碼,UTF-8就像一列火車,第一個(gè)字節(jié)是車頭,后面每個(gè)字節(jié)是車廂,其中承載的貨物是UCS編碼。UTF-8規(guī)定承載的UCS編碼以大端表示,也就是說(shuō)第一個(gè)字節(jié)中的x是UCS編碼的高位,后面字節(jié)中的x是UCS編碼的低位。

例如U 00A9(?字符)的二進(jìn)制是10101001,編碼成UTF-8是11000010 10101001(0xC2 0xA9),但不能編碼成11100000 10000010 10101001,UTF-8規(guī)定每個(gè)字符只能用盡可能少的字節(jié)來(lái)編碼。

編碼原理造價(jià)信息

市場(chǎng)價(jià) 信息價(jià) 詢價(jià)
材料名稱 規(guī)格/型號(hào) 市場(chǎng)價(jià)
(除稅)
工程建議價(jià)
(除稅)
行情 品牌 單位 稅率 供應(yīng)商 報(bào)價(jià)日期
絕對(duì)值編碼 BVS58N-011AVR0NN-0013 查看價(jià)格 查看價(jià)格

倍加福

個(gè) 13% 上海百策自控技術(shù)有限公司
增量式編碼 RVP510 查看價(jià)格 查看價(jià)格

易福門

個(gè) 13% 易福門電子(上海)有限公司
編碼 HZ830 查看價(jià)格 查看價(jià)格

13% 上海鴻真電子有限公司(湖州市廠商期刊)
編碼 PGM8000 查看價(jià)格 查看價(jià)格

依愛

13% 蚌埠依愛消防電子有限責(zé)任公司(湖州市廠商期刊)
手持編碼 TX6930 查看價(jià)格 查看價(jià)格

13% 深圳市泰和安科技有限公司
電子編碼 JBF-6481 查看價(jià)格 查看價(jià)格

13% 青鳥消防股份有限公司(湖州市廠商期刊)
電子編碼 GST-BMQ-2 查看價(jià)格 查看價(jià)格

13% 海灣安全技術(shù)有限公司
便攜式編碼 CODER-F900B 查看價(jià)格 查看價(jià)格

臺(tái) 13% 深圳市泛海三江電子股份有限公司(湖州市廠商期刊)
材料名稱 規(guī)格/型號(hào) 除稅
信息價(jià)
含稅
信息價(jià)
行情 品牌 單位 稅率 地區(qū)/時(shí)間
防爆編碼接口 LD-8340(EX) 查看價(jià)格 查看價(jià)格

個(gè) 湛江市2005年1月信息價(jià)
防爆編碼接口 LD-8340(EX) 查看價(jià)格 查看價(jià)格

個(gè) 湛江市2005年2月信息價(jià)
防爆編碼接口 LD-8340(EX) 查看價(jià)格 查看價(jià)格

個(gè) 湛江市2005年1月信息價(jià)
防爆編碼接口 LD-8340(EX) 查看價(jià)格 查看價(jià)格

個(gè) 湛江市2005年2月信息價(jià)
編碼中斷器 GST-LD-8319 查看價(jià)格 查看價(jià)格

臺(tái) 茂名市2009年8月信息價(jià)
編碼中斷器 GST-LD-8319 查看價(jià)格 查看價(jià)格

臺(tái) 茂名市2009年6月信息價(jià)
編碼中斷器 GST-LD-8319 查看價(jià)格 查看價(jià)格

臺(tái) 茂名市2009年5月信息價(jià)
編碼中繼器 GST-LD-8319 查看價(jià)格 查看價(jià)格

臺(tái) 茂名市2008年11月信息價(jià)
材料名稱 規(guī)格/需求量 報(bào)價(jià)數(shù) 最新報(bào)價(jià)
(元)
供應(yīng)商 報(bào)價(jià)地區(qū) 最新報(bào)價(jià)時(shí)間
編碼 PC端視頻上墻處理編碼卡|2張 1 查看價(jià)格 天翊智能(深圳)有限公司 廣東  陽(yáng)江市 2017-07-28
編碼 編碼器|3791個(gè) 4 查看價(jià)格 江門市松江消防機(jī)電設(shè)備有限公司 廣東  江門市 2015-06-24
編碼 編碼器|6516只 4 查看價(jià)格 廣州市松江消防設(shè)備有限公司 廣東  廣州市 2015-09-29
編碼模組 Shine-EncoderServer-4 1.名稱:編碼模組 2.類別:高清:系統(tǒng)全部采用高清模式,支持1080p、720p,色彩還原度更加,教學(xué)效果更佳。 編碼:采用H.264編碼格式,效率更高|2臺(tái) 1 查看價(jià)格 北京神州視翰科技股份有限公司 海南  海口市 2016-12-27
編碼 用于探測(cè)器編碼使用|1個(gè) 3 查看價(jià)格 營(yíng)口天成消防設(shè)備有限公司 全國(guó)   2018-07-27
編碼 8路標(biāo)清編碼器|5臺(tái) 3 查看價(jià)格 北京金博林科技有限公司 廣東  肇慶市 2020-09-07
編碼 DS-6704HW 高清編碼器|1臺(tái) 1 查看價(jià)格 深圳市金邦偉業(yè)科技有限公司    2014-06-06
編碼 威視系列 HSDH-D1 編碼器|5020個(gè) 4 查看價(jià)格 北京市樂維機(jī)電設(shè)備有限公司 北京  北京市 2015-11-13

編碼原理是對(duì)編碼的屬性及其各自適用于具體應(yīng)用的方法研究。編碼用于數(shù)據(jù)壓縮,加密,糾錯(cuò)和網(wǎng)絡(luò)。編碼在各種科學(xué)學(xué)科(如信息理論,電氣工程,數(shù)學(xué),語(yǔ)言學(xué)和計(jì)算機(jī)科學(xué))都有研究 -旨在設(shè)計(jì)高效可靠的數(shù)據(jù)傳輸方法。這通常涉及去除冗余以及發(fā)送數(shù)據(jù)中的錯(cuò)誤的校正或檢測(cè)。實(shí)現(xiàn)編碼的具體方法和電路很多,方法有低速編碼和高速編碼、線性編碼和非線性編碼;電路有逐次比較型、級(jí)聯(lián)型和混合型編碼。 編碼原理按照應(yīng)用來(lái)分可以分為算術(shù)編碼原理,音頻編碼原理、圖像編碼原理、字符編碼原理等。

編碼原理編碼方法常見問題

  • 工程編碼問題

    這個(gè)說(shuō)明你套了相應(yīng)的定額子目,在工程量表達(dá)式這一列里沒有選擇相應(yīng)的工程量代碼,這樣是計(jì)算不出來(lái)工程量的,在報(bào)表里也是看到相應(yīng)構(gòu)件的工程量的,可以只輸入一個(gè)構(gòu)件的,其他構(gòu)件作做法刷的功能去做,不同的構(gòu)件...

  • 請(qǐng)教:海關(guān)編碼

    39229000 垃圾桶 39229000 垃圾桶 39231000 垃圾桶 39249000 易爾環(huán)保垃圾桶 39249000 臺(tái)面垃圾桶 39249000 塑膠垃圾桶 39249000 家居垃圾桶...

  • 圖集的編碼

    是否是查找西南11J812圖集,12頁(yè),1B項(xiàng)? 恩,是。就是這么查找的。

編碼原理編碼方法文獻(xiàn)

用LED組成數(shù)碼顯示的一種編碼方法 用LED組成數(shù)碼顯示的一種編碼方法

格式:pdf

大?。?span id="ptioip9" class="single-tag-height">170KB

頁(yè)數(shù): 3頁(yè)

評(píng)分: 4.6

介紹用LED發(fā)光二極管組成數(shù)碼顯示的一種編碼方法,并介紹了譯碼驅(qū)動(dòng)電路及與單片機(jī)的接口。

立即下載
紅外測(cè)量圖像自適應(yīng)彩虹碼偽彩色編碼方法 紅外測(cè)量圖像自適應(yīng)彩虹碼偽彩色編碼方法

格式:pdf

大?。?span id="8k0nx8r" class="single-tag-height">170KB

頁(yè)數(shù): 5頁(yè)

評(píng)分: 4.8

由于空中目標(biāo)測(cè)量圖像灰度往往不均衡,采用傳統(tǒng)彩虹碼進(jìn)行偽彩色變換時(shí)往往造成色彩分布極不均勻,整幅圖像僅僅顯示一、二種顏色?;诖藛栴},本文根據(jù)測(cè)量圖像灰度分布特性,利用自適應(yīng)閾值理論,對(duì)傳統(tǒng)彩虹編碼進(jìn)行改造,提出了一種基于測(cè)量圖像的自適應(yīng)偽彩色編碼方法。實(shí)驗(yàn)結(jié)果表明:變換后得到的偽彩色色彩豐富,完整地覆蓋了全部有效灰度范圍,且算法具有較好的自適應(yīng)性。

立即下載

卷積碼擁有良好的糾錯(cuò)性能,是一種被廣泛應(yīng)用于移動(dòng)通信的信道編碼系統(tǒng)。一個(gè)(n,k,m)卷積碼編碼器由k個(gè)輸入,具有m階存儲(chǔ)的n個(gè)輸出的線形時(shí)序電路實(shí)現(xiàn)。通常, nk是較小的整數(shù),且

,但m比較大。當(dāng)
時(shí),信息序列不再分成小塊,以便可以連續(xù)處理。卷積碼(n,k,m)表示碼率
,編碼器級(jí)數(shù)
,其中s是碼約束長(zhǎng)度。

反向CDMA信道使用(3,1,8)卷積碼,碼率

,約束長(zhǎng)度為9,由于
,
,
,則該卷積編碼器包含單個(gè)輸入端,一個(gè)8級(jí)移位寄存器,三個(gè)模2加法器和一個(gè)3向編碼器輸出的連續(xù)轉(zhuǎn)向器。編碼器每輸入一位信息比特將產(chǎn)生三位編碼輸出。這些編碼符號(hào)中,第一個(gè)輸出符號(hào)
是生成序列
編碼產(chǎn)生的符號(hào),第二個(gè)輸出符號(hào)
是由生成序列
編碼產(chǎn)生的符號(hào),最后一個(gè)輸出符號(hào)
是由生成序列
編碼產(chǎn)生的符號(hào),如圖1所示。

該電路由一個(gè)八位寄存器、三個(gè)碼生成邏輯、一個(gè)時(shí)隙發(fā)生器和一個(gè)四選一復(fù)用器構(gòu)成。mux的輸入為

,碼選擇信號(hào)C[1:0]和clk1由時(shí)隙發(fā)生器產(chǎn)生,輸出信號(hào)即為整個(gè)電路的輸出
。

卷積編碼器的初始狀態(tài)用rst異步清零信號(hào)置為0,

時(shí),電路清零。 卷積編碼器的初始狀態(tài)全為0,初始狀態(tài)之后輸出的第一個(gè)編碼符號(hào)由生成序列
編碼產(chǎn)生。這里,三個(gè)生成序列分別為

即三個(gè)生成多項(xiàng)式分別為:

OMRON編碼器工作原理

由一個(gè)中心有軸的光電碼盤,其上有環(huán)形通、暗的刻線,有光電發(fā)射和接收器件讀取,獲得四組正弦波信號(hào)組合成A、B、C、D,每個(gè)正弦波相差90度相位差(相對(duì)于一個(gè)周波為360度),將C、D信號(hào)反向,疊加在A、B兩相上,可增強(qiáng)穩(wěn)定信號(hào);另每轉(zhuǎn)輸出一個(gè)Z相脈沖以代表零位參考位。 由于A、B兩相相差90度,可通過比較A相在前還是B相在前,以判別編碼器的正轉(zhuǎn)與反轉(zhuǎn),通過零位脈沖,可獲得編碼器的零位參考位。 編碼器碼盤的材料有玻璃、金屬、塑料,玻璃碼盤是在玻璃上沉積很薄的刻線,其熱穩(wěn)定性好,精度高,金屬碼盤直接以通和不通刻線,不易碎,但由于金屬有一定的厚度,精度就有限制,其熱穩(wěn)定性就要比玻璃的差一個(gè)數(shù)量級(jí),塑料碼盤是經(jīng)濟(jì)型的,其成本低,但精度、熱穩(wěn)定性、壽命均要差一些。 分辨率-編碼器以每旋轉(zhuǎn)360度提供多少的通或暗刻線稱為分辨率,也稱解析分度、或直接稱多少線,一般在每轉(zhuǎn)分度5~10000線。

假設(shè)我們只有一個(gè)沒有帶類別標(biāo)簽的訓(xùn)練樣本集合

,其中
。自編碼神經(jīng)網(wǎng)絡(luò)是一種無(wú)監(jiān)督學(xué)習(xí)算法,它使用了反向傳播算法,并讓目標(biāo)值等于輸入值,比如
。下圖是一個(gè)自編碼神經(jīng)網(wǎng)絡(luò)(圖一)的示例。

自編碼神經(jīng)網(wǎng)絡(luò)嘗試學(xué)習(xí)一個(gè)

的函數(shù)。換句話說(shuō),它嘗試逼近一個(gè)恒等函數(shù),從而使得輸出
接近于輸入
。恒等函數(shù)雖然看上去不太有學(xué)習(xí)的意義,但是當(dāng)我們?yōu)樽跃幋a神經(jīng)網(wǎng)絡(luò)加入某些限制,比如限定隱藏神經(jīng)元的數(shù)量,我們就可以從輸入數(shù)據(jù)中發(fā)現(xiàn)一些有趣的結(jié)構(gòu)。舉例來(lái)說(shuō),假設(shè)某個(gè)自編碼神經(jīng)網(wǎng)絡(luò)的輸入
是一張
圖像(共100個(gè)像素)的像素灰度值,于是
,其隱藏層
中有50個(gè)隱藏神經(jīng)元。注意,輸出也是100維的
。由于只有50個(gè)隱藏神經(jīng)元,我們迫使自編碼神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)輸入數(shù)據(jù)的'''壓縮'''表示,也就是說(shuō),它必須從50維的隱藏神經(jīng)元激活度向量
中'''重構(gòu)'''出100維的像素灰度值輸入
。如果網(wǎng)絡(luò)的輸入數(shù)據(jù)是完全隨機(jī)的,比如每一個(gè)輸入
都是一個(gè)跟其它特征完全無(wú)關(guān)的獨(dú)立同分布高斯隨機(jī)變量,那么這一壓縮表示將會(huì)非常難學(xué)習(xí)。但是如果輸入數(shù)據(jù)中隱含著一些特定的結(jié)構(gòu),比如某些輸入特征是彼此相關(guān)的,那么這一算法就可以發(fā)現(xiàn)輸入數(shù)據(jù)中的這些相關(guān)性。事實(shí)上,這一簡(jiǎn)單的自編碼神經(jīng)網(wǎng)絡(luò)通常可以學(xué)習(xí)出一個(gè)跟主元分析(PCA)結(jié)果非常相似的輸入數(shù)據(jù)的低維表示。

我們剛才的論述是基于隱藏神經(jīng)元數(shù)量較小的假設(shè)。但是即使隱藏神經(jīng)元的數(shù)量較大(可能比輸入像素的個(gè)數(shù)還要多),我們?nèi)匀煌ㄟ^給自編碼神經(jīng)網(wǎng)絡(luò)施加一些其他的限制條件來(lái)發(fā)現(xiàn)輸入數(shù)據(jù)中的結(jié)構(gòu)。具體來(lái)說(shuō),如果我們給隱藏神經(jīng)元加入稀疏性限制,那么自編碼神經(jīng)網(wǎng)絡(luò)即使在隱藏神經(jīng)元數(shù)量較多的情況下仍然可以發(fā)現(xiàn)輸入數(shù)據(jù)中一些有趣的結(jié)構(gòu)。

稀疏性可以被簡(jiǎn)單地解釋如下。如果當(dāng)神經(jīng)元的輸出接近于1的時(shí)候我們認(rèn)為它被激活,而輸出接近于0的時(shí)候認(rèn)為它被抑制,那么使得神經(jīng)元大部分的時(shí)間都是被抑制的限制則被稱作稀疏性限制。這里我們假設(shè)的神經(jīng)元的激活函數(shù)是sigmoid函數(shù)。如果你使用tanh作為激活函數(shù)的話,當(dāng)神經(jīng)元輸出為-1的時(shí)候,我們認(rèn)為神經(jīng)元是被抑制的。

注意到

表示隱藏神經(jīng)元
的激活度,但是這一表示方法中并未明確指出哪一個(gè)輸入
帶來(lái)了這一激活度。所以我們將使用
來(lái)表示在給定輸入為
情況下,自編碼神經(jīng)網(wǎng)絡(luò)隱藏神經(jīng)元
的激活度。

進(jìn)一步,讓

表示隱藏神經(jīng)元

的平均活躍度(在訓(xùn)練集上取平均)。我們可以近似的加入一條限制

其中,

是'''稀疏性參數(shù)''',通常是一個(gè)接近于0的較小的值(比如
)。換句話說(shuō),我們想要讓隱藏神經(jīng)元
的平均活躍度接近0.05。為了滿足這一條件,隱藏神經(jīng)元的活躍度必須接近于0。

為了實(shí)現(xiàn)這一限制,我們將會(huì)在我們的優(yōu)化目標(biāo)函數(shù)中加入一個(gè)額外的懲罰因子,而這一懲罰因子將懲罰那些

有顯著不同的情況從而使得隱藏神經(jīng)元的平均活躍度保持在較小范圍內(nèi)。懲罰因子的具體形式有很多種合理的選擇,我們將會(huì)選擇以下這一種:

這里,

是隱藏層中隱藏神經(jīng)元的數(shù)量,而索引
依次代表隱藏層中的每一個(gè)神經(jīng)元。如果你對(duì)相對(duì)熵(KL divergence)比較熟悉,這一懲罰因子實(shí)際上是基于它的。于是懲罰因子也可以被表示為

其中

是一個(gè)以
為均值和一個(gè)以
為均值的兩個(gè)伯努利隨機(jī)變量之間的相對(duì)熵。相對(duì)熵是一種標(biāo)準(zhǔn)的用來(lái)測(cè)量?jī)蓚€(gè)分布之間差異的方法。(如果你沒有見過相對(duì)熵,不用擔(dān)心,所有你需要知道的內(nèi)容都會(huì)被包含在這份筆記之中。)

這一懲罰因子有如下性質(zhì),當(dāng)

時(shí)
,并且隨著
之間的差異增大而單調(diào)遞增。舉例來(lái)說(shuō),在圖二中,我們?cè)O(shè)定
并且畫出了相對(duì)熵值
隨著
變化的變化(圖二)。

我們可以看出,相對(duì)熵在

時(shí)達(dá)到它的最小值0,而當(dāng)
靠近0或者1的時(shí)候,相對(duì)熵則變得非常大(其實(shí)是趨向于
)。所以,最小化這一懲罰因子具有使得
靠近
的效果。

我們的總體代價(jià)函數(shù)可以表示為

其中

如之前所定義,而
控制稀疏性懲罰因子的權(quán)重。
項(xiàng)則也(間接地)取決于
,因?yàn)樗请[藏神經(jīng)元
的平均激活度,而隱藏層神經(jīng)元的激活度取決于
。

為了對(duì)相對(duì)熵進(jìn)行導(dǎo)數(shù)計(jì)算,我們可以使用一個(gè)易于實(shí)現(xiàn)的技巧,這只需要在你的程序中稍作改動(dòng)即可。具體來(lái)說(shuō),前面在后向傳播算法中計(jì)算第二層(

)更新的時(shí)候我們已經(jīng)計(jì)算了

我們將其換成

就可以了。

有一個(gè)需要注意的地方就是我們需要知道

來(lái)計(jì)算這一項(xiàng)更新。所以在計(jì)算任何神經(jīng)元的后向傳播之前,你需要對(duì)所有的訓(xùn)練樣本計(jì)算一遍前向傳播,從而獲取平均激活度。如果你的訓(xùn)練樣本可以小到被整個(gè)存到內(nèi)存之中(對(duì)于編程作業(yè)來(lái)說(shuō),通常如此),你可以方便地在你所有的樣本上計(jì)算前向傳播并將得到的激活度存入內(nèi)存并且計(jì)算平均激活度 。然后你就可以使用事先計(jì)算好的激活度來(lái)對(duì)所有的訓(xùn)練樣本進(jìn)行后向傳播的計(jì)算。如果你的數(shù)據(jù)量太大,無(wú)法全部存入內(nèi)存,你就可以掃過你的訓(xùn)練樣本并計(jì)算一次前向傳播,然后將獲得的結(jié)果累積起來(lái)并計(jì)算平均激活度
(當(dāng)某一個(gè)前向傳播的結(jié)果中的激活度
被用于計(jì)算平均激活度
之后就可以將此結(jié)果刪除)。然后當(dāng)你完成平均激活度
的計(jì)算之后,你需要重新對(duì)每一個(gè)訓(xùn)練樣本做一次前向傳播從而可以對(duì)其進(jìn)行后向傳播的計(jì)算。對(duì)于后一種情況,你對(duì)每一個(gè)訓(xùn)練樣本需要計(jì)算兩次前向傳播,所以在計(jì)算上的效率會(huì)稍低一些。

證明上面算法能達(dá)到梯度下降效果的完整推導(dǎo)過程不再本教程的范圍之內(nèi)。不過如果你想要使用經(jīng)過以上修改的后向傳播來(lái)實(shí)現(xiàn)自編碼神經(jīng)網(wǎng)絡(luò),那么你就會(huì)對(duì)目標(biāo)函數(shù)

做梯度下降。使用梯度驗(yàn)證方法,你可以自己來(lái)驗(yàn)證梯度下降算法是否正確。

編碼原理相關(guān)推薦
  • 相關(guān)百科
  • 相關(guān)知識(shí)
  • 相關(guān)專欄

最新詞條

安徽省政采項(xiàng)目管理咨詢有限公司 數(shù)字景楓科技發(fā)展(南京)有限公司 懷化市人民政府電子政務(wù)管理辦公室 河北省高速公路京德臨時(shí)籌建處 中石化華東石油工程有限公司工程技術(shù)分公司 手持無(wú)線POS機(jī) 廣東合正采購(gòu)招標(biāo)有限公司 上海城建信息科技有限公司 甘肅鑫禾國(guó)際招標(biāo)有限公司 燒結(jié)金屬材料 齒輪計(jì)量泵 廣州采陽(yáng)招標(biāo)代理有限公司河源分公司 高鋁碳化硅磚 博洛尼智能科技(青島)有限公司 燒結(jié)剛玉磚 深圳市東海國(guó)際招標(biāo)有限公司 搭建香蕉育苗大棚 SF計(jì)量單位 福建省中億通招標(biāo)咨詢有限公司 泛海三江 威海鼠尾草 廣東國(guó)咨招標(biāo)有限公司 Excel 數(shù)據(jù)處理與分析應(yīng)用大全 甘肅中泰博瑞工程項(xiàng)目管理咨詢有限公司 山東創(chuàng)盈項(xiàng)目管理有限公司 當(dāng)代建筑大師 拆邊機(jī) 廣西北纜電纜有限公司 大山檳榔 上海地鐵維護(hù)保障有限公司通號(hào)分公司 舌花雛菊 甘肅中維國(guó)際招標(biāo)有限公司 華潤(rùn)燃?xì)猓ㄉ虾#┯邢薰? 湖北鑫宇陽(yáng)光工程咨詢有限公司 GB8163標(biāo)準(zhǔn)無(wú)縫鋼管 中國(guó)石油煉化工程建設(shè)項(xiàng)目部 韶關(guān)市優(yōu)采招標(biāo)代理有限公司 莎草目 建設(shè)部關(guān)于開展城市規(guī)劃動(dòng)態(tài)監(jiān)測(cè)工作的通知 電梯平層準(zhǔn)確度 廣州利好來(lái)電氣有限公司 蘇州弘創(chuàng)招投標(biāo)代理有限公司