編碼原理編碼方法

編碼原理編碼方法
編碼原理造價(jià)信息
編碼原理簡(jiǎn)介
編碼原理編碼方法常見問題
編碼原理編碼方法文獻(xiàn)
卷積編碼器原理
OMRON編碼器工作原理
稀疏自編碼器算法原理

編碼原理編碼方法

這里主要介紹線性編碼有關(guān)內(nèi)容

線性編碼

術(shù)語(yǔ)代數(shù)編碼理論表示編碼原理的子領(lǐng)域，其編碼性質(zhì)以代數(shù)術(shù)語(yǔ)表示，然后進(jìn)一步研究。

代數(shù)編碼理論基本上分為兩大類代碼：

線性分組碼

卷積碼

它分析一個(gè)編碼的以下三個(gè)特性-主要是：

碼字長(zhǎng)度

有效代碼字總數(shù)

兩個(gè)有效代碼字之間的最小距離，主要使用漢明距離，有時(shí)也使用其他距離像Lee距離。

線性分組碼

線性分組碼具有的特性的線性度，即，任何兩個(gè)碼字的總和也是一個(gè)編碼字，并且它們被應(yīng)用到組的源比特中，因此稱為線性分組碼。有分組碼不是線性的，但是很難證明編碼是沒有這個(gè)屬性的編碼。

線性分組碼由其符號(hào)字母（例如，二進(jìn)制或三元）和參數(shù)（n，m，

）組成，其中

n是碼字的長(zhǎng)度，以符號(hào)表示，

m是將一次用于編碼的源符號(hào)的數(shù)量，

是編碼的最小漢明距離。

有許多類型的線性分組碼，如循環(huán)碼（如漢明碼）、重復(fù)代碼、奇偶校驗(yàn)碼、多項(xiàng)式編碼（例如BCH碼）、里德 - 所羅門編碼、代數(shù)幾何編碼、里德 - 穆勒編碼、完美編碼。

編碼原理使用N維球體模型。例如，可以在桌面上或三維中將多少便士包裝成圓圈，可以將多少個(gè)彈珠包裝在一個(gè)球面上。其他注意事項(xiàng)輸入編碼的選擇。例如，六邊形包裝成矩形框的約束將在角落留下空的空間。隨著尺寸越來(lái)越大，空白空間的百分比越來(lái)越小。但是在某些維度上，包裝使用所有空間，這些代碼是所謂的“完美”代碼。唯一非常重要和有用的完美編碼是距離為3漢明碼，其參數(shù)滿足（2 r - 1，2 r - 1 - r，3）和[23,12,7]二進(jìn)制和[11,6,5 ]三重Golay碼。

另一個(gè)編碼屬性是單個(gè)碼字可能具有的鄰居的數(shù)量。再次，以便士為例。首先我們把便士打包成矩形網(wǎng)格。每一分錢將有4個(gè)鄰近的鄰居（在距離更遠(yuǎn)的角落有4個(gè)）。在六邊形，每一分錢將有6個(gè)近鄰。當(dāng)我們?cè)黾映叽鐣r(shí)，近鄰的數(shù)量增加非?？臁＝Y(jié)果是使接收端選擇鄰居（因此錯(cuò)誤）的噪聲的方式也增加。這是分組碼以及所有編碼的基本限制?？赡芨y對(duì)單個(gè)鄰居造成錯(cuò)誤，但鄰居數(shù)量可能足夠大，因此總錯(cuò)誤概率實(shí)際上會(huì)受到影響。

線性分組碼的屬性可以應(yīng)用于很多應(yīng)用。例如，線性分組碼的校正子集合唯一性被用網(wǎng)格成形，是最有名的形狀碼之一。傳感器網(wǎng)絡(luò)中使用相同的屬性進(jìn)行分布式源代碼編碼。

卷積碼

如果特定的一致監(jiān)督關(guān)系不是在一個(gè)碼字中實(shí)現(xiàn)，而是在個(gè)碼字中實(shí)現(xiàn)，這種碼稱為卷積碼。卷積碼可用移位寄存器來(lái)實(shí)現(xiàn)，這種卷積編碼器的輸出可看作是輸入信息碼元序列與編碼器響應(yīng)函數(shù)的卷積。能糾正突發(fā)錯(cuò)誤的哈格伯爾格碼也是一種卷積碼。在平穩(wěn)高斯噪聲干擾的信道上采用序貫譯碼方法的卷積碼有很好的性能，能用于衛(wèi)星通信和深空通信。

UTF-8 編碼原理

為了統(tǒng)一全世界各國(guó)語(yǔ)言文字和專業(yè)領(lǐng)域符號(hào)（例如數(shù)學(xué)符號(hào)、樂譜符號(hào)）的編碼，ISO制定了ISO 10646標(biāo)準(zhǔn)，也稱為UCS（Universal Character Set）。UCS編碼的長(zhǎng)度是31位，可以表示231個(gè)字符。如果兩個(gè)字符編碼的高位相同，只有低16位不同，則它們屬于一個(gè)平面（Plane），所以一個(gè)平面由216個(gè)字符組成。目前常用的大部分字符都位于第一個(gè)平面（編碼范圍是U-00000000~U-0000FFFD），稱為BMP（Basic Multilingual Plane）或Plane 0，為了向后兼容，其中編號(hào)為0~256的字符和Latin-1相同。UCS編碼通常用U-xxxxxxxx這種形式表示，而BMP的編碼通常用 U xxxx這種形式表示，其中x是十六進(jìn)制數(shù)字。在ISO制定UCS的同時(shí)，另一個(gè)由廠商聯(lián)合組織也在著手制定這樣的編碼，稱為Unicode，后來(lái)兩家聯(lián)手制定統(tǒng)一的編碼，但各自發(fā)布各自的標(biāo)準(zhǔn)文檔，所以UCS編碼和Unicode碼是相同的。

有了字符編碼，另一個(gè)問題就是這樣的編碼在計(jì)算機(jī)中怎么表示?，F(xiàn)在已經(jīng)不可能用一個(gè)字節(jié)表示一個(gè)字符了，最直接的想法就是用四個(gè)字節(jié)表示一個(gè)字符，這種表示方法稱為UCS-4或UTF- 32，UTF是Unicode Transformation Format的縮寫。一方面這樣比較浪費(fèi)存儲(chǔ)空間，由于常用字符都集中在BMP，高位的兩個(gè)字節(jié)通常是0，如果只用ASCII碼或Latin-1，高位的三個(gè)字節(jié)都是0。另一種比較節(jié)省存儲(chǔ)空間的辦法是用兩個(gè)字節(jié)表示一個(gè)字符，稱為UCS-2或UTF-16，這樣只能表示BMP中的字符，但BMP中有一些擴(kuò)展字符，可以用兩個(gè)這樣的擴(kuò)展字符表示其它平面的字符，稱為Surrogate Pair。無(wú)論是UTF-32還是UTF-16都有一個(gè)更嚴(yán)重的問題是和C語(yǔ)言不兼容，在C語(yǔ)言中0字節(jié)表示字符串結(jié)尾，庫(kù)函數(shù)strlen、 strcpy等等都依賴于這一點(diǎn)，如果字符串用UTF-32存儲(chǔ)，其中有很多0字節(jié)并不表示字符串結(jié)尾，這就亂套了。

UNIX之父Ken Thompson提出的UTF-8編碼很好地解決了這些問題，現(xiàn)在得到廣泛應(yīng)用。UTF-8具有以下性質(zhì)：

* 編碼為U 0000~U 007F的字符只占一個(gè)字節(jié)，就是0x00~0x7F，和ASCII碼兼容。

* 編碼大于U 007F的字符用2~6個(gè)字節(jié)表示，每個(gè)字節(jié)的最高位都是1，而ASCII碼的最高位都是0，因此非ASCII碼字符的表示中不會(huì)出現(xiàn)ASCII碼字節(jié)（也就不會(huì)出現(xiàn)0字節(jié)）。

* 用于表示非ASCII碼字符的多字節(jié)序列中，第一個(gè)字節(jié)的取值范圍是0xC0~0xFD，根據(jù)它可以判斷后面有多少個(gè)字節(jié)也屬于當(dāng)前字符的編碼。后面每個(gè)字節(jié)的取值范圍都是0x80~0xBF，見下面的詳細(xì)說(shuō)明。

* UCS定義的所有231個(gè)字符都可以用UTF-8編碼表示出來(lái)。

* UTF-8編碼最長(zhǎng)6個(gè)字節(jié)，BMP字符的UTF-8編碼最長(zhǎng)三個(gè)字節(jié)。

* 0xFE和0xFF這兩個(gè)字節(jié)在UTF-8編碼中不會(huì)出現(xiàn)。

具體來(lái)說(shuō)，UTF-8編碼有以下幾種格式：

U-00000000 – U-0000007F: 0xxxxxxx

U-00000080 – U-000007FF: 110xxxxx 10xxxxxx

U-00000800 – U-0000FFFF: 1110xxxx 10xxxxxx10xxxxxx

U-00010000 – U-001FFFFF: 11110xxx 10xxxxxx10xxxxxx 10xxxxxx

U-00200000 – U-03FFFFFF: 111110xx 10xxxxxx10xxxxxx 10xxxxxx 10xxxxxx

U-04000000 – U-7FFFFFFF: 1111110x 10xxxxxx10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

第一個(gè)字節(jié)要么最高位是0（ASCII字節(jié)），要么最高兩位都是1，最高位之后1的個(gè)數(shù)決定后面有多少個(gè)字節(jié)也屬于當(dāng)前字符編碼，例如111110xx，最高位之后還有四個(gè)1，表示后面有四個(gè)字節(jié)也屬于當(dāng)前字符的編碼。后面每個(gè)字節(jié)的最高兩位都是10，可以和第一個(gè)字節(jié)區(qū)分開。這樣的設(shè)計(jì)有利于誤碼同步，例如在網(wǎng)絡(luò)傳輸過程中丟失了幾個(gè)字節(jié)，很容易判斷當(dāng)前字符是不完整的，也很容易找到下一個(gè)字符從哪里開始，結(jié)果頂多丟掉一兩個(gè)字符，而不會(huì)導(dǎo)致后面的編碼解釋全部混亂了。上面的格式中標(biāo)為x的位就是UCS編碼，最后一種6字節(jié)的格式中x位有31個(gè)，可以表示31位的UCS編碼，UTF-8就像一列火車，第一個(gè)字節(jié)是車頭，后面每個(gè)字節(jié)是車廂，其中承載的貨物是UCS編碼。UTF-8規(guī)定承載的UCS編碼以大端表示，也就是說(shuō)第一個(gè)字節(jié)中的x是UCS編碼的高位，后面字節(jié)中的x是UCS編碼的低位。

例如U 00A9（?字符）的二進(jìn)制是10101001，編碼成UTF-8是11000010 10101001（0xC2 0xA9），但不能編碼成11100000 10000010 10101001，UTF-8規(guī)定每個(gè)字符只能用盡可能少的字節(jié)來(lái)編碼。

查看詳情

編碼原理造價(jià)信息

市場(chǎng)價(jià)

信息價(jià)

詢價(jià)

材料名稱	規(guī)格/型號(hào)	市場(chǎng)價(jià) （除稅）	工程建議價(jià) （除稅）	品牌	單位	稅率	供應(yīng)商
絕對(duì)值編碼器	BVS58N-011AVR0NN-0013	查看價(jià)格	查看價(jià)格	倍加福	個(gè)	13%	上海百策自控技術(shù)有限公司
增量式編碼器	RVP510	查看價(jià)格	查看價(jià)格	易福門	個(gè)	13%	易福門電子(上海)有限公司
編碼器	HZ830	查看價(jià)格	查看價(jià)格		套	13%	上海鴻真電子有限公司(湖州市廠商期刊)
編碼器	PGM8000	查看價(jià)格	查看價(jià)格	依愛	只	13%	蚌埠依愛消防電子有限責(zé)任公司(湖州市廠商期刊)
手持編碼器	TX6930	查看價(jià)格	查看價(jià)格		只	13%	深圳市泰和安科技有限公司
電子編碼器	JBF-6481	查看價(jià)格	查看價(jià)格		只	13%	青鳥消防股份有限公司(湖州市廠商期刊)
電子編碼器	GST-BMQ-2	查看價(jià)格	查看價(jià)格		只	13%	海灣安全技術(shù)有限公司
便攜式編碼器	CODER-F900B	查看價(jià)格	查看價(jià)格		臺(tái)	13%	深圳市泛海三江電子股份有限公司(湖州市廠商期刊)

材料名稱	規(guī)格/型號(hào)	除稅信息價(jià)	含稅信息價(jià)	單位	地區(qū)/時(shí)間
防爆編碼接口	LD-8340(EX)	查看價(jià)格	查看價(jià)格	個(gè)	湛江市2005年1月信息價(jià)
防爆編碼接口	LD-8340(EX)	查看價(jià)格	查看價(jià)格	個(gè)	湛江市2005年2月信息價(jià)
防爆編碼接口	LD-8340(EX)	查看價(jià)格	查看價(jià)格	個(gè)	湛江市2005年1月信息價(jià)
防爆編碼接口	LD-8340(EX)	查看價(jià)格	查看價(jià)格	個(gè)	湛江市2005年2月信息價(jià)
編碼中斷器	GST-LD-8319	查看價(jià)格	查看價(jià)格	臺(tái)	茂名市2009年8月信息價(jià)
編碼中斷器	GST-LD-8319	查看價(jià)格	查看價(jià)格	臺(tái)	茂名市2009年6月信息價(jià)
編碼中斷器	GST-LD-8319	查看價(jià)格	查看價(jià)格	臺(tái)	茂名市2009年5月信息價(jià)
編碼中繼器	GST-LD-8319	查看價(jià)格	查看價(jià)格	臺(tái)	茂名市2008年11月信息價(jià)

材料名稱	規(guī)格/需求量	報(bào)價(jià)數(shù)	最新報(bào)價(jià) （元）	供應(yīng)商	報(bào)價(jià)地區(qū)	最新報(bào)價(jià)時(shí)間
編碼卡	PC端視頻上墻處理編碼卡\|2張	1	查看價(jià)格	天翊智能（深圳）有限公司	廣東陽(yáng)江市	2017-07-28
編碼器	編碼器\|3791個(gè)	4	查看價(jià)格	江門市松江消防機(jī)電設(shè)備有限公司	廣東江門市	2015-06-24
編碼器	編碼器\|6516只	4	查看價(jià)格	廣州市松江消防設(shè)備有限公司	廣東廣州市	2015-09-29
編碼模組	Shine-EncoderServer-4 1.名稱:編碼模組 2.類別:高清：系統(tǒng)全部采用高清模式，支持1080p、720p，色彩還原度更加，教學(xué)效果更佳。編碼：采用H.264編碼格式，效率更高\|2臺(tái)	1	查看價(jià)格	北京神州視翰科技股份有限公司	海南海口市	2016-12-27
編碼器	用于探測(cè)器編碼使用\|1個(gè)	3	查看價(jià)格	營(yíng)口天成消防設(shè)備有限公司	全國(guó)	2018-07-27
編碼器	8路標(biāo)清編碼器\|5臺(tái)	3	查看價(jià)格	北京金博林科技有限公司	廣東肇慶市	2020-09-07
編碼器	DS-6704HW 高清編碼器\|1臺(tái)	1	查看價(jià)格	深圳市金邦偉業(yè)科技有限公司		2014-06-06
編碼器	威視系列 HSDH-D1 編碼器\|5020個(gè)	4	查看價(jià)格	北京市樂維機(jī)電設(shè)備有限公司	北京北京市	2015-11-13

編碼原理簡(jiǎn)介

編碼原理是對(duì)編碼的屬性及其各自適用于具體應(yīng)用的方法研究。編碼用于數(shù)據(jù)壓縮，加密，糾錯(cuò)和網(wǎng)絡(luò)。編碼在各種科學(xué)學(xué)科（如信息理論，電氣工程，數(shù)學(xué)，語(yǔ)言學(xué)和計(jì)算機(jī)科學(xué)）都有研究 -旨在設(shè)計(jì)高效可靠的數(shù)據(jù)傳輸方法。這通常涉及去除冗余以及發(fā)送數(shù)據(jù)中的錯(cuò)誤的校正或檢測(cè)。實(shí)現(xiàn)編碼的具體方法和電路很多，方法有低速編碼和高速編碼、線性編碼和非線性編碼；電路有逐次比較型、級(jí)聯(lián)型和混合型編碼。編碼原理按照應(yīng)用來(lái)分可以分為算術(shù)編碼原理，音頻編碼原理、圖像編碼原理、字符編碼原理等。

查看詳情

編碼原理編碼方法常見問題

工程編碼問題

這個(gè)說(shuō)明你套了相應(yīng)的定額子目，在工程量表達(dá)式這一列里沒有選擇相應(yīng)的工程量代碼，這樣是計(jì)算不出來(lái)工程量的，在報(bào)表里也是看到相應(yīng)構(gòu)件的工程量的，可以只輸入一個(gè)構(gòu)件的，其他構(gòu)件作做法刷的功能去做，不同的構(gòu)件...
請(qǐng)教:海關(guān)編碼

39229000 垃圾桶 39229000 垃圾桶 39231000 垃圾桶 39249000 易爾環(huán)保垃圾桶 39249000 臺(tái)面垃圾桶 39249000 塑膠垃圾桶 39249000 家居垃圾桶...
圖集的編碼

是否是查找西南11J812圖集，12頁(yè)，1B項(xiàng)？恩，是。就是這么查找的。

編碼原理編碼方法文獻(xiàn)

用LED組成數(shù)碼顯示的一種編碼方法

格式：pdf

大?。?span id="ptioip9" class="single-tag-height">170KB

頁(yè)數(shù)： 3頁(yè)

評(píng)分： 4.6

介紹用LED發(fā)光二極管組成數(shù)碼顯示的一種編碼方法,并介紹了譯碼驅(qū)動(dòng)電路及與單片機(jī)的接口。

立即下載

紅外測(cè)量圖像自適應(yīng)彩虹碼偽彩色編碼方法

格式：pdf

大?。?span id="8k0nx8r" class="single-tag-height">170KB

頁(yè)數(shù)： 5頁(yè)

評(píng)分： 4.8

由于空中目標(biāo)測(cè)量圖像灰度往往不均衡,采用傳統(tǒng)彩虹碼進(jìn)行偽彩色變換時(shí)往往造成色彩分布極不均勻,整幅圖像僅僅顯示一、二種顏色?；诖藛栴},本文根據(jù)測(cè)量圖像灰度分布特性,利用自適應(yīng)閾值理論,對(duì)傳統(tǒng)彩虹編碼進(jìn)行改造,提出了一種基于測(cè)量圖像的自適應(yīng)偽彩色編碼方法。實(shí)驗(yàn)結(jié)果表明:變換后得到的偽彩色色彩豐富,完整地覆蓋了全部有效灰度范圍,且算法具有較好的自適應(yīng)性。

立即下載

卷積編碼器原理

卷積碼擁有良好的糾錯(cuò)性能，是一種被廣泛應(yīng)用于移動(dòng)通信的信道編碼系統(tǒng)。一個(gè)（n，k，m）卷積碼編碼器由k個(gè)輸入，具有m階存儲(chǔ)的n個(gè)輸出的線形時(shí)序電路實(shí)現(xiàn)。通常， n和k是較小的整數(shù)，且

，但m比較大。當(dāng)

時(shí)，信息序列不再分成小塊，以便可以連續(xù)處理。卷積碼（n，k，m）表示碼率

，編碼器級(jí)數(shù)

，其中s是碼約束長(zhǎng)度。

反向CDMA信道使用（3，1，8）卷積碼，碼率

，約束長(zhǎng)度為9，由于

，

，則該卷積編碼器包含單個(gè)輸入端，一個(gè)8級(jí)移位寄存器，三個(gè)模2加法器和一個(gè)3向編碼器輸出的連續(xù)轉(zhuǎn)向器。編碼器每輸入一位信息比特將產(chǎn)生三位編碼輸出。這些編碼符號(hào)中，第一個(gè)輸出符號(hào)

是生成序列

編碼產(chǎn)生的符號(hào)，第二個(gè)輸出符號(hào)

是由生成序列

編碼產(chǎn)生的符號(hào)，最后一個(gè)輸出符號(hào)

是由生成序列

編碼產(chǎn)生的符號(hào)，如圖1所示。

該電路由一個(gè)八位寄存器、三個(gè)碼生成邏輯、一個(gè)時(shí)隙發(fā)生器和一個(gè)四選一復(fù)用器構(gòu)成。mux的輸入為

、

和

，碼選擇信號(hào)C[1:0]和clk1由時(shí)隙發(fā)生器產(chǎn)生，輸出信號(hào)即為整個(gè)電路的輸出

。

卷積編碼器的初始狀態(tài)用rst異步清零信號(hào)置為0，

時(shí)，電路清零。卷積編碼器的初始狀態(tài)全為0，初始狀態(tài)之后輸出的第一個(gè)編碼符號(hào)由生成序列

編碼產(chǎn)生。這里，三個(gè)生成序列分別為

即三個(gè)生成多項(xiàng)式分別為：

查看詳情

OMRON編碼器工作原理

由一個(gè)中心有軸的光電碼盤，其上有環(huán)形通、暗的刻線，有光電發(fā)射和接收器件讀取,獲得四組正弦波信號(hào)組合成A、B、C、D,每個(gè)正弦波相差90度相位差(相對(duì)于一個(gè)周波為360度)，將C、D信號(hào)反向，疊加在A、B兩相上，可增強(qiáng)穩(wěn)定信號(hào);另每轉(zhuǎn)輸出一個(gè)Z相脈沖以代表零位參考位。由于A、B兩相相差90度，可通過比較A相在前還是B相在前，以判別編碼器的正轉(zhuǎn)與反轉(zhuǎn)，通過零位脈沖，可獲得編碼器的零位參考位。編碼器碼盤的材料有玻璃、金屬、塑料，玻璃碼盤是在玻璃上沉積很薄的刻線，其熱穩(wěn)定性好，精度高，金屬碼盤直接以通和不通刻線，不易碎，但由于金屬有一定的厚度，精度就有限制，其熱穩(wěn)定性就要比玻璃的差一個(gè)數(shù)量級(jí)，塑料碼盤是經(jīng)濟(jì)型的，其成本低，但精度、熱穩(wěn)定性、壽命均要差一些。分辨率-編碼器以每旋轉(zhuǎn)360度提供多少的通或暗刻線稱為分辨率，也稱解析分度、或直接稱多少線，一般在每轉(zhuǎn)分度5~10000線。

查看詳情

稀疏自編碼器算法原理

假設(shè)我們只有一個(gè)沒有帶類別標(biāo)簽的訓(xùn)練樣本集合

，其中

。自編碼神經(jīng)網(wǎng)絡(luò)是一種無(wú)監(jiān)督學(xué)習(xí)算法，它使用了反向傳播算法，并讓目標(biāo)值等于輸入值，比如

。下圖是一個(gè)自編碼神經(jīng)網(wǎng)絡(luò)（圖一）的示例。

自編碼神經(jīng)網(wǎng)絡(luò)嘗試學(xué)習(xí)一個(gè)

的函數(shù)。換句話說(shuō)，它嘗試逼近一個(gè)恒等函數(shù)，從而使得輸出

接近于輸入

。恒等函數(shù)雖然看上去不太有學(xué)習(xí)的意義，但是當(dāng)我們?yōu)樽跃幋a神經(jīng)網(wǎng)絡(luò)加入某些限制，比如限定隱藏神經(jīng)元的數(shù)量，我們就可以從輸入數(shù)據(jù)中發(fā)現(xiàn)一些有趣的結(jié)構(gòu)。舉例來(lái)說(shuō)，假設(shè)某個(gè)自編碼神經(jīng)網(wǎng)絡(luò)的輸入

是一張

圖像（共100個(gè)像素）的像素灰度值，于是

，其隱藏層

中有50個(gè)隱藏神經(jīng)元。注意，輸出也是100維的

。由于只有50個(gè)隱藏神經(jīng)元，我們迫使自編碼神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)輸入數(shù)據(jù)的'''壓縮'''表示，也就是說(shuō)，它必須從50維的隱藏神經(jīng)元激活度向量

中'''重構(gòu)'''出100維的像素灰度值輸入

。如果網(wǎng)絡(luò)的輸入數(shù)據(jù)是完全隨機(jī)的，比如每一個(gè)輸入

都是一個(gè)跟其它特征完全無(wú)關(guān)的獨(dú)立同分布高斯隨機(jī)變量，那么這一壓縮表示將會(huì)非常難學(xué)習(xí)。但是如果輸入數(shù)據(jù)中隱含著一些特定的結(jié)構(gòu)，比如某些輸入特征是彼此相關(guān)的，那么這一算法就可以發(fā)現(xiàn)輸入數(shù)據(jù)中的這些相關(guān)性。事實(shí)上，這一簡(jiǎn)單的自編碼神經(jīng)網(wǎng)絡(luò)通常可以學(xué)習(xí)出一個(gè)跟主元分析（PCA）結(jié)果非常相似的輸入數(shù)據(jù)的低維表示。

我們剛才的論述是基于隱藏神經(jīng)元數(shù)量較小的假設(shè)。但是即使隱藏神經(jīng)元的數(shù)量較大（可能比輸入像素的個(gè)數(shù)還要多），我們?nèi)匀煌ㄟ^給自編碼神經(jīng)網(wǎng)絡(luò)施加一些其他的限制條件來(lái)發(fā)現(xiàn)輸入數(shù)據(jù)中的結(jié)構(gòu)。具體來(lái)說(shuō)，如果我們給隱藏神經(jīng)元加入稀疏性限制，那么自編碼神經(jīng)網(wǎng)絡(luò)即使在隱藏神經(jīng)元數(shù)量較多的情況下仍然可以發(fā)現(xiàn)輸入數(shù)據(jù)中一些有趣的結(jié)構(gòu)。

稀疏性可以被簡(jiǎn)單地解釋如下。如果當(dāng)神經(jīng)元的輸出接近于1的時(shí)候我們認(rèn)為它被激活，而輸出接近于0的時(shí)候認(rèn)為它被抑制，那么使得神經(jīng)元大部分的時(shí)間都是被抑制的限制則被稱作稀疏性限制。這里我們假設(shè)的神經(jīng)元的激活函數(shù)是sigmoid函數(shù)。如果你使用tanh作為激活函數(shù)的話，當(dāng)神經(jīng)元輸出為-1的時(shí)候，我們認(rèn)為神經(jīng)元是被抑制的。

注意到

表示隱藏神經(jīng)元

的激活度，但是這一表示方法中并未明確指出哪一個(gè)輸入

帶來(lái)了這一激活度。所以我們將使用

來(lái)表示在給定輸入為

情況下，自編碼神經(jīng)網(wǎng)絡(luò)隱藏神經(jīng)元

的激活度。

進(jìn)一步，讓

表示隱藏神經(jīng)元

的平均活躍度（在訓(xùn)練集上取平均）。我們可以近似的加入一條限制

其中，

是'''稀疏性參數(shù)'''，通常是一個(gè)接近于0的較小的值（比如

）。換句話說(shuō)，我們想要讓隱藏神經(jīng)元

的平均活躍度接近0.05。為了滿足這一條件，隱藏神經(jīng)元的活躍度必須接近于0。

為了實(shí)現(xiàn)這一限制，我們將會(huì)在我們的優(yōu)化目標(biāo)函數(shù)中加入一個(gè)額外的懲罰因子，而這一懲罰因子將懲罰那些

和

有顯著不同的情況從而使得隱藏神經(jīng)元的平均活躍度保持在較小范圍內(nèi)。懲罰因子的具體形式有很多種合理的選擇，我們將會(huì)選擇以下這一種：

這里，

是隱藏層中隱藏神經(jīng)元的數(shù)量，而索引

依次代表隱藏層中的每一個(gè)神經(jīng)元。如果你對(duì)相對(duì)熵（KL divergence）比較熟悉，這一懲罰因子實(shí)際上是基于它的。于是懲罰因子也可以被表示為

其中

是一個(gè)以

為均值和一個(gè)以

為均值的兩個(gè)伯努利隨機(jī)變量之間的相對(duì)熵。相對(duì)熵是一種標(biāo)準(zhǔn)的用來(lái)測(cè)量?jī)蓚€(gè)分布之間差異的方法。（如果你沒有見過相對(duì)熵，不用擔(dān)心，所有你需要知道的內(nèi)容都會(huì)被包含在這份筆記之中。）

這一懲罰因子有如下性質(zhì)，當(dāng)

時(shí)

，并且隨著

與

之間的差異增大而單調(diào)遞增。舉例來(lái)說(shuō)，在圖二中，我們?cè)O(shè)定

并且畫出了相對(duì)熵值

隨著

變化的變化（圖二）。

我們可以看出，相對(duì)熵在

時(shí)達(dá)到它的最小值0，而當(dāng)

靠近0或者1的時(shí)候，相對(duì)熵則變得非常大（其實(shí)是趨向于

）。所以，最小化這一懲罰因子具有使得

靠近

的效果。

我們的總體代價(jià)函數(shù)可以表示為

其中

如之前所定義，而

控制稀疏性懲罰因子的權(quán)重。

項(xiàng)則也（間接地）取決于

，因?yàn)樗请[藏神經(jīng)元

的平均激活度，而隱藏層神經(jīng)元的激活度取決于

。

為了對(duì)相對(duì)熵進(jìn)行導(dǎo)數(shù)計(jì)算，我們可以使用一個(gè)易于實(shí)現(xiàn)的技巧，這只需要在你的程序中稍作改動(dòng)即可。具體來(lái)說(shuō)，前面在后向傳播算法中計(jì)算第二層（

）更新的時(shí)候我們已經(jīng)計(jì)算了

我們將其換成

就可以了。

有一個(gè)需要注意的地方就是我們需要知道

來(lái)計(jì)算這一項(xiàng)更新。所以在計(jì)算任何神經(jīng)元的后向傳播之前，你需要對(duì)所有的訓(xùn)練樣本計(jì)算一遍前向傳播，從而獲取平均激活度。如果你的訓(xùn)練樣本可以小到被整個(gè)存到內(nèi)存之中（對(duì)于編程作業(yè)來(lái)說(shuō)，通常如此），你可以方便地在你所有的樣本上計(jì)算前向傳播并將得到的激活度存入內(nèi)存并且計(jì)算平均激活度。然后你就可以使用事先計(jì)算好的激活度來(lái)對(duì)所有的訓(xùn)練樣本進(jìn)行后向傳播的計(jì)算。如果你的數(shù)據(jù)量太大，無(wú)法全部存入內(nèi)存，你就可以掃過你的訓(xùn)練樣本并計(jì)算一次前向傳播，然后將獲得的結(jié)果累積起來(lái)并計(jì)算平均激活度

（當(dāng)某一個(gè)前向傳播的結(jié)果中的激活度

被用于計(jì)算平均激活度

之后就可以將此結(jié)果刪除）。然后當(dāng)你完成平均激活度

的計(jì)算之后，你需要重新對(duì)每一個(gè)訓(xùn)練樣本做一次前向傳播從而可以對(duì)其進(jìn)行后向傳播的計(jì)算。對(duì)于后一種情況，你對(duì)每一個(gè)訓(xùn)練樣本需要計(jì)算兩次前向傳播，所以在計(jì)算上的效率會(huì)稍低一些。

證明上面算法能達(dá)到梯度下降效果的完整推導(dǎo)過程不再本教程的范圍之內(nèi)。不過如果你想要使用經(jīng)過以上修改的后向傳播來(lái)實(shí)現(xiàn)自編碼神經(jīng)網(wǎng)絡(luò)，那么你就會(huì)對(duì)目標(biāo)函數(shù)

做梯度下降。使用梯度驗(yàn)證方法，你可以自己來(lái)驗(yàn)證梯度下降算法是否正確。

查看詳情

編碼原理相關(guān)推薦

相關(guān)百科
相關(guān)知識(shí)
相關(guān)專欄

百科

編碼原理編碼方法

編碼原理編碼方法

編碼原理造價(jià)信息

編碼原理簡(jiǎn)介

編碼原理編碼方法常見問題

編碼原理編碼方法文獻(xiàn)

卷積編碼器原理

OMRON編碼器工作原理

稀疏自編碼器算法原理

最新詞條