久草久草欧美看看日毛片|亚洲色情电影在线观看|中国一极毛片爱爱欧美一区|国产精品丝袜美腿|干人人操人人干人人|av黄色无码亚洲v视频|全国一级黄片在哪里看|国产精品av影院|特级一级黄色视频|亚洲黄色导航网站在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 熱點 ? 正文

70年前他本想逃避考試,卻影響了整個互聯(lián)網(wǎng)

作者:楊凈 尚恩 來源: 量子位 96706/26

誰曾想,一次學(xué)生不想?yún)⒓涌荚嚨摹叭涡浴保髞砭褂绊懥苏麄€互聯(lián)網(wǎng)。70年前MIT的一堂信息論課上,一位老師為了給學(xué)生“減壓”,擺出一道選擇題。要么參加期末考試,要么寫篇論文改進現(xiàn)有算法,自己挑。這位老師名叫羅伯特·范諾,他沒告訴學(xué)生們的是,這

標(biāo)簽: 互聯(lián)網(wǎng) 計算機 字符串

誰曾想,一次學(xué)生不想?yún)⒓涌荚嚨摹叭涡浴?,后來竟影響了整個互聯(lián)網(wǎng)。

70年前MIT的一堂信息論課上,一位老師為了給學(xué)生“減壓”,擺出一道選擇題。

要么參加期末考試,要么寫篇論文改進現(xiàn)有算法,自己挑。

這位老師名叫羅伯特·范諾,他沒告訴學(xué)生們的是,這個“現(xiàn)有算法”,正是他和信息論創(chuàng)始人香農(nóng)合著的香農(nóng)-范諾編碼。而為了改進算法不足,他本人已經(jīng)投入大量時間進行研究。

雖然有點損,但這招還真管用。這票學(xué)生一聽“交篇論文”就不用考試,拍腦袋就決定寫論文,包括大衛(wèi)?哈夫曼。

不選不知道,一選嚇一跳。初出茅廬的哈夫曼很快意識到了老師挖的坑——這論文也太難搞了。

這一寫,就是好幾個月,并且苦苦掙扎中,哈夫曼仍然一無所獲。

但命運,有時候就是十分奇妙。就在哈夫曼終于放棄“逃考”,準(zhǔn)備將論文筆記扔到垃圾桶中時,突然靈光一現(xiàn)!答案出現(xiàn)了!

哈夫曼放棄對已有編碼的研究,轉(zhuǎn)向新的探索,最終發(fā)現(xiàn)了基于有序頻率二叉樹編碼的方法。

他提出的這一想法,效率成功超越他老師的方法論。甚至在之后的發(fā)展中,以他命名的編碼方法——哈夫曼編碼,直接改變了數(shù)據(jù)壓縮范式。

至于當(dāng)時那篇結(jié)題報告,已引用近萬次。

低效的傳統(tǒng)編碼方法

1951年,正在MIT任教的羅伯特·范諾正在思考一道信息論的難題:如何用二進制代碼高效表示數(shù)字、字母或者其他符號?

當(dāng)時最常見、也是最直接的方法,就是為每個字符分配一個*的二進制數(shù)。

比如,字母A可能表示為01000001,!表示為 00100001,每個八位數(shù)的數(shù)字都對應(yīng)一個字符。

這樣一來代碼容易解析,但效率極低。

另外還有種優(yōu)化方法,類似于摩爾斯電碼。常用字母E僅由一個點表示,但不常見的Q需要更長且更費力的“—— —— · ——”。

這種方式,會導(dǎo)致代碼長度不一, 信息不容易被理解;而且傳輸中還需要在字符間加入間隙,否則就無法區(qū)分不同的字符組合。

范諾意識到,或許這兩種方法的優(yōu)勢可以兼并之——以不同長度的二進制代碼表示字符。進一步地,為避免代碼“重疊”,他還構(gòu)建了二叉樹。

他詳盡地測試了每一種排列的可能性以獲得*效率,最終得到了一種有效情況:每條消息按照頻率分為兩個分支,并盡可能讓兩邊字母使用頻率基本相同。

這樣,常用的字符就會在更短、密度更低的分支上。

1948年,信息論之父香農(nóng)在介紹信息理論的文章“通信數(shù)學(xué)理論”中提出了這一方法;不久之后,范諾也獨立地以技術(shù)報告形式將其發(fā)布。故而這套方法被稱作是香農(nóng)-范諾編碼

但這個方法并非總是有效。像字母出現(xiàn)概率分別為{0.35,0.17,0.17,0.16,0.15}這種情況時,就不能給出理想編碼。

范諾認(rèn)為一定存在更好壓縮策略。于是乎,這樣的重任就交到了他的學(xué)生手里。

一次靈光乍現(xiàn),一篇世紀(jì)論文

如果說,范諾教授他們的方法是從上到下構(gòu)建字符樹,并在成對的樹枝之間盡可能保持對稱。

那么哈夫曼的方法,是直接顛覆了這一過程——自下而上構(gòu)建二叉樹

他認(rèn)為,無論發(fā)生什么情況,在一段有效的代碼中,兩個最不常見的字符應(yīng)該有兩個最長的代碼。

因此首先就確定兩個最不常見的字符,將它們組合在一起作為一個分支對,然后再重復(fù)該過程,再從剩余字符中與剛剛構(gòu)建的字符對中尋找最不常見的字符(對)。

schoolroom為例,其中O出現(xiàn)了四次,S、C、H、L、R、M各出現(xiàn)一次。

范諾的方法,就是首先將O與另一個字母分配給左側(cè)分支,這樣一來兩邊都是5次總使用量,生成的編碼總共27位。

相比之下,哈夫曼的方法,比如就從不常見的r和m開始,將其組合成一個字母對。

組合完之后,現(xiàn)有字符(對)包括:O(4次)、RM(2次)以及單個字母S、C、H和L。

按照出現(xiàn)頻率劃分,重復(fù)上一操作——將兩個不常見的選項分組,然后更新數(shù)樹和頻率圖。

最終,“schoolroom”變成了 11101111110000110110000101,比Fano 自上而下的方法少了1位。

雖然1位在這里并不多,但要是當(dāng)擴展到數(shù)十億字節(jié)時候,這就是一次不小的節(jié)省。

事實上,哈夫曼的方法已經(jīng)被證明非常強大,據(jù)谷歌學(xué)術(shù)統(tǒng)計,當(dāng)年論文已經(jīng)被引用9570次。

至于他老師的辦法,卻幾乎沒有再被使用過。

直至今天,幾乎所有無損壓縮方法都全部或部分使用了哈夫曼的方法,可以壓縮圖像、音頻、表格等。它支持從PNG圖像標(biāo)準(zhǔn)到無處不在的軟件PKZip 的一切。

現(xiàn)代計算機科學(xué)先驅(qū)、圖靈獎得主高德納曾這樣形容哈夫曼的成就:

在計算機科學(xué)和數(shù)據(jù)通信領(lǐng)域,哈夫曼編碼是人們一直在使用的基本思想。

后來哈夫曼再回憶起那個「靈光乍現(xiàn)」時刻,當(dāng)時他正準(zhǔn)備將論文筆記扔進垃圾桶,結(jié)果突然思想?yún)R聚,答案在腦海里出現(xiàn)了:

那是我生命中最奇特的時刻。

突然恍然大悟,猶如閃電一般。

并表示,如果他知道自己的教授范諾(Fano)曾與這個問題作過斗爭,他可能永遠(yuǎn)都不會嘗試解決這個問題,更不用說在25歲的時候就大膽去嘗試。

成就與秩序感,用數(shù)學(xué)玩藝術(shù)

哈夫曼編碼改變了數(shù)據(jù)壓縮范式,也為其贏得了眾多榮譽與獎?wù)隆?/p>

比如,1998年哈夫曼獲得 IEEE 信息理論學(xué)會頒發(fā)的技術(shù)創(chuàng)新金禧獎、1999年獲得電氣和電子工程師協(xié)會 (IEEE) 頒發(fā)的理查德·漢明獎?wù)拢≧ichard Hamming Medal)。

不過即便如此,在他一生歷程中,相比發(fā)明無損壓縮方法這件事兒,最讓他引以為傲的反而是這篇博士論文。

題目:The Synthesis of Sequential Switching Circuits。

哈夫曼在MIT讀博期間,發(fā)布這篇討論時序開關(guān)電路的重要論文。在當(dāng)時,哈夫曼幾乎是*闡述如何設(shè)計異步順序開關(guān)電路的學(xué)者,而這一理論后來也為計算機發(fā)展提供了重要邏輯支撐。

這篇論文的發(fā)布,不僅幫助他獲得富蘭克林研究所的Louis E. Levy Medal,也順理成章讓他獲得留校任職資格,教授關(guān)于開關(guān)電路的課程。

在校期間,哈夫曼還提出一種革新的數(shù)學(xué)公式,可以在不丟失任何信息的情況下將一個二進制數(shù)序列轉(zhuǎn)換成另一個二進制數(shù)序列,這項研究在當(dāng)時密碼學(xué)中發(fā)揮了重要作用,也為其謀得了一份重要職位。

時任貝爾實驗室研究副總裁的William O. Baker將其招納入了一個審查委員會,主要負(fù)責(zé)為國家安全局審查未來科技計劃。Baker博士曾擔(dān)任過艾森豪威爾、肯尼迪、約翰遜、尼克松和里根五位總統(tǒng)的科學(xué)顧問。

1967年已是正教授的霍夫曼選擇離開MIT,加入加利福尼亞大學(xué)圣克魯茲分校(UCSC),期間主導(dǎo)創(chuàng)立了計算機科學(xué)系,并參與學(xué)術(shù)課程開發(fā)工作,為之后計算機科學(xué)系發(fā)展奠定重要基礎(chǔ)。

數(shù)學(xué)可以說是哈夫曼畢生追求之一,以至于后來在搞藝術(shù)時,也離不開數(shù)學(xué)。

70年代開始,哈夫曼對折紙產(chǎn)生濃厚興趣,同時研究數(shù)學(xué)和折紙藝術(shù),制作了上百件曲痕折紙作品,還專門發(fā)表論文分析曲痕折紙的數(shù)學(xué)性質(zhì),成為折紙數(shù)學(xué)領(lǐng)域的先驅(qū)人物。

回過頭看,哈夫曼的一生贏得過無數(shù)榮譽與表彰,卻從未為自己任何一項發(fā)明申請過專利。

最后,借用哈夫曼自己的一段話。

作為一名科學(xué)家和老師,我真的非常執(zhí)著。如果我覺得自己還沒有找到問題的最簡單解決方法,我會非常不滿意,這種不滿會一直持續(xù),直到我找到*方法為止。對我來說,這就是科學(xué)家的本質(zhì)。

參考鏈接:[1]https://www.quantamagazine.org/how-lossless-data-compression-works-20230531[2]https://www.huffmancoding.com/my-uncle/scientific-american[3]https://www.nytimes.com/1999/10/13/us/d-a-huffman-computer-expert-dies-at-74.html

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載合作媒體、機構(gòu)或其他網(wǎng)站的公開信息,并不意味著贊同其觀點或證實其內(nèi)容的真實性,信息僅供參考,不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有,如有侵權(quán)或其它問題請及時告之,本網(wǎng)將及時修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596,謝謝。

財中網(wǎng)合作