關(guān)于作者
吳軍,畢業(yè)于清華大學(xué)和約翰霍普金斯大學(xué),他有很多個(gè)身份。
他是硅谷投資人,是著名的自然語言處理專家和搜索專家,也是“得到”App專欄《硅谷來信》的主理人。他是谷歌的早期員工之一,在谷歌期間領(lǐng)導(dǎo)參與了很多研發(fā)項(xiàng)目,是谷歌中、日、韓搜索算法的發(fā)明人。
同時(shí)他還是位暢銷書作家,除了這本《數(shù)學(xué)之美》以外,還寫過《文明之光》《智能時(shí)代》《浪潮之巔》等多本暢銷書。
關(guān)于本書
在本書里,吳軍從他的親身經(jīng)歷出發(fā),為我們介紹了數(shù)學(xué)在信息科學(xué)領(lǐng)域的種種應(yīng)用,以及兩位著名的數(shù)學(xué)信息科學(xué)大師的數(shù)學(xué)智慧。
通過這些實(shí)際案例,他為我們展示了數(shù)學(xué)和我們當(dāng)今生活的緊密聯(lián)系,以及數(shù)學(xué)思想背后蘊(yùn)含的簡(jiǎn)單之美。
核心內(nèi)容
本書的核心思想是:數(shù)學(xué)和我們的生活聯(lián)系非常緊密,生活中很多意想不到的問題,其實(shí)都能用數(shù)學(xué)方法來解決。數(shù)學(xué)能夠幫助我們跳出問題的表面現(xiàn)象,抓住事物發(fā)展背后的邏輯,從而用一種巧妙的方法去解決復(fù)雜的問題;
同時(shí)因?yàn)閿?shù)學(xué)也具有簡(jiǎn)單的一致性,這就讓我們經(jīng)常能用一種思想來解決不同種類的問題。而數(shù)學(xué)之美,就體現(xiàn)在這種實(shí)用和簡(jiǎn)潔之中。
1
數(shù)學(xué)能幫我們跳出表象,
抓住事物發(fā)展背后的邏輯
讓計(jì)算機(jī)能處理人類的語言是我們今天很多工作的基礎(chǔ),所以科學(xué)家們很早就在這個(gè)問題上展開了研究。
其實(shí)最開始讓計(jì)算機(jī)處理語言的時(shí)候,科學(xué)家們按照仿生學(xué)的思路,堅(jiān)持認(rèn)為,要讓機(jī)器學(xué)會(huì)翻譯或者語言識(shí)別,就必須像人一樣,先讓計(jì)算機(jī)學(xué)會(huì)語法。但是后來人們發(fā)現(xiàn),語法規(guī)則實(shí)在是太多,根本沒有辦法窮盡。這種方法在上個(gè)世紀(jì)70年代逐漸被證明是不可行的。
與此同時(shí),著名計(jì)算機(jī)科學(xué)家賈里尼克和他領(lǐng)導(dǎo)的實(shí)驗(yàn)室,發(fā)明了用統(tǒng)計(jì)學(xué)處理自然語言的方法,大大提高了語音識(shí)別的識(shí)別率和識(shí)別規(guī)模。
他們的方法主要用了“馬爾科夫假設(shè)”, 這個(gè)假設(shè)是說,假定一個(gè)句子里每一個(gè)詞出現(xiàn)的概率,只和前一個(gè)詞有關(guān),就好比“漲停”這個(gè)詞,最有可能出現(xiàn)在“股票”之后。
那么,只要給計(jì)算機(jī)量足夠大的機(jī)讀文本,計(jì)算機(jī)就能算出來,在一個(gè)特定詞后面出現(xiàn)某個(gè)詞的概率。這樣,只要把一句話里所有詞出現(xiàn)的概率相乘,就是這個(gè)句子出現(xiàn)的概率了。概率最大的句子,就是我們需要的正確句子。
在解決問題時(shí),過度地注意模仿卻不懂變通,也是導(dǎo)致失敗的重要原因。就像當(dāng)年人們最開始制造飛機(jī)時(shí),總是想把飛機(jī)的機(jī)翼設(shè)計(jì)成鳥的翅膀,但是最后萊特兄弟制造出來的第一架飛機(jī),靠的不是仿生學(xué),而是空氣動(dòng)力學(xué)。
所以說,不被事情的表面現(xiàn)象迷惑,是一種很重要的能力,而數(shù)學(xué)就能幫我們跳出表象,抓住事物發(fā)展背后的邏輯。
2
數(shù)學(xué)的“一致性”體現(xiàn)著數(shù)學(xué)之美
余弦定理是一個(gè)揭示三角形邊角關(guān)系的重要數(shù)學(xué)定理,使用余弦定理,就可以僅憑三角形兩個(gè)邊的向量,計(jì)算出這兩個(gè)邊的夾角。
科學(xué)家為了讓計(jì)算機(jī)能處理人類的語言,要先把新聞里的文字變成一組可以計(jì)算的數(shù)字,再設(shè)計(jì)一個(gè)算法,這樣就能讓計(jì)算機(jī)通過余弦定理,來算出任意兩篇新聞的相似性,從而確定新聞的分類。
新聞里的詞分為實(shí)詞和虛詞,“之乎者也的”這種虛詞對(duì)判斷新聞分類無益,就不考慮,而“股票”“利息”這種實(shí)詞,對(duì)判斷新聞分類很有幫助,是我們關(guān)注的重點(diǎn),我們就要用這些實(shí)詞計(jì)算出一則新聞的特征向量。
只要給每一則新聞都計(jì)算出其獨(dú)特的特征向量,再根據(jù)每一類新聞經(jīng)常出現(xiàn)的詞的特征,就可以判斷出任意一條新聞的分類。
在新聞分類的工作中,計(jì)算機(jī)不需要去理解每篇新聞,只要找到同一類新聞的相似點(diǎn)就可以了,用余弦定理就能搞定,這就證明了數(shù)學(xué)的“一致性”。
雖然事物發(fā)展千變?nèi)f化,但處理它們的數(shù)學(xué)模型卻是相似、甚至相同的。這種一致性,就是一種“數(shù)學(xué)之美”。
3
數(shù)學(xué)的妙處就是,
一個(gè)好方法,常常也是最簡(jiǎn)單明了的方法。
現(xiàn)在我們每個(gè)人幾乎每天都會(huì)用到搜索引擎,它可以在極短的時(shí)間內(nèi)搜索到大量你需要的網(wǎng)頁,這背后的關(guān)鍵就是數(shù)學(xué)。搜索引擎背后的基本數(shù)學(xué)原理,其實(shí)特別簡(jiǎn)單。
二進(jìn)制是世界上最簡(jiǎn)單的計(jì)數(shù)方法,因?yàn)槎M(jìn)制只有0和1兩個(gè)數(shù)字,并且二進(jìn)制還可以表示邏輯里的“是”和“非”。
布爾運(yùn)算,就是一種針對(duì)二進(jìn)制的運(yùn)算,它是19世紀(jì)英國的一名名叫布爾的數(shù)學(xué)家發(fā)明的,基本的運(yùn)算只有“與”“或”“非”三種,非常簡(jiǎn)單。
搜索引擎會(huì)把用戶查詢的語句,轉(zhuǎn)換成布爾運(yùn)算的算式,看看搜索關(guān)鍵詞有沒有出現(xiàn)在這個(gè)網(wǎng)頁,1就代表出現(xiàn),0就代表沒出現(xiàn)。
這樣一來,每個(gè)網(wǎng)頁就會(huì)轉(zhuǎn)換成一個(gè)數(shù)字。最后只要把顯示為1的網(wǎng)頁拿出來,就是你要的搜索結(jié)果了。計(jì)算機(jī)做布爾運(yùn)算的速度非?,所以搜索引擎可以輕松地在很短的時(shí)間里搜索出大量網(wǎng)頁。
牛頓曾經(jīng)說過,“真理在形式上從來都是簡(jiǎn)單的,而不是復(fù)雜和含混不清的”。數(shù)學(xué)之美也體現(xiàn)在這里,如果你能拿數(shù)學(xué)工具來解決問題,那么不管你的方法有多復(fù)雜,這里面的基本思想都應(yīng)該是簡(jiǎn)單的。
4
兩位數(shù)學(xué)信息科學(xué)大師的數(shù)學(xué)思維
本書的作者吳軍認(rèn)為,技術(shù)其實(shí)分為兩種,分別是“術(shù)”和“道”。“術(shù)”指的是具體做事的技藝和方法,而“道”指的是做事的原理和原則。
這本書的目的是講“道”,而不是去講多么具體的“術(shù)”。因?yàn)楹芏嗑唧w的技術(shù)很快就會(huì)變得落伍。追求“術(shù)”的人,一輩子都會(huì)很辛苦。只有掌握了技術(shù)的本質(zhì)和精髓,做事才能游刃有余。
第一位大師是阿米特·辛格。他是美國工程院院士,谷歌公司內(nèi)的一位技術(shù)大神。辛格做事情的哲學(xué),是先幫助用戶解決80%的問題,再慢慢解決剩下20%的問題,這就讓他總是能在較短的時(shí)間里較好的解決問題。阿米特·辛格還奉行簡(jiǎn)單的哲學(xué),他認(rèn)為最簡(jiǎn)單的東西往往是最好的。因?yàn)樗J(rèn)為越簡(jiǎn)單的事情越容易解釋道理,這樣可以方便查找錯(cuò)誤。
第二位大師是邁克爾·柯林斯,他是一個(gè)擅長用數(shù)學(xué)把工作做到極致的人。柯林斯的哲學(xué)是追求極致和完美。比如他曾經(jīng)設(shè)計(jì)了一個(gè)幫助計(jì)算機(jī)處理自然語言的分析器,目的不是為了驗(yàn)證什么理論,而僅僅是為了做出世界上最好的分析器。
柯林斯的特點(diǎn),就是把事情做到極致。他并不是刻意去追求繁瑣和復(fù)雜,也不是和阿米特·辛格完全對(duì)立,他只是在追求數(shù)學(xué)上的嚴(yán)謹(jǐn)和完美。
不管是阿米特·辛格的簡(jiǎn)單哲學(xué),還是邁克爾·柯林斯的完美哲學(xué),都把數(shù)學(xué)的力量發(fā)揮到了極致,讓數(shù)學(xué)用最好的方式來解決復(fù)雜的問題。這兩種哲學(xué),不是硬幣的兩面,而是相互補(bǔ)充的。
來源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問題,請(qǐng)聯(lián)系我們及時(shí)刪除。