第784章計算機學習_大時代之巔

沈向陽道：“他沒跟我談業務的事。”

周不器點了點頭，“嗯，這算是公司機密。我跟你說說。其中有一個項目，是個性化的內容分發，根本不同的用戶信息，來通過信息流的方式分發相應的廣告和內容。”

“朋友網的廣告？”

“對，主要是今日頭條，這是我們內部的一個項目，9月份會上線，會有內容的分發。”

周不器就簡單的說了一下今日頭條內容分發的理念。

沈向陽略作思考，沉吟道：“如果是這種模式，簡單的個性化分發是不夠的，這不夠精確。必須要有更複雜的算法支持，這需要使用到深度的計算機學習。”

“什麼說？”

“嗯……”

沈向陽有些頭疼，他最煩跟外行探討深度的技術問題，可對方是老板，又不能不解釋，想了一下，說道：“這樣，你問我5+5等於幾。然後我模擬計算機，給你解釋一下。如果我說錯了，你要給出正確的答案，然後多問幾遍。”

周不器覺得挺有趣，笑道：“行，那我問啦。咳咳，5+5等於多少？”

沈向陽道：“88。”

周不器微微一愣，明白了他的意思，幫他改正，“不對，是10。5+5等於多少？”

沈向陽道：“24。”

“不對，是10。5+5等於多少？”

“17。”

“不對，是10。5+5等於多少？”

“12。”

“不對，是10。是5+5等於多少？”

“10。”

“對了。5+5等於多少？”

“10。”

“5+5等於多少？”

“10。”

沈向陽做出了這個解答，然後接結束了這個問題，“這就是機器學習的邏輯。當然不是算術了，而是計算用戶對廣告或者內容的喜好度。其實針對廣告的個性化投放，不能根據廣告本身，而是根據內容。朋友網的個性化廣告我看了，主要就是根據用戶的個人信息，這略顯粗糙，準確率也不高。”

“那應該怎麼做？”

“通過機器學習，把廣告和內容捆綁。比如閱讀內容a的用戶，都喜歡廣告a，兩者就可以對接了。這個比較簡單。更複雜的是內容投放，要結合統計學習和神經網絡，通過機器學習，讓計算機學習用戶的閱讀習慣。就像剛才的算術題一樣，一開始，錯誤率比較大，越是學習，錯誤率就越小，就越貼近正確答案，即用戶的閱讀習慣。”

周不器不太服氣，透露了點小秘密，“朋友網的個性化廣告分發算法，是facebook做出來的呢！嗯，我們是合作夥伴。”

“這樣啊……”沈向陽笑了笑，“facebook的技術也不怎麼樣。”

“呃……”

口氣真大！

好吧，這哥們的確夠資格諷刺facebook技術差。

周不器接著說：“還有一個項目，我們都做了半年了，一點頭緒都沒有，我們派出了一個很厲害的技術大牛，叫徐銘，他也沒辦法。他本來是搜索事業群的技術總監，不過項目沒進展，接下來就把他調進研究院，你來帶吧。”

“什麼項目？”

“智能搜索，個性化搜索，千人千頁。”

其實就跟個性化內容推薦差不多，不同的是，這次是針對搜索結果的個性化推薦。

沈向陽臉色就凝重起來，“這可難多了！比那個朋友網的個性化廣告，今日頭條的個性化內容都難。”

“是嗎？不都是個性化推薦嗎？”

“級彆不一樣。”

“嗯？”

沈向陽解釋道：“技術難題往往是兩點，一類是複雜度，一類是規模量。比如pab這種工程軟件，就是太複雜了，我們國內做不出來。規模量指的是數據多少。一個算法，處理小數據時可能很奏效。可是涉及到大規模數據，算法就失效了。就像手工製作和機械化批量生產一樣，沒有可比性。”

周不器點了點頭，“嗯，大數據。”

沈向陽道：“大數據算法是一套，個性化算法是一套，大數據下的個性化算法，又是另外一套。這並不是簡單的1+1=2的關係，需要從算法框架方麵有更優化的設計。智能搜索這個概念前兩年就提過了，可是做不到。”

現在，全世界連大數據都沒搞明白呢，對大數據下的衍生算法，更是想都彆想。

這麼一看，還是老沈技術更高、視野更廣、認知更清楚啊！

智能搜索這個項目，是許亮傑、程秉皓、王小船和徐銘共同決定的，覺得這個方向大有可為。可沈向陽卻給否了，說做不到。

嗯，一家公司，肯定是技術最好的人當首席技術官。

老沈實至名歸啊！

請記住本書首發域名：..bigebar.

第784章 計算機學習（2 / 2）

第784章計算機學習（2 / 2）