沈向陽道:“他沒跟我談業務的事。”
周不器點了點頭,“嗯,這算是公司機密。我跟你說說。其中有一個項目,是個性化的內容分發,根本不同的用戶信息,來通過信息流的方式分發相應的廣告和內容。”
“朋友網的廣告?”
“對,主要是今日頭條,這是我們內部的一個項目,9月份會上線,會有內容的分發。”
周不器就簡單的說了一下今日頭條內容分發的理念。
沈向陽略作思考,沉吟道:“如果是這種模式,簡單的個性化分發是不夠的,這不夠精確。必須要有更複雜的算法支持,這需要使用到深度的計算機學習。”
“什麼說?”
“嗯……”
沈向陽有些頭疼,他最煩跟外行探討深度的技術問題,可對方是老板,又不能不解釋,想了一下,說道:“這樣,你問我5+5等於幾。然後我模擬計算機,給你解釋一下。如果我說錯了,你要給出正確的答案,然後多問幾遍。”
周不器覺得挺有趣,笑道:“行,那我問啦。咳咳,5+5等於多少?”
沈向陽道:“88。”
周不器微微一愣,明白了他的意思,幫他改正,“不對,是10。5+5等於多少?”
沈向陽道:“24。”
“不對,是10。5+5等於多少?”
“17。”
“不對,是10。5+5等於多少?”
“12。”
“不對,是10。是5+5等於多少?”
“10。”
“對了。5+5等於多少?”
“10。”
“5+5等於多少?”
“10。”
沈向陽做出了這個解答,然後接結束了這個問題,“這就是機器學習的邏輯。當然不是算術了,而是計算用戶對廣告或者內容的喜好度。其實針對廣告的個性化投放,不能根據廣告本身,而是根據內容。朋友網的個性化廣告我看了,主要就是根據用戶的個人信息,這略顯粗糙,準確率也不高。”
“那應該怎麼做?”
“通過機器學習,把廣告和內容捆綁。比如閱讀內容a的用戶,都喜歡廣告a,兩者就可以對接了。這個比較簡單。更複雜的是內容投放,要結合統計學習和神經網絡,通過機器學習,讓計算機學習用戶的閱讀習慣。就像剛才的算術題一樣,一開始,錯誤率比較大,越是學習,錯誤率就越小,就越貼近正確答案,即用戶的閱讀習慣。”
周不器不太服氣,透露了點小秘密,“朋友網的個性化廣告分發算法,是facebook做出來的呢!嗯,我們是合作夥伴。”
“這樣啊……”沈向陽笑了笑,“facebook的技術也不怎麼樣。”
“呃……”
口氣真大!
好吧,這哥們的確夠資格諷刺facebook技術差。
周不器接著說:“還有一個項目,我們都做了半年了,一點頭緒都沒有,我們派出了一個很厲害的技術大牛,叫徐銘,他也沒辦法。他本來是搜索事業群的技術總監,不過項目沒進展,接下來就把他調進研究院,你來帶吧。”
“什麼項目?”
“智能搜索,個性化搜索,千人千頁。”
其實就跟個性化內容推薦差不多,不同的是,這次是針對搜索結果的個性化推薦。
沈向陽臉色就凝重起來,“這可難多了!比那個朋友網的個性化廣告,今日頭條的個性化內容都難。”
“是嗎?不都是個性化推薦嗎?”
“級彆不一樣。”
“嗯?”
沈向陽解釋道:“技術難題往往是兩點,一類是複雜度,一類是規模量。比如pab這種工程軟件,就是太複雜了,我們國內做不出來。規模量指的是數據多少。一個算法,處理小數據時可能很奏效。可是涉及到大規模數據,算法就失效了。就像手工製作和機械化批量生產一樣,沒有可比性。”
周不器點了點頭,“嗯,大數據。”
沈向陽道:“大數據算法是一套,個性化算法是一套,大數據下的個性化算法,又是另外一套。這並不是簡單的1+1=2的關係,需要從算法框架方麵有更優化的設計。智能搜索這個概念前兩年就提過了,可是做不到。”
現在,全世界連大數據都沒搞明白呢,對大數據下的衍生算法,更是想都彆想。
這麼一看,還是老沈技術更高、視野更廣、認知更清楚啊!
智能搜索這個項目,是許亮傑、程秉皓、王小船和徐銘共同決定的,覺得這個方向大有可為。可沈向陽卻給否了,說做不到。
嗯,一家公司,肯定是技術最好的人當首席技術官。
老沈實至名歸啊!
請記住本書首發域名:..bigebar.