Topsy可助蘋(píng)果填補(bǔ)大數(shù)據(jù)這個(gè)坑

2014/01/03 11:23      王玉龍

蘋(píng)果剛剛以 2 億多美元的價(jià)格收購(gòu)了社交媒體分析公司 Topsy。Topsy 是少數(shù)幾家能分析 Twitter 完整信息流的公司之一。有人猜測(cè)蘋(píng)果會(huì)將 Topsy 的技術(shù)應(yīng)用到 iTunes 或應(yīng)用商店的內(nèi)容推薦或 iAd 定向廣告上,但 GigaOM 的 Derrick Harris 認(rèn)為,蘋(píng)果更大的想法也許是要獲得大數(shù)據(jù)的相關(guān)能力。

在少數(shù)幾個(gè)提供跨設(shè)備、應(yīng)用及服務(wù)的平臺(tái)的公司(蘋(píng)果、Google、微軟)里面,蘋(píng)果以提供完整和出色的體驗(yàn)見(jiàn)長(zhǎng),而數(shù)據(jù)而是體驗(yàn)的關(guān)鍵部分,但蘋(píng)果這一塊相對(duì)而言卻是短板。微軟有 Bing、Hotmail 和 Xbox。Google 有搜索、Gmail、Google+、Youtube、Zagat 等。蘋(píng)果呢,Siri(你還經(jīng)常用嗎?),硬是要算的話,iCloud 或 Safari 也可以算上,但這些都要依賴(lài)外部的搜索引擎。從了解用戶(hù)需求方面來(lái)說(shuō),蘋(píng)果掌握到的數(shù)據(jù)遠(yuǎn)遜于另兩個(gè)對(duì)手。

那些數(shù)據(jù)可以幫助微軟和 Google 做很多事情:可以分析搜索引擎、社交網(wǎng)站帖子及評(píng)論來(lái)不斷改進(jìn)其自然語(yǔ)言處理能力和搜索算法,從而更好地實(shí)現(xiàn)語(yǔ)音識(shí)別、翻譯服務(wù)并改善搜索體驗(yàn)。可分析圖像、視頻甚至人體運(yùn)動(dòng)(Kinect)來(lái)進(jìn)一步改進(jìn)與計(jì)算機(jī)視覺(jué)和圖像識(shí)別相關(guān)的能力。

微軟也十分認(rèn)可 Bing 對(duì)于其宏大愿景的重要性,哪怕這個(gè)搜索引擎從未對(duì) Google 的統(tǒng)治地位構(gòu)成威脅。

在社交媒體角度而言,Google 對(duì) Google+ 的重視程度一如微軟之于 Bing。Google+ 賦予 Google 通過(guò)社交圖譜過(guò)濾用戶(hù)體驗(yàn)的能力,并拓寬了流行趨勢(shì),讓它可以用有機(jī)的方式獲得數(shù)據(jù),從而進(jìn)一步促進(jìn)其對(duì)文本和行為分析目標(biāo)的實(shí)現(xiàn)。

突然之間,Siri 似乎沒(méi)有什么競(jìng)爭(zhēng)優(yōu)勢(shì)了。

考慮到 Topsy 可以訪問(wèn)到 Twitter 的全部數(shù)據(jù)(目前為止,包括歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)),也許可以從某種程度幫助蘋(píng)果縮小這種差距。因此蘋(píng)果已經(jīng)擁有了一個(gè)龐大的 Twitter 資料庫(kù)來(lái)幫助它進(jìn)行從自然語(yǔ)言處理到趨勢(shì)分析這樣的事情。從理論上來(lái)說(shuō),蘋(píng)果收購(gòu) Topsy 后第 2 天就可以關(guān)閉它,然后不斷從 Twitter 吸收數(shù)據(jù)不斷壯大自己的數(shù)據(jù)庫(kù)即可(Topsy 以歷史數(shù)據(jù)分析為主,而 Datasift 和 Gnip 則主要關(guān)注實(shí)時(shí)數(shù)據(jù),包括 Twitter 以外的數(shù)據(jù),所以其收購(gòu)價(jià)格可能會(huì)更貴)。

蘋(píng)果當(dāng)然有服務(wù)可從該收購(gòu)案中獲益,如 Siri、iTunes 和 Apple TV。蘋(píng)果可以利用 Topsy 的數(shù)據(jù)來(lái)了解大眾的話題和意思??梢詭椭O(píng)果改進(jìn)推薦算法、聚焦或預(yù)測(cè)媒體趨勢(shì)來(lái)提供更好的用戶(hù)體驗(yàn),也可以讓 Siri 工作得更好。可以想見(jiàn),有了這些數(shù)據(jù)以后,未來(lái)蘋(píng)果將雇用更多的數(shù)據(jù)科學(xué)家、分析師和工程師。

Twitter 一直宣稱(chēng)自己是趨勢(shì)制造者和電視的一個(gè)事實(shí)上的排名系統(tǒng)。蘋(píng)果也可以利用這種定位。不過(guò)今后它靠的不是 Twitter 發(fā)布的數(shù)據(jù),而是關(guān)注于那些對(duì)其終端重要的部分,也許還可以利用這些來(lái)確保內(nèi)容許可等方面的權(quán)益。

誠(chéng)然,現(xiàn)在猜測(cè)蘋(píng)果這樁收購(gòu)案的眾多動(dòng)機(jī)仍為時(shí)尚早,但很難相信蘋(píng)果用 2 億美元收購(gòu)一家公司僅僅是為了知道在 Twitter 上大家對(duì)自己的新 iPad 評(píng)價(jià)如何。Google 和微軟均制造了大量數(shù)據(jù)來(lái)幫助自己在移動(dòng)、電影、音樂(lè)、協(xié)作等幾乎所有事情上發(fā)展,蘋(píng)果顯然也應(yīng)該有自己的數(shù)據(jù)獲取渠道。

相關(guān)閱讀