Kaggle是一個數據建模數據分析競賽平台。企業和研究者可在其上發布數據,統計學者和數據挖掘專家可在其上進行競賽以產生最好的模型。這一眾包模式依賴於這一事實,即有眾多策略可以用於解決幾乎所有預測建模的問題,而研究者不可能在一開始就了解什麼方法對於特定問題是最為有效的。Kaggle的目標則是試圖通過眾包的形式來解決這一難題,進而使數據科學成為一場運動。2017年3月8日谷歌官方博客宣布收購Kaggle[1]

Kaggle
公司類型子公司
成立2010年4月
創辦人安東尼·戈德布盧姆
代表人物安東尼·戈德布盧姆 (CEO)
馬克斯·列夫琴 (董事局主席)
傑夫·莫澤 (CTO)
總部 美國舊金山
標語口號Making Data Science a Sport
使數據科學成為一項運動
產業預測建模
所有權者Alphabet
母公司Google LLC
網站www.kaggle.com

競賽流程

Kaggle中組織一場競賽的過程如下。

  1. 競賽主持人準備數據和問題的描述。Kaggle對這一過程以及競賽的建構、數據的匿名化以及集成最終獲勝的模型提供諮詢服務。
  2. 參與者通過不同的方法進行實驗,相互競賽以獲得最優的模型。對於大多數的參與者,他們的提交會根據預測精度被立即評分,並在實時的積分榜上顯示。
  3. 在截止時間過後,競賽主持人為「全球性的,永久性的,不可撤銷和免版稅地使用獲獎作品」支付獎金。亦即競賽獲勝者的算法、軟體和相關的智慧財產權是非排他性的,除非特別指明[2]

除了公開競賽以外,Kaggle還向活躍參與者提供私下的比賽,以及為大學團體提供Kaggle-in-Class項目[3]

影響

根據Kaggle官方提供的數據,Kaggle在全球範圍內擁有將近20萬名數據科學家,專業領域從計算機科學到統計學、經濟學和數學[4]。Kaggle也曾經和NASA維基百科德勤好事達英語Allstate合作舉辦競賽。其中的一項獎項高達300萬美金的競賽是Heritage Health Prize,目的是通過病人看病及吃藥住院等數據預測明年病人住院的天數[5]。另一項與微軟合作的競賽則旨在提高Kinect的手勢識別精度[6]

Kaggle的競賽在愛滋病研究[7]、棋牌評級[8]和交通預測[9]方面取得了成果。基於這些成果產生了一系列的學術論文。產生這一結果的原因是實時積分榜促使參加者不斷改進以試圖超越當前的最佳實踐[10]。獲勝的方法常常在Kaggle的博客No Free Hunch頁面存檔備份,存於網際網路檔案館)上展示。

融資

2011年,Kaggle從創辦地澳大利亞墨爾本搬遷到美國舊金山,並在11月宣布向矽谷投資者進行規模為1100萬美元的首輪融資。指數風險投資公司英語Index Ventures科斯拉風險投資公司英語Khosla Ventures成為Kaggle最大的股東,而PayPal聯合創始人馬克斯·列夫琴也參加了該輪投資並成為Kaggle的董事局主席。另一位著名的投資人是經濟學家,Google首席經濟師哈爾·范里安。他稱Kaggle提供了一種「將全世界最有才能的數據科學家組織起來並使各種規模的機構都能夠觸及」的方式[11]

參見

參考資料

  1. ^ Welcome Kaggle to Google Cloud頁面存檔備份,存於網際網路檔案館).[2017-03-08].
  2. ^ Kaggle. Terms and Conditions - Kaggle. [2014-09-13]. (原始內容存檔於2021-01-11). 
  3. ^ Kaggle. Kaggle in Class. [2014-09-13]. (原始內容存檔於2011-06-16). 
  4. ^ Kaggle. About Us. [2014-09-13]. (原始內容存檔於2011-07-27). 
  5. ^ Healthy Competition. The Economist. April 10, 2011 [3 May 2011]. (原始內容存檔於2016-03-12). 
  6. ^ Byrne, Ciara. Kaggle launches competition to help Microsoft Kinect learn new gestures. VentureBeat. December 12, 2011 [13 December 2011]. (原始內容存檔於2020-09-28). 
  7. ^ Carpenter, Jennifer. May the Best Analyst Win. Science Magazine. February 2011 [1 April 2011]. (原始內容存檔於2015-09-24). 
  8. ^ Sonas, Jeff. The Deloitte/FIDE Chess Rating Challenge. Chessbase. 20 February 2011 [3 May 2011]. (原始內容存檔於2012-11-09). 
  9. ^ Foo, Fran. Smartphones to predict NSW travel times?. The Australian. April 6, 2011 [3 May 2011]. (原始內容存檔於2019-10-08). 
  10. ^ Athanasopoulos, George; Hyndman, Rob. The Value of Feedback in Forecasting Competitions (PDF) 27. 2011: 845–849 [2021-02-07]. (原始內容存檔 (PDF)於2019-02-16).  |journal=被忽略 (幫助)
  11. ^ Rao, Leena. Index And Khosla Lead $11M Round In Kaggle, A Platfogasgsgrm For Data Modeling Competitions. TechCrunch. November 2, 2011 [13 December 2011]. (原始內容存檔於2020-10-23). 

擴展閱讀

外部連結