
Yandex 提供眾多服務,其開發團隊開發了各種軟體演算法來實現這些服務。其中一項名為 CatBoost 的演算法最近躋身全球同類解決方案中最受歡迎的行列。
CatBoost 的工作是發現表格中複雜而微妙的模式。例如,在 Yandex 搜尋中,它會分析數千個搜尋參數,並從中選擇最有用的參數:地區、相關性、網站受歡迎程度等等。
由於其優異的性能,該演算法被美國出版物MarkTechPost收錄在一份報告中。該報告分析了《自然》雜誌2025年發表的5,000多篇科學文章。報告發現,CatBoost已被50多個國家採用,與微軟、Google、英特爾、亞馬遜和其他主要公司的解決方案並駕齊驅。
此外,CatBoost 成為僅有的五種獲得如此高人氣的非美國演算法之一,其他五種分別是 U-Net(德國)、Scikit-learn(法國)、AlphaFold(英國)以及 GAN 和 RNN(加拿大)。該演算法在中國(32% 的論文提及率)、沙烏地阿拉伯(19%)和印度(18%)的使用最為普遍。在美國,麻省理工學院、哈佛大學和史丹佛大學的研究人員都在論文中提及了這個演算法。
CatBoost能夠準確且有效率地處理涵蓋廣泛類別的數據,從汽車品牌到患者診斷。它無需任何預先配置即可產生準確的預測結果,從而節省研究人員的時間,並使該演算法能夠應用於各種科學領域。
MarkTechPost 的報告共收錄了 188 篇提及 CatBoost 的文章。這些文章表明,CatBoost 在預測早產、肝癌復發、乳癌檢測和阿茲海默症早期診斷方面均取得了成功。此外,該演算法在識別虛假社交媒體帳戶方面表現優異,並在預測水質指數方面也取得了最佳結果之一。