5月9日|5月8日,阿里巴巴開源的ZeroSearch是一種無需與真實搜索引擎交互即可激勵大模型搜索能力的強化學習框架。主要利用了大模型在大規模預訓練過程中積累的豐富知識,將其轉化為一個檢索模塊,能夠根據搜索查詢生成相關內容。同時,還可以動態控制生成內容的質量,這是傳統搜索引擎所不具備的特殊功能。在成本方面,研究人員通過SerpAPI使用谷歌搜索進行約64,000次搜索查詢的訓練,成本約為586.70美元;而在四個A100GPU上使用140億參數的大模型進行模擬時,成本僅為70.80美元,成本降低了80%以上。
新聞來源 (不包括新聞圖片): 格隆匯