【jinnianhui科技消息】2月4日,深度研究智能體權(quán)威評(píng)測(cè)榜單DeepResearch Bench公布最新結(jié)果。百度千帆推出的深度研究智能體(Qianfan-DeepResearch Pro)憑借其卓越的端到端研究能力與極高的報(bào)告產(chǎn)出質(zhì)量,在評(píng)測(cè)中脫穎而出,榮登榜單榜首。

當(dāng)前,深度研究正被視為人工智能進(jìn)化的關(guān)鍵分水嶺。它要求AI系統(tǒng)能夠模擬人類(lèi)專(zhuān)家,自主執(zhí)行從復(fù)雜需求理解、廣泛信息獲取到深度洞察產(chǎn)出的多步驟、可迭代認(rèn)知全過(guò)程,遠(yuǎn)超傳統(tǒng)文本生成的范疇。該技術(shù)已廣泛應(yīng)用于學(xué)術(shù)綜述、金融投研、商業(yè)分析等領(lǐng)域,能將傳統(tǒng)耗時(shí)數(shù)日的手動(dòng)研究工作壓縮至分鐘級(jí)完成。
作為衡量該領(lǐng)域能力的“金標(biāo)準(zhǔn)”,DeepResearch Bench填補(bǔ)了通用AI評(píng)測(cè)在端到端深度研究任務(wù)上的空白。其由領(lǐng)域?qū)<以O(shè)計(jì)了100個(gè)博士級(jí)別的研究任務(wù),覆蓋22個(gè)學(xué)科,并引入嚴(yán)格的RACE報(bào)告質(zhì)量評(píng)價(jià)框架與引文準(zhǔn)確性評(píng)估,是目前全球最硬核、最真實(shí)的深度研究智能體生產(chǎn)力評(píng)價(jià)體系。
在此次評(píng)測(cè)中,百度千帆深度研究Agent在衡量報(bào)告含金量的四大核心維度——全面性、洞察力、指令遵循度和可讀性上,均實(shí)現(xiàn)了行業(yè)領(lǐng)先。

在架構(gòu)方面,百度千帆采用“任務(wù)理解-規(guī)劃-執(zhí)行”循環(huán)機(jī)制,實(shí)現(xiàn)端到端研究交付。信息處理能力方面,千帆依托百度搜索與RAG技術(shù),保障信息獲取的廣度、可信度與相關(guān)性。執(zhí)行控制方面,千帆通過(guò)“由粗到細(xì)”的研究路徑以及深度執(zhí)行規(guī)劃與實(shí)時(shí)反思機(jī)制,動(dòng)態(tài)評(píng)估進(jìn)展、調(diào)整策略,有效避免“幻覺(jué)”與路徑偏離,確保復(fù)雜任務(wù)的高質(zhì)量完成。
報(bào)告生成方面,百度千帆采用獨(dú)特的兩階段報(bào)告渲染機(jī)制,首先生成確保邏輯一致性與內(nèi)容全面性的“pivot報(bào)告”,隨后可渲染輸出markdor:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫n、html、ppt等多形態(tài)最終報(bào)告,實(shí)現(xiàn)“一次研究,多形態(tài)交付”。
目前,該深度研究Agent已正式上線百度千帆平臺(tái)。用戶(hù)只需輸入復(fù)雜的調(diào)研需求,系統(tǒng)即可在十幾分鐘內(nèi)生成附帶規(guī)范引用的專(zhuān)業(yè)級(jí)研究報(bào)告,真正實(shí)現(xiàn)“分鐘級(jí)”的深度洞察交付。
此次登頂榜首,也集中體現(xiàn)了百度千帆Agent Infra的強(qiáng)大支撐能力。該基礎(chǔ)設(shè)施提供模型、工具、Agent開(kāi)發(fā)、數(shù)據(jù)及運(yùn)行環(huán)境等一站式服務(wù)。據(jù)悉,千帆平臺(tái)已累計(jì)開(kāi)發(fā)超過(guò)130萬(wàn)個(gè)Agents,其中以“百度AI搜索”為代表的獨(dú)家工具日均調(diào)用量已達(dá)數(shù)千萬(wàn)次,為AI智能體的高效、可靠運(yùn)行提供了堅(jiān)實(shí)基座。
版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載
-金年會(huì)體育
官方微信公眾號(hào)平臺(tái)