(資料圖片僅供參考)
原標(biāo)題:新工具讓文獻(xiàn)檢索進(jìn)入AI模式查文獻(xiàn)、讀文獻(xiàn),是做科研的一項基本工作。據(jù)統(tǒng)計,科研人員花費在查找和消化科技資料上的時間約占全部科研時間的51%。有沒有一種可能,將文獻(xiàn)變成一個知識庫或者數(shù)據(jù)庫,用人工智能方法減輕科研人員查找與閱讀文獻(xiàn)的“負(fù)擔(dān)”?5月30日,在2023中關(guān)村論壇“人工智能驅(qū)動的科學(xué)研究論壇”上,基于大語言模型+向量數(shù)據(jù)庫的文獻(xiàn)知識庫——Science Navigator(以下簡稱文獻(xiàn)知識庫)正式發(fā)布。
這是一項讓科研人員通過對話提問的方式進(jìn)行文獻(xiàn)檢索、閱讀、分析及管理的科研成果。該成果由北京科學(xué)智能研究院、中國科學(xué)院計算機網(wǎng)絡(luò)信息中心、墨奇科技聯(lián)合研發(fā)。
“從最早眼查手翻的‘查閱式’檢索,到后來基于搜索引擎以及互聯(lián)網(wǎng)的‘搜索式’檢索,再到現(xiàn)在人工智能技術(shù)的跨越式發(fā)展,我們首次看到大語言模型在理解問題和問答能力上接近人類智能的水平?!蹦婵萍几笨偛妹献匡w表示,文獻(xiàn)知識庫的發(fā)布,恰好趕上了檢索模式進(jìn)入對話時代的發(fā)展趨勢。
“文獻(xiàn)知識庫的性能優(yōu)勢,可以用‘多、快、好、省’4個字來形容?!泵献匡w介紹,“多”體現(xiàn)在“多模態(tài)、多模型、多數(shù)據(jù)”;“快”指的是“查詢快、導(dǎo)入快、迭代快”;“好”體現(xiàn)在“數(shù)據(jù)更實時、引用更可靠、理解更專業(yè)”;“省”則是通過極致的系統(tǒng)優(yōu)化與自研向量算法,讓數(shù)據(jù)的運算成本明顯降低。
文獻(xiàn)知識庫的發(fā)展方向,是將更多實驗數(shù)據(jù)納入向量數(shù)據(jù)庫。屆時,科學(xué)實驗涉及的設(shè)計原理、實驗方式,實驗結(jié)論以及結(jié)論背后對應(yīng)的思考都可以作為查詢的目標(biāo)。孟卓飛表示,借助大模型和向量數(shù)據(jù)庫,科研人員提出方向性問題,機器將完成拆解問題、提出質(zhì)疑、設(shè)計實驗、模擬實驗等一套流程,甚至可以根據(jù)結(jié)果進(jìn)行問題的反思推導(dǎo)與迭代,進(jìn)一步釋放科研人員的時間精力,以投身解決關(guān)鍵問題與創(chuàng)新思考。(記者何亮)
(責(zé)編:李依環(huán)、孫競)標(biāo)簽:
Copyright @ 2008-2020 m.g888726.cn 華夏財富網(wǎng) 版權(quán)所有 聯(lián)系郵箱:3960 29142@qq.com