互聯(lián)網(wǎng)搜索引擎中出現(xiàn)的人工智能(AI)聊天機(jī)器人,如谷歌的Bard、微軟的Bing等,似乎將越來(lái)越多地改變科學(xué)搜索。
據(jù)《自然》報(bào)道,8月1日,荷蘭出版業(yè)巨頭愛思唯爾為其Scopus數(shù)據(jù)庫(kù)的一些用戶發(fā)布了一個(gè)基于ChatGPT的AI界面,而英國(guó)數(shù)字科學(xué)公司宣布為其Dimensions數(shù)據(jù)庫(kù)的AI大型語(yǔ)言模型(LLM)進(jìn)行封閉試驗(yàn)。同時(shí),美國(guó)科睿唯安公司表示,他們也試圖將LLM納入其Web of Science數(shù)據(jù)庫(kù)。
用于科學(xué)搜索的LLM并不是什么新鮮事,Elicit、Scite和Consensus等初創(chuàng)公司已經(jīng)有了這樣的AI系統(tǒng),即依靠免費(fèi)的科學(xué)數(shù)據(jù)庫(kù),或通過(guò)與出版商合作來(lái)訪問(wèn)付費(fèi)的研究論文,幫助總結(jié)一個(gè)領(lǐng)域的發(fā)現(xiàn)或識(shí)別頂尖研究。而現(xiàn)在,擁有大型科學(xué)數(shù)據(jù)庫(kù)的公司也加入其中。
作為試點(diǎn)推出的愛思唯爾聊天機(jī)器人名為Scopus AI。負(fù)責(zé)該工具開發(fā)的愛思唯爾的Maxim Khan說(shuō),作為一個(gè)輕便、有趣的工具, Scopus AI旨在幫助研究人員快速獲得他們不熟悉的研究主題的摘要。在回答一個(gè)自然語(yǔ)言問(wèn)題時(shí),機(jī)器人使用LLM GPT-3.5版本獲得一段關(guān)于研究主題的流暢總結(jié)、引用的參考文獻(xiàn)以及需要進(jìn)一步探索的問(wèn)題。
對(duì)用于搜索尤其是科學(xué)搜索的LLM的一個(gè)擔(dān)憂是,它們是不可靠的。LLM并不理解其產(chǎn)生的文本,只是通過(guò)輸出文本上看似合理的詞語(yǔ)來(lái)工作。其輸出可能包含事實(shí)錯(cuò)誤和偏見,而且正如學(xué)者們很快發(fā)現(xiàn)的那樣,LLM可能會(huì)編造不存在的參考文獻(xiàn)。
因此,Scopus AI受到了限制,它只能通過(guò)參考5至10篇研究摘要來(lái)生成答案。Khan 解釋說(shuō),AI本身并不會(huì)尋找這些摘要,相反,在用戶輸入查詢后,一個(gè)傳統(tǒng)搜索引擎會(huì)將它們作為與問(wèn)題相關(guān)的內(nèi)容加以提供。
愛思唯爾限制Scopus AI僅搜索自2018年以來(lái)發(fā)表的文章,以獲取最近的論文,并指示其在回復(fù)中適當(dāng)引用返回的摘要,以避免不安全或惡意的查詢,并指示其說(shuō)明收到的摘要中是否沒有相關(guān)信息。這不能避免錯(cuò)誤,但可以最大限度地減少錯(cuò)誤。
那么,用戶是否有可能將機(jī)器人生成的段落復(fù)制粘貼到自己的論文中,從而對(duì)內(nèi)容進(jìn)行抄襲?Khan表示,這是有可能的。不過(guò),愛思唯爾通過(guò)“指導(dǎo)意見”來(lái)解決這一問(wèn)題,要求研究人員負(fù)責(zé)任地使用摘要。資助者和出版商也發(fā)布了類似的指導(dǎo)意見,要求透明地披露LLM是否用于撰寫論文或進(jìn)行同行評(píng)審,或者在某些情況下聲明不應(yīng)該使用LLM。
目前,Scopus AI僅向約1.5萬(wàn)名用戶推出,該公司表示,預(yù)計(jì)將于2024年初全面開放該工具。
同樣在8月1日,數(shù)字科學(xué)公司宣布將為其龐大的Dimensions數(shù)據(jù)庫(kù)引入AI助手,目前同樣只針對(duì)選定的測(cè)試者。在用戶輸入問(wèn)題后,搜索引擎首先檢索相關(guān)文章,然后開放的AI GPT模型圍繞已檢索到的排名靠前的摘要生成摘要段落。
Dimensions還使用LLM提供了相關(guān)論文的更多細(xì)節(jié),包括研究結(jié)果的簡(jiǎn)短總結(jié)。
數(shù)字科學(xué)公司首席產(chǎn)品官Christian Herzog說(shuō),公司希望在今年年底前在更廣泛的范圍發(fā)布該工具,但目前正在與科學(xué)家、資助者和其他使用Dimensions的人合作,測(cè)試LLM在哪些方面可能有用——這還有待觀察。他說(shuō):“這關(guān)乎逐漸適應(yīng)一項(xiàng)新技術(shù)并建立信任。”
同時(shí),科睿唯安也表示,該公司正“致力于在Web of Science中添加LLM支持的搜索”,但沒有透露相關(guān)工具發(fā)布的時(shí)間。
版權(quán)聲明:凡本網(wǎng)注明“來(lái)源:中國(guó)科學(xué)報(bào)、科學(xué)網(wǎng)、科學(xué)新聞雜志”的所有作品,網(wǎng)站轉(zhuǎn)載,請(qǐng)?jiān)谡纳戏阶⒚鱽?lái)源和作者,且不得對(duì)內(nèi)容作實(shí)質(zhì)性改動(dòng);微信公眾號(hào)、頭條號(hào)等新媒體平臺(tái),轉(zhuǎn)載請(qǐng)聯(lián)系授權(quán)。郵箱:。
FASE 前沿研究:一種監(jiān)測(cè)和指導(dǎo)農(nóng)田土壤增碳的工具——Soil Carbon Check
英文學(xué)術(shù)期刊Malignancy Spectrum(《腫瘤學(xué)全景》)首篇文章在線